使用語音Modem完成電話點播與留言技巧
發(fā)表時間:2024-06-11 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]有一段時間沒有更新網(wǎng)站了,最近挺忙的,所以寫書的進(jìn)度慢了一些,兩周只寫了10多頁設(shè)計模式相關(guān)的內(nèi)容。希望在接下來的幾周能加快進(jìn)度,趕緊弄完。另外前兩天,我被評為了Borland Delphi產(chǎn)品專家,加上這兩天北京的非典形勢也緩和多了,很高興。為此公開很久以前寫的一篇文章,與大家分享一下我的快樂。...
有一段時間沒有更新網(wǎng)站了,最近挺忙的,所以寫書的進(jìn)度慢了一些,兩周只寫了10多頁設(shè)計模式相關(guān)的內(nèi)容。希望在接下來的幾周能加快進(jìn)度,趕緊弄完。另外前兩天,我被評為了Borland Delphi產(chǎn)品專家,加上這兩天北京的非典形勢也緩和多了,很高興。為此公開很久以前寫的一篇文章,與大家分享一下我的快樂。
偶然的起因
記得還是在去年情人節(jié)的時候,當(dāng)時一直在為給女朋友送什么禮物而發(fā)愁,覺得送花實在沒有什么創(chuàng)意,可又不知道什么樣的禮物即能給她一個驚喜同事又不昂貴。這時,我的一個好朋友出了一個主意,說不如電話點歌吧,還比較特別?墒侨绻峭ㄟ^電臺點歌后,再告訴她收聽的話就起不到意外的效果了。
就在沒有什么好辦法的時候,我在Delphi論壇上瞎逛的時候,一個人提出的問題突然啟發(fā)了我,問題是關(guān)于如果編程實現(xiàn)語音留言和電話按鍵的記錄功能的。我突然想為什么我不能寫一個程序來控制電話,然后再給女友打一個傳呼,讓她回電話,當(dāng)電話接通后,我的程序先播放一段事先錄制好的話,提示她通過電話按鍵來選歌,并能提供留言的功能呢。主意一定,我就趕忙查閱這方面的資料了,一開始朋友們告訴可以通過語音卡來實現(xiàn)這些功能,可是語音卡比較貴,而且我買了后,除了用一次以外以后也不會經(jīng)常用到,實在是有點浪費,后來網(wǎng)友cced提到他聽人說TurboPower公司出的Async Professional控件提供了一組基于Telephone Api的控件可以通過語音Modem來實現(xiàn)類似的功能。這個看來成本就低多了,我的Modem正好是語音Modem,于是我就下載了Async Professional(官方網(wǎng)www.turbopower.com)試驗了一下,果然不同反響,便宜且簡單。
開始設(shè)計
下面我們就來看看如何利用這組控件實現(xiàn)語音功能,對于我們程序的應(yīng)用來說,只需要使用兩個TAPI控件TApdComPort和TApdTapiDevice即可,其中TApdComPort控件是一個串口通訊控件,因為Modem是同串口相連接的,因此需要串口通訊控件來進(jìn)行控制。而TapdTapiDevice則是提供語音功能的核心控件。
首先,新建一個程序項目,在窗體上放置一個TApdComport控件,設(shè)置其屬性為AutoOpen:=False;TapiMode=tmOn;這里TapiMode 設(shè)定為tmOn 表明TApdComPort 將由同其關(guān)聯(lián)的TApdTapiDevice.控件來控制,而將AutoOpen設(shè)定為False 是因為串口的打開和關(guān)閉現(xiàn)在可以完全由TAPI來控制了。
然后,在窗體上放置一個TApdTapiDevice控件,設(shè)定其Comport屬性為前面的TApdComPort控件。設(shè)定AnswerOnRing屬性為1,表明第一次振鈴后就開始由程序控制電話的應(yīng)答。設(shè)定ShowTapiDevices為True表明當(dāng)調(diào)用控件的SelectDevice方法時,會顯示一個選擇TAPI設(shè)備的對話框。ShowPorts屬性為false,表明調(diào)用SelectDevice方法不會顯示串行口列表。
接下來,本程序主要是采用有限狀態(tài)機來控制流程的,下面我們來定義枚舉狀態(tài)
Type
TCurrentState = (csIdle, csWaiting, csConnected, csPlaying, csRecording, sDisconnected);
其中csIdle狀態(tài)表示電話處于空閑狀態(tài),正等待接入。csWaiting則表示電話處于程序控制下,等待接入,如果有電話打入,程序會自動應(yīng)答。csConnected則表示有電話打入,處于連接狀態(tài),csRecording則用來表示當(dāng)前處于記錄電話留言狀態(tài)。csDisconnected則表示當(dāng)前連接掛斷了。
程序初始化
下面就是程序的OnCreate的事件處理函數(shù),非常簡單,就是先設(shè)置當(dāng)前狀態(tài)為csIdle,并設(shè)置ApdTapiDevice控件的TrimSeconds屬性為5,表示當(dāng)錄音時如果有5秒的沉默時間就掛斷。
procedure TFrmMain.FormCreate(Sender: TObject);
var
TeleIni: TIniFile;
begin
CurrentState := csIdle;
ApdTapiDevice.TrimSeconds := 5; //錄音時有5秒靜音就掛斷
CommandList := TStringList.Create;
TeleIni := TIniFile.Create(ExtractFilePath(ParamStr(0)) + 'Tele.ini');
TeleIni.ReadSectionvalues('Commands', CommandList);
TeleIni.Free;
WindowState := wsMaximized;
end;
然后是將定義在Tele.Ini文件中的將要播放的聲音列表文件目錄加載到CommandList中。Tele.Ini的示例如下:
[Commands]
1#=1.wav
2#=2.wav
3#=3.wav
123#=E:\Program Files\APRO\Examples\Beep.wav
其中1#,表示當(dāng)用戶按下1和#號按鍵后,程序會播放其對應(yīng)的1.wav文件。接下來就是我們要提供兩個命令,一個是監(jiān)控電話,一個是掛斷電話,先在窗體上添加一個TlistBox,起名為LBSysInfo,然后添加兩個菜單項,并同兩個Action連接,編寫Action的OnExecute事件處理函數(shù):
//監(jiān)控電話
procedure TFrmMain.ActionAnswerExecute(Sender: TObject);
begin
try
ApdTapiDevice.EnableVoice := True;
except
Application.MessageBox('當(dāng)前設(shè)備不支持語音擴展', '錯誤', MB_OK);
end;
if ApdTapiDevice.EnableVoice then
begin
ApdTapiDevice.AutoAnswer;
LBSysInfo.Items.Add('answer:接聽對方電話');
CurrentState := csWaiting;
end
end;
因為不是所有的Modem都支持語音功能,因此在監(jiān)控電話接入前應(yīng)該先判斷設(shè)置ApdTapiDevice.EnableVoice := True;,如果出現(xiàn)異常,表明Modem不支持語音功能。如果支持的話,就調(diào)用AutoAnswer方法等待接入同時設(shè)置狀態(tài)為csWaiting,并在列表框中寫入日志。
//掛斷電話
procedure TFrmMain.ActionCancelExecute(Sender: TObject);
begin
ApdTapiDevice.CancelCall;
LBSysInfo.Items.Add('cancel:掛斷對方電話');
CurrentState := csIdle;
end;
掛斷電話就簡單多了,只要簡單的調(diào)用TApdTapiDevice控件的CancelCall方法就可以了,還需要設(shè)置當(dāng)前狀態(tài)為csIdle。
如果系統(tǒng)中存在多個TAPI設(shè)備的時候,我們還可以選擇使用哪一個來接聽電話,下面是選擇設(shè)備的方法:
//選擇設(shè)備
procedure TFrmMain.ActionSelDevExecute(Sender: TObject);
begin
ApdTapiDevice.SelectDevice;
ApdTapiDevice.EnableVoice := True;
end;
事件驅(qū)動
Telephone API是基于事件驅(qū)動的,因此核心功能需要在事件處理函數(shù)中實現(xiàn),先來看程序的TApdTapiDevice的OnConnect事件處理函數(shù)代碼:
procedure TFrmMain.ApdTapiDeviceTapiConnect(Sender: TObject);
begin
CurrentState := csConnected;
LBSysInfo.Items.Add('Connect:連接成功');
ApdTapiDevice.PlayWaveFile('Greeting.wav');//播放功能提示語音
LBSysInfo.Items.Add('connect:播放greeting.wav');
end;
當(dāng)用戶打入被監(jiān)控的電話后,會激發(fā)這個事件,程序應(yīng)該在用戶接入后播放提示語音,提示用戶按不同功能鍵來點歌或留言。程序設(shè)置當(dāng)前狀態(tài)為csConnected,然后調(diào)用ApdTapiDevice的PlayWaveFile方法播放提示語音波文件。
要注意的是:不同Modem支持播放的波文件的格式是不同的,但它們都支持PCM 8位單聲道的波文件,但這種類型波文件的音質(zhì)非常差,用來播放歌曲效果實在糟糕,不過大多數(shù)語音Modem都支持音質(zhì)更好的波文件格式,但通常都是 PCM格式的,比如我的Lucent Voice Modem就支持PCM 16位 單聲道的波文件的播放。歌曲轉(zhuǎn)化為波文件非常簡單,我用Winamp將mp3文件通過Winamp本身的Disk Writer Plug-in插件直接將mp3轉(zhuǎn)化成44位的波文件(通常為40-70M大小),然后在用一個叫g(shù)oldwave的軟件(我忘了從什么地方下載的了)將其轉(zhuǎn)化為16位的單聲道波文件(通常4-7M大。。至于提示語音,我則是使用windows自帶的錄音機程序通過麥克風(fēng)錄制的。
當(dāng)用戶聽完提示語音后,他們會按鍵來點歌或留言,而用戶的按鍵會激發(fā)TApdTapiDevice的OnDTMF事件,我們就可以在這個事件中對按鍵進(jìn)行處理,下面就是處理過程代碼:
procedure TFrmMain.ApdTapiDeviceTapiDTMF(CP: TObject; Digit: Char;
ErrorCode: Integer);
begin
if (Digit = '') or (Digit = ' ') then
Exit;
LBSysInfo.Items.Add('dtmf:按鍵=' + Digit);
CurrentCommand := CurrentCommand + Digit;
{簡單狀態(tài)機}
if Digit = '#' then
begin
if CurrentCommand = '*#' then
begin
CurrentCommand := '';
ApdTapiDevice.MaxMessageLength := 30; //最長記錄時間30秒
ApdTapiDevice.InterruptWave := False; //按鍵不能中斷提示語音的播放
ApdTapiDevice.PlayWaveFile('recordhint.wav');//播放錄音提示語音
CurrentState := csRecording;
Exit;
end;
if CommandList.values[CurrentCommand] <> '' then
begin
ApdTapiDevice.PlayWaveFile(CommandList.values[CurrentCommand]);
LBSysInfo.Items.Add(Format('%s %s 正在播放 %s',
[ApdTapiDevice.calleridname, apdtapidevice.callerid,
CommandList.values[CurrentCommand]]));
end
else
begin
//播放錯誤提示語音,并要求用戶重新輸入命令
ApdTapiDevice.PlayWaveFile('errorno.wav');
LBSysInfo.Items.Add(Format('%s %s 輸入了錯誤的號碼',
[ApdTapiDevice.calleridname, apdtapidevice.callerid]));
end;
//重置命令為空
CurrentCommand := '';
end;
end;
程序?qū)Π存I進(jìn)行判斷(按鍵對應(yīng)于digit參數(shù)),如果輸入的為’*#’鍵,就進(jìn)入錄音功能,在錄音前先播放提示語音,可以告訴用戶留言長度為30秒,然后設(shè)置當(dāng)前狀態(tài)為csRecording,有人可能要問,沒看到用來錄音的代碼呀,這部分其實是實現(xiàn)在另外的事件中的,我們稍后就會講到。再來看點歌部分,同樣的根據(jù)按鍵的組合在先前加載進(jìn)CommandList的字符串列表中查找相匹配的歌曲,如果有相應(yīng)的歌曲就播放,否則播放錯誤提示語音,提示用戶重新輸入命令,然后將按鍵清空等待重新輸入。另外注意在事件的日志記錄中我記錄了ApdTapiDevice.calleridname和CallerID的屬性,它們對應(yīng)的是打入電話的號碼,不過這項功能只對開通了來電顯示功能的電話號碼才有效,通過對打入電話號碼信息的處理,我們可以提供一些額外的功能,不過這是題外話了。
前面提到了在按鍵處理事件中我們并沒有進(jìn)行留言的錄制功能,這主要是因為我們要保證留言提示語音不被按鍵中斷(設(shè)定Interruptwave:=false),因此把留言錄制功能放到了TApdTapiDevice的OnWaveNotify事件中了,這個事件可以提示波文件播放的狀態(tài),比如播放結(jié)束和錄音所需聲音數(shù)據(jù)準(zhǔn)備狀態(tài)等,在本程序中我們需要在提示語音播放結(jié)束后,開始記錄留言,并在留言聲音數(shù)據(jù)準(zhǔn)備好后,將其保存到磁盤文件中。下面是處理過程的流程:
procedure TFrmMain.ApdTapiDeviceTapiWaveNotify(CP: TObject;
Msg: TWaveMessage);
var
TimeStr: string;
FileName: string;
begin
//決不能在case外做耗時的操作
case Msg of
waPlayOpen: LBSysInfo.Items.Add('wavnotify:播放開始');
waPlayDone:
begin
LBSysInfo.Items.Add('wavnotify:播放結(jié)束');
if CurrentState = csRecording then
begin
try
//等待波設(shè)備狀態(tài)為wsIdle再開始錄音
while ApdTapiDevice.WaveState <> wsIdle do
Application.ProcessMessages;
ApdTapiDevice.InterruptWave := True;
ApdTapiDevice.StartWaveRecord;
LBSysInfo.Items.Add('dtmf:錄音成功');
except
LBSysInfo.Items.Add('dtmf:錄音失敗');
end;
end;
end;
waPlayClose: LBSysInfo.Items.Add('wavnotify:播放關(guān)閉');
waRecordOpen: LBSysInfo.Items.Add('wavnotify:錄音開始');
waDataReady:
begin
LBSysInfo.Items.Add('wavnotify:數(shù)據(jù)準(zhǔn)備');
TimeSeparator := '-';
FileName := DateTimeToStr(Now) + '.wav';
try
ApdTapiDevice.SaveWaveFile(ExtractFilePath(ParamStr(0)) + 'record\' +
FileName, True);
LBSysInfo.Items.Add('wavNotify:保存聲音文件 ' + FileName);
except
LBSysInfo.Items.Add('wavnotify:保存聲音文件失敗');
end;
end;
waRecordClose:
begin
LBSysInfo.Items.Add('wavnotify:記錄聲音結(jié)束');
CurrentState := csWaiting;
ActionCancelExecute(nil);
Timer1.Enabled := True;
end;
end;
end;
整個流程就是通過一個Case語句來判斷當(dāng)前聲音狀態(tài),如果為waPlayDone(播放完畢),同事CurrentStatus為csRecording的話,就調(diào)用StartWaveRecord方法來記錄聲音。而當(dāng)Msg為waDataReady狀態(tài)時,表明錄音數(shù)據(jù)已經(jīng)可以存盤了,這時根據(jù)當(dāng)前時間生成一個文件名,并將數(shù)據(jù)保存為波文件。而當(dāng)錄音結(jié)束后,我們就需要調(diào)用ActionCancelExecute(nil)來掛斷電話,并將狀態(tài)設(shè)置為csWaiting來等待下次接入,注意的在代碼最后,我們將一個TTimer控件激活了。這個TTimer控件的時間間隔Interval設(shè)置為8秒,同時其OnTimer事件代碼如下:
procedure TFrmMain.Timer1Timer(Sender: TObject);
begin
try
//應(yīng)答電話
ActionAnswerExecute(nil);
CurrentState := csWaiting;
Timer1.Enabled := False;
except
end;
end;
這樣設(shè)置的原因在于,當(dāng)調(diào)用CancelCall方法來掛斷電話后,TAPI設(shè)備需要8秒來恢復(fù)正常狀態(tài),如果立刻執(zhí)行AutoAnswer的話,這個方法就會失效,無法正確監(jiān)控電話接入,因此要用TTimer來控制恢復(fù)電話應(yīng)答的時間。
異常處理
要想程序非常健壯的反復(fù)應(yīng)答電話接入,我們必須對用戶突然掛斷電話進(jìn)行處理,用戶斷開的事件會激發(fā)控件的OnTapiStatus事件,當(dāng)用戶掛斷電話時,我們要做的是如果當(dāng)前還在錄音,就停止錄音,如果是在播放歌曲,就掛斷電話,然后設(shè)置TTimer生效,重新進(jìn)入電話應(yīng)答狀態(tài)。下面就是整個處理過程的代碼:
procedure TFrmMain.ApdTapiDeviceTapiStatus(CP: TObject; First,
Last: Boolean; Device, Message, Param1, Param2, Param3: Cardinal);
begin
if (Message = Line_CallState) then
begin
case Param1 of
LineCallState_Disconnected:
begin
LBSysInfo.Items.Add('status:disconnected from remote modem');
if CurrentState = csRecording then
begin
ApdTapiDevice.StopWaveRecord;
Exit;
end;
CurrentState := csDisconnected;
ActionCancelExecute(nil);
Timer1.Enabled := True;
end;
end;
end;
end;
進(jìn)一步完善
當(dāng)錄音完畢后,我們想聽一下電話留言的話,可以在窗體上放置一個打開文件對話框,用下面代碼實現(xiàn):
procedure TFrmMain.ActionPlayRecExecute(Sender: TObject);
var
FrmPlay: TFrmPlayRec;
begin
DlgOpenRec.InitialDir := ExtractFilePath(ParamStr(0)) + 'Record\';
if DlgOpenRec.Execute then
//播放聲音記錄文件
ShellExecute(Application.Handle, PChar('open'), PChar(DlgOpenRec.FileName),
nil, nil, SW_SHOW);
end;
另外,如果大家自信自己的歌喉不比那些歌星差的話,完全可以錄制自己的歌聲,然后播放給你的女朋友或朋友聽,也許效果更棒:)。
最后,我要說的就是Telephone API所能提供的功能遠(yuǎn)遠(yuǎn)不止本文中所提到的,感興趣的朋友可以進(jìn)一步查閱相關(guān)資料來研究。
最后,要說的是Turbo Power已經(jīng)不再開發(fā)Async Pro了,它把所有的源碼都放到了Sourceforge上共享,大家可以到SourceForge上下載。