明輝手游網(wǎng)中心:是一個免費提供流行視頻軟件教程、在線學習分享的學習平臺!

API層完成語音錄制

[摘要]我從前出于需要,上網(wǎng)尋找了關(guān)于錄音部分的源代碼,收獲不大,現(xiàn)在把自己摸索的部分源代碼公開出來吧,希望對部分人有用。 其實要實現(xiàn)聲音的錄制,可以用多種的方式(例如 mci ),我這里介紹的是在...
     我從前出于需要,上網(wǎng)尋找了關(guān)于錄音部分的源代碼,收獲不大,現(xiàn)在把自己摸索的部分源代碼公開出來吧,希望對部分人有用。

     其實要實現(xiàn)聲音的錄制,可以用多種的方式(例如 mci ),我這里介紹的是在 API 的層面來實現(xiàn),你可以對其中進行更多的控制。比方說,要音頻裸數(shù)據(jù)存到你指定的內(nèi)存中去。

     先說一下要用到的 API , 錄音通常都是使用 waveInXXX 一類 API 的,最主要的是 waveInStart (顧名思義就是開始錄音),然后是 waveInStop(它能夠在你指定的緩沖滿的時候返回) ; 如果不用 waveInStop 可以使用 waveInReset(不同于Stop的是該函數(shù)不等緩沖滿就馬上返回那樣你才可以終止錄音),不過最好跟 waveInGetPosition 配合使用。

    說完這些函數(shù),不得不提的是為以上幾個函數(shù)做準備工作的函數(shù)(注意配對使用), waveInOpen 和 waveInClose 配對( waveInOpen 里面指定音頻的格式,比方說立體聲 和16位音質(zhì)等); waveInPrepareHeader 和 waveInUnprepareHeader 配對( waveInPrepareHeader 里面指定用來錄音緩沖的大小和首地址),緊跟著 waveInPrepareHeader要例行公事調(diào)用 waveInAddBuffer( 作用未詳,不多說了)。

    詳細調(diào)用過程可以看下面



(之前最好調(diào)用 waveInGetNumDevs 看看有沒有可用的設(shè)備)

waveInOpen (該處用 WAVEFORMATEX 結(jié)構(gòu)指定音頻格式)



     waveInPrepareHeader (該處用 WAVEHDR 結(jié)構(gòu)的 lpData 成員指定緩沖首地址)

     waveInAddBuffer



        waveInStart

         (錄制中....)

        waveInStop (warning:一定要緩沖滿了才返回)



     waveInUnprepareHeader



waveInClose







    需要指出的是,上面的代碼你不能隨心所欲的停止錄音過程(如果你指定的緩沖非常大,比方說足夠錄音一個小時,那么你就要乖乖的等上一個小時),如果希望馬上停止,請使用下面的方法。





        waveInStart

        (錄制中....)

        (n 時間后,用戶提出停止請求)

        waveInGetPosition (保留該值,用來設(shè)置 WAVEHDR 結(jié)構(gòu)的 dwBytesRecorded 成員)

        waveInReset

        (重新設(shè)置 WAVEHDR 結(jié)構(gòu)的 dwBytesRecorded 成員)







    整個過程就是如此的幾句,下面將給出源程序以驗證。





    需要說明一下,正常情況下錄音以后,總共耗費的內(nèi)存(以字節(jié)算) 會保存在WAVEHDR 結(jié)構(gòu)的 dwBytesRecorded 成員中,可用的音頻裸數(shù)據(jù)當然就放進你指定的內(nèi)存緩沖中去了,你大可不必等 waveInUnprepareHeader 就可以馬上拿來用了。





   ( 補充一個內(nèi)容,粗略講解一下 .wav 文件的文件頭格式 )

    看下面的結(jié)構(gòu),一開始的八個字節(jié)是一個結(jié)構(gòu), 第一個 四字節(jié) 是標志,剛好等于 ascii 的 "RIFF" ,第二個四字節(jié)是總的文件長度減去8。你可以驗證一下。(參照16進制閱讀數(shù)字的方法)

    跟著是第二個數(shù)據(jù)結(jié)構(gòu),占12個字節(jié)。如果你是標準的 wave 格式的文件,那么就是緊接著兩個標志,第一個四字節(jié)的標志是 ascii 的 "WAVE" ,第二個 四字節(jié)的標志就是 ascii 的 "fmt "(注意,有一個空格),然后剩下的四字節(jié)里面藏的是 WAVEFORMATEX 結(jié)構(gòu)的大小(參照MSDN),應該是18個字節(jié)。

    然后,當然就是 18個字節(jié)的 WAVEFORMATEX 結(jié)構(gòu)里面的值。詳細的就不說了,自己查一下 MSDN。 (需要注意的是,這個 WAVEFORMATEXEX 的末一個成員,講了可能的長度擴充)

    在這 18 個字節(jié)后面 (按照舊時候的方法),應該是跟著一個8字節(jié)的結(jié)構(gòu)的,然后就是 "裸數(shù)據(jù)" 的開始地址了,這八字節(jié)結(jié)構(gòu)的開始四字節(jié)是標志,應該等于 ascii 的 "data",然后緊跟著的四字節(jié)就是裸數(shù)據(jù)的大小了,也就是最重要的部分。

    好了,如此一來,你就可以得到音頻裸數(shù)據(jù)的起始位置(緊緊跟在含"data"標志的數(shù)據(jù)結(jié)構(gòu)的后面),還有就是音頻數(shù)據(jù)的長度了。應該是所有的問題都很容易解決的。

    

    不過,還要注意,就是現(xiàn)在的很多 .wav 文件都會外加一個數(shù)據(jù)結(jié)構(gòu)(12字節(jié)),就插在 WAVEFORMATEX 的后面和 含 "data" 的數(shù)據(jù)結(jié)構(gòu)前面。  這個外加的結(jié)構(gòu) 第一個四字節(jié)是標志,等于 ascii 碼的 "fact",然后第二個四字節(jié)的值在大部分情況下都等于 4, 第三個四字節(jié)的值也是等于 音頻裸數(shù)據(jù)的長度。  基本上就是這樣了。





      下面給出的源程序文件只要加進新建的 VC win32工程中,編譯即可,執(zhí)行效果是錄音三秒后自動生成 mytest.wav 文件供播放測試(記得選好默認錄音通道)。

    廢話不多說,給出源程序(該源程序中要包含 RunTimeLog.cpp,見http://www.csdn.net/develop/Read_Article.asp?Id=17477) 希望對大家有用。(全文完)

      (全文完 - 2003年03月27日_am: 11時27分)







// *******************  FileName: WinMain.cpp  *****************************



// 該源程序需要加入到 VC6 的 Win32 Application 的 empty Project 中

// 請包含我自定義的調(diào)試類,見 #include "RunTimeLog.cpp"

// 對于工程的 Link 選項,至少要包含以下庫:  msvcrt.lib kernel32.lib user32.lib Winmm.lib





#define WIN32_LEAN_AND_MEAN      // Say No to MFC !!



#include <windows.h>

#include <Mmsystem.h>



#include "RunTimeLog.cpp"



RunTimeLog log;





char lpTemp[256]="";





DWORD FCC(LPSTR lpStr)

{

   DWORD Number = lpStr[0] + lpStr[1] *0x100 + lpStr[2] *0x10000 + lpStr[3] *0x1000000 ;

   return Number;

}





int WINAPI WinMain( HINSTANCE hInstance, HINSTANCE hPrevInstance,

                    LPSTR lpCmdLine, int nCmdShow )

{



  CreateMutex( NULL, false, "MyMutex");

   if ( GetLastError() == ERROR_ALREADY_EXISTS )

   { log.write("Exists and Exit"); log.last(); ExitProcess( NULL); }





    log.write("Program Start.");

    log.nobuff = true;



DWORD datasize = 48000;

    

    // 最常用法

WAVEFORMATEX waveformat;

waveformat.wFormatTag=WAVE_FORMAT_PCM;

waveformat.nChannels=1;

waveformat.nSamplesPerSec=8000;

waveformat.nAvgBytesPerSec=8000;

waveformat.nBlockAlign=1;

waveformat.wBitsPerSample=8; //指定錄音格式

waveformat.cbSize=0;



  wsprintf( lpTemp, "WAVEFORMATEX size = %lu", sizeof(WAVEFORMATEX) );

  log.write(lpTemp);







HWAVEIN  m_hWaveIn;



if ( waveInGetNumDevs() ) log.write("有可以使用的 WaveIn 通道");  else log.write("沒有可以使用的 waveIn 通道");



int res=waveInOpen(&m_hWaveIn,WAVE_MAPPER, &waveformat, (DWORD)NULL,0L,CALLBACK_WINDOW); //打開錄音設(shè)備



if ( res == MMSYSERR_NOERROR ) log.write("打開 waveIn 成功");  // 驗證創(chuàng)建是否成功

else  {

     wsprintf(lpTemp, "打開 waveIn 通道失敗,Error_Code = 0x%x", res );

     log.write(lpTemp);

} // End of 驗證創(chuàng)建是否成功







WAVEHDR m_pWaveHdr;

   

  m_pWaveHdr.lpData = (char *)GlobalLock( GlobalAlloc(GMEM_MOVEABLE GMEM_SHARE, datasize) );

  memset(m_pWaveHdr.lpData, 0, datasize );

  m_pWaveHdr.dwBufferLength = datasize;

  m_pWaveHdr.dwBytesRecorded = 0;

  m_pWaveHdr.dwUser = 0;

  m_pWaveHdr.dwFlags = 0;

  m_pWaveHdr.dwLoops = 0;





  wsprintf( lpTemp, "WAVEHDR size = %lu", sizeof(WAVEHDR) );

  log.write(lpTemp);





int resPrepare = waveInPrepareHeader( m_hWaveIn, &m_pWaveHdr, sizeof(WAVEHDR) ); //準備內(nèi)存塊錄音



if ( resPrepare == MMSYSERR_NOERROR) log.write("準備錄音用頭文件成功");

  else  {

     wsprintf(lpTemp, "不能開辟錄音頭文件,Error_Code = 0x%03X", resPrepare );

     log.write(lpTemp);

} // End of 驗證開辟緩沖







  resPrepare = waveInAddBuffer( m_hWaveIn, &m_pWaveHdr, sizeof(WAVEHDR) );



if ( resPrepare == MMSYSERR_NOERROR) log.write("準備錄音用內(nèi)存成功");

  else  {

     wsprintf(lpTemp, "不能開辟錄音用緩沖,Error_Code = 0x%03X", resPrepare );

     log.write(lpTemp);

} // End of 驗證開辟緩沖









  log.write("");  // 寫入空字符串可以分行



  

  if (! waveInStart(m_hWaveIn) ) log.write("開始錄音"); else log.write("開始錄音失敗");



  Sleep(3200);





MMTIME mmt;

mmt.wType = TIME_BYTES;

log.numberwrite( "sizeof(MMTIME) =", sizeof(MMTIME) );

log.numberwrite( "sizeof(UINT) =", sizeof(UINT) );



if ( waveInGetPosition(m_hWaveIn, &mmt, sizeof(MMTIME)) ) log.write("不能取得音頻長度");

  else log.numberwrite( "取得現(xiàn)在音頻位置 =", mmt.u.cb );



if (mmt.wType == TIME_BYTES) { log.write("得到的 TIME_BYTES 格式的音頻長度"); }

   else log.write("指定的 TIME_BYTES 格式音頻長度不支持");





//  if (! waveInStop(m_hWaveIn) )  log.write("停止錄音"); else   log.write("停止錄音失敗");



  if (! waveInReset(m_hWaveIn) )  log.write("重置內(nèi)存區(qū)成功"); else log.write("重置內(nèi)存區(qū)失敗");





m_pWaveHdr.dwBytesRecorded = mmt.u.cb;







DWORD NumToWrite=0;  DWORD dwNumber = 0;



HANDLE FileHandle =

       CreateFile( "myTest.wav", GENERIC_WRITE, FILE_SHARE_READ, NULL,

                   CREATE_ALWAYS, FILE_ATTRIBUTE_NORMAL, NULL);



//  memset(m_pWaveHdr.lpData, 0, datasize);



dwNumber = FCC("RIFF");

WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);



dwNumber = m_pWaveHdr.dwBytesRecorded + 18 + 20;

WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);



dwNumber = FCC("WAVE");

WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);



dwNumber = FCC("fmt ");

WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);



dwNumber = 18L;

WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);



WriteFile(FileHandle, &waveformat, sizeof(WAVEFORMATEX), &NumToWrite, NULL);



dwNumber = FCC("data");

WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);



dwNumber = m_pWaveHdr.dwBytesRecorded;

WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);



WriteFile(FileHandle, m_pWaveHdr.lpData, m_pWaveHdr.dwBytesRecorded, &NumToWrite, NULL);



SetEndOfFile(FileHandle);

CloseHandle( FileHandle );    FileHandle = INVALID_HANDLE_VALUE; // 收尾關(guān)閉句柄



log.write("應該已生成 myTest.wav 文件");







  if ( waveInUnprepareHeader(m_hWaveIn, &m_pWaveHdr, sizeof(WAVEHDR)) ) log.write("Un_Prepare Header 失敗"); else log.write("Un_Prepare Header 成功");



  if ( GlobalFree(GlobalHandle( m_pWaveHdr.lpData )) ) log.write("Global Free 失敗"); else log.write("Global Free 成功");







if (res == MMSYSERR_NOERROR )  //關(guān)閉錄音設(shè)備

if (waveInClose(m_hWaveIn)==MMSYSERR_NOERROR)log.write("正常關(guān)閉錄音設(shè)備");

else log.write("非正常關(guān)閉錄音設(shè)備");







    log.last(true);

    // ExitProcess(0);

    return 0;

}



// *******************  End of File  *****************************