API層完成語音錄制
發(fā)表時間:2023-08-20 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]我從前出于需要,上網(wǎng)尋找了關(guān)于錄音部分的源代碼,收獲不大,現(xiàn)在把自己摸索的部分源代碼公開出來吧,希望對部分人有用。 其實要實現(xiàn)聲音的錄制,可以用多種的方式(例如 mci ),我這里介紹的是在...
我從前出于需要,上網(wǎng)尋找了關(guān)于錄音部分的源代碼,收獲不大,現(xiàn)在把自己摸索的部分源代碼公開出來吧,希望對部分人有用。
其實要實現(xiàn)聲音的錄制,可以用多種的方式(例如 mci ),我這里介紹的是在 API 的層面來實現(xiàn),你可以對其中進行更多的控制。比方說,要音頻裸數(shù)據(jù)存到你指定的內(nèi)存中去。
先說一下要用到的 API , 錄音通常都是使用 waveInXXX 一類 API 的,最主要的是 waveInStart (顧名思義就是開始錄音),然后是 waveInStop(它能夠在你指定的緩沖滿的時候返回) ; 如果不用 waveInStop 可以使用 waveInReset(不同于Stop的是該函數(shù)不等緩沖滿就馬上返回那樣你才可以終止錄音),不過最好跟 waveInGetPosition 配合使用。
說完這些函數(shù),不得不提的是為以上幾個函數(shù)做準備工作的函數(shù)(注意配對使用), waveInOpen 和 waveInClose 配對( waveInOpen 里面指定音頻的格式,比方說立體聲 和16位音質(zhì)等); waveInPrepareHeader 和 waveInUnprepareHeader 配對( waveInPrepareHeader 里面指定用來錄音緩沖的大小和首地址),緊跟著 waveInPrepareHeader要例行公事調(diào)用 waveInAddBuffer( 作用未詳,不多說了)。
詳細調(diào)用過程可以看下面
(之前最好調(diào)用 waveInGetNumDevs 看看有沒有可用的設(shè)備)
waveInOpen (該處用 WAVEFORMATEX 結(jié)構(gòu)指定音頻格式)
waveInPrepareHeader (該處用 WAVEHDR 結(jié)構(gòu)的 lpData 成員指定緩沖首地址)
waveInAddBuffer
waveInStart
(錄制中....)
waveInStop (warning:一定要緩沖滿了才返回)
waveInUnprepareHeader
waveInClose
需要指出的是,上面的代碼你不能隨心所欲的停止錄音過程(如果你指定的緩沖非常大,比方說足夠錄音一個小時,那么你就要乖乖的等上一個小時),如果希望馬上停止,請使用下面的方法。
waveInStart
(錄制中....)
(n 時間后,用戶提出停止請求)
waveInGetPosition (保留該值,用來設(shè)置 WAVEHDR 結(jié)構(gòu)的 dwBytesRecorded 成員)
waveInReset
(重新設(shè)置 WAVEHDR 結(jié)構(gòu)的 dwBytesRecorded 成員)
整個過程就是如此的幾句,下面將給出源程序以驗證。
需要說明一下,正常情況下錄音以后,總共耗費的內(nèi)存(以字節(jié)算) 會保存在WAVEHDR 結(jié)構(gòu)的 dwBytesRecorded 成員中,可用的音頻裸數(shù)據(jù)當然就放進你指定的內(nèi)存緩沖中去了,你大可不必等 waveInUnprepareHeader 就可以馬上拿來用了。
( 補充一個內(nèi)容,粗略講解一下 .wav 文件的文件頭格式 )
看下面的結(jié)構(gòu),一開始的八個字節(jié)是一個結(jié)構(gòu), 第一個 四字節(jié) 是標志,剛好等于 ascii 的 "RIFF" ,第二個四字節(jié)是總的文件長度減去8。你可以驗證一下。(參照16進制閱讀數(shù)字的方法)
跟著是第二個數(shù)據(jù)結(jié)構(gòu),占12個字節(jié)。如果你是標準的 wave 格式的文件,那么就是緊接著兩個標志,第一個四字節(jié)的標志是 ascii 的 "WAVE" ,第二個 四字節(jié)的標志就是 ascii 的 "fmt "(注意,有一個空格),然后剩下的四字節(jié)里面藏的是 WAVEFORMATEX 結(jié)構(gòu)的大小(參照MSDN),應該是18個字節(jié)。
然后,當然就是 18個字節(jié)的 WAVEFORMATEX 結(jié)構(gòu)里面的值。詳細的就不說了,自己查一下 MSDN。 (需要注意的是,這個 WAVEFORMATEXEX 的末一個成員,講了可能的長度擴充)
在這 18 個字節(jié)后面 (按照舊時候的方法),應該是跟著一個8字節(jié)的結(jié)構(gòu)的,然后就是 "裸數(shù)據(jù)" 的開始地址了,這八字節(jié)結(jié)構(gòu)的開始四字節(jié)是標志,應該等于 ascii 的 "data",然后緊跟著的四字節(jié)就是裸數(shù)據(jù)的大小了,也就是最重要的部分。
好了,如此一來,你就可以得到音頻裸數(shù)據(jù)的起始位置(緊緊跟在含"data"標志的數(shù)據(jù)結(jié)構(gòu)的后面),還有就是音頻數(shù)據(jù)的長度了。應該是所有的問題都很容易解決的。
不過,還要注意,就是現(xiàn)在的很多 .wav 文件都會外加一個數(shù)據(jù)結(jié)構(gòu)(12字節(jié)),就插在 WAVEFORMATEX 的后面和 含 "data" 的數(shù)據(jù)結(jié)構(gòu)前面。 這個外加的結(jié)構(gòu) 第一個四字節(jié)是標志,等于 ascii 碼的 "fact",然后第二個四字節(jié)的值在大部分情況下都等于 4, 第三個四字節(jié)的值也是等于 音頻裸數(shù)據(jù)的長度。 基本上就是這樣了。
下面給出的源程序文件只要加進新建的 VC win32工程中,編譯即可,執(zhí)行效果是錄音三秒后自動生成 mytest.wav 文件供播放測試(記得選好默認錄音通道)。
廢話不多說,給出源程序(該源程序中要包含 RunTimeLog.cpp,見http://www.csdn.net/develop/Read_Article.asp?Id=17477) 希望對大家有用。(全文完)
(全文完 - 2003年03月27日_am: 11時27分)
// ******************* FileName: WinMain.cpp *****************************
// 該源程序需要加入到 VC6 的 Win32 Application 的 empty Project 中
// 請包含我自定義的調(diào)試類,見 #include "RunTimeLog.cpp"
// 對于工程的 Link 選項,至少要包含以下庫: msvcrt.lib kernel32.lib user32.lib Winmm.lib
#define WIN32_LEAN_AND_MEAN // Say No to MFC !!
#include <windows.h>
#include <Mmsystem.h>
#include "RunTimeLog.cpp"
RunTimeLog log;
char lpTemp[256]="";
DWORD FCC(LPSTR lpStr)
{
DWORD Number = lpStr[0] + lpStr[1] *0x100 + lpStr[2] *0x10000 + lpStr[3] *0x1000000 ;
return Number;
}
int WINAPI WinMain( HINSTANCE hInstance, HINSTANCE hPrevInstance,
LPSTR lpCmdLine, int nCmdShow )
{
CreateMutex( NULL, false, "MyMutex");
if ( GetLastError() == ERROR_ALREADY_EXISTS )
{ log.write("Exists and Exit"); log.last(); ExitProcess( NULL); }
log.write("Program Start.");
log.nobuff = true;
DWORD datasize = 48000;
// 最常用法
WAVEFORMATEX waveformat;
waveformat.wFormatTag=WAVE_FORMAT_PCM;
waveformat.nChannels=1;
waveformat.nSamplesPerSec=8000;
waveformat.nAvgBytesPerSec=8000;
waveformat.nBlockAlign=1;
waveformat.wBitsPerSample=8; //指定錄音格式
waveformat.cbSize=0;
wsprintf( lpTemp, "WAVEFORMATEX size = %lu", sizeof(WAVEFORMATEX) );
log.write(lpTemp);
HWAVEIN m_hWaveIn;
if ( waveInGetNumDevs() ) log.write("有可以使用的 WaveIn 通道"); else log.write("沒有可以使用的 waveIn 通道");
int res=waveInOpen(&m_hWaveIn,WAVE_MAPPER, &waveformat, (DWORD)NULL,0L,CALLBACK_WINDOW); //打開錄音設(shè)備
if ( res == MMSYSERR_NOERROR ) log.write("打開 waveIn 成功"); // 驗證創(chuàng)建是否成功
else {
wsprintf(lpTemp, "打開 waveIn 通道失敗,Error_Code = 0x%x", res );
log.write(lpTemp);
} // End of 驗證創(chuàng)建是否成功
WAVEHDR m_pWaveHdr;
m_pWaveHdr.lpData = (char *)GlobalLock( GlobalAlloc(GMEM_MOVEABLE GMEM_SHARE, datasize) );
memset(m_pWaveHdr.lpData, 0, datasize );
m_pWaveHdr.dwBufferLength = datasize;
m_pWaveHdr.dwBytesRecorded = 0;
m_pWaveHdr.dwUser = 0;
m_pWaveHdr.dwFlags = 0;
m_pWaveHdr.dwLoops = 0;
wsprintf( lpTemp, "WAVEHDR size = %lu", sizeof(WAVEHDR) );
log.write(lpTemp);
int resPrepare = waveInPrepareHeader( m_hWaveIn, &m_pWaveHdr, sizeof(WAVEHDR) ); //準備內(nèi)存塊錄音
if ( resPrepare == MMSYSERR_NOERROR) log.write("準備錄音用頭文件成功");
else {
wsprintf(lpTemp, "不能開辟錄音頭文件,Error_Code = 0x%03X", resPrepare );
log.write(lpTemp);
} // End of 驗證開辟緩沖
resPrepare = waveInAddBuffer( m_hWaveIn, &m_pWaveHdr, sizeof(WAVEHDR) );
if ( resPrepare == MMSYSERR_NOERROR) log.write("準備錄音用內(nèi)存成功");
else {
wsprintf(lpTemp, "不能開辟錄音用緩沖,Error_Code = 0x%03X", resPrepare );
log.write(lpTemp);
} // End of 驗證開辟緩沖
log.write(""); // 寫入空字符串可以分行
if (! waveInStart(m_hWaveIn) ) log.write("開始錄音"); else log.write("開始錄音失敗");
Sleep(3200);
MMTIME mmt;
mmt.wType = TIME_BYTES;
log.numberwrite( "sizeof(MMTIME) =", sizeof(MMTIME) );
log.numberwrite( "sizeof(UINT) =", sizeof(UINT) );
if ( waveInGetPosition(m_hWaveIn, &mmt, sizeof(MMTIME)) ) log.write("不能取得音頻長度");
else log.numberwrite( "取得現(xiàn)在音頻位置 =", mmt.u.cb );
if (mmt.wType == TIME_BYTES) { log.write("得到的 TIME_BYTES 格式的音頻長度"); }
else log.write("指定的 TIME_BYTES 格式音頻長度不支持");
// if (! waveInStop(m_hWaveIn) ) log.write("停止錄音"); else log.write("停止錄音失敗");
if (! waveInReset(m_hWaveIn) ) log.write("重置內(nèi)存區(qū)成功"); else log.write("重置內(nèi)存區(qū)失敗");
m_pWaveHdr.dwBytesRecorded = mmt.u.cb;
DWORD NumToWrite=0; DWORD dwNumber = 0;
HANDLE FileHandle =
CreateFile( "myTest.wav", GENERIC_WRITE, FILE_SHARE_READ, NULL,
CREATE_ALWAYS, FILE_ATTRIBUTE_NORMAL, NULL);
// memset(m_pWaveHdr.lpData, 0, datasize);
dwNumber = FCC("RIFF");
WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);
dwNumber = m_pWaveHdr.dwBytesRecorded + 18 + 20;
WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);
dwNumber = FCC("WAVE");
WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);
dwNumber = FCC("fmt ");
WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);
dwNumber = 18L;
WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);
WriteFile(FileHandle, &waveformat, sizeof(WAVEFORMATEX), &NumToWrite, NULL);
dwNumber = FCC("data");
WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);
dwNumber = m_pWaveHdr.dwBytesRecorded;
WriteFile(FileHandle, &dwNumber, 4, &NumToWrite, NULL);
WriteFile(FileHandle, m_pWaveHdr.lpData, m_pWaveHdr.dwBytesRecorded, &NumToWrite, NULL);
SetEndOfFile(FileHandle);
CloseHandle( FileHandle ); FileHandle = INVALID_HANDLE_VALUE; // 收尾關(guān)閉句柄
log.write("應該已生成 myTest.wav 文件");
if ( waveInUnprepareHeader(m_hWaveIn, &m_pWaveHdr, sizeof(WAVEHDR)) ) log.write("Un_Prepare Header 失敗"); else log.write("Un_Prepare Header 成功");
if ( GlobalFree(GlobalHandle( m_pWaveHdr.lpData )) ) log.write("Global Free 失敗"); else log.write("Global Free 成功");
if (res == MMSYSERR_NOERROR ) //關(guān)閉錄音設(shè)備
if (waveInClose(m_hWaveIn)==MMSYSERR_NOERROR)log.write("正常關(guān)閉錄音設(shè)備");
else log.write("非正常關(guān)閉錄音設(shè)備");
log.last(true);
// ExitProcess(0);
return 0;
}
// ******************* End of File *****************************