


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
語音識別芯片綜述
作為一項高度語音的高科技語言識別技術(shù),語音識別在各個領(lǐng)域得到了廣泛應(yīng)用和應(yīng)用。許多外國制造商正在生產(chǎn)一種基于不同用途的識別算法和外圍硬件的聲音識別芯片。一些中國研究機(jī)構(gòu)也正在開發(fā)中。用戶可以直接使用集成的芯片來構(gòu)建自己的聲音識別系統(tǒng),從而節(jié)省成本,提高可靠性。目前國內(nèi)語音識別應(yīng)用的方案中,常見的芯片有以下幾種:SensoryRSC-x是美國Sensory公司生產(chǎn)的集語音綜合與識別于一體的系列語音芯片,主要有RSC-164、RSC-264/200、RSC-364/300;KinstarEK5221是臺灣KingStar公司生產(chǎn)的一款語音識別芯片;GrossFieldHL7003是臺灣GrossField公司生產(chǎn)的一款語音識別芯片,三者都具有語音識別功能,比較而言,SensoryRSC-x系列語音芯片功能較為全面,KinstarEK5221與GrossFieldHL7003功能相當(dāng),屬同一層面。對比其各自性能如下:1語音識別芯片1)SensoryRSC-x系列語音識別芯片不僅具有語音識別功能,還具有語音綜合功能,RSC-x能識別最終用戶的語音命令,并能為最終用戶提供友好的提示音界面,或進(jìn)行交互式對話;KinstarEK5221與GrossFieldHL7003只具備語音識別功能,無語音綜合功能。2)SensoryRSC-x系列語音識別芯片支持SD(SpeakerDependent)、SI(SpeakerIndependent)、SV(SpeakerVerification)3種基本語音識別模式,同時還支持由此3種基本模式所演變而來的DRT、CLSD、CLSI、WordSpot等多種語音識別模式;KinstarEK5221與GrossFieldHL7003只支持SD一種語音識別模式。3)SensoryRSC-x系列語音識別芯片在SD模式下識別精度達(dá)99%;KinstarEK5221與GrossFieldHL7003在85%-95%左右。4)SensoryRSC-x系列語音識別芯片具有RP(RecordandPlay)、Music合成,以及發(fā)DTMF撥號音等功能;KinstarEK5221與GrossFieldHL7003不具備上述功能。5)SensoryRSC-x可片外擴(kuò)展SRAM、FLASH或SerialE2PROM作為數(shù)據(jù)存儲器;KinstarEK5221能片外擴(kuò)展SRAM;GrossFieldHL7003只有片上SRAM,不能片外擴(kuò)展。2k病毒以及kistorekmintit設(shè)計SensoryRSC-x、KinstarEK5221與GrossFieldHL7003由于性能的不同而使各自應(yīng)用上有所差別。1)SensoryRSC-x系列語音識別芯片功能較為全面,所以應(yīng)用范圍較廣,可用于家用電器、通訊產(chǎn)品、門禁系統(tǒng)、玩具及各種消費類電子產(chǎn)品;KinstarEK5221與GrossFieldHL7003則多用于玩具類產(chǎn)品。2)在設(shè)計開發(fā)上,SensoryRSC-x系列語音識別芯片需要用戶編程,前期開發(fā)的工作量較大;KinstarEK5221與GrossFieldHL7003無需用戶編程,開發(fā)較為簡單。另外,KinstarEK5221可用于獨立模式或受控模式,GrossFieldHL7003只能用于受控模式。SensoryRSC-x系列語音識別芯片應(yīng)用方式更為靈活,可根據(jù)不同應(yīng)用選用不同的語音識別方式或?qū)⒍喾N語音識別方式綜合應(yīng)用,可加之以豐富的提示音,并可選用不同款式和大小的片外存儲器,設(shè)置適合不同產(chǎn)品要求的語音識別門限等等;相對而言,KinstarEK5221與GrossFieldHL7003的應(yīng)用方式較為單一。KinstarEK5221在獨立模式下,只能用片內(nèi)SRAM,最多可存儲10個1秒時間長度的語音命令。在受控模式下,可用片內(nèi)SRAM,亦可用片外SRAM,若用片外SRAM時,可存儲多達(dá)90個1s時間長度的語音命令;GrossFieldHL7003只能用片內(nèi)SRAM,最多可存儲12個1.5s時間長度的語音命令。3)SensoryRSC-x、KinstarEK5221與GrossFieldHL70033者都內(nèi)置了麥克風(fēng)前置放大及模數(shù)轉(zhuǎn)換電路,所需外圍元器件都較少。SensoryRSC-x系列語音識別芯片用于SI語音識別模式時,無需外接數(shù)據(jù)存儲器,而在用于SD或SV語音識別模式時,通常需外接SerialE2PROM或FLASH(RSC-200/264片內(nèi)SRAM只能存儲一個2.5s時間長的語音命令,RSC-300/364片內(nèi)SRAM能最多存儲6個2.5s時間長的語音命令)。另外,SensoryRSC-x系列語音識別芯片需用戶編程,小批量生產(chǎn)需外接一個ROM來存儲程序(大批量生產(chǎn)則可以將程序掩膜進(jìn)片上MASKROM中),而SensoryRSC-X系列語音芯片本身價格略高,故總的應(yīng)用成本較高。KinstarEK5221工作于獨立模式時,只需一些外接電容、電阻,是較低成本的應(yīng)用方式;工作于受控模式時,需外接Micro-Controller,語音命令多于10n需片外SRAM,故需加一顆防掉電電池保持?jǐn)?shù)據(jù);GrossFieldHL7003只能工作于受控模式下,需外接Micro-Controller,同樣需加一顆防掉電電池保持?jǐn)?shù)據(jù)??梢?SensoryRSC-x系列語音識別芯片性能優(yōu)異、應(yīng)用范圍廣泛但應(yīng)用成本相對較高、KinstarEK5221與GrossFieldHL7003屬于大眾型芯片,功能較為單一但相對應(yīng)用成本較低,在玩具等領(lǐng)域應(yīng)用較廣,用戶可根據(jù)不同的需要選用不同的芯片構(gòu)造自己的語音識別系統(tǒng)。下面介紹運用1999年底臺灣微晶公司設(shè)計開發(fā)的一款語音識別芯片Vp-2的設(shè)計應(yīng)用情況。這款芯片在國內(nèi)較為少見,其功能大體與KinstarEK5221相當(dāng),但只工作于外接Micro-Controller的模式下。我們用Inter的CMOS8051作為CPU,外接液晶顯示器,設(shè)計了一款語音計算器,其線路框圖所示。如圖1所示,片外的數(shù)據(jù)存儲器E2PROM在8051上擴(kuò)展,8位的液晶體顯示器以串行通訊方式與8051相連,主CPU上的P1口線P1.0-P1.6作為數(shù)據(jù)線直接與Vp-2連接,進(jìn)行控制命令與識別結(jié)果的數(shù)據(jù)交換。由于Vp-2芯片本身不具備語音合成的綜合語音功能,只能在片外搭接語音提示電路,但成本會大大增加,因此,直接用Vp-2片上的識別結(jié)果指示LED并結(jié)合主CPU收到的識別結(jié)果反饋信息,利用LED1與LED2對識別的結(jié)果進(jìn)行指示。Vp-2可通過upload與download方式,以每次最大20個時間長度為1.5s的經(jīng)過訓(xùn)練的字句為限,對其識別內(nèi)存進(jìn)行上載和下載的操作。在本例設(shè)計中,主程序控制芯片對使用者0-9共9個數(shù)字以及加上、減去、乘以、除以、點、等于等等的讀音語句
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 員工培訓(xùn)計劃與資源模板
- 多項目管理統(tǒng)籌的標(biāo)準(zhǔn)化流程
- 2025內(nèi)蒙古鄂溫克族自治旗融媒體中心多元化崗位招聘2人考前自測高頻考點模擬試題及答案詳解(新)
- 改編音樂的考試題及答案
- 醫(yī)師衛(wèi)生職稱考試試題及答案
- 2025福建省市場監(jiān)督管理局直屬事業(yè)單位招聘高層次人才20人考前自測高頻考點模擬試題及答案詳解(典優(yōu))
- 2025年北京高教崗前培訓(xùn)考試題及參考答案
- 2025年保育員鑒定題庫及答案
- 守秘義務(wù)與信息安全保障保證承諾書9篇
- 項目成本分析與控制工具包
- 孕產(chǎn)婦全程保健指南
- 航空理論教學(xué)課件
- 【MOOC答案】《VLSI設(shè)計基礎(chǔ)(數(shù)字集成電路設(shè)計基礎(chǔ))》(東南大學(xué))章節(jié)作業(yè)慕課答案
- 中國兒童食管狹窄診治專家共識解讀 2
- 注塑質(zhì)量管理辦法
- 數(shù)字治理培訓(xùn)課件
- 軍品配套項目管理辦法
- TCSF00782023森林草原消防無人機(jī)巡護(hù)作業(yè)技術(shù)規(guī)程
- DB62∕T 4964-2024 地質(zhì)災(zāi)害精細(xì)調(diào)查技術(shù)規(guī)范
- 2025年七一黨課-作風(fēng)建設(shè)永遠(yuǎn)在路上學(xué)習(xí)教育黨課
- 2025年《互聯(lián)網(wǎng)銷售》課程標(biāo)準(zhǔn)
評論
0/150
提交評論