目前市場上面語音芯片細(xì)分的類目有很多,比如說經(jīng)典的OTP語音芯片,還有FLASH語音芯片,還有離線語音識別芯片,TTS文字轉(zhuǎn)語音合成芯片,還有MP3芯片,AI對話芯片等,沒有接觸過語音芯片的工程師有時候就會比較懵,因為需要花費不少時間來了解這些芯片,在了解以后再確定選擇什么類型的語音芯片,下面小編就帶大家來了解一下語音芯片的選型問題。

OTP語音芯片
OTP顧名思義就是一次性寫入語音內(nèi)容,如果你的產(chǎn)品語音需求都是固定不變的,并且內(nèi)容也不多,只需要幾個固定的語音片段,那么選OTP就沒錯,因為otp語音芯片就是為這類型產(chǎn)品開發(fā)的。OTP的優(yōu)勢是無法篡改,缺點也是無法篡改~。目前唯創(chuàng)知音的WTN6系列可以提供20秒-170秒之間的語音內(nèi)容,支持一線/二線通信接口和DAC/PWM的音頻輸出,6-32K的采樣率,SOP8封裝。
FLASH語音芯片
其實就是采用集成了FLASH儲存的語音芯片,可以反復(fù)擦寫語音內(nèi)容,也就是可以通過上位機(jī)等方式來修改語音內(nèi)容,如果您的語音內(nèi)容比較多還有修改和音質(zhì)上的需求,那么選擇FLASH語音芯片就沒錯。唯創(chuàng)知音的WT588F系列支持170秒到6400秒語音時長,有不同的儲存版本和通信接口能夠支持UART通信,有sop8和sop16腳封裝。
TTS文字轉(zhuǎn)語音合成芯片
這類型的語音芯片主要是面向語音播報多元化的產(chǎn)品,以收銀機(jī)為例,可能會有各種各樣的語音播報需求,從0.5元到幾百元上千元上萬元甚至幾十萬元上百萬元不等,在實際操作中我們不能提前錄制好這么多的語音放置進(jìn)去,所以這種就會采用TTS語音芯片或者模塊來實現(xiàn)文字轉(zhuǎn)語音播報,只需要MCU給出收款一元,TTS就可以播報收款一元。這個類型的芯片或者模塊適合有動態(tài)語音播報需求的產(chǎn)品,由MCU輸出需要播報的內(nèi)容,然后TTS把文字合成為語音。唯創(chuàng)知音的TTS文字轉(zhuǎn)語音模塊WT3000Tx和WT3000Ax,支持16bit
ADC/DAC SNR≥95db,支持SPI/PWM/UART/IIC/ADC/IO/INT 工作電壓2.6-5.55v -40°-85°寬溫。
AI語音交互芯片
這類型的芯片主要是為產(chǎn)品提供AI對話的功能的,可以廣泛應(yīng)用于各種需要AI對話的產(chǎn)品上,分為離線版本和在線版本。目前主要采用還是在線AI語音交互版本居多,因為離線版本因為受限于成本,效果還是不如在線版本的,唯創(chuàng)知音的離在線AI語音交互芯片WT2606A,采用流式傳輸,語音延遲低,支持雙麥克風(fēng)陣列拾音更清晰,支持接入主流大模型,廣泛應(yīng)用于各種需要AI對話的產(chǎn)品當(dāng)中。
離線語音識別芯片
這類型語音芯片可以簡單理解成語音遙控器,因為以前傳統(tǒng)的產(chǎn)品是通過遙控器或者按鍵控制的形式來做的,但是離線語音識別芯片可以做成語音控制產(chǎn)品,所以我說可以理解成語音遙控器。唯創(chuàng)知音的WTK6900系列,支持最低20條到最高300條的離線指令,還支持自學(xué)習(xí)。
MP3/WAV音頻流解碼芯片
這類型產(chǎn)品是用來提升語音品質(zhì)的,采用流式解碼邊放邊播,適合一些本身帶有音頻功能的MCU但是需要提升音質(zhì)需求或者降低MCU負(fù)載的情況下就可以使用這種音頻流式解碼芯片來負(fù)責(zé)解碼和播放功能。唯創(chuàng)知音的WTV380C-8S提供流式解碼的功能同時集成了一顆D類功放芯片,可以實現(xiàn)邊解碼邊播放語音的功能,還能夠?qū)崿F(xiàn)邊放邊錄,把需要播放的語音儲存下載,下次需要播放的時候可以直接播放。
以上就是關(guān)于語音芯片大需求方向上的選項,如果需要深入去選具體的儲存容量,音質(zhì)需求,功耗需求,功能需求等可以和相關(guān)的語音芯片廠家提供相關(guān)的需求,廠家工程師會協(xié)助選型和報價降低自己的工作量。