遼寧語(yǔ)音識(shí)別學(xué)習(xí)

來(lái)源：發(fā)布時(shí)間：2024-01-13

中國(guó)科學(xué)院聲學(xué)所成為國(guó)內(nèi)shou個(gè)開(kāi)始研究計(jì)算機(jī)語(yǔ)音識(shí)別的機(jī)構(gòu)。受限于當(dāng)時(shí)的研究條件，我國(guó)的語(yǔ)音識(shí)別研究在這個(gè)階段一直進(jìn)展緩慢。放開(kāi)以后，隨著計(jì)算機(jī)應(yīng)用技術(shù)和信號(hào)處理技術(shù)在我國(guó)的普及，越來(lái)越多的國(guó)內(nèi)單位和機(jī)構(gòu)具備了語(yǔ)音研究的成熟條件。而就在此時(shí)，外國(guó)的語(yǔ)音識(shí)別研究取得了較大的突破性進(jìn)展，語(yǔ)音識(shí)別成為科技浪潮的前沿，得到了迅猛的發(fā)展，這推動(dòng)了包括中科院聲學(xué)所、中科院自動(dòng)化所、清華大學(xué)、中國(guó)科技大學(xué)、哈爾濱工業(yè)大學(xué)、上海交通大學(xué)、西北工業(yè)大學(xué)、廈門(mén)大學(xué)等許多國(guó)內(nèi)科研機(jī)構(gòu)和高等院校投身到語(yǔ)音識(shí)別的相關(guān)研究當(dāng)中。大多數(shù)的研究者將研究重點(diǎn)聚焦在語(yǔ)音識(shí)別基礎(chǔ)理論研究和模型、算法的研究改進(jìn)上。1986年3月，我國(guó)的"863"計(jì)劃正式啟動(dòng)。"863"計(jì)劃即國(guó)家高技術(shù)研究發(fā)展計(jì)劃，是我國(guó)的一項(xiàng)高科技發(fā)展計(jì)劃。作為計(jì)算機(jī)系統(tǒng)和智能科學(xué)領(lǐng)域的一個(gè)重要分支。語(yǔ)音識(shí)別在該計(jì)劃中被列為一個(gè)專項(xiàng)研究課題。隨后，我國(guó)展開(kāi)了系統(tǒng)性的針對(duì)語(yǔ)音識(shí)別技術(shù)的研究。因此，對(duì)于我國(guó)國(guó)內(nèi)的語(yǔ)音識(shí)別行業(yè)來(lái)說(shuō)，"863"計(jì)劃是一個(gè)里程碑，它標(biāo)志著我國(guó)的語(yǔ)音識(shí)別技術(shù)進(jìn)入了一個(gè)嶄新的發(fā)展階段。但是由于研究起步晚、基礎(chǔ)薄弱、硬件條件和計(jì)算能力有限。舌頭部位不同可以發(fā)出多種音調(diào)，組合變化多端的輔音，可產(chǎn)生大量的、相似的發(fā)音，這對(duì)語(yǔ)音識(shí)別提出了挑戰(zhàn)。遼寧語(yǔ)音識(shí)別學(xué)習(xí)

語(yǔ)音識(shí)別包括兩個(gè)階段:訓(xùn)練和識(shí)別。不管是訓(xùn)練還是識(shí)別，都必須對(duì)輸入語(yǔ)音預(yù)處理和特征提取。訓(xùn)練階段所做的具體工作是收集大量的語(yǔ)音語(yǔ)料，經(jīng)過(guò)預(yù)處理和特征提取后得到特征矢量參數(shù)，通過(guò)特征建模達(dá)到建立訓(xùn)練語(yǔ)音的參考模型庫(kù)的目的。而識(shí)別階段所做的主要工作是將輸入語(yǔ)音的特征矢量參數(shù)和參考模型庫(kù)中的參考模型進(jìn)行相似性度量比較，然后把相似性高的輸入特征矢量作為識(shí)別結(jié)果輸出。這樣，終就達(dá)到了語(yǔ)音識(shí)別的目的。語(yǔ)音識(shí)別的基本原理是現(xiàn)有的識(shí)別技術(shù)按照識(shí)別對(duì)象可以分為特定人識(shí)別和非特定人識(shí)別。特定人識(shí)別是指識(shí)別對(duì)象為專門(mén)的人，非特定人識(shí)別是指識(shí)別對(duì)象是針對(duì)大多數(shù)用戶，一般需要采集多個(gè)人的語(yǔ)音進(jìn)行錄音和訓(xùn)練，經(jīng)過(guò)學(xué)習(xí)，達(dá)到較高的識(shí)別率。基于現(xiàn)有技術(shù)開(kāi)發(fā)嵌入式語(yǔ)音交互系統(tǒng)，目前主要有兩種方式:一種是直接在嵌入式處理器中調(diào)用語(yǔ)音開(kāi)發(fā)包;另一種是嵌入式處理器外擴(kuò)展語(yǔ)音芯片。第一種方法程序量大，計(jì)算復(fù)雜，需要占用大量的處理器資源，開(kāi)發(fā)周期長(zhǎng);第二種方法相對(duì)簡(jiǎn)單，只需要關(guān)注語(yǔ)音芯片的接口部分與微處理器相連，結(jié)構(gòu)簡(jiǎn)單，搭建方便，微處理器的計(jì)算負(fù)擔(dān)降低，增強(qiáng)了可靠性，縮短了開(kāi)發(fā)周期。本文的語(yǔ)音識(shí)別模塊是以嵌入式微處理器為說(shuō)明。遼寧語(yǔ)音識(shí)別學(xué)習(xí)語(yǔ)言建模也用于許多其他自然語(yǔ)言處理應(yīng)用，如文檔分類或統(tǒng)計(jì)機(jī)器翻譯。

作為人機(jī)交互領(lǐng)域重要的研究對(duì)象，語(yǔ)音識(shí)別技術(shù)已經(jīng)成為信息社會(huì)不可或缺的組成部分。目前基于在線引擎和語(yǔ)音芯片實(shí)現(xiàn)的語(yǔ)音技術(shù)方案，其適用性和使用成本均限制了技術(shù)的應(yīng)用和推廣。通過(guò)對(duì)離線語(yǔ)音識(shí)別引擎的研究，結(jié)合特定領(lǐng)域內(nèi)的應(yīng)用特點(diǎn)，提出一套適用性強(qiáng)，成本較低的語(yǔ)音識(shí)別解決方案，可以在離線的網(wǎng)絡(luò)環(huán)境中，實(shí)現(xiàn)非特定人的連續(xù)語(yǔ)音識(shí)別功能。根據(jù)本方案設(shè)計(jì)語(yǔ)音撥號(hào)軟件，并對(duì)語(yǔ)音撥號(hào)軟件的功能進(jìn)行科學(xué)的測(cè)試驗(yàn)證。語(yǔ)音識(shí)別技術(shù)，又稱為自動(dòng)語(yǔ)音識(shí)別（AutomaticSpeechRecognition，ASR），它是以語(yǔ)音為研究對(duì)象，通過(guò)語(yǔ)音信號(hào)處理和模式識(shí)別讓機(jī)器理解人類語(yǔ)言，并將其轉(zhuǎn)換為計(jì)算機(jī)可輸入的數(shù)字信號(hào)的一門(mén)技術(shù)。語(yǔ)音識(shí)別技術(shù)將繁瑣的輸入勞動(dòng)交給機(jī)器處理，在解放人類雙手的同時(shí)，還可以有效提高人機(jī)交互效率，信息化高度發(fā)達(dá)，已經(jīng)成為信息社會(huì)不可或缺的組成部分。語(yǔ)音識(shí)別引擎是ASR技術(shù)的**模塊，它可以工作在識(shí)別模式和命令模式。在識(shí)別模式下，引擎系統(tǒng)在后臺(tái)提供詞庫(kù)和識(shí)別模板，用戶無(wú)需對(duì)識(shí)別語(yǔ)法進(jìn)行改動(dòng)，根據(jù)引擎提供的語(yǔ)法模式即可完成既定的人機(jī)交互操作；但在命令模式下，用戶需要構(gòu)建自己的語(yǔ)法詞典，引擎系統(tǒng)根據(jù)用戶構(gòu)建的語(yǔ)法詞典。

技術(shù)和產(chǎn)業(yè)之間形成了比較好的正向迭代效應(yīng)，落地場(chǎng)景越多，得到的真實(shí)數(shù)據(jù)越多，挖掘的用戶需求也更準(zhǔn)確，這幫助了語(yǔ)音識(shí)別技術(shù)快速進(jìn)步，也基本滿足了產(chǎn)業(yè)需求，解決了很多實(shí)際問(wèn)題，這也是語(yǔ)音識(shí)別相對(duì)其他AI技術(shù)為明顯的優(yōu)勢(shì)。不過(guò)，我們也要看到，語(yǔ)音識(shí)別的內(nèi)涵必須不斷擴(kuò)展，狹義語(yǔ)音識(shí)別必須走向廣義語(yǔ)音識(shí)別，致力于讓機(jī)器聽(tīng)懂人類語(yǔ)言，這才能將語(yǔ)音識(shí)別研究帶到更高維度。我們相信，多技術(shù)、多學(xué)科、多傳感的融合化將是未來(lái)人工智能發(fā)展的主流趨勢(shì)。在這種趨勢(shì)下，我們還有很多未來(lái)的問(wèn)題需要探討，比如鍵盤(pán)、鼠標(biāo)、觸摸屏和語(yǔ)音交互的關(guān)系怎么變化？搜索、電商、社交是否再次重構(gòu)？硬件是否逆襲變得比軟件更加重要？產(chǎn)業(yè)鏈中的傳感、芯片、操作系統(tǒng)、產(chǎn)品和內(nèi)容廠商之間的關(guān)系又該如何變化？需要對(duì)發(fā)生在數(shù)千個(gè)離散時(shí)間步驟前的事件進(jìn)行記憶，這對(duì)語(yǔ)音識(shí)別很重要。

隨著語(yǔ)音識(shí)別技術(shù)的不斷發(fā)展和進(jìn)步，也應(yīng)用到越來(lái)越多的產(chǎn)品跟領(lǐng)域中。它們都少不了語(yǔ)音識(shí)別芯片、語(yǔ)音識(shí)別模塊的支持。那么市面上有哪些語(yǔ)音識(shí)別模塊好用呢？哪些領(lǐng)域又運(yùn)用到語(yǔ)音識(shí)別技術(shù)呢？語(yǔ)音識(shí)別模塊具有語(yǔ)音識(shí)別及播報(bào)功能，需要掛spl-Flash，存儲(chǔ)詞條或者語(yǔ)音播放內(nèi)容。還具備有工業(yè)級(jí)性能，同時(shí)還具有識(shí)別率高、簡(jiǎn)單易用、更新詞條方便等優(yōu)勢(shì)。語(yǔ)音識(shí)別模塊被廣泛應(yīng)用在AI人工智能產(chǎn)品、智能家居遙控、智能玩具等多種領(lǐng)域上。語(yǔ)音識(shí)別技術(shù)應(yīng)用領(lǐng)域有哪些語(yǔ)音識(shí)別技術(shù)的應(yīng)用領(lǐng)域：智能家電遙控如今很多家電都已經(jīng)智能化了，用一個(gè)小小的遙控器就可以把家里所有的電器用語(yǔ)音操控起來(lái)，比如客廳的電視、空調(diào)、窗簾等。以前要一個(gè)個(gè)遙控器換著操控，如今只需要結(jié)合到一個(gè)遙控器就可以讓這些操作輕松實(shí)現(xiàn)。語(yǔ)音識(shí)別技術(shù)的應(yīng)用領(lǐng)域：智能玩具語(yǔ)音識(shí)別技術(shù)的智能化也讓玩具行業(yè)進(jìn)行了變革，越來(lái)越多的智能玩具被研發(fā)出來(lái)，比如智能語(yǔ)音娃娃、智能語(yǔ)音兒童機(jī)器人。語(yǔ)音識(shí)別還不能解決無(wú)限制場(chǎng)景、無(wú)限制人群通用識(shí)別問(wèn)題，但是已在各個(gè)真實(shí)場(chǎng)景中普遍應(yīng)用并得到規(guī)模驗(yàn)證。海南c語(yǔ)音識(shí)別

實(shí)時(shí)語(yǔ)音識(shí)別基于DeepPeak2的端到端建模，將音頻流實(shí)時(shí)識(shí)別為文字，并返回每句話的開(kāi)始和結(jié)束時(shí)間。遼寧語(yǔ)音識(shí)別學(xué)習(xí)

用來(lái)描述雙重隨機(jī)過(guò)程。HMM有算法成熟、效率高、易于訓(xùn)練等優(yōu)點(diǎn)，被***應(yīng)用于語(yǔ)音識(shí)別、手寫(xiě)字識(shí)別和天氣預(yù)報(bào)等多個(gè)領(lǐng)域，目前仍然是語(yǔ)音識(shí)別中的主流技術(shù)。HMM包含S1、S2、S3、S4和S55個(gè)狀態(tài)，每個(gè)狀態(tài)對(duì)應(yīng)多幀觀察值，這些觀察值是特征序列(o1、o2、o3、o4,...,oT)，沿時(shí)刻t遞增，多樣化而且不局限取值范圍，因此其概率分布不是離散的，而是連續(xù)的。自然界中的很多信號(hào)可用高斯分布表示，包括語(yǔ)音信號(hào)。由于不同人發(fā)音會(huì)存在較大差異，具體表現(xiàn)是，每個(gè)狀態(tài)對(duì)應(yīng)的觀察值序列呈現(xiàn)多樣化，單純用一個(gè)高斯函數(shù)來(lái)刻畫(huà)其分布往往不夠，因此更多的是采用多高斯組合的GMM來(lái)表征更復(fù)雜的分布。這種用GMM作為HMM狀態(tài)產(chǎn)生觀察值的概率密度函數(shù)(pdf)的模型就是GMM-HMM，每個(gè)狀態(tài)對(duì)應(yīng)的GMM由2個(gè)高斯函數(shù)組合而成。其能夠?qū)?fù)雜的語(yǔ)音變化情況進(jìn)行建模。把GMM-HMM的GMM用DNN替代，HMM的轉(zhuǎn)移概率和初始狀態(tài)概率保持不變。把GMM-HMM的GMM用DNN替代DNN的輸出節(jié)點(diǎn)與所有HMM(包括"a"、"o"等音素)的發(fā)射狀態(tài)一一對(duì)應(yīng)，因此可通過(guò)DNN的輸出得到每個(gè)狀態(tài)的觀察值概率。DNN-HMM4.端到端從2015年，端到端模型開(kāi)始流行，并被應(yīng)用于語(yǔ)音識(shí)別領(lǐng)域。遼寧語(yǔ)音識(shí)別學(xué)習(xí)

標(biāo)簽：麥克風(fēng)陣列語(yǔ)音識(shí)別 USB聲卡降噪聲學(xué)回聲

上一篇 江蘇數(shù)字語(yǔ)音關(guān)鍵事件檢測(cè)哪里買(mǎi)

下一篇： 北京新一代語(yǔ)音關(guān)鍵事件檢測(cè)設(shè)計(jì)

遼寧語(yǔ)音識(shí)別學(xué)習(xí)

可能感興趣的產(chǎn)品:

可能感興趣的廠家:

可能感興趣的關(guān)鍵詞: