河南語音關鍵事件檢測設計

來源: 發布時間:2024-01-08

    存儲器通過通信總線完成相互間的通信;存儲器,用于存放計算機程序;處理器,用于執行存儲器上所存放的程序時,實現上述方面提供的一種事件檢測方法中的任一方法步驟。第四方面,本發明實施例提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執行時實現上述方面提供的一種事件檢測方法中的任一方法步驟。以上可見,應用本發明實施例提供的方案,實時獲取目標防護艙的圖像,并判斷當前時刻所采集到的當前幀圖像是否包括目標對象,由于目標對象為:能夠表征用戶進入目標防護艙的用戶身體部位,則可以基于當前幀圖像判斷當前時刻是否有用戶進入目標防護艙。則當判斷結果為是時,便可以基于當前幀圖像,確定待分析圖像,進而將該待分析圖像輸入到預設的檢測模型中,得到當前時刻,關于目標語音關鍵事件檢測防護艙的事件檢測結果。這樣,由于檢測模型是基于各個樣本圖像和各個樣本圖像的事件檢測結果所訓練得到的模型,因此,檢測模型充分學習了樣本圖像和事件檢測結果之間的對應關系?;诖耍诒景l明實施例中,利用采集到的真實圖像來確定待分析圖像,利用訓練好的檢測模型對待分析圖像進行檢測。語音關鍵事件檢測在線咨詢魚亮科技!歡迎來電咨詢!河南語音關鍵事件檢測設計

    將w2與w4進行橫向拼接得到終的語義表示w3,w3的維度可以為[n,2*d1]。在本申請的示例性實施例中,自注意力機制計算具體可以包括:將w2分別進行多次(如三次)線性變換得到w21、w22、w23,然后可以執行矩陣相乘運算得到w4=(w22*w23t)*w21,w3=w2||w4。s105、對所述新的語義表示w3進行span分類,確定每個span是否為一個事件的觸發詞或事件主體。在本申請的示例性實施例中,所述對所述新的語義表示w3進行span分類可以包括:使用兩層全連接神經網絡和softmax層對每個span進行分類;其中,在訓練階段,將分類結果與帶有標記的span進行誤差計算和反向傳播。在本申請的示例性實施例中,得到步驟s104的span的表示w3后,可以使用兩層全連接神經網絡和softmax層對span進行分類。在本申請的示例性實施例中,如果如步驟s101中所述,預先對數據進行了預處理,即預先對數據進行了span分類和標記,則在訓練階段,可以將分類結果與預處理過程所得的帶有標記的span進行誤差計算和反向傳播,并進行參數更新操作完成訓練過程。在本申請的示例性實施例中,在預測階段,根據分類的結果即可得到每個span的類型。softmax的輸出是每個span所屬對應類型(預處理過程獲得的帶類型標記的span)的概率。安徽信息化語音關鍵事件檢測介紹在語音合成中,語音關鍵事件檢測可以用于提取和合成特定情感或風格的語音片段。

    上文中所公開方法中的全部或某些步驟、系統、裝置中的功能模塊/單元可以被實施為軟件、固件、硬件及其適當的組合。在硬件實施方式中,在以上描述中提及的功能模塊/單元之間的劃分不一定對應于物理組件的劃分;例如,一個物理組件可以具有多個功能,或者一個功能或步驟可以由若干物理組件合作執行。某些組件或所有組件可以被實施為由處理器,如數字信號處理器或微處理器執行的軟件,或者被實施為硬件,或者被實施為集成電路,如集成電路。這樣的軟件可以分布在計算機可讀介質上,計算機可讀介質可以包括計算機存儲介質(或非暫時性介質)和通信介質(或暫時性介質)。如本領域普通技術人員公知的,術語計算機存儲介質包括在用于存儲信息(諸如計算機可讀指令、數據結構、程序模塊或其他數據)的任何方法或技術中實施的易失性和非易失性、可移除和不可移除介質。計算機存儲介質包括但不限于ram、rom、eeprom、閃存或其他存儲器技術、cd-rom、數字多功能盤(dvd)或其他光盤存儲、磁盒、磁帶、磁盤存儲或其他磁存儲裝置、或者可以用于存儲期望的信息并且可以被計算機訪問的任何其他的介質。此外,本領域普通技術人員公知的是。

    缺點在于:首先處理繁瑣,其次這些工具在處理的過程中本身具有一定的誤差,因此在后續建模分析的過程中會存在誤差累積的問題。3、基于序列標注的一系列模型很難解決事件主體存在交叉的情況,比如“北京的法院”為一個事件主體(機構),但是“北京”本身也是一種主體/實體(地名)。技術實現要素:本申請提供了一種事件檢測方法和裝置,能夠獲取更加有用的信息,具有較強的實際應用價值;在數據處理和建模的過程中操作簡單,避免了因使用自然語言處理工具而導致的誤差累積的問題;通過劃分span的方式,完美解決了序列標注存在的問題,效率更高,適用性更強。本申請提供了一種事件檢測方法,所述方法可以包括:獲得語句的向量化語義表示w1;對所述向量化語義表示w1進行span劃分,得到多個語義片段;對多個語義片段進行平均池化,得到每個span的表示w2;使用自注意力機制對獲得的每個span的表示w2進行計算,得到每個span的新的語義表示w3;對所述新的語義表示w3進行span分類,確定每個span是否為一個事件的觸發詞或事件主體。在本申請的示例性實施例中,所述獲得語句的向量化語義表示w1可以包括:通過雙向lstm網絡模型或bert模型獲得語句的向量化語義表示w1。語音關鍵事件檢測在音頻編輯和音頻處理領域也有應用,如自動剪輯音頻中的特定部分或去除背景噪音等。

    并判斷當前時刻所采集到的當前幀圖像是否包括目標對象,由于目標對象為:能夠表征用戶進入目標防護艙的用戶身體部位,則可以基于當前幀圖像判斷當前時刻是否有用戶進入目標防護艙。則當判斷結果為是時,便可以基于當前幀圖像,確定待分析圖像,進而將該待分析圖像輸入到預設的檢測模型中,得到當前時刻,關于目標防護艙的事件檢測結果。這樣,由于檢測模型是基于各個樣本圖像和各個樣本圖像的事件檢測結果所訓練得到的模型,因此,檢測模型充分學習了樣本圖像和事件檢測結果之間的對應關系?;诖?,在本發明實施例中,利用采集到的真實圖像來確定待分析圖像,利用訓練好的檢測模型對待分析圖像進行檢測,便可以提高關于目標防護艙的事件檢測結果的準確率。而上述事件檢測結果中可以包括目標防護艙內所發生的事件類型,從而可以提高對防護艙內用戶出現異常事件的檢測準確率。需要說明的是,由于電子設備可以實時對目標防護艙內部發生的異常事件進行檢測,則在上述本發明實施例提供的一種事件檢測方法中,電子設備對實時獲取的每一關于目標防護艙的圖像后,判斷該圖像是否包括目標對象,并在判斷結果為是時,執行后續步驟s303-s304。然而,可以理解的,在某些時刻。隨著深度學習技術的不斷發展,語音關鍵事件檢測的準確性和實時性將得到進一步提高。江西光纖數據語音關鍵事件檢測介紹

語音關鍵事件檢測是未來語音識別和智能交互領域的重要研究方向之一。河南語音關鍵事件檢測設計

    本發明涉及語音關鍵事件檢測技術,特別是涉及一種事件語音關鍵事件檢測。背景技術:當前,很多銀行通過設置語音關鍵事件檢測防護艙來為用戶提供更便捷的金融服務。所謂防護艙,是一種離行式或在行式的智能化金融服務設施,其具有完善的結構設計,可以實現智能化控制和遠程監控,保障內部atm(automatictellermachine,自動柜員機)及其它金融服務設備全天候安全、以及可靠地運行。其中,離行式是指設置在銀行營業網點之外的地方,例如,住宅小區、校園、地鐵站等公共場所;在行式是指設置在銀行營業網點中??梢岳斫獾?,當用戶進入語音關鍵事件檢測防護艙進行金融活動時,有些時候會出現倒地、劇烈運動、破壞設備等異常事件,例如,老人突然身體不適暈倒、有人搶奪用戶的銀行卡、有人惡意破壞設備等情況。為了保障用戶的人身和財產安全,需要對用戶在防護艙中出現的異常事件進行檢測,以便于可以及時救治或報警。相關方案中,檢測用戶在語音關鍵事件檢測防護艙內出現倒地事件的方案是:在防護艙的兩側面板上距離地面1米。這樣,用戶在進入到防護艙時,便進入到紅外線發射器的感測范圍內,進而,由于用戶身體的遮擋。河南語音關鍵事件檢測設計

欧美乱妇精品无乱码亚洲欧美,日本按摩高潮a级中文片三,久久男人电影天堂92,好吊妞在线视频免费观看综合网
亚洲人成网线在线播放 | 日韩国产欧美另类 | 日韩精品一区二区三区免费视频 | 熟女精品视频一区二区三区 | 亚洲日本va在线视频 | 日韩国产一级一区精品 |