本發明實施例涉及語音識別,具體涉及一種基于vad算法的開口率計算方法及裝置。
背景技術:
1、線上教育以互聯網為媒介,實現線上學習,消除了時間和空間限制,方便靈活安排學習,更便捷和靈活,也能適用不用學員的需求,提高學習效率。
2、對于線上語言類學習,學員不僅僅需要學習語言的書寫、規則等,還需要開口練習使用語言。學員的開口率體現了學員對語言類課程的接受度、參與度以及掌握度,是線上學習的重要學習指標,用于對教學進行評估。
3、現有技術在對開口率進行處理時,可以采用如課程錄音方式,在學習課程結束后,對錄音文件進行asr(automatic?speech?recognition,自動語音識別)解析,識別出老師和學員在每個時間點的說話內容(如語音轉文字),根據兩者的說話次數確定開口率。但使用asr的成本花費較高,需要大量的計算資源,且服務費用昂貴。asr解析耗時較長,尤其當存在多個課程的錄音文件時,需要采用排隊機制一一識別,導致課程結束后無法及時識別,影響計算開口率的及時性和有效性。或者,采用實時asr處理,但大量課程會導致asr的并發問題,服務器負載增加,引發性能瓶頸。進一步,實時asr需要花費大量資源,需要提升系統穩定性和網絡帶寬,也增加了技術實現的復雜度和成本。
技術實現思路
1、鑒于上述問題,提出了本發明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的基于vad算法的開口率計算方法及裝置。
2、根據本發明實施例的一個方面,提供了一種基于vad算法的開口率計算方法,方法包括:
3、獲取線上課堂的錄音文件;錄音文件包括老師錄音文件和學員錄音文件;
4、基于vad算法按照預設時間間隔分別檢測老師錄音文件和學員錄音文件的語音活動信息,得到老師錄音文件的第一語音字符串以及學員錄音文件的第二語音字符串;其中,第一語音字符串和第二語音字符串由表征語音活動信息的預設字符組成;
5、統計第一語音字符串和第二語音字符串中的語音活動信息,根據統計結果,計算得到線上課堂的學員開口率;學員開口率根據第二語音字符串和第一語音字符串中語音活動信息的比值確定。
6、根據本發明實施例的另一方面,提供了一種基于vad算法的開口率計算裝置,其包括:
7、獲取模塊,適于獲取線上課堂的錄音文件;錄音文件包括老師錄音文件和學員錄音文件;
8、語音識別模塊,適于基于vad算法按照預設時間間隔分別檢測老師錄音文件和學員錄音文件的語音活動信息,得到老師錄音文件的第一語音字符串以及學員錄音文件的第二語音字符串;其中,第一語音字符串和第二語音字符串由表征語音活動信息的預設字符組成;
9、計算模塊,適于統計第一語音字符串和第二語音字符串中的語音活動信息,根據統計結果,計算得到線上課堂的學員開口率;學員開口率根據第二語音字符串和第一語音字符串中語音活動信息的比值確定。
10、根據本發明實施例的又一方面,提供了一種計算設備,包括:處理器、存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通過所述通信總線完成相互間的通信;
11、所述存儲器用于存放至少一可執行指令,所述可執行指令使所述處理器執行上述基于vad算法的開口率計算方法對應的操作。
12、根據本發明實施例的再一方面,提供了一種計算機存儲介質,所述存儲介質中存儲有至少一可執行指令,所述可執行指令使處理器執行如上述基于vad算法的開口率計算方法對應的操作。
13、根據本發明實施例的還一方面,提供了一種計算機程序產品,包括至少一可執行指令,所述可執行指令使處理器執行如上述基于vad算法的開口率計算方法對應的操作。
14、根據本發明實施例的提供的基于vad算法的開口率計算方法及裝置,利用vad算法可以準確、實時、快速地識別老師和學生在線上課堂的語音活動,從而可以準確計算得到線上課堂的學員開口率,實現了對學生學習狀態的有效監控。
15、上述說明僅是本發明實施例技術方案的概述,為了能夠更清楚了解本發明實施例的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明實施例的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明實施例的具體實施方式。
1.一種基于vad算法的開口率計算方法,其特征在于,方法包括:
2.根據權利要求1所述的方法,其特征在于,所述預設字符包括表征包含語音活動信息的第一字符和表征未包含語言活動的第二字符;
3.根據權利要求2所述的方法,其特征在于,所述根據提取得到的各音頻幀的語音特征,依次循環判斷所述老師錄音文件和學員錄音文件中各音頻幀是否包含語音活動信息進一步包括:
4.根據權利要求2所述的方法,其特征在于,所述根據提取得到的各音頻幀的語音特征,依次循環判斷所述老師錄音文件和學員錄音文件中各音頻幀是否包含語音活動信息進一步包括:
5.根據權利要求2所述的方法,其特征在于,所述統計所述第一語音字符串和所述第二語音字符串中的語音活動信息,根據統計結果,計算得到線上課堂的學員開口率進一步包括:
6.根據權利要求1-5中任一項所述的方法,其特征在于,所述獲取線上課堂的錄音文件進一步包括:
7.一種基于vad算法的開口率計算裝置,其特征在于,裝置包括:
8.一種計算設備,其特征在于,包括:處理器、存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通過所述通信總線完成相互間的通信;
9.一種計算機存儲介質,其特征在于,所述存儲介質中存儲有至少一可執行指令,所述可執行指令使處理器執行如權利要求1-6中任一項所述的基于vad算法的開口率計算方法對應的操作。
10.一種計算機程序產品,包括至少一可執行指令,所述可執行指令使處理器執行如權利要求1-6中任一項所述的基于vad算法的開口率計算方法對應的操作。