会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 6. 发明专利
    • 語音辨識的前級偵測系統與方法 PRE-STAGE DETECTING SYSTEM AND METHOD FOR SPEECH RECOGNITION
    • 语音辨识的前级侦测系统与方法 PRE-STAGE DETECTING SYSTEM AND METHOD FOR SPEECH RECOGNITION
    • TWI319152B
    • 2010-01-01
    • TW094134669
    • 2005-10-04
    • 財團法人工業技術研究院
    • 張森嘉廖元甫林政賢
    • G06F
    • G10L15/00G10L21/02
    • 一種偵測輸入語音訊號可辨識度的系統與方法,係設計在語音辨識或對話系統的前級中,偵測使用者環境品質狀況,並且判別輸入語音訊號可否板系統辨識成功。本發明主要包含一環境參數求取器、一訊號可辨識與否判別器和一策略回應處理器。加入本發明在語音辨識或對話裝置的前級中,則在雜訊環境的干擾下,能準確地判別輸入訊號可成功辨識與否,並接收辨識成功機率較高的輸入訊號,排除了辨識成功機率較低的輸入訊號,而提升了系統的辨識成功率。 A system and method for detecting the recognizability of input speech signal is provided. It is designed in the pre-stage of speech recognition or a dialog system. The invention detects the user’s environmental condition and verifies if the input speech signal can be recognized. It mainly comprises an environment parameter generator, a signal recognition verifier, and a strategy response processor. Through the use of the invention in the pre-stage of speech recognition or a dialog system, it can precisely verify the recognizability of the input speech signal and receives the input speech signals of high recognition probability in a noisy environment. This reduces the impact caused by receiving the input speech signals of low recognition probability. This invention thus increases the recognition probability for a recognizer. 【創作特點】 本發明解決上述的習知技術中,語音辨認系統並無環境感知能力的缺點。其主要目的是提供一種偵測輸入語音訊號可辨識度的系統與方法。
      相較於習知技術,本發明擁有下列的特色:(a)本發明著重及設計於系統辨識的前級中,只花費少許系統資源來量測輸入訊號可辨識成功與否。而非偵測出輸入訊號裡語音及非語音部分,及直接將此資訊提供給辨識器以提高辨識率。(b)對於可成功辨識的訊號便直接進入辨識器辨認,而針對無法辨識成功的訊號則做出一些回應和對策。(c)減少不必要的辨識資源的浪費,並提高系統辨識成功的機率。
      本發明之偵測輸入語音訊號可辨識度的系統是設計在語音辨識或對話裝置的前級中,主要包含一環境參數求取器(environment parameter generator)、一訊號可辨識與否判別器(signal recognition verifier)和一策略回應處理器(recognition rejection processor)。
      此系統的運作流程如下。首先,參數求取器對輸入訊號求取出一些環境參數,來代表此輸入訊號所在的環境狀況或訊號的品質。之後,訊號可辨識與否判別器經由事先訓練後,根據該輸入訊號之環境參數,判別此輸入訊號是否可辨識成功。當判別可辨識成功時,便將此輸入訊號傳送至一般的辨識裝置。當判別無法辨識成功時,便觸發策略回應處理器。策略回應處理器根據輸入訊號之環境參數來回應使用者目前的環境狀況或訊號品質,並且提出對策,使辨識成功機率提高。
      在本發明之實施例中,參數求取器選擇輸入訊號的訊號-雜訊比、輸入訊號為語音之機率,以及系統處理輸入訊號之可靠度來當作環境參數。而策略回應處理器提出的多種不同的對策為引導使用者改善,包括如訊號-雜訊比過低時,請使用者提高音量或更接較為安靜之環境;或者可靠度值太小時,則提示使用者提高說話之清晰度等。接著提示使用者重新輸入訊號或者為其轉接客服中心。
      茲配合下列圖示、實施例之詳細說明及申請專利範圍,將上述及本發明之其他目的與優點詳述於後。
    • 一种侦测输入语音频号可辨识度的系统与方法,系设计在语音辨识或对话系统的前级中,侦测用户环境品质状况,并且判别输入语音频号可否板系统辨识成功。本发明主要包含一环境参数求取器、一信号可辨识与否判别器和一策略回应处理器。加入本发明在语音辨识或对话设备的前级中,则在噪声环境的干扰下,能准确地判别输入信号可成功辨识与否,并接收辨识成功概率较高的输入信号,排除了辨识成功概率较低的输入信号,而提升了系统的辨识成功率。 A system and method for detecting the recognizability of input speech signal is provided. It is designed in the pre-stage of speech recognition or a dialog system. The invention detects the user’s environmental condition and verifies if the input speech signal can be recognized. It mainly comprises an environment parameter generator, a signal recognition verifier, and a strategy response processor. Through the use of the invention in the pre-stage of speech recognition or a dialog system, it can precisely verify the recognizability of the input speech signal and receives the input speech signals of high recognition probability in a noisy environment. This reduces the impact caused by receiving the input speech signals of low recognition probability. This invention thus increases the recognition probability for a recognizer. 【创作特点】 本发明解决上述的习知技术中,语音辨认系统并无环境感知能力的缺点。其主要目的是提供一种侦测输入语音频号可辨识度的系统与方法。 相较于习知技术,本发明拥有下列的特色:(a)本发明着重及设计于系统辨识的前级中,只花费少许系统资源来量测输入信号可辨识成功与否。而非侦测出输入信号里语音及非语音部分,及直接将此信息提供给辨识器以提高辨识率。(b)对于可成功辨识的信号便直接进入辨识器辨认,而针对无法辨识成功的信号则做出一些回应和对策。(c)减少不必要的辨识资源的浪费,并提高系统辨识成功的概率。 本发明之侦测输入语音频号可辨识度的系统是设计在语音辨识或对话设备的前级中,主要包含一环境参数求取器(environment parameter generator)、一信号可辨识与否判别器(signal recognition verifier)和一策略回应处理器(recognition rejection processor)。 此系统的运作流程如下。首先,参数求取器对输入信号求取出一些环境参数,来代表此输入信号所在的环境状况或信号的品质。之后,信号可辨识与否判别器经由事先训练后,根据该输入信号之环境参数,判别此输入信号是否可辨识成功。当判别可辨识成功时,便将此输入信号发送至一般的辨识设备。当判别无法辨识成功时,便触发策略回应处理器。策略回应处理器根据输入信号之环境参数来回应用户目前的环境状况或信号品质,并且提出对策,使辨识成功概率提高。 在本发明之实施例中,参数求取器选择输入信号的信号-噪声比、输入信号为语音之概率,以及系统处理输入信号之可靠度来当作环境参数。而策略回应处理器提出的多种不同的对策为引导用户改善,包括如信号-噪声比过低时,请用户提高音量或更接较为安静之环境;或者可靠度值太小时,则提示用户提高说话之清晰度等。接着提示用户重新输入信号或者为其转接客服中心。 兹配合下列图标、实施例之详细说明及申请专利范围,将上述及本发明之其他目的与优点详述于后。