会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 2. 发明专利
    • 一種語音端點檢測方法及語音辨識方法
    • 一种语音端点检测方法及语音辨识方法
    • TW201830377A
    • 2018-08-16
    • TW107104564
    • 2018-02-08
    • 大陸商芋頭科技(杭州)有限公司YUTOU TECHNOLOGY (HANGZHOU) CO., LTD.
    • 范利春FAN, LICHUN
    • G10L15/02G10L15/28G10L17/20
    • 本發明公開了一種語音端點檢測方法及語音辨識方法,屬於語音辨識技術領域;方法包括:提取語音數據的語音特徵並輸入至靜音模型中;靜音模型根據語音特徵輸出標籤用於表示語音數據是否為靜音幀;根據連續幀的語音數據的標籤確認一段語音的語音端點:在非啟動狀態,若連續出現非靜音幀的語音數據的長度大於一預設的第一閾值,則判斷第一幀為非靜音幀的語音數據為一段語音的起始端點;在啟動狀態,若連續出現靜音幀的語音數據的長度大於一預設的第二閾值,則判斷第一幀為靜音幀的語音數據為一段語音的結束端點。上述技術方案的有益效果是:解決現有技術中語音端點檢測不準確以及對於檢測環境要求過高的問題。
    • 本发明公开了一种语音端点检测方法及语音辨识方法,属于语音辨识技术领域;方法包括:提取语音数据的语音特征并输入至静音模型中;静音模型根据语音特征输出标签用于表示语音数据是否为静音帧;根据连续帧的语音数据的标签确认一段语音的语音端点:在非启动状态,若连续出现非静音帧的语音数据的长度大于一默认的第一阈值,则判断第一帧为非静音帧的语音数据为一段语音的起始端点;在启动状态,若连续出现静音帧的语音数据的长度大于一默认的第二阈值,则判断第一帧为静音帧的语音数据为一段语音的结束端点。上述技术方案的有益效果是:解决现有技术中语音端点检测不准确以及对于检测环境要求过高的问题。
    • 3. 发明专利
    • 一種混合頻率聲學識別模型的訓練方法及語音識別方法
    • 一种混合频率声学识别模型的训练方法及语音识别方法
    • TW201832223A
    • 2018-09-01
    • TW107106653
    • 2018-02-27
    • 大陸商芋頭科技(杭州)有限公司YUTOU TECHNOLOGY (HANGZHOU) CO., LTD.
    • 范利春FAN, LICHUN
    • G10L17/04G10L15/02G10L15/00
    • 本發明公開了一種混合頻率聲學識別模型的訓練方法及語音識別方法,屬於語音識別技術領域;方法包括:獲取第一語音訊號的第一類語音特徵並進行處理,以得到對應的第一語音訓練數據;獲取第二語音訊號的第一類語音特徵並對進行處理,以得到對應的第二語音訓練數據;根據功率譜獲取第一語音訊號的第二類語音特徵以及第二語音訊號的第二類語音特徵;根據第一語音訊號和第二語音訊號預訓練形成混合頻率聲學識別模型的一初步識別模型;根據第一語音訓練數據、第二語音訓練數據以及第二類語音特徵對初步識別模型進行有監督的參數訓練,以形成混合頻率聲學識別模型。上述技術方案的有益效果是:識別模型具有較好的穩健性和類化性。
    • 本发明公开了一种混合频率声学识别模型的训练方法及语音识别方法,属于语音识别技术领域;方法包括:获取第一语音频号的第一类语音特征并进行处理,以得到对应的第一语音训练数据;获取第二语音频号的第一类语音特征并对进行处理,以得到对应的第二语音训练数据;根据功率谱获取第一语音频号的第二类语音特征以及第二语音频号的第二类语音特征;根据第一语音频号和第二语音频号预训练形成混合频率声学识别模型的一初步识别模型;根据第一语音训练数据、第二语音训练数据以及第二类语音特征对初步识别模型进行有监督的参数训练,以形成混合频率声学识别模型。上述技术方案的有益效果是:识别模型具有较好的稳健性和类化性。
    • 4. 发明专利
    • 一種基於麥克風陣列的拾音方法及系統
    • 一种基于麦克风数组的十音方法及系统
    • TW201828719A
    • 2018-08-01
    • TW107102998
    • 2018-01-26
    • 大陸商芋頭科技(杭州)有限公司YUTOU TECHNOLOGY (HANGZHOU) CO., LTD.
    • 范利春FAN, LICHUN朱磊ZHU, LEI高鵬GAO, PENG
    • H04R17/02G10L21/0208
    • 本發明涉及基於麥克風陣列的拾音方法,包括:步驟1,使用麥克風陣列拾取並輸出多路語音訊號中的其中一路進行語音啟動檢測,判斷是否出現語音啟動訊號,如是,執行步驟2,如否,重複步驟1; 步驟2,多路語音訊號進行聲源定位,獲得聲源定位方向;步驟3,對聲源定位方向的語音訊號進行語音增強,獲得增強過的語音訊號; 步驟4,對增強過的語音訊號進行語音喚醒檢測,判斷是否檢測到語音喚醒,如是,執行步驟5,否則,重複步驟1;步驟5,麥克風陣列拾取並輸出多路語音訊號;步驟6,將多路語音訊號處理爲一路作爲最終所拾取到的音輸出。本發明能更好地對遠場環境下的語音訊號進行拾取,尤其在高噪聲環境下能夠準確的拾音,爲遠距離的語音控制提供了優秀的解決方案。
    • 本发明涉及基于麦克风数组的十音方法,包括:步骤1,使用麦克风数组十取并输出多路语音频号中的其中一路进行语音启动检测,判断是否出现语音启动信号,如是,运行步骤2,如否,重复步骤1; 步骤2,多路语音频号进行声源定位,获得声源定位方向;步骤3,对声源定位方向的语音频号进行语音增强,获得增强过的语音频号; 步骤4,对增强过的语音频号进行语音唤醒检测,判断是否检测到语音唤醒,如是,运行步骤5,否则,重复步骤1;步骤5,麦克风数组十取并输出多路语音频号;步骤6,将多路语音频号处理为一路作为最终所十取到的音输出。本发明能更好地对远场环境下的语音频号进行十取,尤其在高噪声环境下能够准确的十音,为远距离的语音控制提供了优秀的解决方案。
    • 8. 发明专利
    • 機器人自身音源消除系統
    • 机器人自身音源消除系统
    • TW201701272A
    • 2017-01-01
    • TW105120630
    • 2016-06-29
    • 芋頭科技(杭州)有限公司YUTOU TECHNOLOGY (HANGZHOU) CO., LTD.
    • 劉鑫LIU, XIN高鵬GAO, PENG施家琪SHI, JIAQI范利春FAN, LICHUN
    • G10L21/02G10L21/0272
    • G10L25/03
    • 本發明公開了一種機器人自身音源消除系統,包括拾音單元,用於採集混合有左右聲道的數字訊號,並輸出;音效卡驅動單元用於將接收到的機器人自身音源的參考訊號及混合有左右聲道的數字訊號混合形成混合語音訊號,並輸出;訊號分離單元用於將混合語音訊號分離為混合有左右聲道的數字訊號和參考訊號,並判斷混合有左右聲道的數字訊號是否存在干擾訊號,獲取播放訊號量,並輸出;音源消除單元用於接收參考訊號、播放訊號量和混合有左右聲道的數字訊號,並根據播放訊號量消除混合有左右聲道的數字訊號中的干擾訊號,並輸出;識別單元用以識別混合有左右聲道的數字訊號。本發明可對機器人自身播放的音樂干擾訊號進行抵消或抑制,提高機器人的語音識別率。
    • 本发明公开了一种机器人自身音源消除系统,包括十音单元,用于采集混合有左右声道的数字信号,并输出;声卡驱动单元用于将接收到的机器人自身音源的参考信号及混合有左右声道的数字信号混合形成混合语音频号,并输出;信号分离单元用于将混合语音频号分离为混合有左右声道的数字信号和参考信号,并判断混合有左右声道的数字信号是否存在干扰信号,获取播放信号量,并输出;音源消除单元用于接收参考信号、播放信号量和混合有左右声道的数字信号,并根据播放信号量消除混合有左右声道的数字信号中的干扰信号,并输出;识别单元用以识别混合有左右声道的数字信号。本发明可对机器人自身播放的音乐干扰信号进行抵消或抑制,提高机器人的语音识别率。