![使用听觉注意力线索的语音音节/元音/音素边界检测](/CN/2015/1/69/images/201510346155.jpg)
基本信息:
- 专利标题: 使用听觉注意力线索的语音音节/元音/音素边界检测
- 申请号:CN201510346155.5 申请日:2011-11-02
- 公开(公告)号:CN105023573B 公开(公告)日:2018-10-09
- 发明人: O.卡琳里 , 陈如新
- 申请人: 索尼电脑娱乐公司
- 申请人地址: 日本东京都
- 专利权人: 索尼电脑娱乐公司
- 当前专利权人: 索尼互动娱乐股份有限公司
- 当前专利权人地址: 日本东京都
- 代理机构: 北京市柳沈律师事务所
- 代理人: 郭定辉
- 优先权: 13/078,866 2011.04.01 US
- 主分类号: G10L15/04
- IPC分类号: G10L15/04 ; G10L15/16 ; G10L15/24 ; G10L15/34 ; G10L25/03
摘要:
提供检测语音音节/元音/音素边界方法和设备。该方法包括:从关于声音输入窗口的听觉频谱中提取一个或多个多尺度特征,其中每个多尺度特征使用单独的二维频谱时间接收滤波器提取;生成对应于所述一个或多个多尺度特征的一个或多个特征图;从所述一个或多个特征图中的每个提取听觉要点矢量;通过放大从所述一个或多个特征图所提取的每个听觉要点矢量来获得累积要点矢量;通过将所述累积要点矢量映射到一个或多个音节或元音或音素边界来检测所述声音输入窗口中的一个或多个音节或元音或音素边界;以及使用所述声音输入窗口中的一个或多个音节或元音或音素边界,确定每单位时间的音节数量或每次话语的音节数量。
公开/授权文献:
- CN105023573A 使用听觉注意力线索的语音音节/元音/音素边界检测 公开/授权日:2015-11-04