会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 22. 发明申请
    • METHOD AND APPARATUS FOR VOICE ACCESS TO MULTIMEDIA INTERACTIVE WEBSITE
    • 语音访问多媒体互动网站的方法和设备
    • WO2015106688A1
    • 2015-07-23
    • PCT/CN2015/070706
    • 2015-01-14
    • TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED
    • LIN, Yu
    • G06F3/0487
    • G06F3/167G06F3/01G06F3/04847G06F9/453G06F17/2235G06F17/2247G06F2203/0381G10L17/14G10L17/22
    • A method and an apparatus for voice access to a multimedia interactive website. The method includes: compiling selectable human computer interaction modes for at least one link on the multimedia interactive website (101), where the selectable human computer interaction modes at least include: a voice mode and a non-voice mode; monitoring a link to be accessed that is selected on the multimedia interactive website by a user, and identifying a human computer interaction mode that is selected by the user for the link to be accessed (102); when it is identified that the user selects the voice mode, jumping to a page used for guiding a user to provide a voice, guiding the user to provide a voice on the page, and acquiring voice data provided on the page by the user (103); and determining whether the voice data satisfies a set requirement for triggering the link to be accessed, and if yes, providing information corresponding to the link to be accessed (104). By means of the method, voice interaction between a user and a multimedia website can be implemented.
    • 一种用于语音接入多媒体互动网站的方法和装置。 该方法包括:为多媒体交互式网站(101)上的至少一个链路编译可选择的人机交互模式,其中可选择的人机交互模式至少包括语音模式和非语音模式; 监视由用户在所述多媒体交互式网站上选择的要访问的链接,以及识别由用户为所述要访问的链接选择的人机交互模式(102); 当识别出用户选择语音模式时,跳到用于引导用户提供语音的页面,引导用户在页面上提供语音,以及获取用户提供的页面上的语音数据(103 ); 以及确定所述语音数据是否满足用于触发要被访问的链接的设置要求,以及如果是,则提供与要被访问的链接相对应的信息(104)。 通过该方法,可以实现用户与多媒体网站之间的语音交互。
    • 24. 发明申请
    • СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО ПО ФОНОГРАММАМ ПРОИЗВОЛЬНОЙ УСТНОЙ РЕЧИ НА ОСНОВЕ ФОРМАНТНОГО ВЫРАВНИВАНИЯ
    • 识别发言者的方法,录音制品任意语音共振峰基于ALIGNMENT
    • WO2011046474A2
    • 2011-04-21
    • PCT/RU2010/000661
    • 2010-11-03
    • ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЦEНТP РЕЧЕВЫХ ТЕХНОЛОГИЙ"КОВАЛЬ, Сергей Львович
    • КОВАЛЬ, Сергей Львович
    • G10L17/00
    • G10L17/14G10L17/02G10L17/06G10L17/20G10L25/15
    • Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания. Предлагаемый способ позволяет осуществлять надежную идентификацию говорящего, как для длинных, так и для коротких фонограмм, фонограмм, записанных в различных каналах с высоким уровнем помех и искажений, а также фонограмм с произвольной устной речью дикторов, находящихся в различных психофизиологических состояниях, говорящих на различающихся языках, что обеспечивает широкую область применения предлагаемого способа, в том числе в криминалистических исследованиях. Идентификации говорящего по фонограммам устной речи осуществляют путем оценки сходства между первой фонограммой говорящего, и второй, эталонной фонограммой. Для указанной оценки на первой и второй фонограммах выбирают опорные фрагменты речевых сигналов, на которых присутствуют формантные траектории по крайней мере трех формант сравнивают между собой опорные фрагменты, в которых совпадают значения по крайней мере двух формантных частот, оценивают сходство сравниваемых опорных фрагментов по совпадению значений остальных формантных частот, а сходство фонограмм в целом определяют по суммарной оценке сходства всех сравниваемых опорных фрагментов.
    • 一种通过基于共振峰对准的任意口头语音的音标识别说话者的方法。 所提出的方法使得能够发言,对长期和短期录音制品,录音制品,记录在不同的信道具有高水平的噪声和失真的,以及从任何口语扬声器音轨的可靠识别,有各种心理生理状态讲不同语言 ,它提供了所提出的方法的广泛应用,包括法医学研究。 识别由通过扬声器的第一声道和第二声道参考之间的相似性评估执行的语音录音制品的扬声器。 对于此评估,选择的参考片段的语音信号的第一和第二录音制品,其存在的共振峰轨迹的至少三个共振峰轴承片段,其具有至少两个共振峰频率的相同的值之间进行比较评价的比较参考片段中的相似性的其他巧合值 共振峰频率以及整个音标的相似性是根据所比较的所有参考片段的相似性的总评估来确定的。

    • 25. 发明申请
    • 音声認証システム
    • 音频认证系统
    • WO2006087799A1
    • 2006-08-24
    • PCT/JP2005/002589
    • 2005-02-18
    • 富士通株式会社早川昭二
    • 早川昭二
    • G10L17/00
    • G10L17/14
    •  キーワードを音声入力させて認証を行うテキスト依存型の音声認証システムであって、発声が可能な単位を最小単位として複数の部分に分割されたキーワードの音声入力を、前記部分毎に時間間隔をおいて複数回にわたって受け付ける入力部(11)と、利用者の登録キーワードを、前記発声が可能な単位で作成された話者モデルとして予め格納した音声モデル格納部(20)と、入力部(11)において1回の音声入力で受け付けられたキーワードの部分から、当該部分に含まれる音声の特徴量を求める特徴量変換部(12)と、特徴量と話者モデルとの類似度を求める類似度計算部(13)と、類似度計算部で求められた類似度に基づき、前記複数回の音声入力により登録キーワードを構成するすべての音韻の音声入力が完了したか否かを判定するキーワード確認部(17)と、キーワード確認部による判定結果と類似度計算部で求められた類似度とに基づき、認証を受理するか棄却するかを判定する認証判定部(19)とを備えた音声認証システム。
    • 提供了一种文本相关的音频认证系统,用于通过音频输入关键字进行认证。 音频认证系统包括:输入单元(11),用于以多个时间间隔接收分为多个部分的关键字的音频输入作为可以发出的最小单位; 音频模型存储单元(20),其包含注册为由发声单元创建的扬声器模型的用户关键字; 特征量转换单元,用于获得包含在由输入单元(11)上的一个音频输入接收的关键字部分中的音频的特征量; 相似度计算单元,用于获得特征量和说话者模型之间的相似度; 关键字检查单元(17),用于判断由所述多个音频输入是否输入了构成所述注册关键字的所有音素; 以及用于根据关键字检查单元的判断结果和由相似度计算单元获得的相似度来决定是否建立或丢弃认证的认证单元(19)。