会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 2. 发明专利
    • 音声合成装置、音声合成方法およびプログラム
    • 语音合成设备,语音合成方法和程序
    • JP2016090664A
    • 2016-05-23
    • JP2014221770
    • 2014-10-30
    • 株式会社東芝東芝ソリューション株式会社
    • 平野 薫鈴木 優水谷 博之
    • G10L13/10
    • G10L13/10G10L13/033G10L13/0335G10L13/04
    • 【課題】タグ付きテキストを効率よく生成することができる音声合成装置、音声合成方法およびプログラムを提供する。 【解決手段】実施形態の音声合成装置1は、コンテンツ選択部10と、コンテンツ生成部20と、コンテンツ登録部30と、を備える。コンテンツ選択部10は、音声合成の対象となるテキストに対して音声合成を制御するタグ情報が付加されたタグ付きテキストを含むコンテンツであって、コンテンツ記憶部40に登録されている複数のコンテンツの中から、選択コンテンツを決定する。コンテンツ生成部20は、選択コンテンツに含まれるタグ付きテキストのタグ情報を、指定されたテキストに適用して新たなコンテンツを生成する。コンテンツ登録部30は、生成された新たなコンテンツをコンテンツ記憶部40に登録する。 【選択図】図1
    • 要解决的问题:提供一种语音合成装置,语音合成方法和能够有效地生成具有标签的文本的程序。解决方案:语音合成装置1包括:内容选择部分10:内容生成部分20; 内容注册部分30.内容选择部分10确定包括具有标签的文本的内容,其中用于控制语音合成的标签信息被添加到作为语音合成的目标的文本,即,从多个内容中选择的内容 注册在内容存储部分40.内容生成部分20通过将包含在所选内容中的标签的文本的标签信息应用于指定文本来生成新内容。 内容注册部30将生成的新内容登记在内容存储部40中。图1:
    • 3. 发明专利
    • ターゲット文字列の推定
    • 目标字符串的估计
    • JP2016033662A
    • 2016-03-10
    • JP2015150085
    • 2015-07-29
    • ヤマハ株式会社
    • 山本 和彦
    • G10L13/02
    • G10L13/027G10H7/008G10H7/02G10H2220/221G10H2250/455G10L13/0335
    • 【課題】歌詞のような予め規定された文字列中の所望の部分(ターゲット文字列)を簡易な手法で間接的に指定する方法を提供する。 【解決手段】予め規定された基準文字列(例えば歌詞)内に含まれる任意の文字列をターゲット文字列として、ユーザは、該ターゲット文字列を間接的に示すターゲット音素列を指定する。ターゲット音素列は、限られた複数種の特定音素(例えば、母音と特定の子音)を用いてターゲット文字列を間接的に表現してなるものである。一方、特定音素を用いて基準文字列を間接的に表現してなる基準文字列を用意しておく。ターゲット音素列と基準音素列とを比較することに基づき、ターゲット音素列にマッチする基準音素列内の特定音素の配列を特定し、該特定した特定音素配列に対応する基準文字列内の文字配列を特定する。こうして特定された文字配列は、ターゲット文字列を推定している。 【選択図】図1
    • 要解决的问题:提供一种用简单方法间接指定诸如歌词等限制字符串中的期望部分(目标字符串)的方法。解决方案:用户指定间接指示目标字符串的目标音素串, 其中包括在受限参考字符串(例如,歌词)中的可选字符串作为目标字符串。 目标音素串通过使用有限的多种特定音素(例如,元音和特定辅音)间接地表示目标字符串。 另一方面,也准备了通过使用特定的音素间接表示参考字符串的参照字符串。 基于目标音素字符串和参考音素串的比较,指定与目标音素串匹配的参考音素串中的特定音素的排列,并且对应于指定的特定音素的参考字符串中的字符排列 安排,被指定。 指定的字符排列估计目标字符串。选择图:图1
    • 9. 发明专利
    • 音声合成装置
    • 语音合成设备
    • JP2016161919A
    • 2016-09-05
    • JP2015043918
    • 2015-03-05
    • ヤマハ株式会社
    • 才野 慶二郎ジョルディ ボナダメルレイン ブラアウ
    • G10L13/00G10L13/10G10L13/033
    • G10L13/0335G10L13/047G10L13/06
    • 【課題】調子はずれと知覚される可能性を低減しながら音素依存変動(マイクロプロソディ)を反映した音高遷移を生成する。 【解決手段】音声合成装置100は、参照音声から抽出された音声素片Pの接続で音声信号Vを生成する装置であって、音声素片Pを順次に選択する素片選択部22と、参照音声の発音の基準である基準音高と素片選択部22が選択した音声素片Pの観測音高との差分値に応じた度合で当該音声素片Pの観測音高の変動が反映された音高遷移Cを設定する音高設定部24と、素片選択部22が選択した音声素片Pの音高を音高設定部24が生成した音高遷移Cに応じて調整して音声信号Vを生成する音声合成部26とを具備する。 【選択図】図1
    • 要解决的问题:产生一种反映音素依赖变化(微韵律)的音调转换,同时减少被感知为音调的可能性。解决方案:语音合成装置100是通过连接产生语音信号V的装置 从参考语音提取的语音基本部分P,包括:基本部分选择部分22,用于顺序选择语音基本部分P; 音调设定部分24,用于根据作为参考语音的发音的基准的参考音调与语音元素之间的差值来设置反映语音元素片段P的观看音调的变化的音调转变量C 片P选择部件22; 以及语音合成部26,用于通过根据由音高设定部24生成的音调变化C来调整由基本部件选择部22选择的语音元素片段P的间距来生成语音信号V.选择的图示:图1
    • 10. 发明专利
    • Speech processing apparatus and method, and program
    • 语音处理设备和方法及程序
    • JP2009251029A
    • 2009-10-29
    • JP2008095101
    • 2008-04-01
    • Toshiba Corp株式会社東芝
    • LATORRE JAVIERAKAMINE MASAMI
    • G10L13/08
    • G10L13/0335G10L13/10
    • PROBLEM TO BE SOLVED: To provide a speech processing apparatus and method, and a program, capable of generating a natural pitch contour which smoothly changes. SOLUTION: Based on time length for each character string in each linguistic level which is included in an input document, a basic frequency of speech corresponding to the input document is divided into a plurality of segments, linear transformation of a segment group for each linguistic level is performed by a predetermined operator in which inverse transformation is possible, and a first parameter group according to each linguistic level is generated. Moreover, for each character string in each linguistic level included in the input document, a descriptor which shows features of the character string is generated, and the first parameter in each of the linguistic level is clustered based on the descriptor corresponding to the linguistic level, and model learning is performed as pitch contour model for each linguistic level. COPYRIGHT: (C)2010,JPO&INPIT
    • 要解决的问题:提供能够产生平滑变化的自然俯仰轮廓的语音处理装置和方法以及程序。 解决方案:基于包括在输入文档中的每个语言级别中的每个字符串的时间长度,与输入文档相对应的基本语音频率被划分为多个段,对于 每个语言级别由可以进行逆变换的预定运算符执行,并且生成根据每个语言级别的第一参数组。 此外,对于包含在输入文档中的每个语言级别中的每个字符串,生成显示字符串的特征的描述符,并且基于与语言级别对应的描述符,将语言级别中的每一个中的第一参数聚类, 并且模型学习被执行为每个语言水平的音高轮廓模型。 版权所有(C)2010,JPO&INPIT