专利快速检索-快速检索全球专利，免费商用专利数据库-IPRDB

1. 发明授权

KR100486734B1 음성 합성 방법 및 장치 有权
标题翻译：文本到语音合成的方法和装置
公开(公告)号：KR100486734B1
公开(公告)日：2005-05-03
申请号：KR1020030011786
申请日：2003-02-25
申请人： 삼성전자주식회사
发明人： 페렌쯔어띨러 , 김정수 , 이재원
IPC分类号： G10L13/00
CPC分类号： G10L13/07
摘要： 코퍼스 기반의 음성 합성 방법이 개시된다. 코퍼스 기반으로 음성 유닛들을 접속하는 본 발명에 의한 음성 합성 방법은, (a) 접속될 상기 음성 유닛들을 결정하여 좌측 유닛과 우측 유닛으로 구분하는 단계; (b) 좌측 유닛과 우측 유닛의 보간될 소정 영역을 가변적으로 결정하는 단계; (c) 좌측 유닛과 우측 유닛의 경계에 확장부를 연결하는 단계; (d) 확장부에 대하여 대응 유닛을 기준으로 피치 파형 위치를 정렬하는 단계; 및 (e) 좌측 유닛 및 우측 유닛을 중첩하는 단계를 포함하는 것을 특징으로 한다. 따라서, 코퍼스 기반의 작은 크기의 DB로도, 가외 세그먼트 데이터의 유무에 따라 보간법 또는 보외법을 선택적으로 이용하여 평활화된 접속을 수행함으로써 접속 경계부의 음향적 부정합(acoustical mismatch)을 완화할 수 있고, 양호한 품질의 음성 합성을 구현할 수 있다. 본 발명은, 대용량 DB를 구비하는 시스템에서도 효과가 있으나, 상대적으로 소용량 DB를 구비하는 시스템에서 더욱 자연스럽고 만족스러운 음성 합성 출력을 제공하는 효과가 있다.

2. 发明公开

KR1020050057354A 신호 합성 방법, 컴퓨터 프로그램 제품, 컴퓨터 시스템 및합성 신호 无效
标题翻译：合成语音的方法
公开(公告)号：KR1020050057354A
公开(公告)日：2005-06-16
申请号：KR1020057004474
申请日：2003-08-08
申请人： 코닌클리케 필립스 엔.브이.
发明人： 기기에르칸에프
IPC分类号： G10L13/08
CPC分类号： G10L13/07 , G10L13/04
摘要： The invention relates to a method of synthesizing a signal comprising the steps of: a) providing of a first signal having first periods of a first type and second periods of a second type in an alternating sequence, b) selecting of one of the pitch bells for a first one of the required pitch bell locations by identifying the nearest neighboring period of the first one of the required pitch bell locations being of the first type, and selecting of the pitch bell of the identified period, c) selecting of one of the pitch bells for a second one of the required pitch bell locations by identifying a nearest neighboring period of the second one of the required pitch bell locations having the second type, and selecting the pitch bell of the identified period, whereby the steps b) and c) are carried out for all of the required pitch bell locations.
摘要翻译：本发明涉及一种合成信号的方法，包括以下步骤：a）以交替顺序提供具有第一类型的第一周期和第二类型的第二周期的第一信号，b）选择一个音调钟通过识别所述第一类型的所需音调铃声位置中的第一个的最近相邻周期，并且选择所识别的周期的音调钟，来选择所需音调钟位置中的第一个，c）选择通过识别具有第二类型的所需音调铃声位置中的第二个的最近相邻周期，并且选择所识别的周期的音调钟，从而为所需的音调钟位置中的第二个音调钟位置的音调铃声，由此步骤b）和c ）用于所有所需的音调钟位置。

3. 发明授权

KR100438826B1 스무딩 필터를 이용한 음성 합성 시스템 및 그 방법 失效
标题翻译： 스무딩필터를이용한음성합성시스템및그방
公开(公告)号：KR100438826B1
公开(公告)日：2004-07-05
申请号：KR1020010067623
申请日：2001-10-31
申请人： 삼성전자주식회사
发明人： 이기승 , 김정수 , 이재원
IPC分类号： G10L13/027
CPC分类号： G10L13/07
摘要： Disclosed is a speech synthesis system and method using a smoothing filter. A speech synthesis system for controlling a discontinuous distortion occurred at the transition portion between concatenated phonemes which are speech units of a synthesized speech using a smoothing technique, comprising: a discontinuous distortion processing means adapted to predict a discontinuity occurred at the transition portion between concatenated samples of phonemes used for a speech synthesis through a predetermined learning process, and control a discontinuity occurred at the transition portion between the concatenated phonemes of the synthesized speech in such a fashion that it is smoothed adaptively to correspond to a degree of the predicted discontinuity. The smoothing filter smoothes the synthesized speech so that the discontinuity degree of synthesized speech follows the predicted discontinuity degree according to the filter coefficient (a) changed adaptively to correspond to a ratio of the predicted discontinuity degree to the real discontinuity degree. That is, since a discontinuity occurred at a transition portion between concatenated phonemes of the synthesized speech (IN) is adaptively smoothed to follow that occurred in the actually spoken sound, the synthesized speech (IN) can be approximated more closely to a real human voice.
摘要翻译：公开了一种使用平滑滤波器的语音合成系统和方法。一种语音合成系统，用于使用平滑技术控制在作为合成语音的语音单元的连接音素之间的过渡部分处发生的不连续失真，该语音合成系统包括：不连续失真处理装置，适于预测在连接样本之间的过渡部分发生的不连续性用于通过预定学习过程进行语音合成的音素，并且以这样的方式控制在合成语音的连接音素之间的过渡部分发生的不连续性，使得其自适应地平滑以对应于预测的不连续性的程度。平滑滤波器对合成语音进行平滑，使得合成语音的不连续程度根据预测不连续程度根据自适应地改变的滤波器系数（α）以对应于预测不连续程度与实际不连续程度的比率。也就是说，由于在合成语音（IN）的连接音素之间的过渡部分发生的不连续性被自适应地平滑以跟随在实际说出的声音中发生的不连续性，合成语音（IN）可以更接近于真实人声。＆lt;图像＆GT;

4. 发明授权

KR101880378B1 음성 합성 방법 및 장치 有权
公开(公告)号：KR101880378B1
公开(公告)日：2018-07-19
申请号：KR1020167028544
申请日：2015-11-24
申请人： 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
发明人： 시에,얀 , 리,슈린 , 바이,지에
IPC分类号： G10L13/02 , G10L13/04 , G10L13/08
CPC分类号： G10L13/047 , G10L13/07 , G10L13/08
摘要： 본발명은음성합성방법및 장치에관한것으로, 상기음성합성방법은텍스트를처리하여합성대기중인텍스트를획득하는단계, 네트워크연결이존재할때, 상기합성대기중인텍스트를온라인음성합성시스템으로송신하여음성합성을행하는단계, 및만약상기온라인음성합성시스템에서음성합성을행하는과정에서, 상기온라인음성합성시스템에고장이발생하거나또는실제사용과정에서네트워크연결이중단되면, 상기온라인음성합성시스템에서음성합성이미완성된텍스트를오프라인음성합성시스템으로송신하여음성합성을행하는단계를포함한다. 본발명은온라인음성합성및 오프라인음성합성의우점을결합하여더욱안정적이고효과가더욱자연스러운음성합성서비스를제공할수 있어, 사용자의음성합성요구가늘 순조롭게완성되도록확보할수 있고사용자가음성합성서비스에대한선호도및 사용자체험만족도를향상시킬수 있다.

5. 发明授权

KR101016978B1 소리 신호 합성 방법, 컴퓨터 판독가능 저장 매체 및 컴퓨터 시스템 有权
标题翻译：用于稳定声音信号的合成方法
公开(公告)号：KR101016978B1
公开(公告)日：2011-02-25
申请号：KR1020057004512
申请日：2003-08-05
申请人： 코닌클리케 필립스 엔.브이.
发明人： 기기에르캔에프
IPC分类号： G10L13/027
CPC分类号： G10L13/07 , G10L13/08 , G10L21/01
摘要： 본 발명은 제 2 소리 신호에 기초해서 제 1 소리 신호를 합성하는 방법에 관한 것으로, 제 1 소리 신호는 필수 제 1 기본 주파수를 갖고, 제 2 소리 신호는 제 2 기본 주파수를 가지며, 이 방법은 a) 제 1 기본 주파수의 한 주기만큼 이격된, 제 1 소리 신호의 시간 영역 내의 필수 피치 벨 위치를 결정하는 단계와, b) 제 2 기본 주파수의 한 주기만큼 이격된, 제 2 소리 신호의 시간 영역 내의 피치 벨 위치 상의 제 2 소리 신호를 윈도윙함으로써 피치 벨을 제공하는 단계와, c) 필수 피치 벨 위치 각각에 대해 제공된 피치 벨로부터 피치 벨을 임의로 선택하는 단계와, d) 제 1 신호를 합성하기 위해 선택된 피치 벨에 대해 중첩 및 추가 동작을 수행하는 단계를 포함한다.

6. 发明公开

KR1020170021226A 음성 합성 방법 및 장치 审中-实审
标题翻译：语音合成方法和设备
公开(公告)号：KR1020170021226A
公开(公告)日：2017-02-27
申请号：KR1020167028544
申请日：2015-11-24
申请人： 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
发明人： 시에,얀 , 리,슈린 , 바이,지에
IPC分类号： G10L13/02 , G10L13/04 , G10L13/08
CPC分类号： G10L13/047 , G10L13/07 , G10L13/08 , G10L13/02 , G10L13/04
摘要： 본발명은음성합성방법및 장치에관한것으로, 상기음성합성방법은텍스트를처리하여합성대기중인텍스트를획득하는단계, 네트워크연결이존재할때, 상기합성대기중인텍스트를온라인음성합성시스템으로송신하여음성합성을행하는단계, 및만약상기온라인음성합성시스템에서음성합성을행하는과정에서, 상기온라인음성합성시스템에고장이발생하거나또는실제사용과정에서네트워크연결이중단되면, 상기온라인음성합성시스템에서음성합성이미완성된텍스트를오프라인음성합성시스템으로송신하여음성합성을행하는단계를포함한다. 본발명은온라인음성합성및 오프라인음성합성의우점을결합하여더욱안정적이고효과가더욱자연스러운음성합성서비스를제공할수 있어, 사용자의음성합성요구가늘 순조롭게완성되도록확보할수 있고사용자가음성합성서비스에대한선호도및 사용자체험만족도를향상시킬수 있다.
摘要翻译：公开了一种语音合成方法和装置，所述语音合成方法包括：处理文本以获得要合成的文本（101）; 当存在网络连接时，将要合成的文本发送到用于语音合成的在线语音合成系统（102）; 并且在实际使用中，如果联机语音合成系统的语音合成处理或网络连接的在线语音合成系统发生故障，则将在线语音合成系统未完成语音合成的文本发送到离线语音合成语音合成系统（103）。语音合成方法结合了在线语音合成和离线语音合成的优点，从而可以提供更稳定的语音合成服务，具有更自然的效果，保证用户的语音合成请求成功完成，提高用户识别到语音综合服务和用户体验。

7. 发明授权

KR101657916B1 멀티채널 다운믹스/업믹스의 경우에 대한 일반화된 공간적 오디오 객체 코딩 파라미터 개념을 위한 디코더 및 방법 有权
标题翻译：用于多通道DownMIX / UPMIX的通用空间 - 音频 - 对象编码参数概念的解码器和方法
公开(公告)号：KR101657916B1
公开(公告)日：2016-09-19
申请号：KR1020157002923
申请日：2013-08-05
申请人： 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
发明人： 캐스트너,써스튼 , 헤레,위르겐 , 테렌티브,레옹 , 헬머스,올리버
IPC分类号： G10L19/008
CPC分类号： G10L19/008 , G10L13/07 , H04S1/002
摘要： 하나이상의다운믹스채널을포함하는다운믹스신호로부터하나이상의오디오출력채널을포함하는오디오출력신호를생성하기위한디코더가제공된다. 다운믹스신호는하나이상의오디오객체신호를인코딩한다. 디코더는하나이상의오디오객체신호중 적어도하나의잡음에너지또는신호에너지, 또는하나이상의다운믹스채널중 적어도하나의잡음에너지또는신호에너지에따라임계값을결정하기위한임계값결정기(110)를포함한다. 더욱이, 디코더는임계값에따라하나이상의다운믹스채널로부터하나이상의오디오출력채널을생성하기위한처리유닛(120)을포함한다.

8. 发明公开

KR1020150087023A 감성음성 합성장치, 감성음성 합성장치의 동작방법, 및 이를 포함하는 이동 단말기 审中-实审
标题翻译：移动终端及其控制方法
公开(公告)号：KR1020150087023A
公开(公告)日：2015-07-29
申请号：KR1020140007381
申请日：2014-01-21
申请人： 엘지전자 주식회사
发明人： 김재민 , 양종열
IPC分类号： G10L13/08 , G10L13/02
CPC分类号： G10L13/10 , G06F3/167 , G10L13/02 , G10L13/0335 , G10L13/07 , G10L2013/105
摘要： 감성음성합성장치및 이의동작방법, 및이를포함하는이동단말기가본 발명에개시된다. 본발명의실시예에따른감성음성합성장치는, 입력된문장을인식하는문장인식부와, 상기인식된문장의단어별로미리정의된감성에대한확률벡터를계산하고, 상기확률벡터를기초로상기단어별로감성및 운율을추정하는단어감성판단부와, 감성음성합성부를포함한다. 여기서, 상기감성음성합성부는, 인식된문장의문맥정보를기초로인접한단어의감성및 운율의유사정도를단계적으로산출하고, 상기유사정도와상기확률벡터를기초로, 각단어에대응되는음소후보에가중치를적용하고, 가중치가적용된음소후보중 목표피치, 지속시간, 목표피치곡선(pitch contour)의거리값이최소가되는음소후보를선택하여, 최적의단위로상기인식된문장에대응되는감성음성을합성한다.
摘要翻译：本发明公开了一种情感语音合成装置及其操作方法及包括该情绪语音合成装置的移动终端。根据本发明的实施例，情感语音合成装置包括：识别输入句子的句子识别单元; 单词情感决定单元，其计算识别句子中的各个单词的预定情绪的概率向量，并基于概率向量估计各个单词的情感和韵律; 和情感语音合成单元。情感语音合成单元基于识别语句的上下文信息，逐渐计算出相邻词的情感和韵律的相似度，基于相似度对与各个词对应的音素候选应用加权值，并且概率向量，并且在应用权重值的音素候选中选择具有目标音调，持续时间和目标音调轮廓之间的最小距离值的音素候选，从而合成与最佳单位中的识别句子相对应的情感语音。

9. 发明授权

KR100769033B1 스피치 합성 방법 有权
标题翻译：语音合成方法
公开(公告)号：KR100769033B1
公开(公告)日：2007-10-22
申请号：KR1020067006170
申请日：2004-09-17
申请人： 모토로라 솔루션즈, 인크.
发明人： 첸팡 , 첸기-린
IPC分类号： G10L13/10 , G10L13/06
CPC分类号： G10L13/07
摘要： 다수의 스피치 샘플들(140)을 포함하는 발화 파형 코퍼스(60)와 텍스트 세그먼트(120)를 비교하는 것을 포함하는 스피치 합성 수행 방법. 이 방법은 하나의 스피치 샘플(140)과 텍스트 세그먼트(120) 사이의 문맥상 최상의 매칭이 존재하는지 여부를 결정한다. 문맥상 최상의 매칭이 존재하지 않는 경우, 이 방법은 텍스트 세그먼트(120)와 스피치 샘플(140) 사이에 문맥 표음 혼성 매칭이 존재하는지 여부를 결정한다. 문맥 표음 혼성 매칭은 규정된 운율 특징 그룹(220)내의 모든 내재적 운율 특징들(210)의 매칭을 필요로 한다. 이 매칭이 여전히 발견되지 않는 경우, 운율 특징 그룹(220)은 운율 특징 그룹(220)으로부터 내재적 운율 특징들(210) 중 하나를 삭제함으로써 재규정된다. 운율 특징 그룹(220)은 입력 텍스트 세그먼트(120)와 스피치 샘플(140) 사이에 매칭이 발견될 때까지, 운율 특징 그룹(220)으로부터 하나의 내재적 운율 특징(210)을 제거함으로써 연속적으로 재규정된다. 매칭이 발견될 대, 매칭된 스피치 샘플(140)이 연쇄 스피치(110)를 생성하기 위해 사용된다.
텍스트 메모리 모듈, 스피치 합성기, 병음, 음조 문맥, 동시조음

10. 发明公开

KR1020050057409A 음성 신호 합성 방법, 컴퓨터 판독가능 저장 매체 및 컴퓨터 시스템 有权
标题翻译：控制语音合成时间的方法
公开(公告)号：KR1020050057409A
公开(公告)日：2005-06-16
申请号：KR1020057004601
申请日：2003-08-05
申请人： 코닌클리케 필립스 엔.브이.
发明人： 기기에르칸에프
IPC分类号： G10L13/08 , G10L21/04
CPC分类号： G10L13/07 , G10L21/04
摘要： The present invention relates to a method of synthesizing of a speech signal, comprising:- assigning of a first identifier to a first class of intervals of an original speech signal and assigning of a second identifier to a second class of intervals of the original speech signal,- windowing the original speech signal to provide a number of pitch bells,- processing the pitch bells having the first identifier assigned thereto for modifying a duration of the speech signal,- performing an overlap and add operation on the processed pitch bells.
摘要翻译：本发明涉及一种合成语音信号的方法，包括： - 将第一标识符分配给原始语音信号的第一类间隔，并将第二标识符分配给原始语音信号的第二类间隔， - 翻译原始语音信号以提供多个音调铃， - 处理具有分配给其的第一标识符的音调铃以修改语音信号的持续时间， - 对所处理的音调钟执行重叠和添加操作。

你已经成功收藏专利！

检索式保存成功!

IPRDB

热门服务

关于我们

友情链接

联系方式