会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 1. 发明授权
    • 음성 합성 방법 및 장치
    • 文本到语音合成的方法和装置
    • KR100486734B1
    • 2005-05-03
    • KR1020030011786
    • 2003-02-25
    • 삼성전자주식회사
    • 페렌쯔어띨러김정수이재원
    • G10L13/00
    • G10L13/07
    • 코퍼스 기반의 음성 합성 방법이 개시된다. 코퍼스 기반으로 음성 유닛들을 접속하는 본 발명에 의한 음성 합성 방법은, (a) 접속될 상기 음성 유닛들을 결정하여 좌측 유닛과 우측 유닛으로 구분하는 단계; (b) 좌측 유닛과 우측 유닛의 보간될 소정 영역을 가변적으로 결정하는 단계; (c) 좌측 유닛과 우측 유닛의 경계에 확장부를 연결하는 단계; (d) 확장부에 대하여 대응 유닛을 기준으로 피치 파형 위치를 정렬하는 단계; 및 (e) 좌측 유닛 및 우측 유닛을 중첩하는 단계를 포함하는 것을 특징으로 한다. 따라서, 코퍼스 기반의 작은 크기의 DB로도, 가외 세그먼트 데이터의 유무에 따라 보간법 또는 보외법을 선택적으로 이용하여 평활화된 접속을 수행함으로써 접속 경계부의 음향적 부정합(acoustical mismatch)을 완화할 수 있고, 양호한 품질의 음성 합성을 구현할 수 있다. 본 발명은, 대용량 DB를 구비하는 시스템에서도 효과가 있으나, 상대적으로 소용량 DB를 구비하는 시스템에서 더욱 자연스럽고 만족스러운 음성 합성 출력을 제공하는 효과가 있다.
    • 2. 发明公开
    • 신호 합성 방법, 컴퓨터 프로그램 제품, 컴퓨터 시스템 및합성 신호
    • 合成语音的方法
    • KR1020050057354A
    • 2005-06-16
    • KR1020057004474
    • 2003-08-08
    • 코닌클리케 필립스 엔.브이.
    • 기기에르칸에프
    • G10L13/08
    • G10L13/07G10L13/04
    • The invention relates to a method of synthesizing a signal comprising the steps of: a) providing of a first signal having first periods of a first type and second periods of a second type in an alternating sequence, b) selecting of one of the pitch bells for a first one of the required pitch bell locations by identifying the nearest neighboring period of the first one of the required pitch bell locations being of the first type, and selecting of the pitch bell of the identified period, c) selecting of one of the pitch bells for a second one of the required pitch bell locations by identifying a nearest neighboring period of the second one of the required pitch bell locations having the second type, and selecting the pitch bell of the identified period, whereby the steps b) and c) are carried out for all of the required pitch bell locations.
    • 本发明涉及一种合成信号的方法,包括以下步骤:a)以交替顺序提供具有第一类型的第一周期和第二类型的第二周期的第一信号,b)选择一个音调钟 通过识别所述第一类型的所需音调铃声位置中的第一个的最近相邻周期,并且选择所识别的周期的音调钟,来选择所需音调钟位置中的第一个,c)选择 通过识别具有第二类型的所需音调铃声位置中的第二个的最近相邻周期,并且选择所识别的周期的音调钟,从而为所需的音调钟位置中的第二个音调钟位置的音调铃声,由此步骤b)和c )用于所有所需的音调钟位置。
    • 3. 发明授权
    • 스무딩 필터를 이용한 음성 합성 시스템 및 그 방법
    • 스무딩필터를이용한음성합성시스템및그방
    • KR100438826B1
    • 2004-07-05
    • KR1020010067623
    • 2001-10-31
    • 삼성전자주식회사
    • 이기승김정수이재원
    • G10L13/027
    • G10L13/07
    • Disclosed is a speech synthesis system and method using a smoothing filter. A speech synthesis system for controlling a discontinuous distortion occurred at the transition portion between concatenated phonemes which are speech units of a synthesized speech using a smoothing technique, comprising: a discontinuous distortion processing means adapted to predict a discontinuity occurred at the transition portion between concatenated samples of phonemes used for a speech synthesis through a predetermined learning process, and control a discontinuity occurred at the transition portion between the concatenated phonemes of the synthesized speech in such a fashion that it is smoothed adaptively to correspond to a degree of the predicted discontinuity. The smoothing filter smoothes the synthesized speech so that the discontinuity degree of synthesized speech follows the predicted discontinuity degree according to the filter coefficient (a) changed adaptively to correspond to a ratio of the predicted discontinuity degree to the real discontinuity degree. That is, since a discontinuity occurred at a transition portion between concatenated phonemes of the synthesized speech (IN) is adaptively smoothed to follow that occurred in the actually spoken sound, the synthesized speech (IN) can be approximated more closely to a real human voice.
    • 公开了一种使用平滑滤波器的语音合成系统和方法。 一种语音合成系统,用于使用平滑技术控制在作为合成语音的语音单元的连接音素之间的过渡部分处发生的不连续失真,该语音合成系统包括:不连续失真处理装置,适于预测在连接样本之间的过渡部分发生的不连续性 用于通过预定学习过程进行语音合成的音素,并且以这样的方式控制在合成语音的连接音素之间的过渡部分发生的不连续性,使得其自适应地平滑以对应于预测的不连续性的程度。 平滑滤波器对合成语音进行平滑,使得合成语音的不连续程度根据预测不连续程度根据自适应地改变的滤波器系数(α)以对应于预测不连续程度与实际不连续程度的比率。 也就是说,由于在合成语音(IN)的连接音素之间的过渡部分发生的不连续性被自适应地平滑以跟随在实际说出的声音中发生的不连续性,合成语音(IN)可以更接近于真实人声 。 <图像>
    • 6. 发明公开
    • 음성 합성 방법 및 장치
    • 语音合成方法和设备
    • KR1020170021226A
    • 2017-02-27
    • KR1020167028544
    • 2015-11-24
    • 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
    • 시에,얀리,슈린바이,지에
    • G10L13/02G10L13/04G10L13/08
    • G10L13/047G10L13/07G10L13/08G10L13/02G10L13/04
    • 본발명은음성합성방법및 장치에관한것으로, 상기음성합성방법은텍스트를처리하여합성대기중인텍스트를획득하는단계, 네트워크연결이존재할때, 상기합성대기중인텍스트를온라인음성합성시스템으로송신하여음성합성을행하는단계, 및만약상기온라인음성합성시스템에서음성합성을행하는과정에서, 상기온라인음성합성시스템에고장이발생하거나또는실제사용과정에서네트워크연결이중단되면, 상기온라인음성합성시스템에서음성합성이미완성된텍스트를오프라인음성합성시스템으로송신하여음성합성을행하는단계를포함한다. 본발명은온라인음성합성및 오프라인음성합성의우점을결합하여더욱안정적이고효과가더욱자연스러운음성합성서비스를제공할수 있어, 사용자의음성합성요구가늘 순조롭게완성되도록확보할수 있고사용자가음성합성서비스에대한선호도및 사용자체험만족도를향상시킬수 있다.
    • 公开了一种语音合成方法和装置,所述语音合成方法包括:处理文本以获得要合成的文本(101); 当存在网络连接时,将要合成的文本发送到用于语音合成的在线语音合成系统(102); 并且在实际使用中,如果联机语音合成系统的语音合成处理或网络连接的在线语音合成系统发生故障,则将在线语音合成系统未完成语音合成的文本发送到离线 语音合成语音合成系统(103)。 语音合成方法结合了在线语音合成和离线语音合成的优点,从而可以提供更稳定的语音合成服务,具有更自然的效果,保证用户的语音合成请求成功完成,提高用户识别 到语音综合服务和用户体验。
    • 8. 发明公开
    • 감성음성 합성장치, 감성음성 합성장치의 동작방법, 및 이를 포함하는 이동 단말기
    • 移动终端及其控制方法
    • KR1020150087023A
    • 2015-07-29
    • KR1020140007381
    • 2014-01-21
    • 엘지전자 주식회사
    • 김재민양종열
    • G10L13/08G10L13/02
    • G10L13/10G06F3/167G10L13/02G10L13/0335G10L13/07G10L2013/105
    • 감성음성합성장치및 이의동작방법, 및이를포함하는이동단말기가본 발명에개시된다. 본발명의실시예에따른감성음성합성장치는, 입력된문장을인식하는문장인식부와, 상기인식된문장의단어별로미리정의된감성에대한확률벡터를계산하고, 상기확률벡터를기초로상기단어별로감성및 운율을추정하는단어감성판단부와, 감성음성합성부를포함한다. 여기서, 상기감성음성합성부는, 인식된문장의문맥정보를기초로인접한단어의감성및 운율의유사정도를단계적으로산출하고, 상기유사정도와상기확률벡터를기초로, 각단어에대응되는음소후보에가중치를적용하고, 가중치가적용된음소후보중 목표피치, 지속시간, 목표피치곡선(pitch contour)의거리값이최소가되는음소후보를선택하여, 최적의단위로상기인식된문장에대응되는감성음성을합성한다.
    • 本发明公开了一种情感语音合成装置及其操作方法及包括该情绪语音合成装置的移动终端。 根据本发明的实施例,情感语音合成装置包括:识别输入句子的句子识别单元; 单词情感决定单元,其计算识别句子中的各个单词的预定情绪的概率向量,并基于概率向量估计各个单词的情感和韵律; 和情感语音合成单元。 情感语音合成单元基于识别语句的上下文信息,逐渐计算出相邻词的情感和韵律的相似度,基于相似度对与各个词对应的音素候选应用加权值,并且 概率向量,并且在应用权重值的音素候选中选择具有目标音调,持续时间和目标音调轮廓之间的最小距离值的音素候选,从而合成与最佳单位中的识别句子相对应的情感语音 。
    • 9. 发明授权
    • 스피치 합성 방법
    • 语音合成方法
    • KR100769033B1
    • 2007-10-22
    • KR1020067006170
    • 2004-09-17
    • 모토로라 솔루션즈, 인크.
    • 첸팡첸기-린
    • G10L13/10G10L13/06
    • G10L13/07
    • 다수의 스피치 샘플들(140)을 포함하는 발화 파형 코퍼스(60)와 텍스트 세그먼트(120)를 비교하는 것을 포함하는 스피치 합성 수행 방법. 이 방법은 하나의 스피치 샘플(140)과 텍스트 세그먼트(120) 사이의 문맥상 최상의 매칭이 존재하는지 여부를 결정한다. 문맥상 최상의 매칭이 존재하지 않는 경우, 이 방법은 텍스트 세그먼트(120)와 스피치 샘플(140) 사이에 문맥 표음 혼성 매칭이 존재하는지 여부를 결정한다. 문맥 표음 혼성 매칭은 규정된 운율 특징 그룹(220)내의 모든 내재적 운율 특징들(210)의 매칭을 필요로 한다. 이 매칭이 여전히 발견되지 않는 경우, 운율 특징 그룹(220)은 운율 특징 그룹(220)으로부터 내재적 운율 특징들(210) 중 하나를 삭제함으로써 재규정된다. 운율 특징 그룹(220)은 입력 텍스트 세그먼트(120)와 스피치 샘플(140) 사이에 매칭이 발견될 때까지, 운율 특징 그룹(220)으로부터 하나의 내재적 운율 특징(210)을 제거함으로써 연속적으로 재규정된다. 매칭이 발견될 대, 매칭된 스피치 샘플(140)이 연쇄 스피치(110)를 생성하기 위해 사용된다.
      텍스트 메모리 모듈, 스피치 합성기, 병음, 음조 문맥, 동시조음