专利快速检索-快速检索全球专利，免费商用专利数据库-IPRDB

11. 发明公开

KR1019990047332A 텍스트/음성 변환기에서 신경망을 이용한 에너지컨투어 생성 방법 无效
标题翻译：如何在文本到语音转换器中使用神经网络生成能量轮廓
公开(公告)号：KR1019990047332A
公开(公告)日：1999-07-05
申请号：KR1019970065689
申请日：1997-12-03
申请人： 한국전자통신연구원
发明人： 박준 , 이정철 , 강동규 , 김상훈
IPC分类号： G06F3/16
摘要： 본 발명은 텍스트/음성 변환기(text-to-speech conversion system)에서 신경망을 이용한 에너지 컨투어 생성 방법에 관한 것이다.
종래 합성기는 입력된 텍스트로부터 합성음을 생성하는데 있어서 에너지 컨투어 제어를 인접한 합성단위간의 에너지 컨투어 평활화와 강세 정도의 처리 만을 하고 있다. 그러므로 종래의 텍스트/음성변환기 방식을 이용하여 문장단위의 에너지 컨투어를 제어하기는 불가능하다.
따라서, 본 발명은 음운환경, 단어간 끊어읽기, 앞/현재/뒤 단어의 평균 피치값을 입력으로 하는 다층신경망을 이용한 학습방법을 사용하여 문장내 음절의 에너지값을 추정, 합성음 생성에 사용함으로써 합성음의 자연성 구현을 그 목적으로 한다. 본 발명은 입력 텍스트에 대한 언어처리 결과를 입력받아서 문장내 음절의 에너지값을 출력하는 다층신경망을 이용하여 실제 음성데이타의 음절 에너지값으로 학습하고, 학습 결과를 이용하여 텍스트/음성 변환기에서 문장단위의 에너지 컨투어를 생성하는 방식을 통해 문장내 에너지 변화를 제어함으로써 합성음의 자연성이 향상되므로 텍스트/음성 변환기의 자연성이 요구되는 응용분야인 통신 서비스, 사무 자동화, 교육 등의 여러 분야에 응용할 수 있는 효과가 있다.

12. 发明公开

KR1019980037190A 유성음 구간에서 프레임별 피치 검출 방법 失效
公开(公告)号：KR1019980037190A
公开(公告)日：1998-08-05
申请号：KR1019960055906
申请日：1996-11-21
申请人： 한국전자통신연구원
发明人： 강동규 , 한민수
IPC分类号： G10L25/90
摘要： 본 발명은 음성 신호 처리 방법에 관한 것으로, 약 500㎐로 저역 통과된 유성음 신호에서 인접한 영교차점 구간별 면적을 산출하고 인접한 면적의 합을 구하여 피치를 검출하기 용이한 진폭 변화를 피크를 산출한다. 그리고 분석 프레임 내에서 대표적인 진폭 변화 피크의 수에 따라 분석 프레임의 길이를 재설정한 후 임의의 두 진폭 변화 피크의 크기에 대한 유사도를 두 피크의 거리에 대한 분포로 나타내고 최대 분포 봉우리의 중심 거리를 측정하여 분석 구간 내에서의 피치 및 후보 피치를 검출한다. 또한 전체 음성 신호의 피치 윤곽선에서 프레임별 피치 변화치를 참조로 예상 검출에러 구간에 대해 후보 피치를 이용하여 에러를 수행한다. 이렇게 함으로서 보다 정확한 피치를 검출할 수 있고 광범위한 피치의 분포와 변화에 적응이 용이할 뿐 아니라 고속 처리가 가능한 유성음 구간에서 프레임별 피치 검출 방법이 제시된다.

13. 发明授权

KR100373329B1 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법 失效
标题翻译： 음운환경과묵음구간길이를이용한텍스트/음성변환장치및그방
公开(公告)号：KR100373329B1
公开(公告)日：2003-02-25
申请号：KR1019990033869
申请日：1999-08-17
申请人： 한국전자통신연구원
发明人： 이정철 , 강동규 , 김상훈
IPC分类号： G10L13/00
摘要： PURPOSE: An apparatus and a method for changing text/speech using phoneme environment and mute section are provided to improve clearness and nature of compound sound by using mute period length information for selecting the compound unit. CONSTITUTION: The apparatus for changing text/speech using phoneme environment and mute section includes following units. A language processing unit(21) extracts phoneme stream and sentence structure information from the text being inputted. A rhythm processing unit(22) receives the phoneme stream and sentence structure information and estimates a rhythm control parameter value by using a rule and rhythm table. A compound unit database(24) stores sound pieces corresponding to the searching information of compound unit. A signal processing unit(23) produces a compound unit searching information, selects the stored candidate sound pieces and then produces a desired compound sound by compounding the selected sound pieces.
摘要翻译：目的：提供一种使用音素环境和静音部分来改变文本/语音的装置和方法，以通过使用静音周期长度信息来选择复合单元来改善复合声音的清晰度和性质。组成：使用音素环境和静音部分改变文本/语音的装置包括以下单元。语言处理单元（21）从输入的文本中提取音素流和句子结构信息。节奏处理单元（22）接收音素流和句子结构信息，并通过使用规则和节奏表来估计节奏控制参数值。复合单元数据库（24）存储对应于复合单元的搜索信息的声音片段。信号处理单元（23）产生复合单元搜索信息，选择存储的候选声音片段，然后通过复合所选择的声音片段来产生期望的复合声音。

14. 发明授权

KR100340690B1 그래픽 사용자 인터페이스를 이용한 합성 음성 분석 방법 失效
标题翻译：一种使用图形用户界面分析合成语音的方法
公开(公告)号：KR100340690B1
公开(公告)日：2002-06-20
申请号：KR1019990039869
申请日：1999-09-16
申请人： 한국전자통신연구원
发明人： 강동규 , 이정철 , 김상훈
IPC分类号： G10L13/027
摘要： 1. 청구범위에기재된발명이속한기술분야본 발명은그래픽사용자인터페이스를이용한합성음성분석방법에관한것임. 2. 발명이해결하려고하는기술적과제본 발명은하나의음편에대하여여러개의후보가있는고품질음성합성기의합성음을그래픽사용자인터페이스를이용하여보다효율적으로분석하기위한합성음성분석방법및 그기록매체를제공하는데그 목적이있음. 3. 발명의해결방법의요지본 발명은, 전체합성음에대한기본주파수궤적, 각인접한음편간의스펙트럼차이및 음편경계를음성파형에동기시켜그래픽사용자인터페이스를이용하여표시하는제 1 단계; 전체음성파형에서선택된하나의음편후보에대한기본주파수분포, 지속시간분포및 포먼트에의해합성단위후보의분포를나타낸후에현재의음편과인접한음편위치를분포도위에나타내는제 2 단계; 및선택된음편의분포도에서원하는임의의특성을선택하여현재의합성된음편을교체한후에교체된합성파형을음성으로출력하는제 3 단계를포함한다. 4. 발명의중요한용도본 발명은음성합성기의성능분석에이용됨.

15. 发明公开

KR1020010027891A 그래픽 사용자 인터페이스를 이용한 합성 음성 분석 방법 失效
标题翻译：使用图形用户界面分析合成声音的方法
公开(公告)号：KR1020010027891A
公开(公告)日：2001-04-06
申请号：KR1019990039869
申请日：1999-09-16
申请人： 한국전자통신연구원
发明人： 강동규 , 이정철 , 김상훈
IPC分类号： G10L13/027
摘要： PURPOSE: An analyzing method for synthetic sound and a recording medium thereof are provided to efficiently analyze the synthetic sound of a high quality sound synthesizer using a graphic user interface. CONSTITUTION: Synthetic sound is analyzed by indicating the track of a reference frequency about entire synthetic sound, the spectrum difference between each adjacent sound piece and the edge of the sound pieces using a graphic user interface after synchronizing the frequency, the spectrum difference and the edge with a sound wave form; by indicating the position of a sound piece contiguous to a present sound piece on a distribution chart after indicating the reference frequency distribution and the continuous time distribution of one selected sound piece and indicating a synthetic unit waiting list distribution by a formant; and by exchanging the present synthetic sound piece with the optional property of the selected sound piece and outputting a synthetic wave form as sound.
摘要翻译：目的：提供合成声音的分析方法及其记录介质，以便使用图形用户界面来有效地分析高质量声音合成器的合成声音。规定：合成声音通过在同步频率，频谱差和边缘之间通过使用图形用户界面指示关于整个合成声音的参考频率的轨迹，每个相邻声部之间的频谱差和声音片的边缘具有声波形式; 通过在指示参考频率分布和一个所选声音的连续时间分布并且表示共同体的合成单元等待列表分配之后，指示在分布图上与当前音片相邻的声音片段的位置; 并且通过使用所选择的声音片的可选属性交换当前的合成声音片并输出合成波形作为声音。

16. 发明授权

KR100211965B1 유성음 구간에서 피치동기식 포먼트 추정방법 失效
标题翻译：提取语音同声传译的方法
公开(公告)号：KR100211965B1
公开(公告)日：1999-08-02
申请号：KR1019960068952
申请日：1996-12-20
申请人： 한국전자통신연구원
发明人： 강동규 , 한민수
IPC分类号： G10L25/90
摘要： 본 발명은 유성음 구간에서 피치동기식 포먼트(formant) 추정방법에 관한 것이다. 그 목적은 선형예측(Linear Prediction) 기법으로 음성신호의 유성음구간에서 피치(pitch) 길이에 관계없이 음원에 의한 영향을 최소화하면서 정밀한 포먼트 정보를 추출하는 데에 있다.
그 특징은 에포크(epoch)를 참조하여 분석구간의 길이를 결정하는 단계와, 선택된 분석구간 내에서 각각의 성문열림 구간 중 에포크로부터 해당 피치의 20% 내외의 구간을 '0'으로 대치하고 선형예측(공분산 혹은 자기 상관계수방법 등) 분석을 수생하는 단계와, 산출된 선형예측계수를 이용하여 '0'으로 대치된 각각의 성문열림 구간을 선형 예측된 값으로 음성을 합성하여 대치함으로써 성문파(음원)의 영향이 줄어든 임펄스 응답신호에 가까운 신호로 변환하고 다시 선형예측 계수를 산출하는 단계와, 선형예측 분석단계에서 산출된 선형예측 계수를 이용하여 성문열림 구간을 피치의 30% 내외까지 확장하여 성문파의 영향을 더욱 억제하여 보다 임펄스 응답신호에 가까운 신호로 변환한 다음 최종적인 선형예측 분석을 수행하여 포먼트 정보를 추출하는 � ��계 및 전체 음성신호에 대해 상기 단계들을 모두 수행하여 얻은 포먼트 궤적에 대하여 피티 주기별로 포먼트의 변화치를 산출하여 그 값이 200Hz를 초과할 경우에 에러발생 여부를 확인하고 궤적의 밀림현상을 보정하여 최종적인 포먼트 궤적을 구하는 단계로 이루어지는 데에 있다.

17. 发明授权

KR100292801B1 영역의존 음성합성용 데이터베이스를 이용한 음성 합성 방법 失效
标题翻译：基于区域相关语音合成的语音合成方法
公开(公告)号：KR100292801B1
公开(公告)日：2001-06-15
申请号：KR1019980051342
申请日：1998-11-27
申请人： 한국전자통신연구원
发明人： 김상훈 , 이정철 , 강동규 , 이영직 , 양재우
IPC分类号： G10L13/00
摘要： 본 발명은 무제한 텍스트를 기본으로 합성하되 특정 서비스 분야에 따라 영역의존 음성합성용 데이터베이스를 각각 제작하여 특정 영역에서는 상용화 가능한 음질을 생성할 수 있는 영역의존 음성합성용 데이터베이스를 이용한 음성 합성 방법을 제공하는 데 그 목적이 있다.
본 발명에 따르면, 음성합성용 데이터베이스를 이용한 음성 합성 방법에 있어서, 영역별 텍스트 코피스로부터 고유 트라이폰 발생 빈도를 추출하여 영역의존 최적 텍스트 세트를 선정하는 제 1 단계; 발성된 영역 의존 텍스트로부터 EGG 신호를 추출한 후에, 트라이폰 단위로 분절하여 합성 데이터베이스를 구축하는 제 2 단계; 및 구축된 영역 의존 데이터베이스와 무제한용 합성 데이터베이스를 이용하여 음성을 합성하는 제 3 단계를 포함하여 이루어진 음성 합성 방법이 제공된다.

18. 发明公开

KR1020010018064A 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법 失效
标题翻译：使用电话环境和静音部分更改文本/语音的装置和方法
公开(公告)号：KR1020010018064A
公开(公告)日：2001-03-05
申请号：KR1019990033869
申请日：1999-08-17
申请人： 한국전자통신연구원
发明人： 이정철 , 강동규 , 김상훈
IPC分类号： G10L13/00
摘要： PURPOSE: An apparatus and a method for changing text/speech using phoneme environment and mute section are provided to improve clearness and nature of compound sound by using mute period length information for selecting the compound unit. CONSTITUTION: The apparatus for changing text/speech using phoneme environment and mute section includes following units. A language processing unit(21) extracts phoneme stream and sentence structure information from the text being inputted. A rhythm processing unit(22) receives the phoneme stream and sentence structure information and estimates a rhythm control parameter value by using a rule and rhythm table. A compound unit database(24) stores sound pieces corresponding to the searching information of compound unit. A signal processing unit(23) produces a compound unit searching information, selects the stored candidate sound pieces and then produces a desired compound sound by compounding the selected sound pieces.
摘要翻译：目的：提供使用音素环境和静音部分改变文字/语音的装置和方法，通过使用静音长度信息来选择复合单元来提高复合声音的清晰度和性质。规定：使用音素环境和静音部分改变文字/语音的设备包括以下单元。语言处理单元（21）从输入的文本中提取音素流和句子结构信息。节奏处理单元（22）接收音素流和句子结构信息，并通过使用规则和节奏表来估计节奏控制参数值。复合单元数据库（24）存储与复合单元的搜索信息相对应的声音。信号处理单元（23）产生复合单元搜索信息，选择所存储的候选声音片段，然后通过复合所选择的声音片段产生期望的复合声音。

19. 发明公开

KR1019990043759A 골도 마이크를 이용한 음성 인식 방법 无效
标题翻译：使用骨传声器的语音识别方法
公开(公告)号：KR1019990043759A
公开(公告)日：1999-06-15
申请号：KR1019970064801
申请日：1997-11-29
申请人： 한국전자통신연구원
发明人： 김회린 , 안영목 , 강동규
IPC分类号： G10L15/20
摘要： 본 발명은 골도 마이크를 이용한 음성 인식 방법에 관한 것이다. 신호 대 잡음비가 10dB 내지 -5dB인 고 잡음 환경에서의 음성 인식 시스템은 음성에 섞여 있는 잡음으로 인해 정확한 음성 구간의 검출이 불가능하고 음성 특징 벡터 추출 시에도 잡음으로 인하여 입력된 음성 자체의 고유한 특징을 추출해 내기가 어렵다. 따라서 주변이 조용한 환경에서 잘 동작하는 음성 인식기를 고 잡음 환경에서 사용하면 인식 성능이 급격히 저하된다. 종래에는 이러한 문제점을 해결하기 위하여 주변 환경의 잡음이 마이크에 입력되는 비율을 낮추기 위해 지향성 마이크를 사용하는 방법, 입력된 신호로부터 잡음을 제거하기 위하여 아날로그/디지털 변환된 디지털 신호를 적응 신호처리 하여 음질을 개선하는 방법, 잡음이 혼합된 음성 신호로부터 잡음에 강인한 특징 벡터를 추출하는 방법 등을 사용하였다. 그러나 이러한 방법들도 고 잡음 환경에서는 여전히 정확한 음성 구간 검출이나 음성 자체의 고유한 특징을 추출해 내는데 한계가 있어, 음성 인식의 성능이 크게 개선되지 못하는 문제점이 있다. 따라서 본 발명에서는 고 잡음 환경에서 골도(bone conduction) 마이크를 사용함으로써 음성 입력 단계에서 미리 잡음을 제거하여 음성 인식 성능을 향상시킬 수 있는 골도 마이크를 이용한 음성 인식 방법이 제시된다.

20. 发明授权

KR100194953B1 유성음 구간에서 프레임별 피치 검출 방법 失效
标题翻译：在浊音区域检测每帧音调的方法
公开(公告)号：KR100194953B1
公开(公告)日：1999-06-15
申请号：KR1019960055906
申请日：1996-11-21
申请人： 한국전자통신연구원
发明人： 강동규 , 한민수
IPC分类号： G10L25/90
摘要： 본 발명은 음성 처리 방법에 관한 것으로, 약 500Hz로 지역 통과된 유성을 신호에서 인접한 영교차점 구간별 면적을 산출하고 인접한 면적의 합을 구하여 피치를 검출하기 용의한 진폭 변화 피크를 산출한다. 그리고 분석 프레임 내에서 대표적인 진폭 변화 피크의 수에 따라 분석 프레임의 길이를 재설정한 후 임의의 두 진폭 변화 피크의 크기에 대한 유사도를 두 피크의 거리에 대한 분포로 나타내고 최대 분포 봉우리의 중심 거리를 측정하여 분석 구간 내에서의 피치 및 후보 피치를 검출한다. 또한 전체 음성 신호의 피치 윤곽선에서 프레임별 피치 변화치를 참조로 예상 검출에러 구간에 대해 후보 피치를 이용하여 에러를 수정한다. 이렇게 함으로서 보다 정확한 피치를 검출할 수 있고 광범위한 피치의 분포와 변화에 적용이 용이할 뿐 아니라 고속 처리가 가능한 유성음 구간에서 프레임별 피치 검출 방법이 제시된다.

你已经成功收藏专利！

检索式保存成功!

IPRDB

热门服务

关于我们

友情链接

联系方式