会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 2. 发明授权
    • 신호의 피치를 평가하는 방법 및 장치
    • 音调估计的方法和装置
    • KR100590561B1
    • 2006-06-19
    • KR1020040081343
    • 2004-10-12
    • 삼성전자주식회사
    • 이영범쉬얀얀이재원
    • G10L15/12G10L15/08
    • G10L25/90
    • 본 발명은 높은 주기 평가값(pr)을 가지는 후보 피치들에 기초하여 통합 가우시안 분포를 생성하고, 높은 가능도(likelihood)늘 가지는 통합 가우시안 분포를 선택하여 동적 프로그램(dynamic programming)을 실행함으로써 보다 정확하게 음성 신호의 피치를 평가할 수 있는 방법 및 장치에 관한 것이다.
      본 발명에 상응하는 피치 측정 방법은 음성 신호의 프레임에 윈도우 신호(W(t))를 곱하여 윈도우된 신호(Sw(t))에 대한 정규화 자기 상관 함수(Ro(i))를 계산하고 상기 윈도우된 신호에 대한 정규화 자기 상관 함수의 피크 값으로부터 후보 피치들을 결정하는 단계, 상기 결정된 후보 피치들에 대한 주기와 상기 주기의 주기성을 나타내는 주기 평가값을 보간하는 단계, 제1 임계값(TH1) 이상의 보간 주기 평가값을 가지는 각 프레임의 후보 피치들에 대한 가우시안 분포를 생성하는 단계, 상기 가우시안 분포들 중에서 제2 임계값(TH2) 이하의 거리에 있는 가우시안 분포를 통합하여 통합 가우시안 분포를 생성하고, 상기 생성된 통합 가우시안 분포들 중에서 제3 임계값(TH3)을 초과하는 가능도(likelihood)를 가지는 적어도 1개 이상의 통합 가우시안 분포를 선택하는 단계 및 상기 각 프레임의 후보 피치들과 상기 선택된 통합 가우시안 분포들에 기초하여, 상기 프레임들에 대해 동적 프로그램을 실행하여 각 프레임의 피치를 결정하는 단계를 포함하는 것을 특징으로 한다.
    • 3. 发明授权
    • 동적 타임 워핑 디바이스와 이를 이용한 음성 인식 장치
    • 동적타임워핑디바이스와이를이용한음성인식장치
    • KR100462472B1
    • 2004-12-17
    • KR1020020054940
    • 2002-09-11
    • 학교법인 포항공과대학교
    • 정홍김용
    • G10L15/12
    • G10L15/12
    • Provided are a dynamic time warping device using speech recognition software, and a speech recognition apparatus using the same. The dynamic time warping device includes memory units for processing characterization vectors of a test pattern and a predetermined reference pattern using a FIFO queue, and a plurality of processing elements serially connected to each other, the plurality of processing elements multiplying a predetermined weight by a difference between the characterization vectors of the test and reference patterns, which are obtained by shifting them in the opposite directions, adding the multiplication result to matching cost values of adjacent nodes, and comparing the addition results to detect the smallest matching cost value. Accordingly, fast speech recognition can be realized by embedding speech recognition software using a dynamic time warping algorithm into hardware. Also, it is possible to increase a recognition rate of speech by adjusting weight according to a node to be compared, and provide a dynamic time warping device that can be mass-produced as application-specification integrated circuits (ASICs). Further, a compact speech recognition apparatus using the dynamic time warping device can be provided without requiring a computer to drive software for speech recognition.
    • 提供了一种使用语音识别软件的动态时间规整装置以及使用该装置的语音识别装置。 动态时间伸缩装置包括用于使用FIFO队列来处理测试模式的特征向量和预定参考模式的存储器单元以及彼此串联连接的多个处理元件,多个处理元件将预定权重乘以差值 通过在相反方向上移动它们获得的测试和参考模式的特征向量之间,将相乘结果添加到相邻节点的匹配成本值,并比较相加结果以检测最小匹配成本值。 因此,通过使用动态时间规整算法将语音识别软件嵌入到硬件中可以实现快速语音识别。 而且,可以通过根据要比较的节点调整权重来提高语音的识别率,并且提供可以作为应用规范集成电路(ASIC)批量生产的动态时间规整装置。 此外,可以提供使用动态时间规整装置的小型语音识别装置,而不需要计算机驱动用于语音识别的软件。
    • 5. 发明公开
    • 음성 데이터 베이스 구축 방법
    • 构建语音数据库的方法
    • KR1020010027464A
    • 2001-04-06
    • KR1019990039234
    • 1999-09-14
    • 주식회사 현대오토넷
    • 김선화
    • G10L15/12
    • PURPOSE: A method for constructing a voice database is provided to recognize a voice by constructing a voice database in phoneme like units. CONSTITUTION: The method for constructing a voice database comprises the following steps of a collection process(S10), an extraction process(S20), and a labelling process(S30). The collection process(S10) is to collect a word or a sentence from a particular speaker. The extraction process(S20) is to extract phoneme like units predicted from the collected voice of the specific speaker. The labelling process(S30) is to designate specific extension names and file names of each extracted phoneme like unit and store them to a voice database.
    • 目的:提供一种构建语音数据库的方法,通过以音素单位构建语音数据库来识别语音。 构成:构成语音数据库的方法包括收集处理(S10),提取处理(S20)和标签处理(S30)的以下步骤。 收集过程(S10)是从特定说话者收集一个单词或一个句子。 提取处理(S20)是从特定说话者的收集的声音中提取与单元预测相似的音素。 标签处理(S30)是指定每个提取的音素单元的特定扩展名和文件名,并将其存储到语音数据库。
    • 10. 发明授权
    • 음성 인식 장치
    • 用于语音识别的装置
    • KR100693284B1
    • 2007-03-13
    • KR1020050031127
    • 2005-04-14
    • 학교법인 포항공과대학교포항공과대학교 산학협력단
    • 정홍김용
    • G10L15/12
    • G10L15/32G10L15/20G10L21/0208
    • 본 발명은 히든 마코프 모델과 두 개의 레벨을 갖는 동적 프로그래밍을 이용한 음성 인식 장치에 관한 것이다.
      본 발명에 따른 음성 인식 장치는 음성 신호를 샘플링하고 양자화하여 디지털 음성 신호로 변환하는 A/D 변환부; 변환된 디지털 음성 신호의 잡음을 제거하는 잡음 제거부; 잡음이 제거된 음성 신호로부터 특징 벡터를 생성하고 음성 인식을 위한 테스트 패턴으로 변환하는 특징 벡터 생성부; 및 다수 개의 프로세싱 엘리먼트가 병렬로 배치되며, 각 프로세싱 엘리먼트는 테스트 패턴과 레퍼런스 패턴의 매칭 코스트를 각각 계산하고 계산된 매칭 코스트 중 최소값을 선택하여 유입된 테스트 패턴의 최소 매칭 코스트로 산출하는 프로세싱부를 포함한다.
      본 발명의 구성에 따르면, 신속히 음성 인식을 처리할 수 있을 뿐만 아니라 음성 인식률을 제고시키고 ASIC으로 대량 생산할 수 있는 음성 인식 장치를 제공할 수 있다.
      히든 마코프 모델, 레퍼런스 패턴, 매칭 코스트