会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 6. 发明公开
    • 음성 특징 벡터를 이용한 화자 분리 시스템 및 방법
    • 扬声器分离系统和使用语音特征向量的方法
    • KR1020160013592A
    • 2016-02-05
    • KR1020140095570
    • 2014-07-28
    • (주)복스유니버스
    • 최성윤
    • G10L17/02G10L15/02G10L15/28
    • G10L17/02G10L15/02G10L15/04G10L15/28
    • 본발명은적어도한 명이상의화자를포함하는단일채널(single-channel) 상에서음성신호의특징벡터를이용하여화자분리가가능한시스템및 방법에관한것으로, 이의시스템구성은적어도한 명이상의화자를포함하는음성신호로부터특징벡터를추출하는특징벡터추출부와, 특징벡터추출부를통해추출한특징벡터를음성구간또는비음성구간으로분류하여저장하는특징벡터저장부, 특징벡터저장부에서저장된음성구간의특징벡터가누적되면누적데이터를근거로패턴인식기법을이용하여화자를분리하는화자분리부, 및화자분리부를통해출력되는화자분리데이터와특징벡터저장부에기 저장된비음성구간의누적데이터를타임라인상에동기화하여화자별발화구간의시작및 끝시간을탐지하는발화구간탐지부를포함한다.
    • 本发明涉及一种能够通过使用包括至少一个扬声器的单通道上的语音信号的语音特征向量进行扬声器分离的系统及其方法。 其系统结构包括:特征向量提取单元,其从包括至少一个扬声器的语音信号中提取特征向量; 特征向量存储单元,其将通过特征向量提取单元提取的特征向量分类成用于存储的语音部分或非语音部分; 扬声器分离单元,如果存储在特征向量存储单元中的语音部分中的特征向量被累积,则通过使用基于累积数据的模式识别技术来分离扬声器; 以及语音部分检测单元,其将在扬声器分离单元输出的扬声器分离数据与预先存储在特征矢量存储单元中的非语音部分的累积数据同步,以检测起始 并且每个扬声器的语音部分的结束时间。
    • 7. 发明公开
    • 음성 관련 정보 제공 장치 및 방법과 이를 수행하는 프로그램을 저장하는 저장 매체
    • 提供信息相关声音的方法和装置,以及存储执行程序的介质
    • KR1020150054139A
    • 2015-05-20
    • KR1020130136168
    • 2013-11-11
    • 주식회사 한국코퍼레이션
    • 양덕수서정희서태열
    • G10L15/04G10L15/28
    • G10L15/04G10L15/00G10L15/28
    • 본명세서는음성분석정보제공방법및 장치에관한것으로, 주제에연관된키워드를획득하는단계, 음성인식에기반하여단위음성데이터중 상기키워드의예상위치를획득하는단계, 상기단위음성데이터로부터상기주제에연관된둘 이상의키워드의예상위치가검출되고상기둘 이상의키워드의예상위치가미리설정된시간차이이내에위치하는것으로판단되면상기둘 이상의키워드의예상위치를기초로상기주제의유력예상위치를획득하는단계및 상기유력예상위치에관한정보를제공하는단계를포함할수 있다. 본명세서의적어도일부의실시예에따르면효율적인음성처리방식을제공할수 있다.
    • 本发明涉及一种用于提供语音分析信息的装置和方法,包括以下步骤:获得与被摄体有关的关键字; 基于语音识别获得单位语音数据中关键词的估计位置; 当通过单位语音数据检测至少两个与该对象相关的关键词的估计位置时,基于至少两个关键词的估计位置,获得有希望的估计位置,确定至少两个关键字的估计位置为 定位在预设时间差内; 并提供有关有希望的估计位置的信息。 根据本发明的实施例,可以提供有效的语音处理方法。
    • 8. 发明公开
    • 음성 인식용 탐색 공간 생성 장치 및 방법
    • 用于在语音识别中产生调查空间的装置
    • KR1020130026855A
    • 2013-03-14
    • KR1020110090283
    • 2011-09-06
    • 한국전자통신연구원
    • 김승희김동현김영익박준조훈영김상훈
    • G10L15/08
    • G10L15/08G10L15/04G10L15/14
    • PURPOSE: A search space generator for recognizing voice is provided to improve the accuracy of voice recognition by recognizing the voice by using a voice articulation database for training a voice model. CONSTITUTION: A search space generator for recognizing voice includes a pronunciation dictionary(100), a word list database(120), a WFST(Weighted Finite State Transducer) L realization unit(140), and a WFST L database(160). The WFST L implementation unit acquires a pronunciation string for each word by reading the pronunciation dictionary. The WFST L implementation unit generates WFST L in which a selective pause is inserted by comparing the acquired pronunciation dictionary with the word list stored in the word list database. [Reference numerals] (100) Pronunciation dictionary; (120) Word list database; (140) WFST L realization unit; (160) WFST L database
    • 目的:提供用于识别语音的搜索空间发生器,以通过使用用于训练语音模型的语音发音数据库识别语音来提高语音识别的准确性。 构成:用于识别语音的搜索空间发生器包括发音字典(100),单词列表数据库(120),WFST(加权有限状态传感器)L实现单元(140)和WFST L数据库(160)。 WFST L实现单元通过读取发音字典获取每个单词的发音字符串。 WFST L实现单元产生WFST L,其中通过将获取的发音字典与存储在单词列表数据库中的单词列表进行比较来插入选择性暂停。 (附图标记)(100)发音字典; (120)词汇表数据库; (140)WFST L实现单元; (160)WFST L数据库
    • 9. 发明公开
    • 음가의 강세를 이용한 발음기관 애니메이션 생성 장치 및 방법
    • 使用电话价值来生成VOCAL ORGANS动画的装置和方法
    • KR1020120109879A
    • 2012-10-09
    • KR1020110027666
    • 2011-03-28
    • (주)클루소프트
    • 박봉래
    • G06T13/00G06T13/40G10L11/00G10L15/02
    • G10L15/005G06T13/205G06T13/40G10L13/08G10L15/04G10L21/10G10L25/90
    • PURPOSE: An apparatus and a method for generating vocal organs are provided to generate vocal organs by reflecting a phonetic type of a native speaker changed according to the strength of phonetic values. CONSTITUTION: A phonetic value information generator(120) generates phonetic value configuration information. A per-accent phonetic value applying unit(130) applies detailed phonetic value per accent. A pronunciation type detector(140) detects pronunciation configuration information corresponding to the detail phonetic value. An animation generator(160) allots the detected pronunciation configuration information to each phonetic value. The animation generator generates a vocal organ animation corresponding to words included in character information. [Reference numerals] (110) Input unit; (120) Phonetic value information generator; (125) Phonetic value information storing unit; (130) Per-accent phonetic value applying unit; (135) Per-accent phonetic value storing unit; (140) Pronunciation type detector; (145) Pronunciation type information storing unit; (150) Animation controlling unit; (160) Animation generator; (170) Output unit
    • 目的:提供一种用于产生声乐器官的装置和方法,以通过反映根据语音值的强度而改变的母语者的语音类型来产生声乐器官。 构成:语音值信息生成器(120)产生语音值配置信息。 每重音音标值应用单元(130)每个重音应用详细的语音值。 发音型检测器(140)检测与细节语音对应的发音配置信息。 动画生成器(160)将检测到的发音配置信息分配给每个语音值。 动画生成器生成与包含在字符信息中的单词对应的声乐器动画。 (附图标记)(110)输入单元; (120)语音信息发生器; (125)语音值信息存储单元; (130)每口音语音应用单位; (135)每重音音标值存储单元; (140)发音型探测器; (145)发音类型信息存储单元; (150)动画控制单元; (160)动画发生器; (170)输出单元
    • 10. 发明公开
    • 발음 공간 생성 장치 및 그 방법
    • 装置和方法,用于产生授权空间
    • KR1020120054350A
    • 2012-05-30
    • KR1020100115681
    • 2010-11-19
    • 한국전자통신연구원
    • 정훈박전규이윤근송화전이성주정호영강병옥박기영김종진전형배정의석강점자
    • G10L15/04
    • G10L15/04G10L15/18
    • PURPOSE: A pronunciation space formation apparatus is provided to minutely model pronunciation modification rules within a word or between words by applying a probabilistic pronunciation modification rule and expanding a pronunciation space. CONSTITUTION: A pronunciation space generator(110) creates a pronunciation space based on a recognition target word. A pronunciation space expansion unit(120) expands the created pronunciation space in consideration of pronunciation modification rules within a word or between words. A power supply unit(130) supplies a power source to the pronunciation space generator and the pronunciation space expansion unit. A main control unit(140) controls the whole operation of the pronunciation space generator and the pronunciation space expansion unit.
    • 目的:提供一种发音空间形成装置,通过应用概率发音修改规则和扩展发音空间来精细地模拟单词内或单词之间的发音修改规则。 构成:发音空间发生器(110)基于识别目标词创建发音空间。 发音空间扩展单元(120)考虑到单词内或单词之间的发音修改规则来扩展创建的发音空间。 电源单元(130)向发音空间发生器和发音空间扩展单元提供电源。 主控制单元(140)控制发音空间发生器和发音空间扩展单元的整体操作。