专利快速检索-快速检索全球专利，免费商用专利数据库-IPRDB

1. 发明授权

KR101991733B1 음성 전사를 위한 시스템 및 방법 有权
公开(公告)号：KR101991733B1
公开(公告)日：2019-06-21
申请号：KR1020177008484
申请日：2015-12-14
申请人： 바이두 유에스에이 엘엘씨
发明人： 하눈,아우니 , 케이스,칼 , 캐스퍼,자레드 , 카탄자로,브라이언 , 디아모스,그레고리 , 엘센,에리히 , 프렌저,라이언 , 사티쉬,산지브 , 슙하브라타세굽타 , 코츠,애덤 , 응,앤드류
IPC分类号： G10L15/06 , G10L15/16 , G10L15/26

2. 发明公开

KR1020170106445A 배치된 단대단 음성 인식 审中-实审
标题翻译：放置端对端语音识别
公开(公告)号：KR1020170106445A
公开(公告)日：2017-09-20
申请号：KR1020177023173
申请日：2016-11-23
申请人： 바이두 유에스에이 엘엘씨
发明人： 카탄자로,브라이언 , 첸,징둥 , 흐샤노프스키,마이크 , 엘슨,에리히 , 엥겔,제시 , 포그너,크리스토퍼 , 한,수 , 하눈,아우니 , 프렌거,라이언 , 사다쉬,산지브 , 센굽타,슈브하바라타 , 요가타마,다니 , 왕,충 , 잔,준 , 추,진야오 , 아모디,다리오
IPC分类号： G10L15/16 , G10L25/21 , G10L15/02 , G10L15/06 , G10L15/14 , G10L15/183 , G10L15/197 , G10L25/18
CPC分类号： G10L15/16 , G06N3/0445 , G06N3/084 , G10L15/02 , G10L15/063 , G10L15/14 , G10L15/183 , G10L15/197 , G10L25/18 , G10L25/21 , G10L2015/0635
摘要： 영어또는표준중국어등과같은확연히다른언어의음성을인식하기위한단대단딥 러닝시스템및 방법의실시예를개시한다. 실시예에있어서, 신경망으로수동엔지니어링된부재의전체적인파이프라인을대체함으로써, 단대단학습은잡음환경, 억양및 상이한언어를포함하는여러가지음성을처리하는것을허용한다. 트레이닝된실시예와 GPU를이용하는배치디스패치기술의실시예를데이터센터에이용함으로써, 상대적으로낮은코스트로단대단딥 러닝시스템을온라인셋팅에설치하여큰 스케일로사용자에게서비스제공시 낮은지연을실현할수 있다.
摘要翻译：公开了用于识别诸如英语或标准中文等明显不同语言的声音的端到端深度学习系统和方法的实施例。在一个实施例中，通过用神经网络替换手动工程构件的整个管线，端到端学习允许处理包括噪声环境，语调和不同语言的各种语音。通过使用GPU中部署的调度技术以及数据中心中的训练实施例的实施例，当端到端深度学习系统以相对较低的成本安装在在线设置上时，可以实现低延迟，有。

3. 发明公开

KR1020170046751A 음성 전사를 위한 시스템 및 방법 审中-实审
标题翻译：用于语音转录的系统和方法
公开(公告)号：KR1020170046751A
公开(公告)日：2017-05-02
申请号：KR1020177008484
申请日：2015-12-14
申请人： 바이두 유에스에이 엘엘씨
发明人： 하눈,아우니 , 케이스,칼 , 캐스퍼,자레드 , 카탄자로,브라이언 , 디아모스,그레고리 , 엘센,에리히 , 프렌저,라이언 , 사티쉬,산지브 , 슙하브라타세굽타 , 코츠,애덤 , 응,앤드류
IPC分类号： G10L15/06 , G10L15/16 , G10L15/26
CPC分类号： G10L15/063 , G06N3/0445 , G06N3/0454 , G06N3/084 , G10L15/16 , G10L15/26
摘要： 본명세서에는단대단심층학습을이용하여개발된최신의음성인식시스템의실시예가제시된다. 실시예에있어서, 힘들게설계된처리파이프라인에의존하는종래의음성시스템에비해, 모델구조가훨씬간단할뿐만아니라, 잡음이있는환경에서사용시 이러한종래의시스템또한성능이떨어지는경향이있다. 반대로, 본시스템의실시예는, 배경잡음, 잔향또는발언자변이를모델링하기위한수작업으로설계된컴포넌트를필요로하는대신, 이러한영향에로버스트한함수를직접학습한다. 음소사전뿐만아니라, 심지어“음소”의개념도필요하지않게된다. 실시예는, 다수의 GPU를이용할수 있는양호하게최적화된회귀성신경망(RNN) 트레이닝시스템및 트레이닝을위한대량의다양한데이터를효율적으로획득하는것을허용하는신규데이터합성기법들을포함한다. 본시스템의실시예는또한광범위하게사용되는최신상업용음성시스템에비해도전적인잡음환경을더욱잘 처리할수 있다.
摘要翻译：这里给出了使用端到端深度学习开发的现有技术语音识别系统的实施例。在一个实施例中，模型结构比依赖于难以设计的处理流水线的传统语音系统简单得多，并且这些常规系统在嘈杂的环境中使用时也倾向于降低性能。相反，本系统的实施例不需要用于建模背景噪声，混响或话语变化的手动设计的组件，而是直接学习用这种效果突发的功能。除了音素字典之外，“音素”的概念不再是必需的。实施例包括能够使用多个GPU的良好优化的再生神经网络（RNN）训练系统和允许有效获取大量用于训练的各种数据的新颖数据合成技术。与广泛使用的现代商业语音系统相比，本系统的实施例还可以更好地处理具有挑战性的噪声环境。

6. 发明授权

KR101959376B1 멀티 코어 최적화된 순환 신경망을 위한 시스템 및 방법 有权
公开(公告)号：KR101959376B1
公开(公告)日：2019-07-04
申请号：KR1020160167747
申请日：2016-12-09
申请人： 바이두 유에스에이 엘엘씨
发明人： 디아모스,그레고리 , 해넌,어니 , 카탄자로,브라이언 , 아모데이,다리오 , 엘센,에리히 , 엔젤,제시 , 센굽타,슈하브라타
IPC分类号： G06N3/04 , G06N3/08

7. 发明公开

KR1020170107015A 단대단 음성 인식 审中-实审
标题翻译：端到端的语音识别
公开(公告)号：KR1020170107015A
公开(公告)日：2017-09-22
申请号：KR1020177023177
申请日：2016-11-23
申请人： 바이두 유에스에이 엘엘씨
发明人： 카탄자로,브라이언 , 첸,징둥 , 흐샤노프스키,마이크 , 엘슨,에리히 , 엥겔,제시 , 포그너,크리스토퍼 , 한,수 , 하눈,아우니 , 프렌거,라이언 , 사다쉬,산지브 , 센굽타,슈브하바라타 , 요가타마,다니 , 왕,충 , 잔,준 , 추,진야오 , 아모디,다리오
IPC分类号： G10L15/16 , G10L15/14 , G10L15/183 , G10L15/197 , G10L15/06 , G10L15/02 , G10L25/18 , G06N3/04 , G06N3/08
CPC分类号： G10L15/16 , G06N3/0445 , G06N3/084 , G10L15/02 , G10L15/063 , G10L15/14 , G10L15/183 , G10L15/197 , G10L25/18 , G10L25/21 , G10L2015/0635
摘要： 영어또는표준중국어등과같은확연히다른언어의음성을인식하기위한단대단딥 러닝시스템및 방법의실시예를개시한다. 실시예에있어서, 신경망으로수동엔지니어링된부재의전체적인파이프라인을대체함으로써, 단대단학습은잡음환경, 억양및 상이한언어를포함하는여러가지음성을처리하는것을허용한다. 트레이닝된실시예와 GPU를이용하는배치디스패치기술의실시예를데이터센터에이용함으로써, 상대적으로낮은코스트로단대단딥 러닝시스템을온라인셋팅에설치하여큰 스케일로사용자에게서비스제공시 낮은지연을실현할수 있다.
摘要翻译：公开了用于识别诸如英语或标准中文等明显不同语言的声音的端到端深度学习系统和方法的实施例。在一个示例性实施例中，通过用手动工程bujaeui整体管道如神经网络，点至点学习允许处理各种声音包括噪声，口音和不同的语言。通过使用GPU中部署的调度技术以及数据中心中的训练实施例的实施例，当端到端深度学习系统以相对较低的成本安装在在线设置上时，可以实现低延迟，有。

你已经成功收藏专利！

检索式保存成功!

IPRDB

热门服务

关于我们

友情链接

联系方式