会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 3. 发明公开
    • 음성 전사를 위한 시스템 및 방법
    • 用于语音转录的系统和方法
    • KR1020170046751A
    • 2017-05-02
    • KR1020177008484
    • 2015-12-14
    • 바이두 유에스에이 엘엘씨
    • 하눈,아우니케이스,칼캐스퍼,자레드카탄자로,브라이언디아모스,그레고리엘센,에리히프렌저,라이언사티쉬,산지브슙하브라타세굽타코츠,애덤응,앤드류
    • G10L15/06G10L15/16G10L15/26
    • G10L15/063G06N3/0445G06N3/0454G06N3/084G10L15/16G10L15/26
    • 본명세서에는단대단심층학습을이용하여개발된최신의음성인식시스템의실시예가제시된다. 실시예에있어서, 힘들게설계된처리파이프라인에의존하는종래의음성시스템에비해, 모델구조가훨씬간단할뿐만아니라, 잡음이있는환경에서사용시 이러한종래의시스템또한성능이떨어지는경향이있다. 반대로, 본시스템의실시예는, 배경잡음, 잔향또는발언자변이를모델링하기위한수작업으로설계된컴포넌트를필요로하는대신, 이러한영향에로버스트한함수를직접학습한다. 음소사전뿐만아니라, 심지어“음소”의개념도필요하지않게된다. 실시예는, 다수의 GPU를이용할수 있는양호하게최적화된회귀성신경망(RNN) 트레이닝시스템및 트레이닝을위한대량의다양한데이터를효율적으로획득하는것을허용하는신규데이터합성기법들을포함한다. 본시스템의실시예는또한광범위하게사용되는최신상업용음성시스템에비해도전적인잡음환경을더욱잘 처리할수 있다.
    • 这里给出了使用端到端深度学习开发的现有技术语音识别系统的实施例。 在一个实施例中,模型结构比依赖于难以设计的处理流水线的传统语音系统简单得多,并且这些常规系统在嘈杂的环境中使用时也倾向于降低性能。 相反,本系统的实施例不需要用于建模背景噪声,混响或话语变化的手动设计的组件,而是直接学习用这种效果突发的功能。 除了音素字典之外,“音素”的概念不再是必需的。 实施例包括能够使用多个GPU的良好优化的再生神经网络(RNN)训练系统和允许有效获取大量用于训练的各种数据的新颖数据合成技术。 与广泛使用的现代商业语音系统相比,本系统的实施例还可以更好地处理具有挑战性的噪声环境。