会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 21. 发明公开
    • 用于操控技术装置的方法和设备
    • CN113711139A
    • 2021-11-26
    • CN202080027845.3
    • 2020-03-24
    • 罗伯特·博世有限公司
    • F·施密特J·G·沃尔克
    • G05B13/02
    • 用于操控技术装置(102)的计算机实现的方法和设备(100),其中所述技术装置(102)是机器人、至少部分自主的车辆、家居控制装置、家用电器、家庭手工设备尤其是电动工具、生产机器、个人辅助设备、监控系统或者访问控制系统,其中所述设备(100)具有用于至少一个传感器(108)的输入数据(106)的输入端(104)、用于借助于操控信号(112)操控所述技术装置(102)的输出端(110)和计算装置(114),所述计算装置被构造用于根据输入数据(106)操控技术装置(102),其中根据输入数据(106)确定所述技术装置(102)的至少一部分或所述技术装置(102)的环境的状态,其中根据用于所述技术装置(102)的策略和状态确定至少一个行动,并且其中所述技术装置(102)被操控用于执行至少一个行动,其中利用强化学习算法在与所述技术装置(102)或所述技术装置(102)的环境的交互中根据至少一个反馈信号学习尤其是由人工神经网络代表的策略,其中根据目标预设确定所述至少一个反馈信号,其中与连续函数的值成比例地确定交互情节的至少一个起始状态和/或至少一个目标状态,其中通过将连续函数应用于先前为策略确定的性能度量、通过将连续函数应用于先前为策略确定的性能度量的导数、通过将连续函数应用于先前为策略确定的性能度量的尤其是时间上的变化、通过将连续函数应用于策略或通过组合这些应用来确定所述值。