会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 90. 发明授权
    • 一种基于强化学习的通信资源分配方法及其相关设备
    • CN113543065B
    • 2024-02-02
    • CN202110605101.1
    • 2021-05-31
    • 北京邮电大学
    • 李斌蒋丽萍赵成林许方敏
    • H04W4/40H04W16/14H04W72/044H04W72/53
    • 本公开提供一种基于强化学习的通信资源分配方法及其相关设备,所述方法包括:综合考虑目标用户和非目标用户的位置、目标用户的Q值和回报函数,通过生成随机数,根据生成的随机数和ε贪婪算法,确定目标用户的信道选择策略和功率选择策略,进一步根据各个参数、信道选择策略和功率选择策略计算下一时刻的各个参数并更新目标用户的Q值,最后循环迭代直到满足预设的迭代时间或预设条件,得到目标用户的最终信道选择策略和所述目标用户的最终功率选择策略,并根据所述最终信道选择策略和所述最终功率选择策略,进行通信资源分配。使得信令开销降低,实现不同类型用户之间频谱资源的共享,提高频谱资源的利用率,缓解当前频谱(56)对比文件尹翔;李斌;于萌.一种多agent网络中的分布式联盟形成算法.控制与决策.2014,(第03期),全文.江虹;伍春;刘勇.基于强化学习的频谱决策与传输算法.系统仿真学报.2013,(第03期),全文.李卓.基于联合资源分配的飞蜂网吞吐量优化研究.北京信息科技大学学报(自然科学版).2013,(第03期),全文.Liping Jiang.Joint Mode Selection andResource Allocation in D2D-enabledVehicular Network.The 12th InternationalConference on Wireless Communications andSignal Processing.2020,全文.蒋涛涛;朱江.CNR中基于多用户Q学习的联合信道选择和功率控制.计算机应用研究.2019,(第08期),全文.张亚洲;周又玲.基于Q-learning的动态频谱接入算法研究.海南大学学报(自然科学版).2018,(第01期),全文.