
基本信息:
- 专利标题: 一种基于深度学习的数据标准化多层级智能映射方法及系统
- 申请号:CN202510265656.4 申请日:2025-03-06
- 公开(公告)号:CN120196621A 公开(公告)日:2025-06-24
- 发明人: 许春来 , 娄志勇
- 申请人: 武汉大江数据有限公司
- 申请人地址: 湖北省武汉市武昌区水果湖街道
- 专利权人: 武汉大江数据有限公司
- 当前专利权人: 武汉大江数据有限公司
- 当前专利权人地址: 湖北省武汉市武昌区水果湖街道
- 代理机构: 武汉菲翔知识产权代理有限公司
- 代理人: 刘强
- 主分类号: G06F16/215
- IPC分类号: G06F16/215 ; G06F16/22 ; G06F16/901 ; G06F16/903 ; G06F16/951 ; G06F40/242 ; G06F40/30 ; G06N3/045 ; G06N3/084 ; G06N3/096 ; G06N5/01 ; G06N5/022
摘要:
本发明公开了一种基于深度学习的数据标准化多层级智能映射方法及系统,方法包括以下步骤:动态构建多源标准库,通过基于网络爬虫的行业标准采集模块收集最新标准,并利用冲突检测算法处理不同标准间的冲突;采用三级智能映射决策模型,依次从字段级、结构级、语义级对输入数据进行逐层验证;通过微调后的DeepSeek模型解析语义歧义,并基于置信度动态阈值生成映射建议;将人工修正数据反馈至模型进行增量训练,优化映射精度。本发明借助基于网络爬虫的采集模块与企业标准解析模块,利用冲突检测算法维护标准库的准确性,解决了传统标准库更新滞后的问题,能确保数据映射精准,避免因标准滞后产生错误,保障数据处理的准确性和时效性。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/21 | ..数据库设计、管理或维护 |
------------G06F16/215 | ...提高数据质量;数据清理,例如重复数据消除、删除无效条目或更正排版错误 |