![数据库语言的生成方法及其模型的训练方法、装置和设备](/CN/2024/1/23/images/202410117540.jpg)
基本信息:
- 专利标题: 数据库语言的生成方法及其模型的训练方法、装置和设备
- 申请号:CN202410117540.1 申请日:2024-01-26
- 公开(公告)号:CN117992483A 公开(公告)日:2024-05-07
- 发明人: 戴桢锦 , 刘梅琛 , 李昊
- 申请人: 人保信息科技有限公司
- 申请人地址: 上海市松江区新桥镇新站路361号
- 专利权人: 人保信息科技有限公司
- 当前专利权人: 人保信息科技有限公司
- 当前专利权人地址: 上海市松江区新桥镇新站路361号
- 代理机构: 北京国昊天诚知识产权代理有限公司
- 代理人: 张黎
- 主分类号: G06F16/2452
- IPC分类号: G06F16/2452 ; G06F16/242 ; G06F40/30 ; G06N3/0455 ; G06N3/08
摘要:
本申请公开了一种数据库语言的生成的方法及其模型的训练方法、装置和设备,该方法包括:获取指定领域的训练样本,其中,所述训练样本包含多段指定领域的查询语句文本及其对应的数据库语言,以及,基于所述训练样本中用于指示数据实体的文本与关联的数据库实体的标注信息;基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对预训练模型进行训练,以得到用于提取指定领域的语义特征和文本与数据库实体的关联关系特征的预训练模型;基于多段所述指定领域的查询语句文本及其对应的数据库语言,以及所述标注信息,对数据库语言生成模型进行训练。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/24 | ..查询 |
------------G06F16/245 | ...查询过程 |
--------------G06F16/2452 | ....查询翻译 |