[中国发明]
CN202310845013.8
知识库构建方法及基于生成式大语言模型的问答对话方法和系统
著录项
申请号
CN202310845013.8
申请日
20230711
公开号
CN117056471A
公开日
20231114
申请(专利权)人
数字郑州科技有限公司
当前权利人
数字郑州科技有限公司
发明人
张帆
叶艳
韩东阳
沈亚飞
魏红格
郝亮
地址
450000河南省郑州市郑东新区中兴南路与商鼎路交汇处新发展科创大厦24、25层
国省代码
河南(41)
主分类号
G06F16/332
分类号
G06F16/332
G06F16/36
G06F16/34
G06F40/30
G06N3/0455
G06N3/042
G06N3/08
G06N5/04
G06N5/022
G06V30/14
代理机构
郑州大通专利商标代理有限公司
代理人
周艳巧
技术关键词
摘要
本发明涉及数据处理技术领域,特别涉及一种知识库构建方法及基于生成式大语言模型的问答对话方法和系统,依据问答对话业务目标需求创建知识库名称及知识库中用于存储知识库文档数据的向量数据库库表存储结构,并将知识库元数据信息写入向量数据库;获取问答对话业务目标需求对应的文档文件中文本信息;并依据文本分割长度及文本终止符对文本进行分割,得到文本信息所对应的若干文本块;利用预训练大语言模型提取每个文本块对应的文本特征嵌入向量,并将文本块元数据信息及及文本块对应的文本特征嵌入向量写入向量数据库中的库表存储结构,将向量数据库中存储的数据作为问答对话业务目标需求所需的知识库,通过构建私有知识库并基于生成式大语言模型对用户问题以及知识库内容进行理解概括来实现文本对话,以提升用户体验。
信息查询
官网查询地址
网页搜索
数字郑州科技有限公司
学术搜索
知识库构建方法及基于生成式大语言模型的问答对话方法和系统