中建产品演进
2025-09-25 12:11:44 0 举报
第二版
作者其他创作
大纲/内容
上下文压缩
数据归集
数据
Result:该系统可高效处理建筑领域复杂格式的法规文档,用户意图识别准确率高,能在向量数据库支持下快速召回相关知识,生成的答案均基于原文推理、无 “幻觉”,既实现规范条款的精准定位,也能解答专业知识问题,显著降低用户查找法规信息的成本,为建筑业务合规性查询、专业决策提供可靠知识支撑,提升整体业务处理效率。
范畴识别
智能
知识嵌入
Task:需构建一套融合 RAG(检索增强生成)技术与大模型的建筑领域专属问答系统,实现对多样格式法规文档的高效处理,精准识别用户查询意图,快速检索相关知识并生成无 “幻觉” 的严谨答案,满足闲聊交互、规范条款查询、专业知识问答三类需求,解决传统检索的痛点。
公式检测和识别
PDF(文本型、图像型)
本地文件上传
word (docx/doc)
大模型微调
关系数据库
TXT
知识图谱构建
术语表
向量数据库
数据整备
联网检索
Action:先对文档进行预处理,完成 docx 转 Markdown、扫描 PDF 转图片并 OCR 识别,同步检测拆分公式、表格及合并单元格,再通过结构分析构建 “章 - 节 - 条款” 树状结构与语义分割;利用 BGE 模型将知识单元嵌入为向量存入 Milvus 向量数据库,结合意图识别模块分类用户问题,通过混合检索(向量 + 关键词)、重排序及父文档检索获取相关知识,最后以结构化提示词与思维链推理,驱动大模型生成答案。
PPT(文本型、图像型)
数据存储
法律法规
理解
语义分割
表格合并单元格拆分
机理思维图构建
情形条件和结果抽取
混合检索
Situation:建筑公司日常运营中涉及海量法律法规、标准规范类文档,这些文档多以 docx、扫描版 PDF 等非结构化 / 半结构化形式存在,包含复杂的公式、合并单元格表格及层级化条款,传统检索方式易出现信息碎片化、精准度低的问题,导致用户难以快速获取合规依据或专业知识,影响业务效率与决策准确性。
数据清洗
父文档检索
重排序
任务
Agent带逻辑的问答机器人
数据格式
对象存储
领域关键概念抽取
机理思维图预览
行动
学习
推理
MD
JSON
文档结构分析
意图识别
表格检测和识别
文档格式标准化处理
表格(xlsx/xls/csv等)
模型/算法
数据类型
数据库直连
多策略混合检索
大模型
答案生成与输出
标准规范
思维链(CoT)分步逻辑拆解
0 条评论
下一页
为你推荐
查看更多