知识工厂
2025-08-20 16:44:07 0 举报
AI智能生成
知识工厂
作者其他创作
大纲/内容
工程化
登录
任务队列
知识库管理
文档管理
分片管理
可视化配置
公共文件管理
存储
文档服务CDN(全文)<br>
ES (文字片段)<br>
TVD (矢量片段)<br>
图数据库(NEO4J)(关联关系)<br>
mysql/redis
权限
个人(私有)<br>
团队(公有)<br>
条线(公有)
探索(模型训练)<br>
知识库小模型训练
本地搭建embedding模型
知识抽取小模型
自学习与自进化 RAG 系统
解析
PDF 深度解析
Plain Text(快速纯文本)
DeepDOC(结构化更强)
多页大文件处理
docx 深度解析
正文抽取
表格抽取
TXT/MD/HTML
标签清洗
按行切分<br>
按段落切分<br>
Excel
转 HTML 片段纳入正文
xmind(测试case)<br>
文件解析转md
doc 文档提取
图片
音/视频
代码
单代码仓库
多代码仓库
代码架构图总结
wiki
转pdf
权限跳过
实时更新
批量
飞书文档
转pdf
权限跳过
实时更新
批量
企微文档
转pdf
权限跳过
实时更新
批量
分片
索引
批量(`DOC_BULK_SIZE` 可配)、幂等写入
向量/稀疏双索引
配置化词元分片
分层分块
句子级分片
段落级分片
章节/文档级分片
agent语义化分片
融合
关联关系
关联关系抽取
关键字抽取
构图
产业知识源
代码
需求文档
测试用例
用户操作
自动化采集方式
手动采集方式
表结构
视图
定制化规则抽取
反推分数
代码反检
用户操作反检
奖惩机制
检索
agenticRAG
混合检索
cdn(全文)<br>
es(文字)<br>
tvb(向量)<br>
图数据库(关系)<br>
稀疏优化
短语匹配
近邻距离
权重策略
同义词扩展
中英混排友好
重排序策略
粗排
精排
召回
迭代检索
GraghRAG<br>
关联关系检索
多跳推理能力
标签/模块化RAG
评估
多维度评估
上下文相关性/精确率 (Context Relevance/Precision)
上下文召回率 (Context Recall)
全面性 (Comprehensiveness)
正确性 (Correctness)
自定义规则评估
自定义测试集
0 条评论
下一页