知识工厂
2025-08-20 16:44:07 0 举报
AI智能生成
知识工厂
作者其他创作
大纲/内容
工程化
登录
任务队列
知识库管理
文档管理
分片管理
可视化配置
公共文件管理
存储
文档服务CDN(全文)
ES (文字片段)
TVD (矢量片段)
图数据库(NEO4J)(关联关系)
mysql/redis
权限
个人(私有)
团队(公有)
条线(公有)
探索(模型训练)
知识库小模型训练
本地搭建embedding模型
知识抽取小模型
自学习与自进化 RAG 系统
解析
PDF 深度解析
Plain Text(快速纯文本)
DeepDOC(结构化更强)
多页大文件处理
docx 深度解析
正文抽取
表格抽取
TXT/MD/HTML
标签清洗
按行切分
按段落切分
Excel
转 HTML 片段纳入正文
xmind(测试case)
文件解析转md
doc 文档提取
图片
音/视频
代码
单代码仓库
多代码仓库
代码架构图总结
wiki
转pdf
权限跳过
实时更新
批量
飞书文档
转pdf
权限跳过
实时更新
批量
企微文档
转pdf
权限跳过
实时更新
批量
分片
索引
批量(`DOC_BULK_SIZE` 可配)、幂等写入
向量/稀疏双索引
配置化词元分片
分层分块
句子级分片
段落级分片
章节/文档级分片
agent语义化分片
融合
关联关系
关联关系抽取
关键字抽取
构图
产业知识源
代码
需求文档
测试用例
用户操作
自动化采集方式
手动采集方式
表结构
视图
定制化规则抽取
反推分数
代码反检
用户操作反检
奖惩机制
检索
agenticRAG
混合检索
cdn(全文)
es(文字)
tvb(向量)
图数据库(关系)
稀疏优化
短语匹配
近邻距离
权重策略
同义词扩展
中英混排友好
重排序策略
粗排
精排
召回
迭代检索
GraghRAG
关联关系检索
多跳推理能力
标签/模块化RAG
评估
多维度评估
上下文相关性/精确率 (Context Relevance/Precision)
上下文召回率 (Context Recall)
全面性 (Comprehensiveness)
正确性 (Correctness)
自定义规则评估
自定义测试集
0 条评论
下一页