pdf解析
2016-10-18 14:08:52 0 举报
PDF解析是一种将PDF文档转换为可编辑格式的过程。这个过程通常涉及到识别和提取PDF文档中的文字、图像和其他元素,然后将它们转换为Word、Excel或其他常见的文件格式。PDF解析可以用于各种目的,例如数据恢复、文档转换、内容分析等。 有许多工具和软件可以帮助用户进行PDF解析。这些工具通常具有用户友好的界面,可以方便地上传和处理PDF文档。此外,一些工具还提供了高级功能,如批量处理、自动识别和提取特定类型的信息等。 总之,PDF解析是一项非常有用的技术,它可以帮助用户快速、高效地处理PDF文档,从而提高工作效率。
作者其他创作
大纲/内容
1、允许选择入测试库或者正式库2、入库结果有提示
1、取一个XML文件,测试每个表的入库2、取一批数据,批量测试所有表的入库3、测试入正式库和入测试库4、该环节的平均用时
需求
测试
1、XML解析成功率高于90%2、XML可以批量处理3、解析结果有提示4、支持对解析出的表格进行处理作为辅助
1、取一个或多个XML文件,测试二个表的配置,重点测试需求2、3、6的功能,其他待开发完成再进行测试。计划测试时长:3天(10.19-21)
1、取了28个XML做测试,成功率为89%,但入库异常,不知道多少能正常解析2、平均解析用时大约0.5秒1个文件(单线程)
规则配置
1、配置过程复杂,配一个表目前需要花20分左右2、数据列表未实时更新,没有新建表,无法测试3、BUG太多4、界面不友好,不简便5、配置处理结果未完全显示,容易误导对问题的判断6、修改了配置,有时候不起作用,要退出程序再打开才行
问题
1、取一个XML文件,测试能否成功解析2、选择多个文件进行测试3、取4个报告期转换出来的XML文件,全解析,得出解析率4、该环节的平均用时
1)取4个报告期,测试文件转换成功率是否为80-90%?2)在大批数据更新时,转换能否跟上?3)解析过程是否流畅?耗时时长是多少?
1、相同的规则可复制、批量处理2、表和字段直接关联数据字典●3、支持主子表的配置●4、支持字段值为参数或者来源为其他表的查询结果5、通用的规则只需要配置一遍即可,比如公司代码,报表日期等6、配置权限做限制,只允许部分人做修改7、定位等失败有提示8、支持表格内、表格外关键字定位。9、关键字支持分组查询
1、看不到数据处理的结果,只能依赖入库结果来看数据处理是否正常
数据处理
无人开发,无法测试
1、取一个XML文件,测试所有表配置2、选择多个文件进行测试3、选择特殊文件,测试单位换算,批量修改等功能4、该环节的平均用时
1、取28个XML测试一个表,上午入库全部异常,下午改完BUG入不了库2、有些文件名不规范的无法解析3、BUG太多,导致重复测试
1、可以覆盖所有的表格2、数据处理分优先级3、处理结果有提示4、整个文档处理或分块处理5、可以批量自动处理6、支持数据处理功能,包括单位换算、单元格替换、批量修改、删除等7、文本格式处理8、中文日期支持转为标准日期9、SEQ检查EG、CG库后生成
PDF2XML
1、PDF转XML成功率高于80%2、PDF转XML可以批量自动处理3、转换结果有提示4、多线程同时转换文件5、支持WOR2XML作为补充
数据入库
XML解析
0 条评论
下一页