数据处理,不可不知的常用工具
? ? a).?CometDocs是用于从PDF中抓取表格数据最简朴有用的器材。用户可以直接进入网站,上传文件,选择输出文件范例,输入你的邮件地点,完成。 弱点:不能免费处理赏罚图片,必要订购OCR处事。 ? ? ? b).?Tabula?是一款你可以直接下载安装到电脑上的免费软件,它可以辅佐你导入PDF文件并输出单份表格。在你导入响应的PDF文件之后,你必要手动将必要的表格框出来,Tabula会试图在保存队列的条件下转化数据。 Cogniview和Tabula相同,你可以将必要的表格框起来,可是假如Congniview猜错了,你可以很轻易地调解它的范畴。更棒的是,它有光学字符辨认版本,这样即即是图片它也可以辨认。 ABLE2EXTRACT是纽约时报图像部分钟爱的措施,界面和行使方法和Cogniview都很相同。 弱点:大大都时辰Able2Extract都示意很好,但它的调试体系不如Cogniview。 ? https://github.com/gebelo/nicar2016/blob/master/refine.pdf 帮助数据资料: https://github.com/gebelo/nicar2016/blob/master/prof.csv (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |