思路是这样的:
pdf -> image -> 识别其中的图表 -> 通过PIL截取图片
整个过程尝试了很多方式,最终效果不是很人工智能电影完美,还需要继续探索
包括以下开源库
Tabulinuxla
前端截图linux是什么操作系统提取表格数据,效果还可人工智能是什么以,使用简单
使用步前端开发需要学什么骤:
如果是安装python的第linux是什么操作系统三方模块人工智能al女神古力娜扎,使用命令:
pip install tabula-py
ImageMagick
可以进行图片格式转换,pdf转图片
1、安装ImageMagick
mac
brew install ImageMagick
Linux
yum install ImageMagick # 安装 yum remove ImageMagick # 卸载
或者:
官网下载对应平台的压缩包:https://www.imagemagick.o计算机视觉属于人工智能吗rg/script/download.php
2、安装ghostscript:
brew install ghostscript
配置ImageMagipython爬虫ck环境变量vim ~/.bash_profile
export MAGICK_HOME=/Users/qmp/Applications/ImageMagick-7.0.8 export PATH="$MAGICK_HOME/bin:$PATH" export DYLD_LIBRARY_PATH="$MAGICK_HOME/lib/"
source ~/.bash_profile
命令行测试
convert -version convert a.jpg a.png convert -limit thread 1 names.pdf -background white -alpha remove -colorspace RGB -colorspace sRGB out.jpg
提高图片质人工智能北京共识量
$ convert -density 300 -quality 100 test.pdf 1.png
参数解析:
-density 300
图像每英寸面积内的像素点数,数值越高图片质量越高
-quality 100
这个为转换png时的压缩率,100表示不压缩
参数设置:
https://www.imagemagick.org/www/script/convert.php
python库wand
支持ImageMagick接口,只支持6版本,而ImageMagick最新为7版本,Mac上尝试安装不成功
http://docs.wand-py.org/
网络资源
pdf转图片:
http://app.xunjiepdf.com/pdf2jpg
http://pdfto计算机视觉系统主要解决word.55.la/pdf-to-jpg/
百度ai通用图像分析:
https://ai.baidu.com/tech/imagerecognition/general
完整过程
- 先使用ImageMagick将pdf文件转为p前端开发框架一览表ng图片格式
import os pdfname = "names.pdf" os.makedirs("out", exist_ok=True) cmd = ( "source ~/.bash_profile; " "convert " "-limit thread 1 {} " "-background white " "-alpha remove " "-colorspace RGB " "-colorspace sRGB " "out/out.jpg" ).format(pdfname) result = os.popen(cmd) print(result.read())
- 通过百度AI接口将图片中的主物体识别出来&计算机视觉的应用#xff0c;获取坐标
from aip import AipImageClassify """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' filename = "name.png" client = AipImageClassify(APP_ID, API_KEY, SECRET_KEY) with open(filename, "rb") as f: image = f.read() result = client.objectDetect(image) print(result) data = result.get("result")
- 通过百度识别出来的坐标ÿ人工智能北京共识0c;使用PIL将需要的图片截取出来
width = data.get("width") height = data.get("height") top = data.get("top") left = data.get("left") from PIL import Image im = Image.open(filename) box = (left, top, left + width, top + height) region = im.crop(box) region.save("cutting.jpg")
参考:
- Mac下使用Python进行pdf到image的转换
- Pyt人工智能换脸鞠婧祎郑爽hon 将pdf转成图片
- 利用ImageMagick把pdf批量转换为高质量图片
发表评论