在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/Python/ Python3 pdfminer怎么解析pdf文件里的圖片?

Python3 pdfminer怎么解析pdf文件里的圖片?

pdf的文字都可以解析出來,但是圖片的解析的就為空。怎么能解析pdf里的圖片呢?
另外pdfminer官方提供的貌似是命令行的文檔,沒看到代碼的呢?

回答
編輯回答
冷眸

https://github.com/euske/pdfm...

PDFMiner是從PDF文檔中提取信息的工具。與其他PDF相關(guān)的工具不同,它完全專注于獲取和分析文本數(shù)據(jù)。PDFMiner允許您獲取頁面中文本的確切位置,以及其他信息,如字體或線條。它包含一個PDF轉(zhuǎn)換器,可以將PDF文件轉(zhuǎn)換為其他文本格式(如HTML)。它具有可擴(kuò)展的PDF解析器,可用于文本分析之外的其他目的。

專注于獲取和分析文本數(shù)據(jù), 所以如果想解析圖片,估計得用ocr的軟件,比如pyocr

2018年5月5日 17:53