国产精品亚洲AV三区_国产精品日本一区二区在线播放_国产成人无码久久久精品一_性感美女视频在线观看免费精品

更多精彩內容,歡迎關注:

視頻號
視頻號

抖音
抖音

快手
快手

微博
微博

基于Python實現PDF區域文本提取工具

文檔

基于Python實現PDF區域文本提取工具

這篇文章主要為大家介紹了如何通過Python實現一個非常精簡的圖像化的PDF區域選擇提取工具,文中示例代碼講解詳細,希望對大家能有所幫助。
推薦度:
導讀這篇文章主要為大家介紹了如何通過Python實現一個非常精簡的圖像化的PDF區域選擇提取工具,文中示例代碼講解詳細,希望對大家能有所幫助。
功能簡介

打開軟件后界面如下:

點擊打開文件按鈕打開之前的PDF文件后效果如下:

框選區域后,標題欄會自動顯示當前框選的區域提取到的文字,還可以左右按鈕切換:

實際我們需要提取文字的區域可能不止這一個,所以程序支持多區域框選:

完成區域框選后就可以點擊保存文件,將PDF每頁提取到的文本保存到一個csv文件中,當前選區的保存結果如下:

可以看到已經按框選順序依次保存了每一個區域的字符串。

如果選擇區域時發現提取結果不準確,可以撤銷后重新選擇:

保存圖片則會將PDF的每頁的整體保存為一張圖片,未選擇區域時,以頁碼為文件名保存圖片:

選擇區域時,會自動提取最后一個區域提取的文本作為當前頁的文件名:

開發代碼

當然這個項目由于本人是一次使用wxpython,功能非常簡約,現在將完整代碼開源出來期待各位大佬的改進。

源碼和已編譯工具下載地址:

https://codechina.csdn.net/as604049322/python_gui

完整代碼:

"""
小小明的代碼
CSDN主頁:https://blog.csdn.net/as604049322
"""
__author__?=?'小小明'
__time__?=?'2021/11/24'

import?csv

import?wx
import?os
import?fitz


class?MyCanvas(wx.Panel):
????def?__init__(self,?parent):
????????wx.Panel.__init__(self,?parent)
????????self.parent?=?parent
????????self.rects?=?[]
????????self.Bind(wx.EVT_LEFT_DOWN,?self.OnLeftButtonEvent)
????????self.Bind(wx.EVT_LEFT_UP,?self.OnLeftButtonEvent)
????????self.Bind(wx.EVT_MOTION,?self.OnLeftButtonEvent)
????????self.Bind(wx.EVT_PAINT,?self.DoDrawing)
????????b?=?wx.Button(self,?-1,?"打開文件",?(0,?0))
????????self.Bind(wx.EVT_BUTTON,?self.OnButton,?b)
????????b?=?wx.Button(self,?-1,?"保存文件",?(75,?0))
????????self.Bind(wx.EVT_BUTTON,?self.save_file,?b)
????????b?=?wx.Button(self,?-1,?"保存圖片",?(150,?0))
????????self.Bind(wx.EVT_BUTTON,?self.save_img,?b)
????????b?=?wx.Button(self,?-1,?"撤銷選區",?(225,?0))
????????self.Bind(wx.EVT_BUTTON,?self.back_select,?b)

????????b?=?wx.Button(self,?-1,?"《",?(300,?0),?size=(25,?25))
????????self.Bind(wx.EVT_BUTTON,?self.previous,?b)
????????b?=?wx.Button(self,?-1,?"》",?(325,?0),?size=(25,?25))
????????self.Bind(wx.EVT_BUTTON,?self.next,?b)

????????self.g1?=?wx.Gauge(self,?-1,?100,?(0,?30),?(-1,?100),?wx.GA_VERTICAL)

????def?previous(self,?evt):
????????if?not?hasattr(self,?"pdfDoc"):
????????????return
????????if?self.i?>?0:
????????????self.i?-=?1
????????????self.change_pdf_page(self.i,?False)
????????????self.DoDrawing(-1)
????????????if?self.rects:
????????????????self.parent.SetTitle(self.path?+?"|"?+?self.extract_pdf_text())

????def?next(self,?evt):
????????if?not?hasattr(self,?"pdfDoc"):
????????????return
????????if?self.i?3d}"
????????????????pix.save(f"{path}/{name}.png")
????????????????self.g1.SetValue((i?+?1)?*?100?//?self.pdfDoc.pageCount)
????????dlg.Destroy()
????????os.system(f"explorer?{path}")

????def?save_file(self,?evt):
????????if?not?hasattr(self,?"pdfDoc"):
????????????return
????????path?=?self.save_FileDialog()
????????if?path?is?None:
????????????return
????????data?=?[]
????????for?i?in?range(self.pdfDoc.pageCount):
????????????page?=?self.pdfDoc[i]
????????????row?=?[self.extract_pdf_text(page,?rect)
???????????????????for?i,?rect?in?enumerate(self.rects)]
????????????data.append(row)
????????with?open(path,?"w")?as?f:
????????????writer?=?csv.writer(f,?lineterminator="\n")
????????????row?=?[f"區域{i}"?for?i?in?range(1,?len(row)?+?1)]
????????????writer.writerow(row)
????????????for?row?in?data:
????????????????writer.writerow(row)
????????os.system(f"cmd?/c?start?{path}")

????def?extract_pdf_text(self,?page=None,?rect=None):
????????if?page?is?None:
????????????page?=?self.pdfDoc[self.i]
????????if?rect?is?None:
????????????rect?=?self.rects[-1]
????????a,?b,?c,?d?=?rect
????????clip?=?fitz.Rect(a,?b,?a?+?c,?b?+?d)
????????text?=?page.get_text(clip=clip).strip()
????????return?text

????def?change_img(self,?img_path,?move=True):
????????self.bmp?=?wx.Bitmap(img_path)
????????self.SetSize(self.bmp.GetSize())
????????self.parent.SetSize(self.parent.GetBestSize())
????????if?move:
????????????self.parent.Center()

????def?DoDrawing(self,?evt):
????????if?not?hasattr(self,?"bmp"):
????????????return
????????dc?=?wx.ClientDC(self)
????????dc.DrawBitmap(self.bmp,?0,?0,?True)
????????dc.SetPen(wx.Pen('blue'))
????????dc.SetBrush(wx.Brush('white',?wx.BRUSHSTYLE_TRANSPARENT))
????????dc.DrawRectangleList(self.rects)

????def?OnLeftButtonEvent(self,?event):
????????if?event.LeftDown():
????????????self.x,?self.y?=?event.GetPosition()
????????????self.rects.append([self.x,?self.y,?0,?0])
????????elif?event.Dragging():
????????????x,?y?=?event.GetPosition()
????????????self.rects[-1][2]?=?x?-?self.x
????????????self.rects[-1][3]?=?y?-?self.y
????????????self.DoDrawing(-1)
????????elif?event.LeftUp():
????????????print(self.rects)
????????????if?self.rects[-1][2]?

文檔

基于Python實現PDF區域文本提取工具

這篇文章主要為大家介紹了如何通過Python實現一個非常精簡的圖像化的PDF區域選擇提取工具,文中示例代碼講解詳細,希望對大家能有所幫助。
推薦度:
為你推薦
資訊專欄
熱門視頻
相關推薦
詳解python的循環 python實現新年倒計時實例代碼 Python實現消消樂小游戲 分享15個超級好用得Python實用技巧 學習python的while循環嵌套 提升Python運行速度的5個小技巧 Python按鍵或值對字典進行排序 圖像檢索之基于vlfeat實現SIFT特征 python繪圖中的四個繪圖技巧 js中toString方法3個作用 描寫春天花朵的詩句 關于思念的詩句 帶馬字的詩句 牡丹花的詩句 想念的詩句 含雁的詩句 愁的詩句 珍惜時間的名言 清明節的諺語 關于清明的諺語 Python數據分析處理(三)--運動員信息的分組與聚合 Python實現城市公交網絡分析與可視化 Python 垃圾回收機制詳解 關于樹的詩句 緬懷親人的詩句 春暖花開的詩句 家國情懷的詩句 含有星字的詩句 用來贊美老師的詩句 看破紅塵的經典詩句 長江的詩句 關于傳統節日的詩句 三月桃花的詩句 夕陽的詩句 紀念烈士的詩句 西湖的詩句 贊美虎的詩句 與蓮有關的詩句 梅蘭竹菊的詩句 描寫山的詩句有哪些
Top 国产精品亚洲AV三区_国产精品日本一区二区在线播放_国产成人无码久久久精品一_性感美女视频在线观看免费精品
<strike id="cakm0"></strike>
  • <button id="cakm0"><dl id="cakm0"></dl></button>
  • <samp id="cakm0"><tbody id="cakm0"></tbody></samp>
    <samp id="cakm0"><pre id="cakm0"></pre></samp><ul id="cakm0"></ul>
    <strike id="cakm0"></strike>
    <li id="cakm0"></li>
  • <ul id="cakm0"></ul>
  • 欧美激情区在线播放| 伊人夜夜躁av伊人久久| 曰本成人黄色| 午夜精品一区二区三区在线| 欧美ed2k| 在线观看欧美日本| 久久九九热免费视频| 国产欧美日韩综合一区在线播放 | 久久精品国产久精国产一老狼| 欧美精品一区二| 亚洲国产一区二区三区高清| 久久久综合网| 激情六月综合| 久久天堂精品| 国产综合一区二区| 欧美在线视频一区二区| 国产欧美一区二区视频| 翔田千里一区二区| 国产日韩在线一区| 久久精品国产免费| 亚洲第一视频| 欧美电影免费| 99这里只有精品| 欧美日韩性视频在线| 在线视频精品一| 欧美午夜久久久| 亚洲尤物在线视频观看| 国产精品美女久久久久久免费| 亚洲视频一二区| 国产精品福利av| 午夜亚洲精品| 国语精品一区| 欧美激情亚洲| 一区二区久久| 国产欧美日韩免费看aⅴ视频| 久久精品1区| 亚洲精品免费在线| 国产精品色一区二区三区| 欧美中文字幕不卡| 最近中文字幕日韩精品| 国产精品99一区二区| 西西裸体人体做爰大胆久久久| 国产精品一区二区黑丝| 久久久久久久网| 一区二区国产日产| 国精品一区二区三区| 免播放器亚洲| 亚洲欧美国产一区二区三区| 激情欧美日韩| 国产精品对白刺激久久久| 欧美一区二区三区在线视频 | 国产中文一区| 久久久久久久久久久久久9999| 韩日精品中文字幕| 快射av在线播放一区| 99综合电影在线视频| 欧美午夜不卡在线观看免费| 亚洲欧美日韩区| 国产一区在线视频| 欧美14一18处毛片| 宅男66日本亚洲欧美视频| 国产女主播一区二区| 老司机亚洲精品| 一个色综合导航| 国产小视频国产精品| 蜜臀久久99精品久久久久久9 | 一区免费观看| 久久经典综合| 日韩午夜在线电影| 国产日本欧美在线观看| 牛夜精品久久久久久久99黑人 | 91久久嫩草影院一区二区| 欧美日韩一区二区视频在线| 午夜精品视频一区| 伊大人香蕉综合8在线视| 欧美日韩精品一区二区| 亚洲午夜在线| 亚洲欧洲美洲综合色网| 嫩草伊人久久精品少妇av杨幂| 一区二区三区视频在线 | 欧美日韩人人澡狠狠躁视频| 午夜精品久久久久久久| **性色生活片久久毛片| 欧美日韩视频在线观看一区二区三区| 欧美一级黄色网| 亚洲精品小视频| 国产主播一区二区三区| 欧美国产激情| 久久久久久久精| 亚洲影院色无极综合| 亚洲第一黄色网| 国产伦精品一区二区三区照片91 | 日韩午夜在线电影| 韩日欧美一区二区三区| 媚黑女一区二区| 亚洲高清一区二| 欧美91视频| 亚洲视频1区| 国产一区美女| 欧美日韩一区二区视频在线| 亚洲国产精品激情在线观看| 欧美激情在线狂野欧美精品| 久久精品91久久香蕉加勒比| 国产精品成人观看视频免费 | 悠悠资源网久久精品| 欧美日韩视频在线第一区| 久久久精品五月天| 欧美一区日本一区韩国一区| 亚洲一区二区视频| 一区二区三区欧美视频| 亚洲欧洲精品一区二区三区| 国产综合一区二区| 国产亚洲精品美女| 国产亚洲精品美女| 国产亚洲欧美日韩美女| 国产美女高潮久久白浆| 国产欧美日韩亚洲一区二区三区| 欧美色视频一区| 国产精品久久久久久久久婷婷| 欧美日韩一级黄| 欧美日韩一区自拍| 欧美色欧美亚洲高清在线视频| 欧美四级电影网站| 国产精品免费看久久久香蕉| 国产精品区一区二区三| 国产精品一区二区久久精品| 国产乱码精品一区二区三| 国产精品综合色区在线观看| 国产精品美女主播| 国产亚洲一区二区三区| 亚洲国产高清自拍| 日韩网站免费观看| 一区二区三区欧美亚洲| 亚洲综合视频1区| 欧美一级专区免费大片| 久久精品主播| 欧美激情精品久久久久久变态| 欧美电影免费观看网站| 欧美日韩在线精品一区二区三区| 欧美色视频日本高清在线观看| 国产日韩欧美不卡在线| 亚洲第一级黄色片| 99热精品在线| 欧美在线观看视频在线| 毛片av中文字幕一区二区| 欧美风情在线| 国产精品天天看| 激情欧美一区二区三区| 亚洲精品一区中文| 久久精品视频99| 欧美极品一区二区三区| 国产精品视频免费观看www| 精品av久久久久电影| 日韩视频在线免费观看| 欧美中文字幕在线观看| 欧美精品精品一区| 国产精品视频午夜| 在线精品亚洲| 亚洲免费视频成人| 麻豆成人小视频| 国产精品色在线| 亚洲人体偷拍| 久久精品免费观看| 国产精品国产三级欧美二区| 一区二区在线观看视频| 亚洲一区二区三区视频播放| 蜜臀久久久99精品久久久久久| 国产精品视频内| 日韩视频一区二区三区在线播放| 欧美与黑人午夜性猛交久久久| 欧美精品免费视频| 国产亚洲福利一区| 欧美一区二区三区久久精品茉莉花| 欧美大学生性色视频| 国内精品久久久久久久影视麻豆| 一本色道久久88亚洲综合88| 久久久久一区| 国产乱肥老妇国产一区二 | 欧美日韩无遮挡| 激情综合视频| 午夜视频久久久久久| 国产精品啊v在线| 亚洲人午夜精品| 久热精品视频在线观看一区| 欧美色视频日本高清在线观看| 亚洲成色777777在线观看影院| 亚洲嫩草精品久久| 欧美性大战xxxxx久久久| 亚洲国产视频一区二区| 久久亚洲欧美国产精品乐播| 国产伪娘ts一区| 欧美一区精品| 欧美视频免费| 日韩视频免费观看| 欧美精品一卡二卡| 日韩一级网站| 欧美日韩一区二区高清| 99精品热视频只有精品10| 欧美久久久久久久久| 亚洲国产第一页|