找回密码
 会员注册
查看: 28|回复: 0

Windows安装TesseractOCR与Python中使用pytesseract进行文字识别

[复制链接]

2万

主题

0

回帖

6万

积分

超级版主

积分
68594
发表于 2024-9-10 13:39:56 | 显示全部楼层 |阅读模式
文章目录前言一、下载并安装TesseractOCR二、配置环境变量三、Python中安装使用pytesseract总结前言TesseractOCR是一个开源OCR(OpticalCharacterRecognition)引擎,用于从图像中提取文本。Pytesseract是TesseractOCR的Python封装,它使得在Python中使用TesseractOCR引擎变得容易。Pytesseract提供了简单的API,帮助开发者轻松地使用TesseractOCR引擎来实现图像中文本的识别。本文主要介绍了Windows下安装TesseractOCR、并在Python中使用pytesseract进行本地文字识别的流程。一、下载并安装TesseractOCR在TesseractOCR下载地址https://digi.bib.uni-mannheim.de/tesseract/下载合适的版本安装包,如下:点击安装包进行安装:语言选择英文:如果需要识别中文,则可以在安装过程中勾选下载中文语言包和脚本(也可以按需选择繁体):自定义安装路径:然后一直选择默认选项进行安装即可。二、配置环境变量为了方便使用Tesseract,需要将软件安装目录添加到系统环境变量中,这样不必每次执行命令时都切换到Tesseract的安装路径,如下:设置确定后之后,可以进行验证,打开CMD,输入tesseract--version,示意如下:C:\Users\LENOVO>tesseract--versiontesseractv5.3.0.20221214leptonica-1.78.0libgif5.1.4:libjpeg8d(libjpeg-turbo1.5.3):libpng1.6.34:libtiff4.0.9:zlib1.2.11:libwebp0.6.1:libopenjp22.3.0FoundAVX2FoundAVXFoundFMAFoundSSE4.1Foundlibarchive3.5.0zlib/1.2.11liblzma/5.2.3bz2lib/1.0.6liblz4/1.7.5libzstd/1.4.5Foundlibcurl/7.77.0-DEVSchannelzlib/1.2.11zstd/1.4.5libidn2/2.0.4nghttp2/1.31.012345678910如果输出版本等信息,说明安装成功。三、Python中安装使用pytesseractPython通过API接入TesseractOCR,就可以在Python中方便进行文字识别。在使用前需要进行安装,如下:#使用conda进行安装condainstallpytesseract-y#使用pip安装pipinstallpytesseract1234安装成功即可使用,OCR示例如下:In[1]:importpytesseractIn[2]:importreIn[3]:importrequestsIn[4]:fromPILimportImageIn[5]:url='http://42.194.197.95:8001/static/imgs/phone_imgs/phone0.png'In[6]:image=Image.open(requests.get(url,stream=True).raw)In[7]:imageOut[7]: In[8]:res=pytesseract.image_to_string(image)In[9]:resOut[9]:'14770126139\n'In[10]:re.search('\d+',res).group()Out[10]:'14770126139'12345678910111213141516171819202122总结TesseractOCR是一个本地的图片识别开源引擎,不需要额外的深度学习OCR模型即可实现简单、快速的识别,同时可以通过接口来与多种编程语言对接而集成,可以作为轻量OCR的最佳选择。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-5 09:38 , Processed in 0.418960 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表