社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python人工智能之图片识别,Python3一行代码实现图片文字识别

python • 4 年前 • 404 次点击  


我们以识别诗词为例 
下面是我们要识别的图片

先看下效果图

我们运行代码后识别的结果,有几个字没有正确识别,但是大多数字都能识别出来。

一行代码就能识别图片,我们背后要做些准备工作的

  • 这里我们需要用到两个库:pytesseract和PIL

  • 同时我们还需要安装识别引擎tesseract-ocr

下面就来讲讲这几个库的安装,因为只有这几个库安装好以后Python才能实现一行代码实现图片文字识别

一,pytesseract和PIL的安装

安装这两个包可以借助pip 
- 1,命令行安装 
pip install PIL 
pip install pytesseract 
- 2,如果你用的pycharm编辑器,就可以直接借助pycharm实现快速安装。 
在pycharm的Settings设置页按照下面步骤操作 

这样就能成功安装pytesseract,安装PIL只需要在上面第三步里搜索PIL并点击安装即可 这时我们安转好了库,运行下面代码

会报下面错误,错误原因是:没有安装识别引擎tesseract-ocr

二,安装识别引擎tesseract-ocr

  • 1.下载下面的安装包,然后直接点击安装即可 

http://download.csdn.net/download/qiushi_1990/9987023

解压安装tesseract-ocr后做如下操作,就可以支持中文识别了。因为tesseract-ocr默认不支持中文识别。 

  • 2,安装完成tesseract-ocr后,我们还需要做一下配置 
    在C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py打开后做如下操作

也可以通过pycharm快速打开pytesseract.py

至此我们所有的配置就完成了,运行下面代码就可以把杜甫的登高这首图片诗解析成文字了



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/111415
 
404 次点击