• 技术文章 >后端开发 >Python教程

    python图像文字识别

    高洛峰高洛峰2016-10-19 17:09:29原创1596
    最近在想没有一个图片文字识别的工具呢?我想到了OCR,国内比较牛逼的汉王OCR。那借助python能否实现呢?于是我找啊找查啊查有关PYthon在这方面探讨的资料,发现PyTesser 这样一个好玩的程序!拿出来分享讨论一下:

    PyTesser 是python的一个光学字符识别模块,它结合Tesseract OCR引擎来使用 ,能从一个图片或图像文件取出的字符串并输出。

    使用PyTesser ,你无须安装Tesseract OCR引擎,但就必须要先安装PIL模块(Python Image Library, python的图形库)

    官方介绍说明:

    PyTesser is an Optical Character Recognition module for Python. It takes as input an image or image file and outputs a string.

    PyTesser uses the Tesseract OCR engine, converting images to an accepted format and calling the Tesseract executable as an external script. A Windows executable is provided along with the Python scripts. The scripts should work in other operating systems as well.

    PyTesser 官方下载地址:http://code.google.com/p/pytesser/downloads/list

    PIL库资源地址: http://www.pythonware.com/products/pil/

    不过,在测试使用过程中,发觉只对英文内容识别较理想,而对中文无法处理识别!

    有兴趣的同学可以试验一下

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    专题推荐:python
    上一篇:Python - 命名规范 下一篇:三种方法删除列表中重复的元素及效率分析
    千万级数据并发解决方案

    相关文章推荐

    • Python模块化整理和第三方模块的安装(总结分享)• 详细了解Python进程池与进程锁• python列表详解(总结分享)• 一起聊聊Python的编码样式• 带你搞懂Python反序列化
    1/1

    PHP中文网