설명: EasyOCR은 이미지에서 텍스트를 추출하는 Python 모듈입니다. 자연스러운 장면 텍스트와 문서의 밀집된 텍스트를 모두 읽을 수 있는 범용 OCR입니다. 현재 80개 이상의 언어와 라틴어, 중국어, 아랍어, 산스크리트어, 키릴어 등을 포함한 모든 인기 있는 작문 스크립트를 지원합니다.
EasyOCR은 PyTorch에서 구현된 광학 문자 인식(OCR) 도구입니다.
설명: EasyOCR은 두 가지 작동 모드를 지원합니다. 하나는 일반적으로 사용되는 CPU이고 다른 하나는 GPU 지원이 필요하며 CUDA 환경을 설치해야 인식할 수 있습니다. 미니 프로그램(예: 자동차 부채 관리 시스템)의 이미지 인식 및 차량 번호판 인식과 같은 사진 속 언어 및 텍스트.
명령 창에서 pip를 사용하여 EasyOCR 안정 버전을 설치하세요.
pip install easyocr
import easyocr reader = easyocr.Reader( ['ch_sim', 'en'], gpu=False, model_storage_directory='model/.', user_network_directory='model/.', ) result = reader.readtext('examples/chinese.jpg')
을 사용하여 위 코드를 실행하면 감지 및 인식 모델이 네트워크를 통해 지정된 디렉터리에 자동으로 다운로드됩니다.
['ch_sim', 'en'],: 인식된 언어 지정
gpu=False,: GPU 사용 여부 설정(EasyOCR은 GPU에서 더 효율적으로 실행되며, GPU가 없거나 GPU가 부족한 경우 설정됨) memory) False)
model_storage_directory='model/.', : 감지 및 인식 모델의 저장 경로 (설정되지 않은 경우 기본값은 ~/.EasyOCR/model 디렉터리에 저장됨)
인식 결과 결과
는 목록이고, 목록의 각 항목은 ([[189, 75], [469, 75], [469, 165 ], [189, 165]], 'Yuyuan Road', 0.3754989504814148)
, 이는 경계 상자, 감지된 텍스트 및 신뢰도값. result
是一个列表,列表中的每一项都是一个长度为 3
的识别结果,例如 ([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.3754989504814148)
,它们分别是 边界框、检测到的文本 和 置信度 值。
EasyOCR 服务器是一个用于从图像中提取文本。它是一种通用的 OCR,既可以读取自然场景文本,也可以读取文档中的密集文本。目前支持 80+ 种语言,并且还在扩展。
步骤 0. 从 GitHub 下载 easyocr-server 并安装。
git clone https://github.com/hekaiyou/easyocr-server.git
步骤 1. 使用 PyPI 安装 easyocr、 bottle 和 gevent 模块。
cd easyocr-server pip install -r requirements.txt
python main.py
Browser: http://localhost:8080/ocr/
CMD: curl http://localhost:8080/ocr/ -F "language=en" -F "img_file=@examples/english.png"
0단계. GitHub에서 easyocr-server를 다운로드하여 설치합니다.
docker build -t easyocr-server:latest .
docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
설치 확인
rrreee🎜브라우저: http://localhost:8080/ocr/🎜🎜🎜🎜CMD:curl http:// localhost:8080/ocr/ -F "언어=en" -F "img_file=@examples/english.png"
🎜🎜🎜🎜인증에 성공하면 브라우저에서 인쇄된 추론 결과를 볼 수 있습니다. . 🎜🎜🎜🎜🎜Docker를 통한 배포 서비스🎜🎜이미지 빌드를 위한 Dockerfile을 제공합니다. 🎜rrreee🎜실행해 보세요. 🎜docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Language | Code Name |
---|---|
Abaza | abq |
Adyghe | ady |
Afrikaans | af |
Angika | ang |
Arabic | ar |
Assamese | as |
Avar | ava |
Azerbaijani | az |
Belarusian | be |
Bulgarian | bg |
Bihari | bh |
Bhojpuri | bho |
Bengali | bn |
Bosnian | bs |
Simplified Chinese | ch_sim |
Traditional Chinese | ch_tra |
Chechen | che |
Czech | cs |
Welsh | cy |
Danish | da |
Dargwa | dar |
German | de |
English | en |
Spanish | es |
Estonian | et |
Persian (Farsi) | fa |
French | fr |
Irish | ga |
Goan Konkani | gom |
Hindi | hi |
Croatian | hr |
Hungarian | hu |
Indonesian | id |
Ingush | inh |
Icelandic | is |
Italian | it |
Japanese | ja |
Kabardian | kbd |
Kannada | kn |
Korean | ko |
Kurdish | ku |
Latin | la |
Lak | lbe |
Lezghian | lez |
Lithuanian | lt |
Latvian | lv |
Magahi | mah |
Maithili | mai |
Maori | mi |
Mongolian | mn |
Marathi | mr |
Malay | ms |
Maltese | mt |
Nepali | ne |
Newari | new |
Dutch | nl |
Norwegian | no |
Occitan | oc |
Pali | pi |
Polish | pl |
Portuguese | pt |
Romanian | ro |
Russian | ru |
Serbian (cyrillic) | rs_cyrillic |
Serbian (latin) | rs_latin |
Nagpuri | sck |
Slovak | sk |
Slovenian | sl |
Albanian | sq |
Swedish | sv |
Swahili | sw |
Tamil | ta |
Tabassaran | tab |
Telugu | te |
Thai | th |
Tajik | tjk |
Tagalog | tl |
Turkish | tr |
Uyghur | ug |
Ukranian | uk |
Urdu | ur |
Uzbek | uz |
Vietnamese | vi |
위 내용은 EasyOCR 도구를 사용하여 Python에서 이미지 텍스트를 인식하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!