Python 프로그래밍을 사용하여 Baidu OCR 인터페이스 도킹을 구현하고 사진에서 텍스트를 추출하는 방법을 가르칩니다.-파이썬 튜토리얼-php.cn

Python 프로그래밍을 사용하여 Baidu OCR 인터페이스 도킹을 구현하고 사진에서 텍스트를 추출하는 방법을 가르칩니다.

PHPz

풀어 주다： 2023-08-14 17:13:06

원래의

1635명이 탐색했습니다.

Python 프로그래밍을 사용하여 Baidu OCR 인터페이스 도킹을 구현하고 사진에서 텍스트를 추출하는 방법을 가르칩니다.

서문:

지속적인 기술 발전으로 인공 지능의 응용이 점점 더 널리 보급되고 있습니다. 그중에서도 이미지에서 텍스트를 추출하고 자동화된 처리를 달성하는 데 도움이 되는 텍스트 인식(OCR) 기술의 적용이 특히 중요합니다. Baidu OCR 인터페이스는 현재 매우 인기 있는 텍스트 인식 기술입니다. 이 기사에서는 Python 프로그래밍을 사용하여 Baidu OCR 인터페이스에 연결하여 사진에서 텍스트를 추출하는 방법을 설명합니다.

바이두 OCR 계정 만들기

먼저 바이두 OCR 계정을 만들어야 합니다. 바이두 개발자 센터(https://cloud.baidu.com/)를 방문하여 계정을 등록하고 새 애플리케이션을 만드세요.

Baidu OCR Python SDK 설치

다음으로 텍스트 인식 작업을 용이하게 하기 위해 Baidu OCR 인터페이스와의 상호 작용 논리를 캡슐화하는 Baidu OCR Python SDK를 설치해야 합니다.

터미널 또는 명령 프롬프트를 열고 다음 명령을 실행하여 SDK를 설치하세요.

pip install baidu-aip

로그인 후 복사

필요한 라이브러리를 가져오고 API 키를 설정하세요

Python 파일에서 필요한 라이브러리를 가져오고 API 키를 설정하세요. API 키는 Baidu OCR 계정에서 생성한 애플리케이션이 소유한 키로, 신원을 인증하는 데 사용됩니다. 코드 예시는 다음과 같습니다.

from aip import AipOcr

# 设置APPID/AK/SK
APP_ID = 'your_app_id'
API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'

# 创建AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

로그인 후 복사

위 코드의 your_app_id, your_api_key, your_secret_key를 Baidu에서 생성한 애플리케이션 이름으로 바꾸세요. OCR 계정 해당 API 키입니다. your_app_id、your_api_key、your_secret_key替换成你在百度OCR账号中创建的应用所对应的API Key。

读取图片和调用接口

接下来，我们需要读取待识别的图片，并调用百度OCR接口，将图片中的文字提取出来。

def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 读取图片
image = get_file_content('your_image_path')

# 调用文字识别接口
result = client.basicGeneral(image)

# 提取文字
words = []
for item in result['words_result']:
    words.append(item['words'])

# 打印文字
for word in words:
    print(word)

로그인 후 복사

将上述代码中的your_image_path