Python appelle l'interface Alibaba Cloud pour implémenter la fonction d'extraction de texte OCR-Tutoriel Python-php.cn

Python appelle l'interface Alibaba Cloud pour implémenter la fonction d'extraction de texte OCR

王林

Libérer： 2023-07-05 21:49:35

original

2014 Les gens l'ont consulté

Python appelle l'interface Alibaba Cloud pour implémenter la fonction d'extraction de texte OCR

Alibaba Cloud fournit une série d'API puissantes, notamment l'interface de reconnaissance de texte OCR (Optical Character Recognition). Grâce à cette interface, nous pouvons identifier le texte dans les images, ce qui est très approprié pour certains scénarios d'extraction de texte, tels que la conversion de texte de documents papier en texte électronique.

Cet article expliquera comment appeler l'interface OCR d'Alibaba Cloud en Python et implémenter la fonction d'extraction de texte. Voici les étapes spécifiques :

Étape 1 : Installer le SDK Alibaba Cloud

Pour appeler l'interface API d'Alibaba Cloud, vous devez d'abord installer le SDK correspondant. En Python, nous pouvons installer le SDK Alibaba Cloud via la commande pip.

Ouvrez le terminal et entrez la commande suivante :

pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-ocr

Copier après la connexion

Étape 2 : Obtenir la clé d'accès et la clé secrète

Pour appeler l'API d'Alibaba Cloud, vous devez fournir la clé d'accès et la clé secrète. Vous pouvez demander et obtenir ces deux informations clés sur la console Alibaba Cloud. Assurez-vous de conserver ces deux informations dans un endroit sûr.

Étape 3 : Écrivez le code pour appeler l'interface OCR

Vous devez d'abord importer les bibliothèques pertinentes :

import base64
import json
import urllib
import urllib.request
from aliyunsdkcore import client
from aliyunsdkocr.request.v20191230 import RecognizeCharacterRequest

Copier après la connexion

Ensuite, initialisez le client Alibaba Cloud :

def create_aliyun_client():
    access_key = "<Your Access Key>"
    secret_key = "<Your Secret Key>"
    region_id = "cn-hangzhou"
    return client.AcsClient(access_key, secret_key, region_id)

Copier après la connexion

Ensuite, écrivez la fonction pour appeler l'interface OCR :

def ocr_character(image_path):
    app_key = "<Your App Key>"
    request = RecognizeCharacterRequest.RecognizeCharacterRequest()
    request.set_accept_format('json')
    with open(image_path, 'rb') as file:
        image_data = file.read()
        base64_data = base64.b64encode(image_data)
        request.set_ImageURL(base64_data)
    response = create_aliyun_client().do_action_with_exception(request)
    result = json.loads(response)
    print(result)

Copier après la connexion

Sur ce qui précède Dans le code, vous devez remplacer la clé d'accès, la clé secrète et la clé d'application, et transmettre le chemin de l'image que vous souhaitez identifier.

Enfin, appelez la fonction ocr_character et passez le chemin de l'image qu'il faut identifier.

if __name__ == "__main__":
    image_path = "<Your Image Path>"
    ocr_character(image_path)

Copier après la connexion

Notez que le chemin local de l'image est utilisé ici. Si vous souhaitez identifier l'image sur Internet, vous devez utiliser son URL. De plus, l'interface OCR d'Alibaba Cloud prend actuellement en charge des formats d'image limités. De manière générale, il est recommandé d'utiliser des images au format JPEG ou PNG.

Résumé :

Cet article explique comment utiliser Python pour appeler l'interface OCR d'Alibaba Cloud afin d'implémenter la fonction d'extraction de texte. Grâce à cette interface, nous pouvons facilement convertir le texte de l'image en texte électronique, ce qui améliore l'efficacité du travail et simplifie certains travaux de transcription manuelle.

J'espère que cet article vous sera utile !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!