Rilevamento del testo in un documento: limiti

Restituisce i limiti delle caselle attorno al testo rilevato in un documento.

Per saperne di più

Per la documentazione dettagliata che include questo esempio di codice, consulta quanto segue:

Esempio di codice


Prima di provare questo esempio, segui le istruzioni di configurazione di Python riportate nella guida rapida di Vision con le librerie client. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Vision Python.

Per autenticarti a Vision, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.

def get_document_bounds(image_file, feature):
    """Finds the document bounds given an image and feature type.

        image_file: path to the image file.
        feature: feature type to detect.

        List of coordinates for the corresponding feature type.
    client = vision.ImageAnnotatorClient()

    bounds = []

    with open(image_file, "rb") as image_file:
        content =

    image = vision.Image(content=content)

    response = client.document_text_detection(image=image)
    document = response.full_text_annotation

    # Collect specified feature bounds by enumerating all document features
    for page in document.pages:
        for block in page.blocks:
            for paragraph in block.paragraphs:
                for word in paragraph.words:
                    for symbol in word.symbols:
                        if feature == FeatureType.SYMBOL:

                    if feature == FeatureType.WORD:

                if feature == FeatureType.PARA:

            if feature == FeatureType.BLOCK:

    # The list `bounds` contains the coordinates of the bounding boxes.
    return bounds

Passaggi successivi

Per cercare e filtrare i sample di codice per altri Google Cloud prodotti, consulta il Google Cloud browser di sample.