Sebbene la maggior parte dei metodi di Natural Language analizza l'argomento di un determinato testo,
il metodo analyzeSyntax
controlla la struttura del linguaggio stesso.
L'analisi sintattica suddivide il testo in una serie di frasi e
token (in genere parole) e fornisce informazioni linguistiche su questi token.
Vedi Morfologia e Alberi delle dipendenze per maggiori dettagli
sull'analisi linguistica e sul supporto linguistico
per un elenco dei linguaggi di cui l'API Natural Language può analizzare la sintassi.
Questa sezione illustra alcuni modi per rilevare la sintassi in un documento. Devi inviare una richiesta separata per ciascun documento.
Analisi della sintassi in una stringa
Ecco un esempio di analisi sintattica di una stringa di testo inviata direttamente all'API Natural Language:
Protocollo
Per analizzare la sintassi in un documento, effettua una richiesta POST
alla
documents:analyzeSyntax
il metodo REST e fornire
il corpo della richiesta appropriato, come mostrato nell'esempio seguente.
L'esempio utilizza gcloud auth application-default print-access-token
per ottenere un token di accesso per un account di servizio configurato
utilizzando gcloud CLI della Google Cloud Platform.
Per istruzioni sull'installazione di gcloud CLI,
configura un progetto con un account di servizio
consulta la Guida rapida.
curl -X POST \ -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \ -H "Content-Type: application/json; charset=utf-8" \ --data "{ 'encodingType': 'UTF8', 'document': { 'type': 'PLAIN_TEXT', 'content': 'Google, headquartered in Mountain View, unveiled the new Android phone at the Consumer Electronic Show. Sundar Pichai said in his keynote that users love their new Android phones.' } }" "https://language.googleapis.com/v1/documents:analyzeSyntax"
Se non specifichi document.language
, la lingua verrà automaticamente
rilevato. Per informazioni sulle lingue supportate dall'API Natural Language, consulta Supporto delle lingue. Per ulteriori informazioni sulla configurazione del corpo della richiesta, consulta la documentazione di riferimento di Document
.
Se la richiesta riesce, il server restituisce un codice di stato HTTP 200 OK
e
la risposta in formato JSON:
{ "sentences": [ { "text": { "content": "Google, headquartered in Mountain View, unveiled the new Android phone at the Consumer Electronic Show.", "beginOffset": 0 } }, { "text": { "content": "Sundar Pichai said in his keynote that users love their new Android phones.", "beginOffset": 105 } } ], "tokens": [ { "text": { "content": "Google", "beginOffset": 0 }, "partOfSpeech": { "tag": "NOUN", "aspect": "ASPECT_UNKNOWN", "case": "CASE_UNKNOWN", "form": "FORM_UNKNOWN", "gender": "GENDER_UNKNOWN", "mood": "MOOD_UNKNOWN", "number": "SINGULAR", "person": "PERSON_UNKNOWN", "proper": "PROPER", "reciprocity": "RECIPROCITY_UNKNOWN", "tense": "TENSE_UNKNOWN", "voice": "VOICE_UNKNOWN" }, "dependencyEdge": { "headTokenIndex": 7, "label": "NSUBJ" }, "lemma": "Google" }, ... { "text": { "content": ".", "beginOffset": 179 }, "partOfSpeech": { "tag": "PUNCT", "aspect": "ASPECT_UNKNOWN", "case": "CASE_UNKNOWN", "form": "FORM_UNKNOWN", "gender": "GENDER_UNKNOWN", "mood": "MOOD_UNKNOWN", "number": "NUMBER_UNKNOWN", "person": "PERSON_UNKNOWN", "proper": "PROPER_UNKNOWN", "reciprocity": "RECIPROCITY_UNKNOWN", "tense": "TENSE_UNKNOWN", "voice": "VOICE_UNKNOWN" }, "dependencyEdge": { "headTokenIndex": 20, "label": "P" }, "lemma": "." } ], "language": "en" }
L'array tokens
contiene oggetti Token
che rappresentano i token della frase rilevati, che includono informazioni come la parte del discorso di un token e la sua posizione nella frase.
gcloud
Consulta le analyze-syntax
per i dettagli completi.
Per eseguire l'analisi della sintassi, utilizza gcloud CLI e il flag --content
per identificare i contenuti da analizzare:
gcloud ml language analyze-syntax --content="Google, headquartered in Mountain View, unveiled the new Android phone at the Consumer Electronic Show. Sundar Pichai said in his keynote that users love their new Android phones."
Se la richiesta riesce, il server restituisce una risposta in formato JSON:
{ "sentences": [ { "text": { "content": "Google, headquartered in Mountain View, unveiled the new Android phone at the Consumer Electronic Show.", "beginOffset": 0 } }, { "text": { "content": "Sundar Pichai said in his keynote that users love their new Android phones.", "beginOffset": 105 } } ], "tokens": [ { "text": { "content": "Google", "beginOffset": 0 }, "partOfSpeech": { "tag": "NOUN", "aspect": "ASPECT_UNKNOWN", "case": "CASE_UNKNOWN", "form": "FORM_UNKNOWN", "gender": "GENDER_UNKNOWN", "mood": "MOOD_UNKNOWN", "number": "SINGULAR", "person": "PERSON_UNKNOWN", "proper": "PROPER", "reciprocity": "RECIPROCITY_UNKNOWN", "tense": "TENSE_UNKNOWN", "voice": "VOICE_UNKNOWN" }, "dependencyEdge": { "headTokenIndex": 7, "label": "NSUBJ" }, "lemma": "Google" }, ... { "text": { "content": ".", "beginOffset": 179 }, "partOfSpeech": { "tag": "PUNCT", "aspect": "ASPECT_UNKNOWN", "case": "CASE_UNKNOWN", "form": "FORM_UNKNOWN", "gender": "GENDER_UNKNOWN", "mood": "MOOD_UNKNOWN", "number": "NUMBER_UNKNOWN", "person": "PERSON_UNKNOWN", "proper": "PROPER_UNKNOWN", "reciprocity": "RECIPROCITY_UNKNOWN", "tense": "TENSE_UNKNOWN", "voice": "VOICE_UNKNOWN" }, "dependencyEdge": { "headTokenIndex": 20, "label": "P" }, "lemma": "." } ], "language": "en" }
L'array tokens
contiene oggetti Token
che rappresentano i token della frase rilevati, che includono informazioni come la parte del discorso di un token e la sua posizione nella frase.
Go
Per scoprire come installare e utilizzare la libreria client per Natural Language, vedi Librerie client di Natural Language. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Natural Language Go.
Per eseguire l'autenticazione in Natural Language, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Natural Language, vedi Librerie client di Natural Language. Per ulteriori informazioni, consulta API Natural Language Java documentazione di riferimento.
Per autenticarti a Natural Language, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Natural Language, consulta Librerie client di Natural Language. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Natural Language Node.js.
Per autenticarti a Natural Language, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Natural Language, consulta Librerie client di Natural Language. Per ulteriori informazioni, consulta API Natural Language Python documentazione di riferimento.
Per autenticarti a Natural Language, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione per C# nella pagina delle librerie client e poi consulta la documentazione di riferimento di Natural Language per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento del linguaggio naturale per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi consulta la documentazione di riferimento di Natural Language per Ruby.
Analisi della sintassi da Cloud Storage
Per comodità, l'API Natural Language può eseguire l'analisi sintattica direttamente su un file in Cloud Storage, senza dover inviare i contenuti del file nel corpo della richiesta.
Ecco un esempio di analisi sintattica di un file in Cloud Storage.
Protocollo
Per analizzare la sintassi in un documento archiviato in Cloud Storage,
esegui una richiesta POST
al metodo REST
documents:analyzeSyntax
e fornisci il corpo della richiesta appropriato con il percorso del documento
come mostrato nell'esempio seguente.
curl -X POST \ -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \ -H "Content-Type: application/json; charset=utf-8" \ --data "{ 'encodingType': 'UTF8', 'document': { 'type': 'PLAIN_TEXT', 'gcsContentUri': 'gs://<bucket-name>/<object-name>' } }" "https://language.googleapis.com/v1/documents:analyzeSyntax"
Se non specifichi document.language
, la lingua verrà rilevata automaticamente. Per informazioni sulle lingue supportate dall'API Natural Language, consulta Supporto delle lingue. Consulta la Document
documentazione di riferimento per ulteriori informazioni sulla configurazione del corpo della richiesta.
Se la richiesta riesce, il server restituisce un codice di stato HTTP 200 OK
e la risposta in formato JSON:
{ "sentences": [ { "text": { "content": "Hello, world!", "beginOffset": 0 } } ], "tokens": [ { "text": { "content": "Hello", "beginOffset": 0 }, "partOfSpeech": { "tag": "X", // ... }, "dependencyEdge": { "headTokenIndex": 2, "label": "DISCOURSE" }, "lemma": "Hello" }, { "text": { "content": ",", "beginOffset": 5 }, "partOfSpeech": { "tag": "PUNCT", // ... }, "dependencyEdge": { "headTokenIndex": 2, "label": "P" }, "lemma": "," }, // ... ], "language": "en" }
L'array tokens
contiene oggetti Token
che rappresentano i token della frase rilevati, che includono informazioni come la parte del discorso di un token e la sua posizione nella frase.
gcloud
Consulta leanalyze-syntax
per i dettagli completi.
Per eseguire l'analisi della sintassi su un file in Cloud Storage, utilizza lo strumento a riga di comando gcloud
e il flag --content-file
per identificare il percorso del file contenente i contenuti da analizzare:
gcloud ml language analyze-syntax --content-file=gs://YOUR_BUCKET_NAME/YOUR_FILE_NAME
Se la richiesta riesce, il server restituisce una risposta in formato JSON:
{ "sentences": [ { "text": { "content": "Hello, world!", "beginOffset": 0 } } ], "tokens": [ { "text": { "content": "Hello", "beginOffset": 0 }, "partOfSpeech": { "tag": "X", // ... }, "dependencyEdge": { "headTokenIndex": 2, "label": "DISCOURSE" }, "lemma": "Hello" }, { "text": { "content": ",", "beginOffset": 5 }, "partOfSpeech": { "tag": "PUNCT", // ... }, "dependencyEdge": { "headTokenIndex": 2, "label": "P" }, "lemma": "," }, // ... ], "language": "en" }
L'array tokens
contiene oggetti Token
che rappresentano i token della frase rilevati, che includono informazioni come la parte del discorso di un token e la sua posizione nella frase.
Go
Per scoprire come installare e utilizzare la libreria client per Natural Language, consulta Librerie client di Natural Language. Per ulteriori informazioni, consulta API Natural Language Go documentazione di riferimento.
Per autenticarti a Natural Language, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Natural Language, consulta Librerie client di Natural Language. Per ulteriori informazioni, consulta API Natural Language Java documentazione di riferimento.
Per eseguire l'autenticazione in Natural Language, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Natural Language, consulta Librerie client di Natural Language. Per ulteriori informazioni, consulta API Natural Language Node.js documentazione di riferimento.
Per autenticarti a Natural Language, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Natural Language, consulta Librerie client di Natural Language. Per ulteriori informazioni, consulta API Natural Language Python documentazione di riferimento.
Per eseguire l'autenticazione in Natural Language, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: Segui le Istruzioni per la configurazione di C# Nella pagina delle librerie client e poi visita Documentazione di riferimento di Natural Language per .NET.
PHP Segui le Istruzioni per la configurazione dei file PHP Nella pagina delle librerie client e poi visita Documentazione di riferimento di Natural Language per PHP.
Ruby: Segui le Istruzioni per la configurazione di Ruby Nella pagina delle librerie client e poi visita Documentazione di riferimento di Natural Language per Ruby.