Questa pagina è stata tradotta dall'API Cloud Translation.

Utilizza l'analisi avanzata dei PDF con RAG Engine

Questa pagina mostra come utilizzare l'analizzatore sintattico avanzato dei PDF con RAG Engine.

RAG Engine implementa la generazione basata sul recupero (RAG) per vari formati di file, inclusi i PDF. I parser estraggono le informazioni dai file in modo che il motore RAG possa basare le risposte ai tuoi prompt. Ogni formato file supportato ha uno o più parser diversi in grado di leggere quel formato. Per maggiori informazioni informazioni sui formati file supportati, vedi Tipi di documenti supportati.

Per i PDF sono disponibili due tipi di parser: l'analizzatore sintattico di PDF di base, predefinita per i file PDF e un parser avanzato di PDF. L'analizzatore PDF di base estrae le informazioni di testo da un PDF nativo nell'ordine in cui il testo è presentato nel documento. I PDF nativi potrebbero contenere altri elementi, come immagini, che vengono ignorati dall'analizzatore sintattico di PDF di base. In alcuni casi, l'ordine di presentazione differisca dall'ordine visivo del documento a seconda di come è stato il PDF creato. L'analizzatore PDF avanzato supporta i PDF nativi e scansionati analizzando il layout del documento ed estraendo il testo in base al flusso logico del documento. Inoltre, l'analizzatore sintattico avanzato dei PDF fornisce risultati di qualità migliore rispetto all'analizzatore sintattico di base dei PDF, ad esempio una sostanziale di miglioramento della qualità di analisi delle tabelle.

Esempi di come attivare l'analisi avanzata

L'API ImportRagFiles supporta l'analisi avanzata dei PDF, che supporta dati nativi e PDF scansionati. Il codice campione seguente illustra come abilitare la funzionalità l'analisi mediante REST in un comando curl e l'uso dell'SDK Vertex AI per Python.

Per abilitare l'analisi di base dei PDF, non utilizzare l'opzione use_advanced_pdf_parsing.

REST

Per abilitare l'analisi avanzata dei PDF utilizzando REST, specifica il Opzione use_advanced_pdf_parsing in rag_file_parsing_config configurazione.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${ENDPOINT}/v1beta1/projects/${PROJECT_ID}/locations/${LOCATION}/ragCorpora/${RAG_CORPUS_ID}/ragFiles:import \
-d '{
  "import_rag_files_config": {
    // ... Existing options for import files here.
    "rag_file_parsing_config": {  // New configuration for advanced parsing.
      use_advanced_pdf_parsing: true
    }
  }
}'

Python

Per abilitare l'analisi avanzata dei PDF utilizzando l'SDK, imposta il valore Opzione use_advanced_pdf_parsing per True.

response = rag.import_files(
    # ... Existing options for import files here.
    use_advanced_pdf_parsing=True,  # New option for advanced parsing.
)

Passaggi successivi

Per scoprire di più sul grounding, consulta la Panoramica del grounding.
Per scoprire di più su RAG Engine, consulta Utilizzare RAG Engine.
Per scoprire di più su grounding e RAG, consulta Risposte al suolo utilizzando RAG.