Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
Cuando envías datos de audio a la API Speech-to-Text, puedes hacerlo directamente (en el campo content de la solicitud) o bien puedes hacer que la API realice el reconocimiento de forma remota en los datos almacenados en un segmento de Cloud Storage. Para ello, especifica el objeto de almacenamiento en el campo uri de la solicitud.
Los datos de audio del campo content de las solicitudes HTTP deben estar en formato base64.
En esta página se describe cómo convertir audio de un archivo binario a datos codificados en Base64.
Usar la línea de comandos
En una solicitud gRPC, puedes escribir datos binarios directamente. Sin embargo, se usa JSON al hacer una solicitud REST. JSON es un formato de texto que no admite directamente datos binarios, por lo que tendrás que convertir esos datos binarios en texto mediante la codificación Base64.
La mayoría de los entornos de desarrollo contienen una utilidad base64 nativa para codificar un archivo binario en datos de texto ASCII. Para codificar un archivo, sigue estos pasos:
Linux
Codifica el archivo con la herramienta de línea de comandos base64. Asegúrate de evitar el salto de línea con la marca -w 0:
base64 INPUT_FILE -w 0 > OUTPUT_FILE
macOS
Codifica el archivo con la herramienta de línea de comandos base64:
base64 -i INPUT_FILE -o OUTPUT_FILE
Windows
Codifica el archivo con la herramienta Base64.exe:
Base64.exe -e INPUT_FILE > OUTPUT_FILE
PowerShell
Codifica el archivo con el método Convert.ToBase64String:
No es recomendable ni práctico insertar datos binarios en solicitudes a través de editores de texto. En la práctica, insertará archivos codificados en base64 en el código del cliente. Todos los lenguajes de programación admitidos tienen mecanismos integrados para codificar contenido en Base64.
Python
En Python, codifica los archivos de audio en base64 de la siguiente manera:
# Import the base64 encoding library.importbase64# Pass the audio data to an encoding function.defencode_audio(audio_file):withopen(audio_file,"rb")asf:encoded_content=base64.b64encode(f.read())returnencoded_content
Node.js
// Read the file into memory.varfs=require('fs');varaudioFile=fs.readFileSync('/full/path/to/audio/file.wav');// Convert the audio data to a Buffer and base64 encode it.varencoded=Buffer.from(audioFile).toString('base64');
Java
// Import the Base64 encoding library.importorg.apache.commons.codec.binary.Base64;// Encode the audio.byte[]audioData=Base64.encodeBase64(audioFile.getBytes());StringencodedString=Base64.getEncoder().encodeToString(audioData);
Go
import("bufio""encoding/base64""io""os")// Open audio file.f,_:=os.Open("/full/path/to/audio/file.wav")// Read entire audio into byte slice.reader:=bufio.NewReader(f)content,_:=io.ReadAll(reader)// Encode audio as base64.base64.StdEncoding.EncodeToString(content)
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-08-20 (UTC)."],[],[],null,["# Base64 encoding audio content\n\nWhen you send audio data to the Speech-to-Text API, you can either send the\ndata directly (within the request's\n[`content`](/speech-to-text/v2/docs/reference/rpc/google.cloud.speech.v2#google.cloud.speech.v2.RecognizeRequest.FIELDS.bytes.google.cloud.speech.v2.RecognizeRequest.content)\nfield) or have the API perform recognition remotely on data stored in a\nCloud Storage bucket by specifying the storage object in the request's\n[`uri`](/speech-to-text/v2/docs/reference/rpc/google.cloud.speech.v2#google.cloud.speech.v2.RecognizeRequest.FIELDS.string.google.cloud.speech.v2.RecognizeRequest.uri)\nfield.\n\nAny audio data in the `content` field in HTTP requests must be in base64 format.\nThis page describes how to convert audio from a binary file to base64-encoded data.\n| **Note:** For clients using client libraries or a gRPC client, audio content should be in binary format, not base64 format.\n| **Note:** Check the [quotas and limits](/speech-to-text/v2/quotas) documentation for the content limits on inline audio.\n\nUsing the command line\n----------------------\n\nWithin a gRPC request, you can simply write binary data out directly;\nhowever, JSON is used when making a REST request. JSON\nis a text format that does not directly support binary data, so you will need to\nconvert such binary data into text using\n[Base64](https://en.wikipedia.org/wiki/Base64) encoding.\n\nMost development environments contain a native `base64` utility to\nencode a binary into ASCII text data. To encode a file: \n\n### Linux\n\nEncode the file using the `base64` command line tool, making sure to\nprevent line-wrapping by using the `-w 0` flag: \n\n```\nbase64 INPUT_FILE -w 0 \u003e OUTPUT_FILE\n```\n\n### macOS\n\nEncode the file using the `base64` command line tool: \n\n```\nbase64 -i INPUT_FILE -o OUTPUT_FILE\n```\n\n### Windows\n\nEncode the file using the `Base64.exe` tool: \n\n```\nBase64.exe -e INPUT_FILE \u003e OUTPUT_FILE\n```\n\n### PowerShell\n\nEncode the file using the `Convert.ToBase64String` method: \n\n```\n[Convert]::ToBase64String([IO.File]::ReadAllBytes(\"./INPUT_FILE\")) \u003e OUTPUT_FILE\n```\n\nCreate a JSON request file, inlining the base64-encoded data: \n\n### JSON\n\n\n {\n \"recognizer\": \"projects/\u003cvar translate=\"no\"\u003ePROJECT_ID\u003c/var\u003e/locations/global/recognizers/_\",\n \"content\": \"ZkxhQwAAACIQABAAAAUJABtAA+gA8AB+W8FZndQvQAyjv...\"\n }\n\n\u003cbr /\u003e\n\nUsing client libraries\n----------------------\n\nEmbedding binary data into requests through text editors is neither\ndesirable or practical. In practice, you will be embedding base64 encoded files\nwithin client code. All supported programming languages have built-in mechanisms\nfor base64 encoding content.\n\n\n### Python\n\nIn Python, base64 encode audio files as follows: \n\n # Import the base64 encoding library.\n import base64\n\n # Pass the audio data to an encoding function.\n def encode_audio(audio_file):\n with open(audio_file, \"rb\") as f:\n encoded_content = base64.b64encode(f.read())\n return encoded_content\n\n### Node.js\n\n // Read the file into memory.\n var fs = require('fs');\n var audioFile = fs.readFileSync('\u003cvar translate=\"no\"\u003e/full/path/to/audio/file.wav\u003c/var\u003e');\n\n // Convert the audio data to a Buffer and base64 encode it.\n var encoded = Buffer.from(audioFile).toString('base64');\n\n### Java\n\n // Import the Base64 encoding library.\n import org.apache.commons.codec.binary.Base64;\n\n // Encode the audio.\n byte[] audioData = Base64.encodeBase64(audioFile.getBytes());\n String encodedString = Base64.getEncoder().encodeToString(audioData);\n\n### Go\n\n import (\n \"bufio\"\n \"encoding/base64\"\n \"io\"\n \"os\"\n )\n\n // Open audio file.\n f, _ := os.Open(\"\u003cvar translate=\"no\"\u003e/full/path/to/audio/file.wav\u003c/var\u003e\")\n\n // Read entire audio into byte slice.\n reader := bufio.NewReader(f)\n content, _ := io.ReadAll(reader)\n\n // Encode audio as base64.\n base64.StdEncoding.EncodeToString(content)\n\n\u003cbr /\u003e"]]