Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Lorsque vous envoyez des données audio à l'API Speech-to-Text, vous pouvez soit les envoyer directement (via le champ content de la requête), soit faire en sorte que l'API effectue une reconnaissance à distance des données stockées dans un bucket Cloud Storage en spécifiant l'objet de stockage dans le champ uri de la requête.
Toutes les données audio du champ content dans les requêtes HTTP doivent être au format base64.
Vous trouverez sur cette page la procédure à suivre pour convertir le contenu audio d'un fichier binaire en données encodées en base64.
Utiliser la ligne de commande
Dans une requête gRPC, vous pouvez écrire directement les données binaires. Cependant, une requête REST utilise JSON. JSON est un format de texte qui n'est pas directement compatible avec les données binaires. Vous devez donc convertir ces données binaires en texte en utilisant l'encodage base64.
La plupart des environnements de développement contiennent un utilitaire natif base64 permettant d'encoder un fichier binaire en données texte ASCII. Pour encoder un fichier, procédez comme suit :
Linux
Encodez le fichier vidéo à l'aide de l'outil de ligne de commande base64, en veillant à empêcher tout retour à la ligne grâce à l'indicateur -w 0 :
base64 INPUT_FILE -w 0 > OUTPUT_FILE
macOS
Encodez le fichier à l'aide de l'outil de ligne de commande base64 :
base64 -i INPUT_FILE -o OUTPUT_FILE
Windows
Encodez le fichier à l'aide de l'outil Base64.exe :
Base64.exe -e INPUT_FILE > OUTPUT_FILE
PowerShell
Encodez le fichier à l'aide de la méthode Convert.ToBase64String :
L'intégration de données binaires dans des requêtes via des éditeurs de texte n'est pas plus souhaitable qu'elle n'est pratique. Concrètement, vous allez incorporer des fichiers encodés en base64 dans le code client. Tous les langages de programmation compatibles intègrent des mécanismes d'encodage de contenu en base64.
Python
En Python, vous pouvez encoder les fichiers audio en base64 comme suit :
# Import the base64 encoding library.importbase64# Pass the audio data to an encoding function.defencode_audio(audio_file):withopen(audio_file,"rb")asf:encoded_content=base64.b64encode(f.read())returnencoded_content
Node.js
// Read the file into memory.varfs=require('fs');varaudioFile=fs.readFileSync('/full/path/to/audio/file.wav');// Convert the audio data to a Buffer and base64 encode it.varencoded=Buffer.from(audioFile).toString('base64');
Java
// Import the Base64 encoding library.importorg.apache.commons.codec.binary.Base64;// Encode the audio.byte[]audioData=Base64.encodeBase64(audioFile.getBytes());StringencodedString=Base64.getEncoder().encodeToString(audioData);
Go
import("bufio""encoding/base64""io""os")// Open audio file.f,_:=os.Open("/full/path/to/audio/file.wav")// Read entire audio into byte slice.reader:=bufio.NewReader(f)content,_:=io.ReadAll(reader)// Encode audio as base64.base64.StdEncoding.EncodeToString(content)
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Base64 encoding audio content\n\nWhen you send audio data to the Speech-to-Text API, you can either send the\ndata directly (within the request's\n[`content`](/speech-to-text/v2/docs/reference/rpc/google.cloud.speech.v2#google.cloud.speech.v2.RecognizeRequest.FIELDS.bytes.google.cloud.speech.v2.RecognizeRequest.content)\nfield) or have the API perform recognition remotely on data stored in a\nCloud Storage bucket by specifying the storage object in the request's\n[`uri`](/speech-to-text/v2/docs/reference/rpc/google.cloud.speech.v2#google.cloud.speech.v2.RecognizeRequest.FIELDS.string.google.cloud.speech.v2.RecognizeRequest.uri)\nfield.\n\nAny audio data in the `content` field in HTTP requests must be in base64 format.\nThis page describes how to convert audio from a binary file to base64-encoded data.\n| **Note:** For clients using client libraries or a gRPC client, audio content should be in binary format, not base64 format.\n| **Note:** Check the [quotas and limits](/speech-to-text/v2/quotas) documentation for the content limits on inline audio.\n\nUsing the command line\n----------------------\n\nWithin a gRPC request, you can simply write binary data out directly;\nhowever, JSON is used when making a REST request. JSON\nis a text format that does not directly support binary data, so you will need to\nconvert such binary data into text using\n[Base64](https://en.wikipedia.org/wiki/Base64) encoding.\n\nMost development environments contain a native `base64` utility to\nencode a binary into ASCII text data. To encode a file: \n\n### Linux\n\nEncode the file using the `base64` command line tool, making sure to\nprevent line-wrapping by using the `-w 0` flag: \n\n```\nbase64 INPUT_FILE -w 0 \u003e OUTPUT_FILE\n```\n\n### macOS\n\nEncode the file using the `base64` command line tool: \n\n```\nbase64 -i INPUT_FILE -o OUTPUT_FILE\n```\n\n### Windows\n\nEncode the file using the `Base64.exe` tool: \n\n```\nBase64.exe -e INPUT_FILE \u003e OUTPUT_FILE\n```\n\n### PowerShell\n\nEncode the file using the `Convert.ToBase64String` method: \n\n```\n[Convert]::ToBase64String([IO.File]::ReadAllBytes(\"./INPUT_FILE\")) \u003e OUTPUT_FILE\n```\n\nCreate a JSON request file, inlining the base64-encoded data: \n\n### JSON\n\n\n {\n \"recognizer\": \"projects/\u003cvar translate=\"no\"\u003ePROJECT_ID\u003c/var\u003e/locations/global/recognizers/_\",\n \"content\": \"ZkxhQwAAACIQABAAAAUJABtAA+gA8AB+W8FZndQvQAyjv...\"\n }\n\n\u003cbr /\u003e\n\nUsing client libraries\n----------------------\n\nEmbedding binary data into requests through text editors is neither\ndesirable or practical. In practice, you will be embedding base64 encoded files\nwithin client code. All supported programming languages have built-in mechanisms\nfor base64 encoding content.\n\n\n### Python\n\nIn Python, base64 encode audio files as follows: \n\n # Import the base64 encoding library.\n import base64\n\n # Pass the audio data to an encoding function.\n def encode_audio(audio_file):\n with open(audio_file, \"rb\") as f:\n encoded_content = base64.b64encode(f.read())\n return encoded_content\n\n### Node.js\n\n // Read the file into memory.\n var fs = require('fs');\n var audioFile = fs.readFileSync('\u003cvar translate=\"no\"\u003e/full/path/to/audio/file.wav\u003c/var\u003e');\n\n // Convert the audio data to a Buffer and base64 encode it.\n var encoded = Buffer.from(audioFile).toString('base64');\n\n### Java\n\n // Import the Base64 encoding library.\n import org.apache.commons.codec.binary.Base64;\n\n // Encode the audio.\n byte[] audioData = Base64.encodeBase64(audioFile.getBytes());\n String encodedString = Base64.getEncoder().encodeToString(audioData);\n\n### Go\n\n import (\n \"bufio\"\n \"encoding/base64\"\n \"io\"\n \"os\"\n )\n\n // Open audio file.\n f, _ := os.Open(\"\u003cvar translate=\"no\"\u003e/full/path/to/audio/file.wav\u003c/var\u003e\")\n\n // Read entire audio into byte slice.\n reader := bufio.NewReader(f)\n content, _ := io.ReadAll(reader)\n\n // Encode audio as base64.\n base64.StdEncoding.EncodeToString(content)\n\n\u003cbr /\u003e"]]