Analyse de données

Libérez tout le potentiel de l'IA générative avec BigQuery et Vertex AI

17 octobre 2024

Gerrit Kazmaier

Vice President & General Manager, Databases, Analytics & Looker

Quelle organisation n’ambitionne pas aujourd’hui de s’ouvrir de nouvelles perspectives et de gagner en efficacité grâce à l’IA ? Mais pour concrétiser cette volonté, elle doit pouvoir s’appuyer sur une plateforme à même d’agréger toutes les données de l’entreprise, qu’elles soient structurées ou non, de façon simple, sécurisée, gouvernée, en toute transparence.

Pour les y aider, nous avons fait évoluer BigQuery et Vertex AI pour encore mieux interconnecter les données et les IA. Cette série d’innovations et d’améliorations change la donne dans l’adoption pratique de l’IA :

- Elle simplifie l'IA générative multimodale pour les données d'entreprise en rendant les modèles Gemini disponibles via BigQuery ML.

- Elle permet d’exploiter toute la valeur des données non structurées en étendant l'intégration de BigQuery aux API de traitement de documents et de synthèse vocale de Vertex AI.

- Elle libère la recherche assistée par l'IA dans toutes vos données d'entreprise grâce à l’intégration d’une recherche vectorielle au cœur de BigQuery.

Cette intégration de l’IA au cœur de vos données grâce à la combinaison de BigQuery, de Vertex AI et de modèles développés par Google Cloud permet de démocratiser la puissance de l'IA générative à toutes vos équipes Data. Elle vous aide également à mieux tirer profit des LLM pour analyser et interpréter votre patrimoine informationnel, le plus simplement du monde, en langage naturel, afin d’améliorer vos prises de décision et faire parler vos données. La création d'analyses basées sur l'IA devient plus simple, plus rapide et plus sûre, tirant profit de l'architecture Serverless unique de BigQuery.

Simplifier les cas d’usage de l'IA générative avec les modèles Gemini

BigQuery ML vous permet de créer, d'entraîner et d'exécuter des modèles ML (Machine Learning) directement dans BigQuery en utilisant un langage SQL familier. Avec des clients qui exécutent des centaines de millions de requêtes de prédiction et d'entraînement chaque année, l'utilisation du ML intégré dans BigQuery a augmenté de 250 % en un an.

Aujourd'hui, nous allons un cran plus loin avec l'intégration de Gemini 1.0 Pro via Vertex AI. Le modèle Gemini 1.0 Pro est conçu pour travailler à plus grande échelle et offrir une meilleure qualité de résultats dans un large éventail de tâches telles que le résumé de texte et l'analyse des sentiments. Vous pouvez désormais y accéder à l'aide de simples instructions SQL ou de l'API DataFrame intégrée à BigQuery.

Vous pouvez ainsi facilement créer des pipelines de données qui mélangent des données structurées, des données non structurées et des modèles d'IA génératifs pour proposer à vos utilisateurs une nouvelle génération d'applications analytiques. Par exemple, vous pouvez analyser les commentaires des clients en temps réel et les combiner avec l'historique des achats et la disponibilité actuelle des produits pour générer des messages et des offres personnalisés, le tout sans quitter BigQuery. Pour en savoir plus sur l'intégration des modèles BigQuery et Gemini, cliquez ici.

Et ce n’est qu’un début. Dans les prochains mois, nous débloquerons des cas d'usage encore plus ambitieux grâce à l'IA générative multimodale et la prise en charge du modèle Gemini 1.0 Pro Vision. Il deviendra alors possible d'analyser des images, des vidéos et d'autres données complexes à l'aide de simples requêtes SQL familières. Par exemple, si vous travaillez avec un grand ensemble de données d'images dans BigQuery, vous pourrez exploiter le modèle Gemini 1.0 Pro Vision pour générer des descriptions d'images, les catégoriser pour en simplifier la recherche, identifier leurs caractéristiques clés comme les couleurs, l'ambiance générale, l’aspect visuel, et bien plus encore.

Exploiter la valeur des données non structurées grâce à l'IA

Les données non structurées telles que les images, les documents et les vidéos représentent une grande partie des données inexploitées des entreprises. Cependant, elles se révèlent souvent difficiles à interpréter et en extraire des informations significatives n’est pas une mince affaire.

BigLake unifie les data lakes et les entrepôts de données sous un seul et même framework, vous offrant ainsi la possibilité d'analyser, de rechercher, de sécuriser, de gérer et de partager des données non structurées. Avec l'augmentation des volumes de données, l'utilisation de BigLake par nos clients a atteint plusieurs centaines de pétaoctets. Grâce à la puissance de BigLake, nos clients peuvent déjà analyser des images en utilisant une large gamme de modèles d'IA, notamment les API de vision de Vertex AI, les modèles open-source de TensorFlow Hub ou leurs propres modèles personnalisés.

Désormais, nous élargissons ces fonctionnalités pour vous aider à extraire aisément des insights à partir de documents et de fichiers audio en utilisant les API de traitement de documents et de transcription vocale de Vertex AI. Avec ces nouvelles fonctionnalités, vous pouvez aisément concevoir des applications d'IA générative capables de créer automatiquement du contenu, de catégoriser des données non structurées, d'analyser des sentiments, d'extraire des entités, de résumer des documents, etc.

Par exemple, pour effectuer une analyse financière plus poussée, il est possible de tirer parti de données telles que les revenus, les bénéfices et les actifs provenant de divers rapports financiers, puis de les combiner avec un ensemble de données BigQuery contenant l’historique des performances boursières. Autre exemple, pour améliorer le service client, il est possible d'analyser les enregistrements d'appels du support client pour détecter les sentiments, identifier les problèmes récurrents et corréler les informations issues des appels avec l'historique des achats.

Combiner la recherche vectorielle à vos données non structurées

À l’occasion de Google Cloud NEXT’2024, nous avons annoncé la disponibilité générale de BigQuery Vector Search, le moteur de recherche vectorielle intégré à BigQuery et Vertex AI, permettant de réaliser simplement des recherches de similarité dans vos données BigQuery. Cette fonctionnalité, communément appelée « recherche de plus proche voisin approché », est essentielle pour déverrouiller de nouveaux cas d'usage de l'IA tels que la recherche sémantique, la détection de similarité et bien évidemment la génération augmentée par récupération (RAG) combinée à un LLM. Cette recherche vectorielle peut également améliorer la qualité de vos modèles IA en renforçant la compréhension du contexte, en réduisant l'ambiguïté, en assurant l'exactitude factuelle et en permettant une adaptabilité à différentes tâches et domaines.

Exemple typique, la recherche vectorielle peut aider les sites de vente à améliorer les recommandations de produits présentés aux clients. Prenons l’exemple d’une acheteuse en train de regarder une robe rouge sur votre site Web. La recherche vectorielle permet de proposer aisément d’autres produits en fonction de préférences stylistiques comme la couleur, la coupe, ou une réduction applicable. Grâce à cette technologie, le site peut automatiquement suggérer d’autres robes similaires même si leurs descriptions textuelles sont différentes (n’ont pas les mêmes mots clés par exemple) de sorte que les clients puissent néanmoins trouver plus facilement ce qu’ils cherchent ou leur suggérer des articles plus susceptibles de leur plaire (et donc d’être achetés).

En s'appuyant sur nos capacités d'intégration de texte et en adhérant à vos politiques de gouvernance de l'IA et à vos contrôles d'accès, la recherche vectorielle BigQuery peut ainsi offrir de nouveaux cas d'usage de l'IA, tels que :

* La génération augmentée par la recherche (RAG) : Cette technique permet de combiner vos propres données aux capacités conversationnelles des LLM. Elle consiste à récupérer (grâce à la recherche vectorielle) des données pertinentes pour une question ou une tâche (dans votre patrimoine informationnel) et les fournir à un LLM en les contextualisant. Par exemple : utiliser un ticket d'assistance pour trouver dix cas antérieurs étroitement liés, et les transmettre comme contexte à un LLM pour qu’il résume les informations et suggère une résolution.

* La recherche sémantique : La recherche vectorielle permet de trouver des documents sémantiquement similaires à une requête donnée, même si les documents ne contiennent pas exactement les mêmes mots. Cette recherche sémantique se révèle très utile pour des tâches telles que la recherche d'articles connexes, de produits similaires ou de réponses à des questions.

* Le regroupement de textes : La recherche vectorielle permet de regrouper des textes en groupes de documents similaires. Cela permet de les organiser automatiquement, de repérer des doublons ou d'identifier des tendances dans un corpus.

* La synthèse de documents : Il s'agit de condenser des documents en repérant ceux les plus proches du texte initial et en en dégageant les idées principales. Cet outil se révèle très pratique pour des opérations telles que l'élaboration de synthèses pour les cadres dirigeants, la production d'abstracts ou la condensation d'articles de presse.

Entrez dans la révolution de l’IA générative avec vos données

L'amélioration de vos données d'entreprise grâce à l'IA générative est un enjeu majeur. Pour en savoir plus sur tout ce potentiel, ne manquez pas Next '24 et découvrez nos dernières innovations pour accélérer votre transformation.

Publié dans

Articles associés

Data Analytics

La nouvelle tour de Babel ? Exemple d’utilisation des embeddings multilingues et de la recherche vectorielle dans BigQuery

De Ginny Gao • Temps de lecture : 4 minutes

Data Analytics

L'atout stratégique du marketeur moderne : les « data clean rooms » alimentées par l'IA

De Surya Kunju • Temps de lecture : 9 minutes

Data Analytics

Un arbre de décision pour optimiser le pilotage des projets data et d'analyse de données dans Google Cloud

De Alicia Williams • Temps de lecture : 10 minutes

https://storage.googleapis.com/gweb-cloudblog-publish/images/google_cloud_2022_H7glFJz.max-2436x985.max-700x700.jpg

Data Analytics

Comment déployer son datawarehouse dans le cloud

De Preethi Igoor • Temps de lecture : 4 minutes