Choisir une solution de notebook
Cette page décrit les différences entre les options d'environnement de notebook de Vertex AI afin que vous puissiez choisir l'option la plus adaptée à votre projet.
Vertex AI fournit deux solutions d'environnement de notebook:
Colab Enterprise : environnement de notebook géré et collaboratif avec les fonctionnalités de sécurité et de conformité de Google Cloud. Si les priorités de votre projet sont de collaborer avec d'autres et d'éviter de perdre du temps à gérer l'infrastructure, Colab Enterprise peut être la meilleure option pour vous. Consultez la section Colab Enterprise suivante.
Vertex AI Workbench : environnement basé sur un notebook Jupyter fourni par des instances de machine virtuelle (VM) dotées de fonctionnalités compatibles avec le workflow de data science. Si les priorités de votre projet sont le contrôle et la personnalisation, Vertex AI Workbench peut être la meilleure option. Consultez la section Vertex AI Workbench suivante.
Colab Enterprise
Découvrez quelques-uns des points forts de Colab Enterprise dans les sections suivantes. Pour en savoir plus, consultez la page Présentation de Colab Enterprise.
Partager et collaborer
Colab Enterprise vous permet de partager des notebooks et de collaborer avec d'autres personnes. Vous pouvez partager un notebook avec un seul utilisateur, un groupe Google ou un domaine Google Workspace. Vous contrôlez cet accès via Identity and Access Management (IAM).
Calcul géré
Colab Enterprise vous permet de travailler dans des notebooks sans avoir à gérer l'infrastructure. Colab Enterprise provisionne un environnement d'exécution lorsque vous en avez besoin. Si vous le souhaitez, vous pouvez configurer des environnements d'exécution pour des besoins spécifiques, mais Colab Enterprise les démarre pour vous et les arrête lorsque vous n'en avez plus besoin.
Intégration à la console Google Cloud
Les intégrations de Colab Enterprise aux services Google Cloud facilitent l'utilisation de notebooks qui interagissent avec ces services. Vous pouvez utiliser Colab Enterprise depuis la console Google Cloud, avec des fonctionnalités intégrées à Vertex AI et BigQuery.
Complétion de code intégrée
Vertex AI vous permet d'écrire du code avec la complétion de code intégrée. Utilisez les suggestions de complétion de code pour terminer vos projets de codage plus rapidement. Pour en savoir plus, consultez la section Écrire du code avec complétion de code intégrée.
Vertex AI Workbench
Découvrez quelques-uns des points forts de Vertex AI Workbench dans les sections suivantes. Pour plus d'informations, consultez la Présentation de Vertex AI Workbench.
Types d'instances
Vertex AI Workbench fournit plusieurs types d'instances basés sur un notebook Jupyter pour votre workflow de data science:
Instances Vertex AI Workbench : option qui combine les intégrations orientées workflow d'une instance de notebooks gérés et la personnalisation d'une instance de notebooks gérés par l'utilisateur..
Instances de notebooks gérés Vertex AI Workbench (obsolète) : environnements gérés par Google avec des intégrations et des caractéristiques qui vous aident à configurer et à utiliser un environnement de production de bout en bout basé sur des notebooks.
Notebooks Vertex AI Workbench gérés par l'utilisateur (obsolète) : instances Deep Learning VM Image hautement personnalisables et donc idéales pour les utilisateurs qui ont besoin de beaucoup de contrôle sur leur environnement.
Toutes les options de Vertex AI Workbench fournissent les éléments suivants :
- Pré-installé avec JupyterLab.
- Suite de packages de deep learning préinstallée, assurant la compatibilité avec les frameworks TensorFlow et PyTorch.
- Compatibilité avec les accélérateurs GPU.
- La capacité à synchroniser avec un dépôt GitHub.
- Authentification et autorisation Google Cloud.
Instances Vertex AI Workbench
Les instances Vertex AI Workbench peuvent être un bon choix si vous avez besoin des intégrations orientées workflow des notebooks gérés et de la personnalisation des notebooks gérés par l'utilisateur.
Ajouter des environnements Conda
Les instances Vertex AI Workbench utilisent des noyaux basés sur des environnements Conda. Vous pouvez ajouter un environnement Conda à votre instance Vertex AI Workbench. L'environnement apparaît comme un noyau dans l'interface JupyterLab de votre instance.
L'ajout d'environnements Conda vous permet d'utiliser des noyaux qui ne sont pas disponibles dans l'instance Vertex AI Workbench par défaut. Par exemple, vous pouvez ajouter des environnements Conda pour R et Apache Beam. Vous pouvez également ajouter des environnements Conda à d'anciennes versions spécifiques des frameworks disponibles, tels que TensorFlow, PyTorch ou Python.
Pour en savoir plus, consultez Ajouter un environnement Conda.
Accès aux données
Vous pouvez travailler plus efficacement en accédant à vos données sans quitter l'interface JupyterLab.
Dans le menu de navigation de JupyterLab d'une instance Vertex AI Workbench, vous pouvez utiliser l'intégration Cloud Storage pour parcourir les données et les autres fichiers auxquels vous avez accès.
Toujours depuis le menu de navigation, vous pouvez utiliser l'intégration de BigQuery pour parcourir les tables auxquelles vous avez accès, écrire des requêtes, prévisualiser les résultats et charger des données dans votre notebook.
Exécutions de notebook automatisées
Vous pouvez configurer un notebook pour qu'il s'exécute selon un calendrier récurrent. Même lorsque votre instance est arrêtée, Vertex AI Workbench va exécuter votre fichier notebook et enregistrer les résultats, que vous pouvez consulter et partager avec d'autres utilisateurs.
Arrêt automatisé pour les instances inactives
Pour vous aider à gérer les coûts, vous pouvez configurer votre instance Vertex AI Workbench de sorte qu'elle s'arrête après une période d'inactivité spécifique. Pour en savoir plus, consultez la section Arrêt en cas d'inactivité.
Surveillance de l'état
Pour vous assurer que votre instance Vertex AI Workbench fonctionne correctement, vous pouvez surveiller l'état de fonctionnement.
Instances de VM deep learning modifiables
Vertex AI Workbench fournit des méthodes d'API pour modifier la VM sous-jacente via l'API Notebooks.
Notebooks gérés par Vertex AI Workbench
Les notebooks gérés constituent généralement un bon choix si vous souhaitez utiliser un notebook pour l'exploration, l'analyse ou la modélisation de données, ou dans le cadre d'un workflow de data science de bout en bout.
Les instances de notebooks gérés vous permettent d'effectuer des tâches axées sur les workflows sans quitter l'interface JupyterLab. Elles disposent également de nombreuses intégrations et fonctionnalités pour implémenter votre workflow de data science.
Voici quelques-unes des intégrations et fonctionnalités incluses dans les notebooks gérés.
Contrôler votre matériel et votre framework à partir de JupyterLab
Dans une instance de notebooks gérés, c'est dans votre interface JupyterLab que vous déterminez les ressources de calcul (par exemple, le nombre de processeurs virtuels ou de GPU et la quantité de RAM) avec lesquelles votre code s'exécutera et le framework dans lequel vous souhaitez l'exécuter. Vous pouvez commencer par écrire votre code, puis choisir la façon de l'exécuter sans avoir à quitter JupyterLab ou à redémarrer votre instance. Pour tester rapidement votre code, vous pouvez procéder à un scaling à la baisse de votre matériel, puis à un scaling à la hausse pour exécuter votre code avec davantage de données.
Conteneurs personnalisés
Votre instance de notebooks gérés comprend un grand nombre de frameworks de data science courants, tels que TensorFlow et PyTorch, mais vous pouvez également ajouter des images de conteneur Docker personnalisées à votre instance. Vos conteneurs personnalisés apparaissent sous forme de noyau dans l'interface JupyterLab de votre instance.
Pour en savoir plus, consultez la page Ajouter un conteneur personnalisé à une instance de notebooks gérés.
Accès aux données
Vous pouvez accéder à vos données sans quitter l'interface JupyterLab.
Dans le menu de navigation de JupyterLab d'une instance de notebooks gérés, vous pouvez utiliser l'intégration Cloud Storage pour parcourir les données et les autres fichiers auxquels vous avez accès.
Toujours depuis le menu de navigation, vous pouvez utiliser l'intégration de BigQuery pour parcourir les tables auxquelles vous avez accès, écrire des requêtes, prévisualiser les résultats et charger des données dans votre notebook.
Exécutions de notebook automatisées
Vous pouvez configurer un notebook pour qu'il s'exécute selon un calendrier récurrent. Même lorsque votre instance est arrêtée, Vertex AI Workbench va exécuter votre fichier notebook et enregistrer les résultats, que vous pouvez consulter et partager avec d'autres utilisateurs.
Intégration de Dataproc
Vous pouvez traiter les données rapidement en exécutant un notebook sur un cluster Dataproc. Une fois votre cluster configuré, vous pouvez exécuter un fichier notebook sur celui-ci sans quitter l'interface JupyterLab.
Arrêt automatisé pour les instances inactives
Pour vous aider à gérer les coûts, vous pouvez configurer votre instance de notebooks gérés de sorte qu'elle s'arrête après une période d'inactivité spécifique. Pour en savoir plus, consultez la section Arrêt en cas d'inactivité.
Notebooks Vertex AI Workbench gérés par l'utilisateur
Les notebooks gérés par l'utilisateur peuvent être un bon choix pour les utilisateurs ayant besoin d'une personnalisation poussée ou de davantage de contrôle sur leur environnement.
Instances Deep Learning VM personnalisables
Les instances de notebooks gérés par l'utilisateur sont des instances Deep Learning VM. Vous choisissez des détails spécifiques sur votre instance de machine virtuelle (VM) lorsque vous créez votre instance de notebooks gérés par l'utilisateur. Par exemple, vous pouvez sélectionner le type de machine et le framework de votre instance de notebooks gérés par l'utilisateur lors de sa création. Vous pouvez modifier le type de machine de votre instance après sa création, bien que cela nécessite un redémarrage de l'instance.
Sur l'instance de notebooks gérés par l'utilisateur, vous pouvez effectuer des modifications manuelles, telles que la mise à jour des versions de logiciels et de packages. La modification du framework sur votre instance est un processus plus complexe.
Étant donné que les instances de notebooks gérés par l'utilisateur sont exposées en tant qu'instances Compute Engine, vous pouvez pas les personnaliser de la même manière que les instances Compute Engine. Pour en savoir plus, consultez la documentation Compute Engine.
Mise en réseau et sécurité
Pour les utilisateurs ayant des besoins spécifiques en matière de réseau et de sécurité, les notebooks gérés par l'utilisateur peuvent être la meilleure option.
Les notebooks gérés par l'utilisateur et les notebooks gérés sont compatibles avec VPC Service Controls, mais vous disposez d'un meilleur contrôle sur la VM d'une instance de notebooks gérés par l'utilisateur. Cela facilite la configuration manuelle des instances de notebooks gérés par l'utilisateur pour répondre à certains besoins spécifiques de mise en réseau et de sécurité.
Surveillance de l'état
Pour vous assurer que votre instance de notebooks gérés par l'utilisateur fonctionne correctement, vous pouvez surveiller l'état de fonctionnement.
Étapes suivantes
Pour commencer, créez l'un des éléments suivants :