Problèmes et limites connus de la version d'image 2.2:
- La traçabilité des données n'est pas disponible, car Spark 3.5 n'est pas compatible avec la collecte de données de traçabilité.
- Les anciens agents ne sont pas installés dans les clusters avec la version d'image 2.2. Les paramètres par défaut de l'agent de surveillance ne sont pas disponibles, sauf si l'agent Ops est installé. Remarque: Les métriques et la journalisation OSS sont disponibles pour les composants Dataproc.
- La journalisation ou la surveillance des applications tierces n'est pas disponible, sauf si l'agent Ops est installé.
Remarques :
- Le code source des bibliothèques d'images 2.2 sous licence réciproque et limitée est disponible au chemin d'accès
/usr/local/share/google/dataproc/third-party-sources
sur les VM de cluster Dataproc. - Les procédures Hudi suivantes ne fonctionnent pas sur une table Hudi basée sur le système de fichiers Cloud Storage :
run_clustering
run_compaction