Dataproc Serverless Spark ランタイム 1.2.x

Spark ランタイム バージョン 1.2 コンポーネント

コンポーネント 1.2.30
2024/10/31
1.2.29
2024/10/25

1.2.28
2024/10/17
1.2.27
2024/10/11
1.2.26
2024/10/04
Apache Spark注 1 3.5.1 3.5.1 3.5.1 3.5.1 3.5.1
Cloud Storage コネクタ 3.0.3 3.0.3 3.0.0 3.0.0 3.0.0
BigQuery コネクタ 0.36.4 0.36.4 0.36.4 0.36.4 0.36.4
Java 17 17 17 17 17
Conda 24.1 24.1 24.1 24.1 24.1
Python 3.12 3.12 3.12 3.12 3.12
R 4.3 4.3 4.3 4.3 4.3
Scala 2.12 2.12 2.12 2.12 2.12

注:

1. Dataproc サーバーレス 1.2 ランタイムは、UTF-8 のデフォルトの文字エンコードを使用します。

Spark ランタイム 1.2 ライブラリ

学習ライブラリ(TensorFlowPyTorchXGBoost など)を備え、機械学習とデータ サイエンス アプリケーションにすぐに使用できる環境を提供します。

次のセクションでは、Dataproc Serverless for Spark ランタイム バージョン 1.2 で使用可能なライブラリ バージョンについて説明します。

GPU 固有のライブラリ

次の NVIDIA ドライバと Spark Rapids ライブラリのバージョンは、Dataproc サーバーレス コンテナで使用でき、NVIDIA Spark Rapids ライブラリを使用して Spark バッチ ワークロードを高速化できます。

パッケージ名 バージョン
Spark Rapids 24.04.0
NVIDA ドライバ 550.127.05

XGBoost ライブラリ

Dataproc Serverless for Spark ランタイム バージョン 1.2 では、Java または Scala で Spark で XGBoost を使用するには、次の Maven パッケージ バージョンを使用できます。

グループ ID パッケージ名 バージョン
ml.dmlc xgboost4j-gpu_2.12 2.0.3
ml.dmlc xgboost4j-spark-gpu_2.12 2.0.3

Python ライブラリ

Dataproc Serverless for Spark ランタイム バージョン 1.2 には、次の Python ライブラリ バージョンが含まれています。

パッケージ名 バージョン
accelerate 0.33
bigframes 1.7
cookiecutter 2.6
cython 3.0
dask 2024.5
deepspeed 0.14
evaluate 0.4
fastavro 1.9
fastparquet 2024.2
gcsfs 2024.5
git 2.45
google-auth-oauthlib 1.2
google-cloud-aiplatform 1.60
google-cloud-bigquery 3.23
google-cloud-bigquery-storage 2.25
google-cloud-bigtable 2.23
google-cloud-container 2.45
google-cloud-datacatalog 3.19
google-cloud-dataproc 5.9
google-cloud-datastore 2.19
google-cloud-dlp 3.22
google-cloud-language 2.13
google-cloud-logging 3.10
google-cloud-monitoring 2.21
google-cloud-pubsub 2.21
google-cloud-redis 2.15
google-cloud-secret-manager 2.20
google-cloud-spanner 3.46
google-cloud-speech 2.26
google-cloud-storage 2.16
google-cloud/text-to-speech 2.16
google-cloud-translate 3.15
google-cloud-vision 3.7
httplib2 0.22
ipyparallel 880
ipython-sql 0.3
ipywidgets 8.1
jupyter_http_over_ws 0.0
jupyterlab 4.1
jupyterlab-git 0.50
keyrings.google-artifactregistry-auth 1.1
langchain 0.2
lightgbm 4.5
Markdown 3.6
matplotlib 3.8
nbclassic 1.0
nbconvert 7.16
nbdime 4.0
nltk 3.8
nodejs 20.12
numba 0.59
numpy 1.26
oauth2client 4.1
openblas 0.3
opencv 4.9
orc 2.0
pandas 2.2
製紙工場 2.6
pyarrow 15.0
pydot 2.0
pyhive 0.7
pymongo 4.7
pynvml 11.5
pytables 3.9
pytorch-cpu 2.3
regex 2024.5
リクエスト 2.31
rtree 1.2
scikit-image 0.22
scikit-learn 1.5
scipy 1.11
seaborn 0.12
sentence-transformers 3.0
sqlalchemy 2.0
sympy 1.12
tokenizers 0.19
transformers 4.43
竜巻 6.4
uritemplate 4.1
virtualenv 20.26
wordcloud 1.9
xgboost 2.0
ydata-profiling 4.8

R ライブラリ

Dataproc Serverless for Spark ランタイム バージョン 1.2 には、次の R ライブラリ バージョンが含まれています。

パッケージ名 バージョン
askpass 1.2
assertthat 0.2
バックポート 1.5
ビット 4.0
bit64 4.0
blob 1.2
boot 1.3_30
醸造 1.0_10
ほうき 1.0
callr 3.7
キャレット 6.0_94
cellranger 1.1
chron 2.3_61
クラス 7.3_22
CLI 3.6
clipr 0.8
クラスタ 2.1
codetools 0.2_20
colorspace 2.1_0
commonmark 1.9
cpp11 0.4
クレヨン 1.5
curl 5.1
data.table 1.15
dbi 1.2
dbplyr 2.5
降順 1.4
devtools 2.4
ダイジェスト 0.6
dplyr 1.1
省略記号 0.3
evaluate 0.23
fansi 1.0
fastmap 1.2
forcats 1.0
foreach 1.5
外国 0.8_86
fs 1.6
将来 1.33
ジェネリック 0.1
ggplot2 3.5
gh 1.4
glmnet 4.1_8
グローバル 0.16
接着剤 1.7
gower 1.0
gtable 0.3
haven 2.5
highr 0.10
hms 1.1
htmltools 0.5.8
htmlwidgets 1.6
httpuv 1.6
httr 1.4
hwriter 1.3.2
ini 0.3
ipred 0.9_14
isoband 0.2
イテレータ 1.0
jsonlite 1.8
kernsmooth 2.23_24
knitr 1.46
ラベル付け 0.4
これ以降 1.3
格子 0.22_6
溶岩 1.7
lifecycle 1.0
listenv 0.9
lubridate 1.9
magrittr 2.0
Markdown 1.12
質量 7.3_60
行列 1.6_5
memoise 2.0
mgcv 1.9_1
mime 0.12
modelmetrics 1.2.2
modelr 0.1
Munsell 0.5
nlme 3.1_164
nnet 7.3_19
numderiv 2016.8_1
openssl 2.2
1.9
pkgbuild 1.4
pkgconfig 2.0
pkgload 1.3
plogr 0.2
plyr 1.8
称賛 1.0
prettyunits 1.2
processx 3.8
prodlim 2023.08
ツイートしましょう 1.2
Promises 1.3
proto 1.0
ps 1.7
purrr 1.0
r6 2.5
randomforest 4.7_1
rappdirs 0.3
rcmdcheck 1.4
rcolorbrewer 1.1_3
rcpp 1.0
rcurl 1.98_1
readr 2.1
readxl 1.4
レシピ 1.0
再戦 2.0
リモコン 2.5
reprex 2.1
reshape2 1.4
rlang 1.1
rmarkdown 2.27
rodbc 1.3_23
roxygen2 7.3
rpart 4.1
rprojroot 2.0
rserve 1.8_7
rsqlite 2.3
rstudioapi 0.16
rvest 1.0
スケール 1.3
selectr 0.4_2
sessioninfo 1.2
シェイプ 1.4.6
光沢のある 1.8.1
sourcetools 0.1
空間 7.3_17
squarem 2021.1
stringi 1.8
stringr 1.5
存続 3.6_4
sys 3.4
teachingdemos 2.12
testthat 3.2.1
tibble 3.2
tidyr 1.3
tidyselect 1.2
tidyverse 2.0
timedate 4032.109
tinytex 0.51
usethis 2.2
utf8 1.2
uuid 1.2_0
vctrs 0.6
ウィスカー 0.4
withr 3.0
xfun 0.44
xml2 1.3
xopen 1.0
xtable 1.8_4
yaml 2.3
zip 2.3