跳至主要內容
Google Cloud
說明文件 技術領域
  • AI 和機器學習
  • 應用程式開發
  • 應用程式託管
  • 運算
  • 資料分析和管道
  • 資料庫
  • 分散式、混合雲和多雲端
  • 生成式 AI
  • 產業解決方案
  • 網路
  • 觀測能力與監控
  • 安全性
  • Storage
跨產品工具
  • 存取權和資源管理
  • 費用和用量管理
  • Google Cloud SDK、語言、架構和工具
  • 基礎架構即程式碼
  • 遷移
相關網站
  • Google Cloud 首頁
  • 免費試用與免費方案
  • 架構中心
  • 網誌
  • 聯絡銷售人員
  • Google Cloud Developer Center
  • Google 開發人員中心
  • Google Cloud Marketplace
  • Google Cloud Marketplace 說明文件
  • Google Cloud Skills Boost
  • Google Cloud Solution Center
  • Google Cloud 支援
  • Google Cloud Tech YouTube 頻道
/
  • English
  • Deutsch
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어
控制台 登入
  • Dataproc
指南 參考資料 範例 資源
聯絡我們 免費試用
Google Cloud
  • 說明文件
    • 指南
    • 參考資料
    • 範例
    • 資源
  • 技術領域
    • 更多
  • 跨產品工具
    • 更多
  • 相關網站
    • 更多
  • 控制台
  • 聯絡我們
  • 免費試用
  • Discover
  • 產品總覽
  • 元件
    • 總覽
    • Delta Lake
    • Docker
    • Flink
    • HBase
    • Hive WebHCat
    • Hudi
    • Iceberg
    • Jupyter
    • Pig
    • Presto
    • Ranger
      • 安裝 Ranger
      • 將 Ranger 與 Kerberos 搭配使用
      • 搭配快取和下修訂範圍使用 Ranger
      • 備份及還原 Ranger 結構定義
    • Solr
    • Trino
    • Zeppelin
    • Zookeeper
  • 服務
  • 運算選項
    • 機器類型
    • GPU
    • 最低 CPU 平台
    • 次要工作站
    • 本機固態硬碟
    • 開機磁碟
  • 版本管理
    • 總覽
    • 2.3.x 發布版本
    • 2.2.x 發布版本
    • 2.1.x 發布版本
    • 2.0.x 發布版本
    • 叢集映像檔版本清單
  • 常見問題
  • 開始使用
  • 在 Dataproc 上執行 Spark
    • 使用主控台
    • 使用指令列
    • 使用 REST API Explorer
      • 建立叢集
      • 執行 Spark 工作
      • 更新叢集
      • 刪除叢集
    • 使用用戶端程式庫
    • 使用 Kubernetes 執行 Spark
  • 建立
  • 設定專案
  • 使用 Dataproc 範本
  • 建立 Dataproc 叢集
    • 建立叢集
    • 建立高可用性叢集
    • 建立節點群組叢集
    • 建立部分叢集
    • 建立單一節點叢集
    • 建立單一用戶群叢集
    • 重新建立叢集
    • 建立自訂映像檔
  • 建立 Kubernetes 叢集
    • 總覽
    • 發布版本
    • 重新建立叢集
    • 建立節點集區
    • 建立自訂映像檔
  • 在 BigQuery metastore 中建立含有中繼資料的 Apache Iceberg 資料表
  • 開發
  • Apache Hadoop
  • Apache HBase
  • Apache Hive 和 Kafka
  • Apache Spark
    • 設定
      • 管理 Spark 依附元件
      • 自訂 Spark 環境
      • 啟用並行寫入
      • 提升 Spark 效能
      • 調整 Spark
    • 連結
      • 使用 Spark BigQuery 連接器
      • 使用 Cloud Storage 連接器
      • 使用 Spark Spanner 連接器
    • 執行
      • 使用 HBase
      • 使用蒙地卡羅模擬
      • 使用 Spark ML
      • 使用 Spark Scala
  • 使用 Notebooks
    • 總覽
    • 在 Dataproc 叢集中執行 Jupyter 筆記本
    • 在筆記本上執行基因體分析
    • 使用 JupyterLab 擴充功能開發無伺服器 Spark 工作負載
  • Python
    • 設定環境
    • 使用 Cloud 用戶端程式庫
  • Trino
  • 部署
  • 執行工作
    • 工作的生命週期
    • 提交工作
    • 重新啟動工作
    • 查看工作記錄
  • 使用工作流程範本
    • 總覽
    • 參數化
    • 使用 YAML 檔案
    • 使用叢集選取器
    • 使用內嵌工作流程
  • 自動化調度管理工作流程
    • 工作流程排程解決方案
    • 使用 Dataproc 工作流程範本
    • 使用 Cloud Composer
    • 使用 Cloud Functions
    • 使用 Cloud Scheduler
  • 調整效能
    • 提升 Spark 效能
    • Dataproc 指標
    • 建立指標快訊
    • 剖析資源使用情況
  • 管理
  • 管理叢集
    • 啟動及停止叢集
      • 手動啟動及停止叢集
      • 排定叢集停止運作時間
    • 更新及刪除叢集
    • 輪替叢集
    • 設定叢集
      • 設定叢集屬性
      • 選取區域
      • 自動選取區域
      • 定義初始化動作
      • 將 VM 類型設為優先順序
      • 排定刪除叢集
    • 調度叢集
      • 調度叢集
      • 自動調度叢集資源
    • 管理資料
      • Hadoop 資料儲存空間
      • 選取儲存空間類型
      • 快取叢集資料
      • 卸載重組資料
    • 管理網路
      • 設定網路
      • 透過 Private Service Connect 建立 Dataproc 叢集網路
  • 管理 Kubernetes 叢集
    • 調度叢集
    • 刪除叢集
  • 存取叢集
    • 使用 SSH
    • 連線至網路介面
    • 使用元件閘道
    • 設定人力資源存取權
  • 管理中繼資料和標籤
    • 啟用 Spark 資料系譜
    • 啟用 Hive 資料系譜
    • 設定中繼資料
    • 設定篩選標籤
    • 使用安全標記
  • 連線至 Dataproc
    • 遷移 Hadoop
    • 連結至 BigQuery
      • BigQuery 連接器
      • Hive-BigQuery 連接器
      • 程式碼範例
    • 連結至 Bigtable
    • 連結至 Cloud Storage
    • 連線至 Pub/Sub Lite
  • 實際工作環境最佳做法
  • 安全性與法規遵循
  • 安全性最佳做法
  • 驗證使用者
    • 驗證 Dataproc
    • 驗證個人叢集
  • 指派角色和權限
    • Dataproc 角色和權限
    • Dataproc 主體
    • 精細的身分與存取權管理
    • 指派 Kubernetes 角色
  • 建立服務帳戶
  • 保護叢集
    • 使用 Kerberos 保護多用戶群
    • 使用服務帳戶確保多用戶群架構安全無虞
    • 加密記憶體
    • 管理資料加密金鑰
    • 啟用 Ranger 授權服務
    • 使用 Secret Manager 憑證提供者
    • 建立並保護 Hive 中繼存放區叢集
  • 建立自訂限制
  • Assured Workloads
  • FedRAMP 法規遵循
  • 查看帳單
  • 疑難排解
  • 總覽
  • 分析記錄檔
    • Dataproc 記錄
    • 工作輸出記錄檔
    • 稽核記錄
  • 排解叢集問題
    • 查看叢集診斷資料
    • 排解叢集建立問題
    • 診斷 Kubernetes 叢集
    • 啟用 Kubernetes 記錄功能
  • 排解工作相關問題
    • 排解工作相關問題
    • 排解記憶體錯誤
    • 排解工作延遲問題
    • 查看工作記錄
    • 排解工作流程範本問題
  • AI 和機器學習
  • 應用程式開發
  • 應用程式託管
  • 運算
  • 資料分析和管道
  • 資料庫
  • 分散式、混合雲和多雲端
  • 生成式 AI
  • 產業解決方案
  • 網路
  • 觀測能力與監控
  • 安全性
  • Storage
  • 存取權和資源管理
  • 費用和用量管理
  • Google Cloud SDK、語言、架構和工具
  • 基礎架構即程式碼
  • 遷移
  • Google Cloud 首頁
  • 免費試用與免費方案
  • 架構中心
  • 網誌
  • 聯絡銷售人員
  • Google Cloud Developer Center
  • Google 開發人員中心
  • Google Cloud Marketplace
  • Google Cloud Marketplace 說明文件
  • Google Cloud Skills Boost
  • Google Cloud Solution Center
  • Google Cloud 支援
  • Google Cloud Tech YouTube 頻道
本頁面由 Cloud Translation API 翻譯而成。
  • Home
  • 說明文件
  • Dataproc
  • Documentation
  • 指南

遷移 Hadoop
透過集合功能整理內容 你可以依據偏好儲存及分類內容。

如要將 Apache Hadoop 工作流程和資料遷移至 Google Cloud和 Dataproc,請參閱下列文件:

  • 將內部部署 Hadoop 基礎架構遷移至 Google Cloud
  • 將 HDFS 資料從內部部署環境遷移至 Google Cloud

除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間:2025-09-04 (世界標準時間)。

  • 選用 Google 的理由

    • 選擇 Google Cloud
    • 信任與安全性
    • 新型基礎架構雲端
    • 多雲端
    • 全球基礎架構
    • 客戶與個案研究
    • 分析師報告
    • 白皮書
  • 產品與定價

    • 查看所有產品/服務
    • 查看所有解決方案
    • Google Cloud for Startups
    • Google Cloud Marketplace
    • Google Cloud 定價
    • 與銷售人員聯絡
  • 支援服務

    • Google Cloud 社群
    • 支援服務
    • 版本資訊
    • 系統狀態
  • 實用資源

    • GitHub
    • 開始使用 Google Cloud
    • Google Cloud 說明文件
    • 程式碼範例
    • 雲端架構中心
    • 訓練與認證
    • 開發人員中心
  • 互動交流

    • 網誌
    • 活動
    • X (Twitter)
    • Google Cloud 的 YouTube 頻道
    • Google Cloud Tech 的 YouTube 頻道
    • 成為合作夥伴
    • Google Cloud Affiliate Program
    • 新聞中心
  • 關於 Google
  • 隱私權
  • 網站條款
  • Google Cloud 服務條款
  • Manage cookies
  • 我們的第三個十年氣候計畫:加入我們
  • 訂閱 Google Cloud 電子報 訂閱
  • English
  • Deutsch
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어