Menyiapkan lingkungan Cloud TPU

Sebelum dapat menggunakan resource Cloud TPU untuk melatih atau menjalankan inferensi pada model, Anda perlu melakukan langkah-langkah penyiapan berikut:

Menyiapkan project Google Cloud Anda

Anda harus memiliki akun dan project Google Cloud untuk menggunakan Cloud TPU.

  1. Di Konsol Google Cloud, login ke Akun Google Anda atau daftar untuk membuat akun baru.

  2. Menginstal Google Cloud CLI. Google Cloud CLI adalah antarmuka untuk mengakses dan mengelola resource serta layanan Google Cloud.

  3. Pilih atau buat project Google Cloud:

    Di Konsol Google Cloud, pilih atau buat project Cloud dari pemilih project.

    Di Cloud Shell, tetapkan ID project Anda menggunakan gcloud CLI. Project ID adalah nama project Anda yang ditampilkan di Konsol Google Cloud.

    $ gcloud config set project PROJECT-ID
    
  4. Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.

    Penyiapan penagihan diperlukan untuk semua penggunaan Google Cloud. Anda hanya akan dikenai biaya setelah mulai menggunakan resource Google Cloud. Untuk informasi selengkapnya, lihat dokumentasi Penagihan Cloud.

    Penagihan untuk semua penggunaan versi Cloud TPU mengikuti harga regional standar yang ditampilkan di halaman harga Cloud TPU.

Menyiapkan lingkungan Anda untuk menggunakan Cloud TPU

Sebelum meminta Cloud TPU, Anda harus mengaktifkan Cloud TPU API dan memastikan bahwa Anda memiliki izin untuk mengelola akses di project Anda dan untuk membuat Cloud TPU. Sebaiknya Anda juga membuat akun layanan yang dikelola pengguna untuk dilampirkan ke TPU.

  1. Aktifkan Cloud TPU API dari Google Cloud Console atau menggunakan gcloud CLI di Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com
    

    Konsol

    1. Di konsol Google Cloud, buka halaman Cloud TPU API.

    Buka halaman Cloud TPU API

    1. Klik Enable.
  2. Pastikan Anda memiliki peran berikut pada project Anda:

    Ikuti petunjuk di bagian Melihat akses saat ini untuk melihat siapa saja yang memiliki akses ke project, folder, atau organisasi Anda. Untuk melihat akses Anda sendiri, di kolom Akun utama, cari baris yang berisi alamat email Anda. Jika alamat email tidak ada di kolom tersebut, berarti Anda tidak memiliki peran apa pun. Di kolom Peran untuk baris dengan alamat email Anda, periksa apakah daftar peran menyertakan peran yang diperlukan.

    Jika Anda tidak memiliki peran yang diperlukan, berikan peran tersebut atau minta administrator untuk melakukannya.

  3. Buat akun layanan TPU:

    Akun layanan memungkinkan layanan Cloud TPU mengakses layanan Google Cloud lainnya. Akun layanan yang dikelola pengguna adalah praktik Google Cloud yang direkomendasikan. Lampirkan akun layanan ke TPU saat Anda membuatnya menggunakan flag --service-account.

    1. Ikuti petunjuk di Membuat akun layanan untuk membuat akun layanan.

    2. Ikuti petunjuk di bagian Mengelola akses ke project, folder, dan organisasi untuk memberi akun layanan Anda akses ke layanan Google Cloud yang akan diakses TPU Anda. Peran berikut direkomendasikan agar TPU Anda dapat mengakses layanan Google Cloud yang biasa digunakan.

Bersiap untuk membuat Cloud TPU

Sebelum membuat Cloud TPU, Anda harus meminta kuota. Anda juga harus mempertimbangkan untuk menggunakan resource yang diantrekan, serta parameter yang ingin digunakan untuk mengonfigurasi TPU Anda.

  1. Kuota permintaan:

    Untuk membuat Cloud TPU, project Google Cloud Anda harus memiliki kuota untuk versi dan ukuran TPU yang ingin dibuat, serta zona tempat Anda ingin membuatnya. Misalnya, jika ingin membuat TPU v4-8 di us-central2-b, Anda harus meminta kuota 8 core TPU v4 di us-central2-b. Untuk mengetahui informasi selengkapnya tentang zona tempat Cloud TPU tersedia, lihat Region dan zona TPU.

    Kuota dialokasikan secara berbeda bergantung pada versi TPU. Jenis kuota yang berbeda memiliki ekspektasi ketersediaan yang berbeda. Untuk mengetahui informasi lebih lanjut tentang alokasi kuota, jenis kuota, dan cara meminta kuota, lihat Kuota.

  2. Tentukan apakah Anda ingin menggunakan resource yang diantrekan.

    Membuat Cloud TPU sebagai resource dalam antrean adalah praktik terbaik. Dengan resource yang diantrekan, Anda dapat menerima kapasitas setelah tersedia. Anda dapat menentukan waktu mulai dan berakhir opsional kapan permintaan harus diisi.

    Ada berbagai perintah gcloud CLI untuk menangani resource yang diantrekan. Untuk informasi lebih lanjut, lihat Panduan pengguna resource yang diantrekan.

  3. Menentukan parameter pembuatan Cloud TPU:

    • Zone: Setel flag --zone ke zona tempat Anda ingin membuat TPU. Anda harus memiliki kuota yang dialokasikan di zona ini. Untuk mengetahui informasi selengkapnya, lihat Region dan zona TPU.

    • Konfigurasi TPU: Jika Anda tidak perlu menentukan topologi kustom, atau Anda menggunakan TPU v2 atau v3, tetapkan tanda --accelerator-type ke vVERSION-TENSORCORES. Ganti VERSION dengan nomor versi TPU yang ingin Anda gunakan. Ganti TENSORCORES dengan jumlah TensorCore yang ingin Anda gunakan.

      Jika Anda ingin menyesuaikan topologi fisik TPU, gunakan flag --version dan --topology. Tetapkan flag --version ke versi TPU yang ingin Anda gunakan. Tetapkan flag --topology ke topologi yang ingin Anda gunakan.

      Untuk mengetahui informasi selengkapnya tentang konfigurasi TPU, termasuk konfigurasi dan varian topologi yang didukung, lihat versi TPU.

    • Versi software: Jika Anda meminta resource dalam antrean, tetapkan flag --runtime-version ke nama versi software yang ingin Anda gunakan. Jika tidak, gunakan flag --version. Versi software TPU tersedia untuk TensorFlow, PyTorch, dan framework JAX. Untuk mengetahui informasi selengkapnya tentang versi software yang didukung, lihat versi software TPU VM.

    • Akun layanan: Setel --service-account ke alamat email akun layanan, jika Anda yang membuatnya, untuk melampirkan akun layanan ke TPU Anda. Jika kosong, akun layanan Compute Engine default akan digunakan.

    • Jenis kuota: Jika Anda ingin membuat TPU menggunakan kuota yang dicadangkan, tambahkan flag --reserved ke permintaan.

      Jika Anda ingin membuat TPU menggunakan kuota yang dapat dihentikan, dan meminta resource yang diantrekan, tambahkan flag --best-effort ke permintaan Anda.

      Jika Anda ingin membuat TPU menggunakan kuota yang dapat dihentikan, dan Anda tidak meminta resource yang diantrekan, tambahkan flag --preemptible ke permintaan Anda.

      Jika ingin membuat TPU menggunakan kuota on demand, Anda tidak perlu menambahkan flag tambahan.

    • Konfigurasi lanjutan: Anda dapat menambahkan flag tambahan ke permintaan untuk mengonfigurasi TPU. Lihat dokumentasi gcloud compute tpus tpu-vm create dan bagian berikut di Mengelola TPU untuk mengetahui informasi selengkapnya:

Untuk contoh cara membuat Cloud TPU, lihat Memulai.

Langkah selanjutnya

  1. Pelajari cara membuat dan mengelola resource VM dan TPU
  2. Menjalankan panduan memulai Cloud TPU