Azure Data Lake Storage
Konektor Azure Data Lake Storage memungkinkan Anda terhubung ke Azure Data Lake Storage dan menggunakan SQL untuk mengambil serta memperbarui data Azure Data Lake Storage.
Sebelum memulai
Sebelum menggunakan konektor Azure Data Lake Storage, lakukan tugas berikut:
- Di project Google Cloud Anda:
- Pastikan konektivitas jaringan telah disiapkan. Untuk mengetahui informasi tentang pola jaringan, lihat Konektivitas jaringan.
- Berikan peran IAM roles/connectors.admin kepada pengguna yang mengonfigurasi konektor.
- Berikan peran IAM berikut ke akun layanan yang ingin Anda gunakan untuk konektor:
roles/secretmanager.viewer
roles/secretmanager.secretAccessor
Akun layanan adalah jenis Akun Google khusus yang dimaksudkan untuk mewakili pengguna non-manusia yang perlu diautentikasi dan diberi otorisasi untuk mengakses data di Google API. Jika Anda tidak memiliki akun layanan, Anda harus membuat akun layanan. Konektor dan akun layanan harus berada dalam project yang sama. Untuk mengetahui informasi selengkapnya, lihat Membuat akun layanan.
- Aktifkan layanan berikut:
secretmanager.googleapis.com
(Secret Manager API)connectors.googleapis.com
(Connectors API)
Untuk memahami cara mengaktifkan layanan, lihat Mengaktifkan layanan.
Jika layanan atau izin ini belum diaktifkan untuk project Anda sebelumnya, Anda akan diminta untuk mengaktifkannya saat mengonfigurasi konektor.
- Untuk mengetahui informasi tentang cara membuat akun penyimpanan Azure, lihat Membuat akun penyimpanan. Untuk mengetahui informasi tentang cara membuat container di Azure, lihat Membuat container. Untuk mengetahui informasi tentang cara membuat direktori di Azure, lihat Membuat direktori.
Mengonfigurasi konektor
Koneksi khusus untuk sumber data. Artinya, jika Anda memiliki banyak sumber data, Anda harus membuat koneksi terpisah untuk setiap sumber data. Untuk membuat koneksi, lakukan hal berikut:
- Di Konsol Cloud, buka halaman Integration Connectors > Connections lalu pilih atau buat project Google Cloud.
- Klik + Buat baru untuk membuka halaman Buat Koneksi.
- Di bagian Location, pilih lokasi untuk koneksi.
- Region: Pilih lokasi dari menu drop-down.
Region yang didukung untuk konektor meliputi:
Untuk mengetahui daftar semua region yang didukung, lihat Lokasi.
- Klik Berikutnya.
- Region: Pilih lokasi dari menu drop-down.
- Di bagian Detail Koneksi, selesaikan langkah-langkah berikut:
- Konektor: Pilih Azure Data Lake Storage dari daftar drop-down Konektor yang tersedia.
- Versi konektor: Pilih Versi konektor dari daftar drop-down versi yang tersedia.
- Di kolom Connection Name, masukkan nama untuk instance Koneksi.
Nama koneksi harus memenuhi kriteria berikut:
- Nama koneksi dapat menggunakan huruf, angka, atau tanda hubung.
- Huruf harus berupa huruf kecil.
- Nama koneksi harus diawali dengan huruf dan diakhiri dengan huruf atau angka.
- Nama koneksi tidak boleh melebihi 49 karakter.
- Secara opsional, masukkan Deskripsi untuk instance koneksi.
- Secara opsional, aktifkan Cloud Logging,
lalu pilih level log. Secara default, level log ditetapkan ke
Error
. - Akun Layanan: Pilih akun layanan yang memiliki peran yang diperlukan.
- Jika perlu, konfigurasikan Setelan node koneksi:
- Jumlah minimum node: Masukkan jumlah minimum node koneksi.
- Jumlah node maksimum: Masukkan jumlah maksimum node koneksi.
Node adalah unit (atau replika) koneksi yang memproses transaksi. Jumlah node yang diperlukan untuk memproses lebih banyak transaksi untuk suatu koneksi akan bertambah dan sebaliknya, jumlah node yang diperlukan untuk memproses lebih sedikit transaksi akan berkurang. Untuk memahami pengaruh node terhadap harga konektor, lihat Harga untuk node koneksi. Jika Anda tidak memasukkan nilai apa pun, secara default node minimum ditetapkan ke 2 (untuk ketersediaan yang lebih baik) dan node maksimum ditetapkan ke 50.
- Akun: Properti ini menentukan nama akun Azure Data Lake Storage.
- Direktori: Properti ini menentukan jalur root untuk mencantumkan file dan folder.
- Sistem File: Properti ini menentukan nama FileSystem yang akan digunakan di akun penyimpanan Gen 2. Misalnya, nama container blob Azure Anda.
- Ukuran Potongan: Ukuran potongan (dalam MB) yang akan digunakan saat mengupload file besar.
- Include Sub Directories: Pilih apakah jalur subdirektori harus dicantumkan dalam tampilan Resources di Skema ADLSGen2.
- Atau, klik + Tambahkan label untuk menambahkan label ke Koneksi dalam bentuk pasangan kunci/nilai.
- Klik Berikutnya.
-
Di bagian Authentication, masukkan detail autentikasi.
- Pilih Jenis autentikasi dan masukkan detail yang relevan.
Jenis autentikasi berikut didukung oleh koneksi Azure Data Lake Storage:
- Tanda Tangan Akses Bersama
- Kunci Akses Akun
- Autentikasi JWT
- Klik Berikutnya.
Untuk memahami cara mengonfigurasi jenis autentikasi ini, lihat Mengonfigurasi autentikasi.
- Pilih Jenis autentikasi dan masukkan detail yang relevan.
- Tinjau: Tinjau detail koneksi dan autentikasi Anda.
- Klik Buat.
Mengonfigurasi autentikasi
Masukkan detail berdasarkan autentikasi yang ingin Anda gunakan.
-
Shared Access Signature
- Shared Access Signature: Secret Manager Secret yang berisi Shared Access Signature.
-
Kunci Akses Akun
- Account Access Key: Secret Manager Secret yang berisi Account Access Key.
-
Autentikasi JWT
- Client ID: Client ID yang digunakan untuk meminta token akses.
- Kunci Pribadi: Secret Manager Secret yang berisi konten file kunci pribadi dalam format PEM. Kunci pribadi harus cocok dengan kunci/sertifikat publik.
- Sandi Kunci Pribadi: Secret Manager Secret yang berisi sandi (parafrasa) file kunci pribadi.
Contoh konfigurasi koneksi
Bagian ini mencantumkan nilai contoh untuk berbagai kolom yang Anda konfigurasi saat membuat koneksi Azure Data Lake Storage.
Jenis koneksi Tanda Tangan Akses Bersama
Nama kolom | Detail |
---|---|
Lokasi | us-central1 |
Konektor | azuredatalakestorage |
Versi konektor | 1 |
Nama Koneksi | adls-gen2-conn-public |
Mengaktifkan Cloud Logging | Ya |
Akun Layanan | account@my-project. |
Akun | google-cloud-dslgen3 |
Direktori | endpoint |
Sistem File | container |
Sertakan Subdirektori | Tidak |
Jumlah minimum node | 2 |
Jumlah maksimum node | 50 |
Tanda Tangan Akses Bersama | SHARED_ACCESS_SIGNATURE |
Versi Secret | 1 |
Jenis koneksi kunci akses akun
Nama kolom | Detail |
---|---|
Lokasi | us-central1 |
Konektor | azuredatalakestorage |
Versi konektor | 1 |
Nama Koneksi | azure-data-lake-conn |
Mengaktifkan Cloud Logging | Ya |
Akun Layanan | account@my-project. |
Akun | google-cloud-dslgen3 |
Direktori | amerika utara |
Sistem File | container |
Sertakan Subdirektori | Tidak |
Jumlah minimum node | 2 |
Jumlah maksimum node | 50 |
Kunci Akses Akun | ACCOUNT_ACCESS_KEY |
Versi Secret | 1 |
Jenis koneksi autentikasi JWT
Nama kolom | Detail |
---|---|
Lokasi | us-central1 |
Konektor | azuredatalakestorage |
Versi konektor | 1 |
Nama Koneksi | adls-gen2-jwt-conn |
Mengaktifkan Cloud Logging | Ya |
Akun Layanan | account@my-project. |
Akun | your-adls-account-name |
Direktori | amerika utara |
Sistem File | data-lake-container |
Sertakan Subdirektori | Ya |
Jumlah minimum node | 2 |
Jumlah maksimum node | 50 |
Authentication type | Autentikasi JWT |
ID Klien | CLIENT_ID |
Kunci Pribadi | PRIVATE_KEY_SECRET |
Sandi Kunci Pribadi | PRIVATE_KEY_PASSWORD_SECRET |
Versi Secret (untuk Kunci Pribadi) | 1 |
Versi Secret (untuk Sandi Kunci Pribadi) | 1 |
Entity, operasi, dan tindakan
Semua Konektor Integrasi menyediakan lapisan abstraksi untuk objek aplikasi yang terhubung. Anda hanya dapat mengakses objek aplikasi melalui abstraksi ini. Abstraksi ini ditampilkan kepada Anda sebagai entitas, operasi, dan tindakan.
- Entitas: Entitas dapat dianggap sebagai objek, atau kumpulan properti, dalam aplikasi atau layanan yang terhubung. Definisi entitas berbeda dari konektor ke konektor. Misalnya, di konektor database, tabel adalah entitas, di konektor server file, folder adalah entitas, dan di konektor sistem pesan, antrean adalah entitas.
Namun, ada kemungkinan konektor tidak mendukung atau tidak memiliki entity apa pun, sehingga daftar
Entities
akan kosong. - Operasi: Operasi adalah aktivitas yang dapat Anda lakukan pada entity. Anda dapat melakukan
salah satu operasi berikut pada entitas:
Memilih entitas dari daftar yang tersedia akan menghasilkan daftar operasi yang tersedia untuk entitas tersebut. Untuk deskripsi mendetail tentang operasi, lihat operasi entitas tugas Konektor. Namun, jika konektor tidak mendukung operasi entitas apa pun, operasi yang tidak didukung tersebut tidak tercantum dalam daftar
Operations
. - Tindakan: Tindakan adalah fungsi kelas utama yang tersedia untuk integrasi melalui antarmuka konektor. Tindakan memungkinkan Anda membuat perubahan pada satu atau beberapa entitas, dan
berbeda-beda dari konektor ke konektor. Biasanya, tindakan akan memiliki beberapa parameter input, dan parameter output. Namun, ada kemungkinan
konektor tidak mendukung tindakan apa pun, sehingga daftar
Actions
akan kosong.
Batasan sistem
Konektor Azure Data Lake Storage dapat memproses 5 transaksi per detik, per node, dan membatasi transaksi apa pun di luar batas ini. Secara default, Integration Connectors mengalokasikan 2 node (untuk ketersediaan yang lebih baik) untuk koneksi.
Untuk mengetahui informasi tentang batas yang berlaku untuk Integration Connectors, lihat Batas.
Tindakan
Bagian ini mencantumkan tindakan yang didukung oleh konektor. Untuk memahami cara mengonfigurasi tindakan, lihat Contoh tindakan.
Tindakan DownloadFile
Tindakan ini memungkinkan Anda mendownload konten blob tertentu dari direktori atau container.
Parameter input tindakan DownloadFile
Nama Parameter | Jenis Data | Wajib | Deskripsi |
---|---|---|---|
Jalur | String | Ya | Jalur file (termasuk nama file) yang akan didownload. Contoh:
|
HasBytes | Boolean | Tidak | Apakah akan mendownload konten sebagai byte (format Base64).
false .
|
Parameter output tindakan DownloadFile
Jika berhasil, tindakan ini akan menampilkan konten file atau blob.
Untuk contoh cara mengonfigurasi tindakan DownloadFile
,
lihat Contoh tindakan.
Tindakan CreateFile
Tindakan ini memungkinkan Anda membuat blob atau file dalam container atau direktori.
Parameter input tindakan CreateFile
Nama Parameter | Jenis Data | Wajib | Deskripsi |
---|---|---|---|
Jalur | String | Ya | Jalur file yang akan dibuat. |
Untuk contoh cara mengonfigurasi tindakan CreateFile
,
lihat Contoh tindakan.
Tindakan CopyFile
Tindakan ini memungkinkan Anda menyalin konten file atau blob ke file atau blob lain dalam container atau direktori yang sama.
Parameter input tindakan CopyFile
Nama Parameter | Jenis Data | Wajib | Deskripsi |
---|---|---|---|
SourcePath | String | Ya | Jalur file yang akan disalin. |
DestinationPath | String | Ya | Jalur file tempat file akan disalin. |
Untuk contoh cara mengonfigurasi tindakan CopyFile
,
lihat Contoh tindakan.
Tindakan DeleteObject
Tindakan ini memungkinkan Anda menghapus file atau blob.
Parameter input tindakan DeleteObject
Nama Parameter | Jenis Data | Wajib | Deskripsi |
---|---|---|---|
Rekursif | String | Tidak | Tetapkan ini ke true untuk menghapus semua konten folder, termasuk subfolder. |
Jalur | String | Ya | Jalur file atau folder yang akan dihapus. |
DeleteType | String | Ya |
|
Untuk contoh cara mengonfigurasi tindakan DeleteObject
,
lihat Contoh tindakan.
Tindakan LeaseBlob
Tindakan ini memungkinkan Anda membuat dan mengelola kunci pada blob.
Parameter input tindakan LeaseBlob
Nama Parameter | Jenis Data | Wajib | Deskripsi |
---|---|---|---|
Jalur | String | Ya | Jalur file. |
LeaseAction | String | Ya | Menentukan tindakan sewa yang akan dijalankan. |
LeaseDuration | Bilangan bulat | Ya | Menentukan durasi sewa. |
Untuk contoh cara mengonfigurasi tindakan LeaseBlob
,
lihat Contoh tindakan.
Tindakan UploadFile
Tindakan ini memungkinkan pengguna mengupload konten ke blob atau penampung tertentu.
Parameter input tindakan UploadFile
Nama Parameter | Jenis Data | Wajib | Deskripsi |
---|---|---|---|
Jalur | String | Ya | Jalur file yang akan diupload. |
HasBytes | Boolean | Tidak | Apakah akan mengupload konten sebagai byte. |
Konten | String | Ya | Konten yang akan diupload. |
Untuk contoh cara mengonfigurasi tindakan UploadFile
,
lihat Contoh tindakan.
Tindakan RenameObject
Tindakan ini memungkinkan Anda mengganti nama file atau folder.
Parameter input tindakan RenameObject
Nama Parameter | Jenis Data | Wajib | Deskripsi |
---|---|---|---|
Jalur | String | Ya | Jalur yang akan diganti namanya. |
RenameTo | String | Ya | Nama baru file atau folder. |
Untuk contoh cara mengonfigurasi tindakan RenameObject
,
lihat Contoh tindakan.
Contoh tindakan
Contoh - Mendownload file
Contoh ini mendownload file biner.
- Dalam dialog
Configure connector task
, klikActions
. - Pilih tindakan
DownloadFile
, lalu klik Selesai. - Di bagian Task Input pada tugas Connectors, klik
connectorInputPayload
, lalu masukkan nilai yang mirip dengan berikut di kolomDefault Value
:{ "Path": "testdirectory1/test1.pdf", "HasBytes": true }
Jika tindakan berhasil, parameter
respons connectorOutputPayload
tugas DownloadFile
akan memiliki nilai yang mirip dengan berikut ini:
[{ "Success": "True", "ContentBytes": "UEsDBBQABgAIAAAAIQCj77sdZQEAAFIFAAATAAgCW0NvbnRlbnRfVHlwZXNdLnhtbCCiBAIooA" }]
Contoh - Mengupload file
Contoh ini mengupload konten sebagai blob.
- Dalam dialog
Configure connector task
, klikActions
. - Pilih tindakan
UploadFile
, lalu klik Selesai. - Di bagian Task Input pada tugas Connectors, klik
connectorInputPayload
, lalu masukkan nilai yang mirip dengan berikut di kolomDefault Value
:{ "Path": "testblob4", "HasBytes": true, "Content": "abcdef\nabcdef" }
Jika tindakan berhasil, parameter
respons connectorOutputPayload
tugas UploadFile
akan memiliki nilai yang mirip dengan berikut ini:
[{ "Success": "true" }]
Contoh - Membuat file
Contoh ini membuat file di direktori yang ditentukan.
- Dalam dialog
Configure connector task
, klikActions
. - Pilih tindakan
CreateFile
, lalu klik Selesai. - Di bagian Task Input pada tugas Connectors, klik
connectorInputPayload
, lalu masukkan nilai yang mirip dengan berikut di kolomDefault Value
:{ "path": "testdirectory1/testblob" }
Jika tindakan berhasil, parameter
respons connectorOutputPayload
tugas CreateFile
akan memiliki nilai yang mirip dengan berikut ini:
[{ "Success": "true" }]
Contoh - Menyalin file
Contoh ini menyalin file dari satu lokasi ke lokasi lain.
- Dalam dialog
Configure connector task
, klikActions
. - Pilih tindakan
CopyFile
, lalu klik Selesai. - Di bagian Task Input pada tugas Connectors, klik
connectorInputPayload
, lalu masukkan nilai yang mirip dengan berikut di kolomDefault Value
:{ "SourcePath": "testdirectory1/testblob", "DestinationPath": "testblob" }
Jika tindakan berhasil, parameter
respons connectorOutputPayload
tugas CopyFile
akan memiliki nilai yang mirip dengan berikut ini:
[{ "Success": "true" }]
Contoh - Menghapus blob
Contoh ini menghapus blob yang ditentukan.
- Dalam dialog
Configure connector task
, klikActions
. - Pilih tindakan
DeleteObject
, lalu klik Selesai. - Di bagian Task Input pada tugas Connectors, klik
connectorInputPayload
, lalu masukkan nilai yang mirip dengan berikut di kolomDefault Value
:{ "path": "testdirectory1/testblob" }
Jika tindakan berhasil, parameter
respons connectorOutputPayload
tugas DeleteObject
akan memiliki nilai yang mirip dengan berikut ini:
[{ "Success": "true" }]
Contoh - Menyewakan blob
Contoh ini menyewakan blob yang ditentukan.
- Dalam dialog
Configure connector task
, klikActions
. - Pilih tindakan
LeaseBlob
, lalu klik Selesai. - Di bagian Task Input pada tugas Connectors, klik
connectorInputPayload
, lalu masukkan nilai yang mirip dengan berikut di kolomDefault Value
:{ "Path": "testblob2", "LeaseAction": "Acquire", "LeaseDuration": 60.0 }
Jika tindakan berhasil, parameter
respons connectorOutputPayload
tugas LeaseBlob
akan memiliki nilai yang mirip dengan berikut:
[{ "LeaseId": "7aae9ca2-f015-41b6-9bdf-5fd3401fc493", "Success": "true" }]
Contoh - Mengganti nama blob
Contoh ini mengganti nama blob.
- Dalam dialog
Configure connector task
, klikActions
. - Pilih tindakan
RenameObject
, lalu klik Selesai. - Di bagian Task Input pada tugas Connectors, klik
connectorInputPayload
, lalu masukkan nilai yang mirip dengan berikut di kolomDefault Value
:{ "Path": "testblob", "RenameTo": "testblob6" }
Jika tindakan berhasil, parameter
respons connectorOutputPayload
tugas RenameObject
akan memiliki nilai yang mirip dengan berikut ini:
[{ "Success": true }]
Contoh operasi entity
Bagian ini menunjukkan cara melakukan beberapa operasi entitas di konektor ini.
Contoh - Mencantumkan semua catatan
Contoh ini mencantumkan semua data dalam entitas Resource
.
- Dalam dialog
Configure connector task
, klikEntities
. - Pilih
Resource
dari daftarEntity
. - Pilih operasi
List
, lalu klik Selesai. - Secara opsional, di bagian Input Tugas pada tugas Konektor, Anda dapat memfilter kumpulan hasil dengan menentukan klausa filter. Selalu tentukan nilai klausa filter dalam tanda kutip tunggal (').
Contoh - Mendapatkan data
Contoh ini mendapatkan data dengan ID yang ditentukan dari entitas Resource
.
- Dalam dialog
Configure connector task
, klikEntities
. - Pilih
Resource
dari daftarEntity
. - Pilih operasi
Get
, lalu klik Selesai. - Di bagian Task Input pada tugas Connectors, klik EntityId, lalu masukkan
testdirectory1/testblob1
di kolom Default Value.Di sini,
testdirectory1/testblob1
adalah ID data unik dalam entitasResource
.
Menggunakan koneksi Azure Data Lake Storage dalam integrasi
Setelah Anda membuat koneksi, koneksi tersebut akan tersedia di Apigee Integration dan Application Integration. Anda dapat menggunakan koneksi dalam integrasi melalui tugas Konektor.
- Untuk memahami cara membuat dan menggunakan tugas Konektor di Apigee Integration, lihat Tugas konektor.
- Untuk memahami cara membuat dan menggunakan tugas Konektor di Integrasi Aplikasi, lihat Tugas konektor.
Mendapatkan bantuan dari komunitas Google Cloud
Anda dapat memposting pertanyaan dan mendiskusikan konektor ini di komunitas Google Cloud di Forum Cloud.Langkah berikutnya
- Pahami cara menangguhkan dan melanjutkan koneksi.
- Pahami cara memantau penggunaan konektor.
- Pahami cara melihat log konektor.