Anda dapat menggunakan sumber generik ini kapan pun Anda perlu membaca dari database. Sebagai Anda dapat menggunakannya untuk membuat snapshot harian dari tabel database generik dan menulis {i>outputnya<i} ke BigQuery.
Mengonfigurasi plugin
- Buka antarmuka web Cloud Data Fusion lalu klik Studio.
- Pastikan Data Pipeline - Batch dipilih (bukan Realtime).
- Di menu Source, klik Database.
- Untuk mengonfigurasi plugin, arahkan kursor ke node plugin, lalu klik Properti.
Masukkan properti berikut. Untuk informasi selengkapnya tentang setiap properti, lihat Properti.
- Masukkan Label untuk node database—untuk
contoh,
database tables
. Masukkan detail koneksi. Anda dapat mengatur koneksi satu kali yang baru, atau koneksi lama yang bisa digunakan kembali.
Koneksi baru
Untuk menambahkan koneksi satu kali ke {i>database<i}, ikuti langkah-langkah langkah:
- Tetap nonaktifkan Gunakan koneksi.
- Masukkan properti koneksi berikut:
- Di bidang {i>driver name<i} JDBC, masukkan nama {i>driver<i}, jika ada. Jika tidak, biarkan No JDBC plugin yang dipilih.
- Di kolom Connection string, masukkan koneksi JDBC {i>string<i}, termasuk nama {i>database<i}.
- Opsional: jika database memerlukan autentikasi, masukkan nama pengguna dan kredensial {i> database<i}.
- Opsional: jika {i>driver<i} JDBC Anda memerlukan konfigurasi tambahan, di kolom Argumen koneksi, masukkan nilai kunci argumen untuk koneksi.
Koneksi yang dapat digunakan kembali
Untuk menggunakan kembali koneksi yang ada, ikuti langkah-langkah berikut:
- Aktifkan Gunakan koneksi.
- Klik Jelajahi koneksi.
Pilih koneksi.
Opsional: jika koneksi tidak ada dan Anda ingin membuat koneksi baru yang dapat digunakan kembali, klik Tambahkan koneksi, lalu lihat langkah-langkah di tab Koneksi baru di halaman ini.
Opsional: untuk menguji konektivitas, klik Get schema. Skema ini digunakan sebagai pengganti skema apa pun yang kembali dari kueri. Harus cocok dengan skema yang berasal dari kueri, kecuali Anda bisa menandai kolom sebagai nullable dan dapat berisi subset kolom.
Di kolom Impor kueri, masukkan kueri
SELECT
untuk mengimpor data dari tabel yang ditentukan—misalnya,select id, name, email, phone from users;
.Opsional: di kolom Kueri pembatas, masukkan nilai minimum dan maksimum nilai yang akan dibaca—misalnya,
SELECT * FROM table WHERE $CONDITIONS
.Opsional: di kolom Split-by field name, masukkan nama yang menghasilkan pemisahan.
Opsional: di kolom Jumlah pemisahan yang akan dibuat, masukkan nomor — misalnya,
2
.Opsional: di kolom Ukuran pengambilan, masukkan angka—misalnya,
1000
.Opsional: masukkan Properti lanjutan, seperti mengubah huruf besar/kecil nama kolom.
- Masukkan Label untuk node database—untuk
contoh,
Opsional: klik Validasi dan tangani error yang ditemukan.
Klik Close. Properti disimpan dan Anda dapat terus membangun pipeline data di Cloud Data Fusion Studio.
Properti
Properti | Makro diaktifkan | Wajib | Deskripsi |
---|---|---|---|
Label | Tidak | Ya | Nama node di pipeline data Anda. |
Gunakan koneksi | Tidak | Tidak | Cari koneksi ke sumber. Jika Use connection dipilih, Anda tidak perlu memberikannya memiliki kredensial yang lengkap. |
Koneksi | Ya | Ya | Nama koneksi yang akan digunakan. Jika Gunakan koneksi dipilih, bidang ini akan muncul. Informasi {i>database<i} dan tabel yang disediakan oleh koneksi. |
Nama driver JDBC | Ya | Ya | Driver JDBC yang akan digunakan. Defaultnya adalah Tidak ada plugin JDBC. |
String koneksi | Ya | Ya | String koneksi JDBC, termasuk nama database. |
Username | Ya | Tidak | Identitas pengguna untuk terhubung ke database. Diperlukan untuk database yang memerlukan otentikasi. Opsional untuk {i>database<i} yang tidak memerlukan autentikasi. |
Password | Ya | Tidak | Kata sandi yang akan digunakan untuk terhubung ke database yang ditentukan. Wajib untuk {i>database<i} yang membutuhkan otentikasi. Opsional untuk {i>database<i} yang tidak memerlukan otentikasi. |
Argumen koneksi | Ya | Tidak | Daftar pasangan tag/nilai string arbitrer sebagai argumen koneksi.
Untuk driver JDBC yang memerlukan konfigurasi tambahan, argumen berikut
diteruskan ke driver JDBC sebagai argumen koneksi dalam
format: key1=value1;key2=value . |
Nama referensi | Tidak | Ya | Nama yang mengidentifikasi sumber ini secara unik untuk silsilah dan anotasi {i>metadata<i}. Biasanya berupa nama tabel atau tampilan. |
Mendapatkan skema | Tidak | Tidak | Skema kumpulan data yang dihasilkan oleh sumber. Model ini digunakan sebagai pengganti skema yang dimunculkan oleh kueri. Nama tersebut harus cocok dengan skema yang ada kembali dari kueri, kecuali bahwa ini memungkinkan Anda menandai kolom sebagai nullable dan itu dapat berisi {i>subset <i}dari {i>field<i}. |
Mengimpor kueri | Ya | Ya | Kueri SELECT untuk mengimpor data dari kueri yang ditentukan
tabel sementara. Anda dapat menentukan jumlah kolom yang akan diimpor, atau
impor semua kolom menggunakan * . Kueri harus berisi
String $CONDITIONS . Misalnya,
SELECT * FROM table WHERE $CONDITIONS . Tujuan
String $CONDITIONS diganti dengan kolom splitBy
batas yang ditentukan di kolom Kueri pembatas. Tujuan
String $CONDITIONS tidak diperlukan jika Jumlah
splits ditetapkan ke 1. |
Kueri pembatas | Ya | Tidak | Kueri pembatas yang mengembalikan nilai minimum dan maksimum
dari kolom pemisahan. Misalnya,
SELECT MIN(id),MAX(id) FROM table . Tidak diperlukan jika
jumlah bagian ditetapkan ke 1. |
Dipisahkan menurut nama kolom | Ya | Tidak | Nama kolom yang digunakan untuk membuat pemisahan. Tidak diperlukan jika jumlah pemisahan yang akan dihasilkan ditetapkan ke 1. |
Jumlah pemisahan yang akan dibuat | Ya | Tidak | Jumlah pemisahan yang akan dihasilkan. Defaultnya adalah 1. |
Ukuran pengambilan | Ya | Tidak | Jumlah baris yang akan diambil per pemisahan. Ukuran pengambilan yang lebih besar
dapat mempercepat proses impor, dengan imbal balik penggunaan memori yang lebih tinggi. Defaultnya adalah 1000. |
Mengaktifkan commit otomatis | Tidak | Tidak | Menentukan apakah akan mengaktifkan commit otomatis untuk kueri yang dijalankan oleh sumber ini. Pertahankan
disetel ke False kecuali Anda menggunakan driver JDBC yang
menyebabkan {i>error<i} ketika operasi commit
sedang dijalankan. Defaultnya adalah False. |
Kapitalisasi nama kolom | Ya | Tidak | Menetapkan huruf besar/kecil dari nama kolom yang ditampilkan dari kueri. Anda
dapat memilih huruf besar atau huruf kecil. Secara default, atau untuk input lainnya,
nama kolom tidak dimodifikasi dan huruf besar/kecil dikembalikan dari
{i>database<i} digunakan. Menetapkan properti ini memberikan prediktabilitas
kapitalisasi nama kolom di seluruh {i>database<i} yang berbeda, tetapi itu dapat menyebabkan
nama kolom akan bentrok jika beberapa nama kolom sama saat kapitalisasi
akan diabaikan. Defaultnya adalah Tidak ada perubahan. |
Tingkat isolasi transaksi | Ya | Tidak | Level isolasi transaksi untuk kueri yang dijalankan oleh sink ini. Untuk selengkapnya
informasi tersebut, lihat
setTransactionIsolation()
Driver JDBC Phoenix menampilkan pengecualian jika database Phoenix
transaksi belum diaktifkan dan bidang ini disetel ke
true . Untuk pengemudi seperti itu, setel kolom ini ke
TRANSACTION_NONE .Defaultnya adalah TRANSACTION_SERIALIZABLE. |
Pola yang akan diganti | Tidak | Tidak | Pola yang akan diganti pada nama {i>field<i} dalam tabel (biasanya digunakan dengan properti Ganti dengan). Jika Properti Ganti dengan tidak ditetapkan, pola dihapus dari nama kolom. |
Ganti dengan | Tidak | Tidak | String yang diganti pada nama kolom di tabel. Anda harus mengonfigurasi kolom Pola yang akan diganti. |
Skema output | Tidak | Tidak | Menentukan skema yang dihasilkan. Hanya kolom yang ditentukan dalam skema termasuk dalam kumpulan data output. |
Praktik terbaik
Periksa apakah plugin yang lebih spesifik tersedia untuk database Anda. Misalnya, jika Anda memiliki sumber database Oracle, sebagai gantinya gunakan sumber batch database Oracle karena dirancang untuk bekerja dengan skema Oracle.
Catatan rilis
Langkah selanjutnya
- Pelajari lebih lanjut plugin di Cloud Data Fusion.