Halaman ini menyediakan ringkasan kontrol serentak streaming, seperti jumlah maksimum tugas pengambilan data perubahan serentak (CDC) dan tugas pengisian ulang. Anda dapat mengontrol performa streaming dengan meningkatkan atau mengurangi nilai parameter tersebut.
Ringkasan kontrol serentak
Dengan menggunakan kontrol serentak, Anda dapat mencapai pengisian ulang dan CDC yang lebih cepat, atau menyeimbangkan beban pada database sumber. Jika Anda memerlukan throughput yang lebih tinggi, dan dapat menanggung beban yang lebih tinggi pada database, Anda dapat meningkatkan konkurensi tugas CDC dan pengisian ulang. Sebaliknya, jika database mengalami beban tinggi dan Anda ingin melindunginya agar tidak kelebihan beban, Anda dapat mengurangi nilai parameter ini.
Jumlah maksimum tugas CDC
Parameter maxConcurrentCdcTasks
memungkinkan Anda mengontrol jumlah tugas CDC
yang dijalankan secara paralel oleh streaming. Untuk memperluas throughput CDC, tingkatkan nilai parameter ini dan izinkan Datastream memproses lebih banyak file log CDC secara bersamaan.
Karakteristik utama parameter ini mencakup:
- Nilai defaultnya adalah
5
. Anda dapat menetapkan parameter ini ke nilai apa pun antara1
dan50
, inklusif. - Parameter ini hanya berlaku untuk sumber Oracle dan MySQL.
- Parameter ini hanya berdampak jika ada lebih banyak file log database yang tersedia untuk dibaca daripada jumlah tugas CDC. Setelan file log dikontrol oleh parameter konfigurasi database sumber: ukuran file log maksimum dan interval waktu rotasi log maksimum. Untuk mengetahui informasi selengkapnya tentang parameter ini, baca dokumentasi Oracle dan MySQL.
- Jika Anda mengurangi jumlah tugas CDC serentak, Datastream mungkin tertinggal di belakang log database, yang pada akhirnya dapat menyebabkan hilangnya posisi log dan kegagalan aliran.
Jumlah maksimum tugas pengisian ulang
Parameter maxConcurrentBackfillTasks
memungkinkan Anda mengontrol jumlah tugas
pengisian ulang yang dapat dijalankan oleh streaming secara paralel. Anda dapat menambah atau mengurangi nilai ini untuk mengontrol throughput pengisian ulang.
Karakteristik utama parameter ini mencakup:
- Nilai defaultnya adalah
15
. Anda dapat menetapkan parameter ini ke nilai apa pun antara1
dan50
, inklusif. - Ada risiko tinggi terkait peningkatan konkurensi pengisian ulang, karena tugas pengisian ulang memiliki dampak yang signifikan pada performa database.
Setiap tugas pengisian ulang menjalankan kueri
SELECT
yang tidak difilter di tabel, dan untuk tabel besar, kueri tersebut menampilkan baris dalam jumlah besar. - Jika Anda mengurangi konkurensi pengisian ulang, hal ini tidak akan berdampak negatif pada database sumber, kecuali pengisian ulang yang memerlukan waktu lebih lama untuk diselesaikan.
Mengubah nilai kontrol serentak
Anda dapat mengubah nilai parameter kontrol serentak menggunakan Datastream API.
- Untuk mempelajari cara menambah atau mengurangi jumlah tugas CDC serentak, lihat Mengubah jumlah tugas CDC serentak maksimum.
- Untuk mempelajari cara menambah atau mengurangi jumlah tugas pengisian ulang serentak, lihat Mengubah jumlah tugas pengisian ulang serentak maksimum
Langkah selanjutnya
- Baca cara mengelola streaming untuk mempelajari lebih lanjut cara menggunakan Datastream API.
- Baca dokumentasi referensi Datastream API
untuk mempelajari resource
Stream
lebih lanjut.