Men-deploy aplikasi

Perhatikan batasan berikut untuk Reasoning Engine API:

  • Reasoning Engine API hanya mendukung deployment kode Python.
  • Reasoning Engine API hanya didukung di wilayah us-central1.

Sebelum memulai

Sebelum menjalankan tutorial ini, pastikan Anda mengikuti:

  1. Menyiapkan lingkungan Anda
  2. Mengembangkan aplikasi.

Buat instance ReasoningEngine

Untuk men-deploy aplikasi di Vertex AI, gunakan ReasoningEngine.create dan teruskan objek sebagai parameter. Untuk memperkenalkan dependensi paket untuk aplikasi, gunakan parameter berikut:

  • requirements: Daftar dependensi paket PyPI eksternal. Setiap baris harus berupa satu string. Untuk mempelajari lebih lanjut, lihat Format File Persyaratan.
  • extra_packages: Daftar dependensi paket internal. Dependensi paket ini adalah file atau direktori lokal yang sesuai dengan paket Python lokal yang diperlukan oleh aplikasi.

Kode berikut menunjukkan cara men-deploy aplikasi:

remote_app = reasoning_engines.ReasoningEngine.create(
    reasoning_engines.LangchainAgent(
        model=model,
        tools=[get_exchange_rate],
        model_kwargs=model_kwargs,
    ),
    requirements=[
        "google-cloud-aiplatform[reasoningengine,langchain]",
    ],
    display_name="DISPLAY_NAME",  # Optional.
)
remote_app

Deployment aplikasi memerlukan waktu beberapa menit untuk dijalankan. Alat ini mem-build penampung dan mengaktifkan server HTTP di backend. Latensi deployment bergantung pada total waktu yang diperlukan untuk menginstal paket yang diperlukan.

Setelah di-deploy, remote_app sesuai dengan instance reasoning_engines.LangchainAgent yang berjalan di Vertex AI dan dapat dikueri atau dihapus. Ini terpisah dari instance lokal reasoning_engines.LangchainAgent.

Setiap aplikasi yang di-deploy memiliki ID unik. Jalankan perintah berikut untuk mendapatkan ID resource_name untuk aplikasi Anda:

remote_app.resource_name

resource_name memiliki format berikut: "projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID".

Praktik Terbaik

  1. Sematkan versi paket Anda (untuk build yang dapat direproduksi). Paket umum yang perlu dilacak mencakup: google-cloud-aiplatform, cloudpickle, langchain, langchain-core, langchain-google-vertexai, dan pydantic.
  2. Minimalkan jumlah dependensi dalam aplikasi Anda. Hal ini mengurangi jumlah perubahan yang menyebabkan error saat mengupdate dependensi dan mempermudah update aplikasi dari waktu ke waktu untuk fitur yang lebih baru.

Langkah selanjutnya