AG2, una bifurcación impulsada por la comunidad del AutoGen original, es un framework de código abierto para compilar agentes potenciados por IA.
En esta página, se muestra cómo desarrollar un agente con la plantilla AG2 específica del framework (la clase AG2Agent
en el SDK de Vertex AI para Python). El agente muestra la tasa de cambio
entre dos monedas en una fecha especificada. A continuación, se indican los pasos que debes seguir:
- Define y configura un elemento ejecutable
- Define y usa una herramienta
- (Opcional) Cómo personalizar la organización
Antes de comenzar
Asegúrate de que tu entorno esté configurado con los pasos que se indican en Configura tu entorno.
Paso 1: Define y configura un elemento ejecutable
Define la versión del modelo que deseas usar.
model = "gemini-1.5-flash-001"
Define el nombre ejecutable que se usará.
runnable_name = "Get Exchange Rate Agent"
(Opcional) Configura el modelo.
from google.cloud.aiplatform.aiplatform import initializer
llm_config = {
"config_list": [{
"project_id": initializer.global_config.project,
"location": initializer.global_config.location,
"model": "gemini-1.5-flash-001",
"api_type": "google",
}]
}
Para obtener más información sobre la configuración del modelo en AG2, consulta Análisis detallado de la configuración de modelos.
(Opcional) Configura la configuración de seguridad del modelo. A continuación, se muestra un ejemplo de cómo puedes configurar los parámetros de configuración de seguridad:
from vertexai.generative_models import HarmBlockThreshold, HarmCategory
safety_settings = {
HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_ONLY_HIGH,
HarmCategory.HARM_CATEGORY_HATE_SPEECH: HarmBlockThreshold.BLOCK_ONLY_HIGH,
HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: HarmBlockThreshold.BLOCK_ONLY_HIGH,
HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_ONLY_HIGH,
}
for config_item in llm_config["config_list"]:
config_item["safety_settings"] = safety_settings
Si quieres obtener más información sobre las opciones disponibles para establecer los parámetros de seguridad en Gemini, consulta Cómo configurar los atributos de seguridad.
Crea un AG2Agent
con las configuraciones del modelo:
agent = agent_engines.AG2Agent(
model=model, # Required.
runnable_name=runnable_name, # Required.
llm_config=llm_config, # Optional.
)
Si ejecutas una consulta en un entorno interactivo (p.ej., una terminal o un notebook de Colab), puedes ejecutar una consulta como un paso de prueba intermedio:
response = agent.query(input="What is the exchange rate from US dollars to Swedish currency?", max_turns=1)
print(response)
La respuesta es un diccionario de Python similar al siguiente ejemplo:
{'chat_id': None,
'chat_history': [{'content': 'What is the exchange rate from US dollars to Swedish currency?',
'role': 'assistant',
'name': 'user'},
{'content': 'I do not have access to real-time information, including currency exchange rates. To get the most up-to-date exchange rate from US dollars to Swedish Krona (SEK), I recommend using a reliable online currency converter or checking with your bank. \n',
'role': 'user',
'name': 'Exchange Rate Agent'}],
'summary': 'I do not have access to real-time information, including currency exchange rates. To get the most up-to-date exchange rate from US dollars to Swedish Krona (SEK), I recommend using a reliable online currency converter or checking with your bank. \n',
'cost': {'usage_including_cached_inference': {'total_cost': 5.2875e-06,
'gemini-1.5-flash-001': {'cost': 5.2875e-06,
'prompt_tokens': 34,
'completion_tokens': 62,
'total_tokens': 96}},
'usage_excluding_cached_inference': {'total_cost': 5.2875e-06,
'gemini-1.5-flash-001': {'cost': 5.2875e-06,
'prompt_tokens': 34,
'completion_tokens': 62,
'total_tokens': 96}}},
'human_input': []}
(Opcional) Personalización avanzada
La plantilla AG2Agent
usa api_type=="google"
de forma predeterminada, ya que proporciona acceso a todos los modelos fundamentales disponibles en Google Cloud. Para usar un modelo que no está disponible a través de api_type=="google"
, puedes personalizar el parámetro llm_config
.
Para obtener una lista de los modelos compatibles con AG2 y sus capacidades, consulta
Proveedores de modelos.
El conjunto de valores admitidos para llm_config=
es específico de cada modelo de chat, por lo que debes consultar la documentación correspondiente para obtener más detalles.
Gemini
Instalado de forma predeterminada.
Se usa en la plantilla AG2Agent
cuando omites el argumento llm_config
, por ejemplo
agent = agent_engines.AG2Agent(
model=model, # Required.
runnable_name=runnable_name # Required.
)
Anthropic
Primero, sigue su documentación para configurar una cuenta e instalar el paquete.
A continuación, define un llm_config
:
llm_config = {
"config_list": [{
"model": "claude-3-5-sonnet-20240620", # Required.
"api_key": "ANTHROPIC_API_KEY", # Required.
"api_type": "anthropic", # Required.
}]
}
Por último, úsalo en la plantilla AG2Agent
con el siguiente código:
agent = agent_engines.AG2Agent(
model="claude-3-5-sonnet-20240620", # Required.
runnable_name=runnable_name, # Required.
llm_config=llm_config, # Optional.
)
OpenAI
Puedes usar OpenAI
junto con la API de ChatCompletions de Gemini.
Primero, define un llm_config
:
import google.auth
from google.cloud.aiplatform.aiplatform import initializer
project = initializer.global_config.project
location = initializer.global_config.location
base_url = f"https://{location}-aiplatform.googleapis.com/v1beta1/projects/{project}/locations/{location}/endpoints/openapi"
# Note: the credential lives for 1 hour by default.
# After expiration, it must be refreshed.
creds, _ = google.auth.default(scopes=["https://www.googleapis.com/auth/cloud-platform"])
auth_req = google.auth.transport.requests.Request()
creds.refresh(auth_req)
llm_config = {
"config_list": [{
"model": "google/gemini-1.5-flash-001", # Required.
"api_type": "openai", # Required.
"base_url": base_url, # Required.
"api_key": creds.token, # Required.
}]
}
Por último, úsalo en la plantilla AG2Agent
con el siguiente código:
agent = agent_engines.AG2Agent(
model="google/gemini-1.5-flash-001", # Or "meta/llama3-405b-instruct-maas".
runnable_name=runnable_name, # Required.
llm_config=llm_config, # Optional.
)
Paso 2. Define y usa una herramienta
Después de definir el modelo, el siguiente paso es definir las herramientas que usa el modelo para el razonamiento. Una herramienta puede ser una herramienta de AG2 o una función de Python.
Cuando definas tu función, es importante incluir comentarios que describan de manera completa y clara los parámetros de la función, lo que hace y lo que muestra. El modelo usa esta información para determinar qué función usar. También debes probar la función de forma local para confirmar que funciona.
Usa el siguiente código para definir una función que muestre un tipo de cambio:
def get_exchange_rate(
currency_from: str = "USD",
currency_to: str = "EUR",
currency_date: str = "latest",
):
"""Retrieves the exchange rate between two currencies on a specified date.
Uses the Frankfurter API (https://api.frankfurter.app/) to obtain
exchange rate data.
Args:
currency_from: The base currency (3-letter currency code).
Defaults to "USD" (US Dollar).
currency_to: The target currency (3-letter currency code).
Defaults to "EUR" (Euro).
currency_date: The date for which to retrieve the exchange rate.
Defaults to "latest" for the most recent exchange rate data.
Can be specified in YYYY-MM-DD format for historical rates.
Returns:
dict: A dictionary containing the exchange rate information.
Example: {"amount": 1.0, "base": "USD", "date": "2023-11-24",
"rates": {"EUR": 0.95534}}
"""
import requests
response = requests.get(
f"https://api.frankfurter.app/{currency_date}",
params={"from": currency_from, "to": currency_to},
)
return response.json()
Para probar la función antes de usarla en tu agente, ejecuta el siguiente comando:
get_exchange_rate(currency_from="USD", currency_to="SEK")
La respuesta podría ser similar a la siguiente:
{'amount': 1.0, 'base': 'USD', 'date': '2024-02-22', 'rates': {'SEK': 10.3043}}
Para usar la herramienta dentro de la plantilla AG2Agent
, la agregarás a la lista de herramientas en el argumento tools=
:
agent = agent_engines.AG2Agent(
model=model, # Required.
runnable_name=runnable_name, # Required.
tools=[get_exchange_rate], # Optional.
)
Para probar el agente de forma local, realiza consultas de prueba en él. Ejecuta el siguiente comando para probar el agente de forma local con dólares estadounidenses y coronas suecas:
response = agent.query(input="What is the exchange rate from US dollars to Swedish currency?", max_turns=2)
La respuesta es un diccionario similar al siguiente:
{'chat_id': None,
'chat_history': [{'content': 'What is the exchange rate from US dollars to Swedish currency?',
'role': 'assistant',
'name': 'user'},
{'content': '',
'tool_calls': [{'id': '2285',
'function': {'arguments': '{"currency_from": "USD", "currency_to": "SEK"}',
'name': 'get_exchange_rate'},
'type': 'function'}],
'role': 'assistant'},
{'content': "{'amount': 1.0, 'base': 'USD', 'date': '2025-02-27', 'rates': {'SEK': 10.6509}}",
'tool_responses': [{'tool_call_id': '2285',
'role': 'tool',
'content': "{'amount': 1.0, 'base': 'USD', 'date': '2025-02-27', 'rates': {'SEK': 10.6509}}"}],
'role': 'tool',
'name': 'user'},
{'content': 'The current exchange rate is 1 USD to 10.6509 SEK. \n',
'role': 'user',
'name': 'Get Exchange Rate Agent'},
{'content': 'What is the exchange rate from US dollars to Swedish currency?',
'role': 'assistant',
'name': 'user'},
{'content': '',
'tool_calls': [{'id': '4270',
'function': {'arguments': '{"currency_from": "USD", "currency_to": "SEK"}',
'name': 'get_exchange_rate'},
'type': 'function'}],
'role': 'assistant'},
{'content': "{'amount': 1.0, 'base': 'USD', 'date': '2025-02-27', 'rates': {'SEK': 10.6509}}",
'tool_responses': [{'tool_call_id': '4270',
'role': 'tool',
'content': "{'amount': 1.0, 'base': 'USD', 'date': '2025-02-27', 'rates': {'SEK': 10.6509}}"}],
'role': 'tool',
'name': 'user'},
{'content': 'The current exchange rate is 1 USD to 10.6509 SEK. \n',
'role': 'user',
'name': 'Get Exchange Rate Agent'}],
'summary': 'The current exchange rate is 1 USD to 10.6509 SEK. \n',
'cost': {'usage_including_cached_inference': {'total_cost': 0.0002790625,
'gemini-1.5-flash-001': {'cost': 0.0002790625,
'prompt_tokens': 757,
'completion_tokens': 34,
'total_tokens': 791}},
'usage_excluding_cached_inference': {'total_cost': 0.0002790625,
'gemini-1.5-flash-001': {'cost': 0.0002790625,
'prompt_tokens': 757,
'completion_tokens': 34,
'total_tokens': 791}}},
'human_input': []}
Paso 3: Personaliza la organización
Todos los agentes de AG2 implementan la interfaz ConversableAgent, que proporciona esquemas de entrada y salida para la orquestación. AG2Agent
requiere que se compile un elemento ejecutable para que responda a las consultas. De forma predeterminada, AG2Agent
compilará un elemento ejecutable de este tipo vinculando el modelo con herramientas.
Te recomendamos que personalices la orquestación si deseas (i) implementar un agente de asistente que resuelva una tarea con un modelo, (ii) implementar un agente de proxy de usuario que pueda ejecutar código y proporcionar comentarios a los otros agentes, o (iii) implementar un agente de razonamiento que resuelva una tarea con un modelo y un razonamiento de árbol de pensamiento.
Para ello, debes anular el ejecutable predeterminado cuando crees el AG2Agent
especificando el argumento runnable_builder=
con una función de Python de la siguiente firma:
def runnable_builder(
**runnable_kwargs,
):
Esto proporciona diferentes opciones para personalizar la lógica de organización.
Agente de Assistant
En el caso más simple, para crear un agente de asistente sin organización, puedes reemplazar runnable_builder
por AG2Agent
.
def runnable_builder(**kwargs):
from autogen import agentchat
return agentchat.AssistantAgent(**kwargs)
agent = agent_engines.AG2Agent(
model=model,
runnable_name=runnable_name,
runnable_builder=runnable_builder,
)
Agente de proxy del usuario
En el caso más simple, para crear un agente de asistente sin organización, puedes reemplazar runnable_builder
por AG2Agent
.
def runnable_builder(**kwargs):
from autogen import agentchat
return agentchat.UserProxyAgent(**kwargs)
agent = agent_engines.AG2Agent(
model=model,
runnable_name=runnable_name,
runnable_builder=runnable_builder,
)
Agente de razonamiento
En el caso más simple, para crear un agente de razonamiento sin organización, puedes reemplazar runnable_builder
por AG2Agent
.
def runnable_builder(**kwargs):
from autogen import agentchat
return agentchat.ReasoningAgent(**kwargs)
agent = agent_engines.AG2Agent(
model=model,
runnable_name=runnable_name,
runnable_builder=runnable_builder,
)