Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Introducción a BigQuery DataFrames
BigQuery DataFrames es un conjunto de bibliotecas de Python de código abierto que te permiten aprovechar el procesamiento de datos de BigQuery mediante APIs de Python conocidas. BigQuery DataFrames proporciona un DataFrame de Python con la tecnología del motor de BigQuery y, además, implementa las APIs de Pandas y scikit-learn enviando el procesamiento a BigQuery a través de la conversión de SQL. Esto te permite usar BigQuery para explorar y procesar terabytes de datos y, también, entrenar modelos de aprendizaje automático (AA), todo con las APIs de Python.
En el siguiente diagrama, se describe el flujo de trabajo de BigQuery DataFrames:
Beneficios de BigQuery DataFrames
BigQuery DataFrames hace lo siguiente:
Ofrece más de 750 APIs de Pandas y scikit-learn implementadas a través de la conversión de SQL transparente a las APIs de BigQuery y BigQuery ML.
Aplazamiento de la ejecución de las consultas para mejorar el rendimiento
Extiende las transformaciones de datos con funciones de Python definidas por el usuario para que puedas procesar datos en Google Cloud. Estas funciones se implementan de forma automática como funciones remotas de BigQuery.
Se integra en Vertex AI para permitirte usar modelos de Gemini para la generación de texto.
Para obtener más detalles, consulta el
directorio third_party/bigframes_vendored
en el repositorio de GitHub de BigQuery DataFrames.
Cuotas y límites
Las cuotas de BigQuery se aplican a
BigQuery DataFrames, incluidos los componentes de hardware, software
y red.
Se admite un subconjunto de las APIs de Pandas y scikit-learn. Para obtener más información, consulta APIs de Pandas compatibles.
Debes limpiar de manera explícita cualquier función de Cloud Run Functions creada de forma automática como parte de la limpieza de la sesión. Para obtener más información, consulta APIs de Pandas compatibles.
Precios
BigQuery DataFrames es un conjunto de bibliotecas de Python de código abierto
disponibles para descargar sin costo adicional.
BigQuery DataFrames utiliza BigQuery, Cloud Run Functions, Vertex AI y otros servicios deGoogle Cloud , que generan sus propios costos.
Durante el uso regular, BigQuery DataFrames almacena datos temporales,
como resultados intermedios, en tablas de BigQuery. Estas
tablas persisten durante siete días de forma predeterminada, y se te cobra por los datos
almacenados en ellas. Las tablas se crean en el conjunto de datos _anonymous_ del proyecto Google Cloud que especificas en la opción bf.options.bigquery.project.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[[["\u003cp\u003eBigQuery DataFrames are open-source Python libraries that enable users to leverage BigQuery's data processing power through familiar Python APIs.\u003c/p\u003e\n"],["\u003cp\u003eIt offers over 750 implemented pandas and scikit-learn APIs by converting them transparently into SQL for BigQuery and BigQuery ML API processing.\u003c/p\u003e\n"],["\u003cp\u003eBigQuery DataFrames enhances performance by deferring query execution and allowing user-defined Python functions for data transformation, which are automatically deployed as BigQuery remote functions.\u003c/p\u003e\n"],["\u003cp\u003eThe libraries integrate with Vertex AI for text generation with Gemini models, alongside other external packages like Ibis, pandas, and scikit-learn, and is distributed under the Apache-2.0 license.\u003c/p\u003e\n"],["\u003cp\u003eUsers should be aware of BigQuery quotas, the subset of supported pandas and scikit-learn APIs, and that the usage of BigQuery, Cloud Run functions, and Vertex AI may incur additional costs.\u003c/p\u003e\n"]]],[],null,["# Introduction to BigQuery DataFrames\n===================================\n\nBigQuery DataFrames is a set of open source Python libraries that let\nyou take advantage of BigQuery data processing by using familiar\nPython APIs. BigQuery DataFrames provides a Pythonic DataFrame powered\nby the BigQuery engine, and it implements the pandas and\nscikit-learn APIs by pushing the processing down to BigQuery\nthrough SQL conversion. This lets you use BigQuery to explore\nand process terabytes of data, and also train machine learning (ML) models,\nall with Python APIs.\n\nThe following diagram describes the workflow of BigQuery DataFrames:\n\n| **Note:** There are breaking changes to some default parameters in BigQuery DataFrames version 2.0. To learn about these changes and how to migrate to version 2.0, see [Migrate to BigQuery DataFrames\n| 2.0](/bigquery/docs/use-bigquery-dataframes#version-2).\n\nBigQuery DataFrames benefits\n----------------------------\n\nBigQuery DataFrames does the following:\n\n- Offers more than 750 pandas and scikit-learn APIs implemented through transparent SQL conversion to BigQuery and BigQuery ML APIs.\n- Defers the execution of queries for enhanced performance.\n- Extends data transformations with user-defined Python functions to let you process data in Google Cloud. These functions are automatically deployed as BigQuery [remote functions](/bigquery/docs/remote-functions).\n- Integrates with Vertex AI to let you use Gemini models for text generation.\n\nLicensing\n---------\n\nBigQuery DataFrames is distributed with the\n[Apache-2.0 license](https://github.com/googleapis/python-bigquery-dataframes/blob/main/LICENSE).\n\nBigQuery DataFrames also contains code derived from the following\nthird-party packages:\n\n- [Ibis](https://ibis-project.org/)\n- [pandas](https://pandas.pydata.org/)\n- [Python](https://www.python.org/)\n- [scikit-learn](https://scikit-learn.org/)\n- [XGBoost](https://xgboost.readthedocs.io/en/stable/)\n\nFor details, see the\n[`third_party/bigframes_vendored`](https://github.com/googleapis/python-bigquery-dataframes/tree/main/third_party/bigframes_vendored)\ndirectory in the BigQuery DataFrames GitHub repository.\n\nQuotas and limits\n-----------------\n\n- [BigQuery quotas](/bigquery/quotas) apply to BigQuery DataFrames, including hardware, software, and network components.\n- A subset of pandas and scikit-learn APIs are supported. For more information, see [Supported pandas APIs](/python/docs/reference/bigframes/latest/supported_pandas_apis).\n- You must explicitly clean up any automatically created Cloud Run functions functions as part of session cleanup. For more information, see [Supported pandas APIs](/python/docs/reference/bigframes/latest/supported_pandas_apis).\n\nPricing\n-------\n\n- BigQuery DataFrames is a set of open source Python libraries available for download at no extra cost.\n- BigQuery DataFrames uses BigQuery, Cloud Run functions, Vertex AI, and other Google Cloud services, which incur their own costs.\n- During regular usage, BigQuery DataFrames stores temporary data, such as intermediate results, in BigQuery tables. These tables persist for seven days by default, and you are charged for the data stored in them. The tables are created in the `_anonymous_` dataset in the Google Cloud project you specify in the [`bf.options.bigquery.project` option](/python/docs/reference/bigframes/latest/bigframes._config.bigquery_options.BigQueryOptions).\n\nWhat's next\n-----------\n\n- Try the [BigQuery DataFrames quickstart](/bigquery/docs/dataframes-quickstart).\n- Learn how to [use BigQuery DataFrames](/bigquery/docs/use-bigquery-dataframes).\n- Learn how to [visualize graphs using BigQuery DataFrames](/bigquery/docs/dataframes-visualizations).\n- Learn how to [use the `dbt-bigquery` adapter](/bigquery/docs/dataframes-dbt)."]]