Tháng này, Google Cloud AI đang xôn xao với tin tức về AP2, the Agent Payments…
Google BigQuery kết hợp ADK & MCP: Tăng tốc phát triển Agents với bộ công cụ độc quyền mới
Cuộc cách mạng về AI Agent (Tác tử AI) đang diễn ra với tốc độ chóng mặt, và mọi doanh nghiệp đều muốn sở hữu những “nhân viên số” tự trị của riêng mình. Tuy nhiên, con đường từ ý tưởng đến một AI Agent thực sự hữu ích, có khả năng suy luận dựa trên dữ liệu nội bộ và thực hiện các tác vụ phức tạp, lại đầy rẫy thách thức: dữ liệu nằm phân mảnh, quá trình tùy chỉnh mô hình tốn kém, và thiếu một bộ công cụ phát triển đồng nhất.
Để phá vỡ rào cản này và trao quyền cho các nhà phát triển, Google đã thực hiện một bước đi mang tính chiến lược. Google BigQuery kết hợp ADK & MCP giờ đây không chỉ là kho dữ liệu, mà còn là trung tâm của một hệ sinh thái phát triển Agent hoàn toàn mới với sự ra mắt của bộ công cụ độc quyền: Agent Development Kit (ADK) và Model Customization Platform (MCP).
Đây không chỉ là một bản cập nhật; đó là một tuyên bố về một phương pháp tiếp cận mới, hứa hẹn tăng tốc đáng kể quá trình đưa các AI Agent thông minh, được tùy chỉnh sâu vào thực tiễn kinh doanh, trực tiếp từ nơi dữ liệu của bạn đang tồn tại.
Tại sảo phải ứng dụng Google BigQuery kết hợp ADK & MCP
Khi sự phấn khích xung quanh các tác nhân AI lan đến khách hàng doanh nghiệp, một câu hỏi quan trọng xuất hiện: Làm thế nào chúng ta có thể trao quyền cho các tác nhân này để tương tác an toàn và thông minh với các hệ thống dữ liệu doanh nghiệp như Google Cloud BigQuery?
Hiện tại, các nhà phát triển ứng dụng agentic buộc phải tự xây dựng và duy trì các công cụ tùy chỉnh của riêng họ, một quy trình chậm chạp, rủi ro và làm sao nhãng việc xây dựng các ứng dụng sáng tạo. Điều này gây ra chi phí phát triển và rủi ro đáng kể, vì họ phải chịu trách nhiệm cho mọi thứ, từ xác thực và xử lý lỗi đến việc theo kịp các khả năng đang phát triển của BigQuery.
Để giải quyết vấn đề này, Google đang giới thiệu một bộ công cụ mới của bên thứ nhất dành cho BigQuery bao gồm tools để lấy siêu dữ liệu và thực hiện truy vấn (và chúng tôi còn nhiều tính năng khác nữa):
- list_dataset_ids: Lấy ID tập dữ liệu BigQuery có trong dự án GCP.
- get_dataset_info: Fetches metadata about a BigQuery dataset.
- list_table_ids: Lấy ID bảng có trong tập dữ liệu BigQuery.
- get_table_info: Lấy siêu dữ liệu về bảng BigQuery.
- execute_sql: Chạy truy vấn SQL trong BigQuery và lấy kết quả.
Các công cụ chính thức do Google duy trì này cung cấp một cầu nối an toàn và đáng tin cậy tới dữ liệu của bạn và bạn có thể sử dụng chúng theo hai cách mạnh mẽ: built-in toolset in Google’s Agent Development Kit (ADK) hoặc thông qua nguồn mở linh hoạt MCP Toolbox for Databases.Điều này giúp bạn có thể tập trung vào việc tạo ra giá trị, chứ không phải vào việc xây dựng nền móng.
Hướng dẫn: Xây dựng một tác nhân phân tích hội thoại bằng cách sử dụng các công cụ của bên thứ nhất BigQuery
Tác nhân của Google sẽ truy vấn tập dữ liệu công khai của BigQuery: thelook_ecommerce, một tập dữ liệu thương mại điện tử tổng hợp bao gồm thông tin khách hàng, hàng tồn kho sản phẩm và lịch sử đơn hàng. Vai trò chính của nhân viên là tạo các truy vấn SQL và cung cấp phản hồi có ý nghĩa cho các câu hỏi kinh doanh phổ biến, chẳng hạn như: Sản phẩm nào bán chạy nhất? Những sản phẩm nào thường được đặt hàng cùng nhau? Và chúng tôi có bao nhiêu khách hàng ở Colombia?
Đầu tiên bạn cần phải tạo môi trường python và cài đặt ADK.Sau đó, bạn có thể gọi tiện ích adk để tạo ứng dụng ADK bq-agent-app mới trong thư mục hiện tại:
adk create bq-agent-app
Chọn mô hình của bạn, chọn Vertex AI làm phần phụ trợ và xác nhận ID dự án và khu vực của bạn:
Bây giờ bạn sẽ có một thư mục mới có tên bq-agent-app. Điều hướng đến agent.py và cập nhật LLM-Agent gốc để phản ánh tác nhân phân tích hội thoại của chúng tôi:
lang-py
root_agent = Agent(
model=”gemini-2.0-flash”,
name=”bigquery_agent”,
description=(
“Agent that answers questions about BigQuery data by executing SQL queries”
),
instruction=””” You are a data analysis agent with access to several BigQuery tools. Make use of those tools to answer the user’s questions.
“””,
tools=[bigquery_toolset],
)
Khi định nghĩa tác nhân, bạn phải cung cấp một tên duy nhất, chỉ định mô hình LLM cơ bản và có thể tùy chọn thêm mô tả để giúp các tác nhân khác hiểu mục đích của nó. Nhiệm vụ hoặc mục tiêu cốt lõi của tác nhân được định nghĩa trong hướng dẫn.
Cuối cùng, để cho phép tác nhân tương tác với dữ liệu của bạn, tác nhân phải được trang bị các công cụ cho phép tương tác với BigQuery để có thể hiểu các tập dữ liệu và bảng có sẵn, và tất nhiên, thực hiện các truy vấn. Hãy cùng xem xét các lựa chọn của chúng ta khi sử dụng bộ công cụ của BigQuery.
Tùy chọn 1: Sử dụng bộ công cụ tích hợp mới của ADK cho BigQuery
first-party toolset thuộc sở hữu và được Google bảo trì. Để gán các công cụ này cho tác nhân của bạn, bạn cần nhập BigQueryToolset từ mô-đun agents.tools và sau đó khởi tạo bộ công cụ:
lang-py
from google.adk.tools.bigquery import BigQueryCredentialsConfig
from google.adk.tools.bigquery import BigQueryToolset
import google.auth
# Define an appropriate credential type
CREDENTIALS_TYPE = AuthCredentialTypes.OAUTH2
# Write modes define BigQuery access control of agent:
# ALLOWED: Tools will have full write capabilites.
# BLOCKED: Default mode. Effectively makes the tool read-only.
# PROTECTED: Only allows writes on temporary data for a given BigQuery session.
tool_config = BigQueryToolConfig(write_mode=WriteMode.ALLOWED)
if CREDENTIALS_TYPE == AuthCredentialTypes.OAUTH2:
# Initiaze the tools to do interactive OAuth
credentials_config = BigQueryCredentialsConfig(
client_id=os.getenv(“OAUTH_CLIENT_ID”),
client_secret=os.getenv(“OAUTH_CLIENT_SECRET”),
)
elif CREDENTIALS_TYPE == AuthCredentialTypes.SERVICE_ACCOUNT:
# Initialize the tools to use the credentials in the service account key.
creds, _ = google.auth.load_credentials_from_file(“service_account_key.json”)
credentials_config = BigQueryCredentialsConfig(credentials=creds)
else:
# Initialize the tools to use the application default credentials.
application_default_credentials, _ = google.auth.default()
credentials_config = BigQueryCredentialsConfig(
credentials=application_default_credentials
)
bigquery_toolset = BigQueryToolset(credentials_config=credentials_config, tool_filter=[
‘list_dataset_ids’,
‘get_dataset_info’,
‘list_table_ids’,
‘get_table_info’,
‘execute_sql’,
])
Bạn có thể sử dụng tham số tool_filter để lọc các công cụ mà bạn muốn cung cấp cho tác nhân.
A note on authentication…
Hiện tại bạn có ba tùy chọn để xác thực với BigQuery:
- Sử dụng thông tin đăng nhập mặc định của ứng dụng có liên quan đến môi trường nơi mã đang chạy.
- Sử dụng service account credentials bằng cách tải chúng từ tệp khóa tài khoản dịch vụ.
- Cung cấp OAuth 2.0 client_id and secret. Cách tiếp cận này thường được sử dụng khi ứng dụng cần người dùng cấp cho ứng dụng quyền truy cập dữ liệu BigQuery.
Để kiểm soát chi tiết hơn tương tác của bạn với BigQuery, tất nhiên bạn có thể tạo riêng cho mình custom function tools, được triển khai dưới dạng các hàm Python mà bạn cung cấp cho tác nhân của mình.
Khi các công cụ được triển khai trực tiếp trong một tác nhân, ngay cả với bộ công cụ tích hợp sẵn, tác nhân hoặc ứng dụng đó vẫn chịu trách nhiệm quản lý xác thực với BigQuery, cũng như logic và việc triển khai cho từng công cụ. Sự kết hợp chặt chẽ này tạo ra những thách thức: việc cập nhật một công cụ hoặc thay đổi phương thức kết nối BigQuery sẽ yêu cầu sửa đổi và triển khai lại thủ công cho từng tác nhân, điều này có thể dẫn đến sự không nhất quán và chi phí bảo trì.
Tùy chọn 2: Sử dụng các công cụ được xây dựng sẵn của BigQuery trong MCP Toolbox for Databases
Hộp công cụ MCP (Giao thức Bối cảnh Mô hình) dành cho Cơ sở dữ liệu là một máy chủ nguồn mở tập trung hóa việc lưu trữ và quản lý các bộ công cụ, tách biệt các ứng dụng đại lý khỏi tương tác trực tiếp với BigQuery. Thay vì tự quản lý logic công cụ và xác thực, các đại lý hoạt động như máy khách MCP, yêu cầu các công cụ từ Hộp công cụ. Hộp công cụ MCP xử lý tất cả các vấn đề phức tạp cơ bản, bao gồm kết nối an toàn với BigQuery, xác thực và thực thi truy vấn.
Phương pháp tập trung này đơn giản hóa việc tái sử dụng công cụ trên nhiều tác nhân, hợp lý hóa các bản cập nhật (logic công cụ có thể được sửa đổi và triển khai trên Hộp công cụ mà không cần thay đổi mọi tác nhân) và cung cấp một điểm duy nhất để thực thi các chính sách bảo mật.
Hộp công cụ MCP dành cho cơ sở dữ liệu hỗ trợ bộ công cụ được xây dựng sẵn của BigQuery.Để truy cập các công cụ này, trước tiên bạn cần tạo một thư mục mcp-toolbox mới trong cùng thư mục với ứng dụng ADK của bạn, sau đó install the MCP Toolbox:
Set the BIGQUERY_PROJECT environment variable, this represents the project where your BigQuery jobs will be created, executed and billed:
export BIGQUERY_PROJECT=<YOUR_PROJECT_NAME>
Chạy lệnh này để khởi động hộp công cụ và bao gồm bộ công cụ BigQuery:
./toolbox –prebuilt bigquery
Ta cũng có thể cấu hình MCP client bên trong IDE.
Bạn có muốn lưu trữ các công cụ tùy chỉnh của riêng mình trong MCP Toolbox for Databases không?
Ta có thể tự định nghĩa công cụ tùy chỉnh trong SQLtùy chỉnh công cụ trong SQL trong tools.yaml configuration file và cung cấp tùy chọn –tools-file khi khởi động máy chủ. Tuy nhiên, bạn không thể sử dụng tùy chọn –prebuilt và –tools-file cùng lúc. Nếu bạn muốn sử dụng các công cụ tùy chỉnh cùng với các công cụ dựng sẵn, bạn phải sử dụng tùy chọn –tool-file và chỉ định thủ công các công cụ dựng sẵn mà bạn muốn đưa vào tệp cấu hình. Như thế này.
Để kết nối ứng dụng ADK của bạn với MCP Toolbox for Databases, bạn cần cài đặt toolbox-core:
pip install toolbox-core
Khi máy chủ của bạn đã hoạt động, bạn có thể truy xuất bộ công cụ của mình bằng ToolboxSyncClient và hàm load_toolset():
lang-py
from toolbox_core import ToolboxSyncClient
bigquery_toolbox = ToolboxSyncClient(“http://127.0.0.1:5000”)
bigquery_toolset = bigquery_toolbox.load_toolset()
Khởi tạo Conversational Analytics Agent
Chỉ cần gán bộ công cụ ADK tích hợp hoặc bộ công cụ MCP cho tác nhân của bạn là bạn đã sẵn sàng!
root_agent = Agent(
model=”gemini-2.0-flash”,
name=”bigquery_agent”,
description=(
“Agent that answers questions about BigQuery data by executing SQL queries”
),
instruction=””” You are a data analysis agent with access to several BigQuery tools. Make use of those tools to answer the user’s questions.
“””,
tools=[bigquery_toolset]
)
You can now run your agent using the adk run or adk web command and start asking questions about your data!
Đại lý của bạn sẽ tận dụng các công cụ được xây dựng sẵn để trích xuất dataset metadata, và sau đó tạo và thực thi truy vấn SQL trong BigQuery để lấy kết quả của bạn:
Kết luận: Biến Kho dữ liệu thành “Xưởng sản xuất” AI Agent
Sự kết hợp giữa Google BigQuery với bộ công cụ Agent Development Kit (ADK) và Model Customization Platform (MCP) không chỉ là một bản cập nhật tính năng, nó đánh dấu một bước chuyển mình chiến lược. BigQuery giờ đây đã vượt ra ngoài vai trò của một kho dữ liệu thụ động, để trở thành một “xưởng sản xuất” AI Agent thực thụ – nơi dữ liệu, công cụ phát triển và mô hình tùy chỉnh hội tụ làm một.
Bằng cách phá vỡ các rào cản truyền thống, Google đang dân chủ hóa khả năng tạo ra các AI Agent phức tạp, trao quyền cho các nhà phát triển để họ có thể kiến tạo những “nhân viên số” thông minh, được tùy chỉnh sâu và am hiểu bối cảnh doanh nghiệp một cách nhanh chóng và hiệu quả hơn bao giờ hết. Tương lai của việc phát triển AI doanh nghiệp không còn nằm ở việc di chuyển dữ liệu đến với mô hình, mà là mang mô hình và công cụ đến với dữ liệu.
Tuy nhiên, hành trình biến kho dữ liệu của bạn thành một “xưởng sản xuất” AI Agent thông minh đòi hỏi chuyên môn sâu cả về cấu trúc dữ liệu lẫn kiến trúc AI.
Hãy liên hệ với Gimasys – Đối tác cao cấp của Google Cloud ngay hôm nay.
Với kinh nghiệm dày dặn trong việc triển khai các giải pháp dữ liệu trên BigQuery và năng lực tư vấn chiến lược AI, chúng tôi sẽ giúp bạn không chỉ hiểu, mà còn khai thác tối đa sức mạnh của bộ công cụ ADK và MCP, xây dựng một lộ trình vững chắc để biến dữ liệu thành lợi thế cạnh tranh thông qua các AI Agent độc quyền.