AI
Builder Hub
Giao diện màn hình UI viễn tưởng mô tả quá trình thu thập và tìm kiếm của Agent với các luồng data chạy liên tục song song giữa mạng Internet và Private Server.
blog2026-04-287 phút

Hướng Dẫn Build Research Agent Tự Trị Với Gemini Deep Research & MCP

Google biến AI nghiên cứu thành quy trình (workflow) thay vì chatbot đơn thuần. Khám phá cách kết hợp Web Search, Private Data và MCP qua Deep Research Max.

Việc tìm kiếm thông tin bằng AI đã dịch chuyển từ "Tóm tắt một trang web" sang "Tự động vận hành một chu trình nghiên cứu đa nguồn". Vừa qua, Google đã có một đợt nâng cấp toàn diện cho Gemini Deep Research và ra mắt phiên bản hạng nặng Deep Research Max, tích hợp trực tiếp giao thức MCP (Model Context Protocol), File Search, tính năng lập kế hoạch làm việc nhóm và vẽ biểu đồ tự động.

Với giới Builder và các nhà vận hành Workflow, đây là thời điểm hoàn hảo để ứng dụng Deep Research vào các hệ thống tự động (Research Agent) thực chiến.


Google Vừa Ra Mắt Thứ Gì?

Bản cập nhật trên API hiện tại cung cấp 2 chế độ:

  • Deep Research: Tối ưu hóa cho tốc độ và khả năng tiêu thụ token nhanh chóng. Phù hợp cho Copilot tương tác theo thời gian thực.
  • Deep Research Max: "Quái vật" tối ưu hóa cho độ bao phủ toàn diện nhất và chất lượng tổng hợp kiến thức chuyên sâu. Dành cho các Workflow chạy ngầm (offline jobs).

Tất cả đều được đưa lên Public Preview qua Gemini API (Interactions API).


5 Tính Năng Thay Đổi Cuộc Chơi Cho Builder

Đây là những yếu tố cấu thành nên một "Production-grade Workflow":

  1. Hỗ Trợ Trực Tiếp MCP (Model Context Protocol): Cho phép Agent móc thẳng vào nguồn dữ liệu nội bộ (Notion, GitHub, Database) mà không cần cấu hình API cồng kềnh.
  2. File Search Nội Tại: Quét mượt mà các file lưu trữ trong Google Drive nội bộ và kho dữ liệu kết nối.
  3. Collaborative Planning: Trình bày kế hoạch nghiên cứu ra màn hình cho user review và sửa đổi trước khi xách bot đi quét hàng ngàn trang web tốn kém token.
  4. Native Charts / Infographics: Cung cấp cho AI khả năng bóp nắn số liệu (Code Execution) để ói ra các biểu đồ trực quan gắn thẳng vào báo cáo cuối.
  5. Multimodal Grounding: Cross-check thông tin từ PDF, CSV, và cả... Video/Audio.

Deep Research Khác Deep Research Max Thế Nào?

Lựa chọn đúng model quyết định biên độ chi phí (Cost) và độ trễ (Latency) của sản phẩm:

  • Dùng Deep Research khi: Bạn làm một con ChatBot để Sales tra cứu thông tin khách hàng tiềm năng trong lúc Call.
  • Dùng Deep Research Max khi: Bạn setup luồng Cron job 2h sáng tự động quét toàn bộ tin tức đối thủ cạnh tranh, mix với số liệu CSV thu thập từ hệ thống CRM và gửi báo cáo PDF dài 30 trang lên Slack vào lúc 7h sáng.

Bản Mẫu Workflow Khuyên Dùng

Hãy nghĩ theo Workflow, đừng nghĩ theo dạng nhập Prompt:

  • Bước 1: User nhập câu hỏi nghiên cứu (Ví dụ: "Đánh giá rủi ro mua lại công ty A").
  • Bước 2: Hệ thống sinh ra Collaborative Plan (Bước 1 tra báo, Bước 2 tra báo cáo tài chính nội bộ) -> User bấm Duyệt.
  • Bước 3: Agent xả đi quét Google Web Search và đục vào CRM qua MCP.
  • Bước 4: Bóc tách File Search từ hợp đồng nội bộ.
  • Bước 5: Tổng hợp số liệu và Code Execution vẽ biểu đồ Radar so sánh.
  • Bước 6: Đẩy Output cuối cùng (Cited Report - Báo cáo có trích dẫn nguồn) sang hệ thống CMS hoặc qua Mail.

Giới Hạn Cần Lưu Ý

Với quyền truy cập qua MCP, lỗ hổng quản trị dữ liệu (Governance) là rủi ro lớn nhất. Việc cấp nguồn cho Agent cần phải được curation (tuyển lựa) cực kỳ kỹ lưỡng. Thêm vào đó, ở các mảng rủi ro cao (Đầu tư, Đấu thầu), sự giám sát của con người ở cuối phễu vẫn là bắt buộc để tránh tình trạng "quá tin tưởng vào sức mạnh tổng hợp của AI".

Lời khuyên: Hãy bắt đầu với bản "Deep Research" cho khâu thu thập thông tin làm sườn bài viết, sau đó áp dụng bản "Max" cho những quy trình nền dài hơi. AI Research Agent không còn là một tính năng vui vẻ, nó đã chính thức trở thành "Infrastructure" (Cơ sở hạ tầng) của doanh nghiệp!