0969 627 162

Google ra mắt Gemini 2.5 Computer Use: AI duyệt web và tương tác như con người

08/10/2025 449 lượt xem
Google vừa công bố một bước tiến đột phá với việc ra mắt Gemini 2.5 Computer Use, một mô hình AI tiên tiến có khả năng tương tác trực tiếp với giao diện web, mô phỏng hành vi của người dùng một cách chính xác.


Công nghệ mới của Google giúp AI thực hiện các tác vụ trực tuyến phức tạp, tăng tốc xử lý, hỗ trợ kiểm thử phần mềm và tự động hóa công việc hiệu quả hơn. (Đồ họa: Cát Tiên)

Được xây dựng trên nền tảng Gemini 2.5 Pro mạnh mẽ, công nghệ mới này cho phép AI tự chủ thực hiện một loạt các hành động phức tạp ngay trên trình duyệt. Các tác vụ như điều hướng trang web, điền biểu mẫu, cuộn trang, nhấp chuột, nhập liệu và sử dụng phím tắt đều được thực hiện thông qua một trình duyệt ảo do chính Google phát triển.

Trao quyền cho AI để tự động hóa các tác vụ phức tạp

Theo thông báo chính thức, Gemini 2.5 Computer Use hiện đã được cung cấp cho các nhà phát triển thông qua Google AI Studio và Vertex AI. Mục tiêu chính của mô hình là cho phép AI thực hiện các công việc thực tế trên internet chỉ bằng các chỉ dẫn ngôn ngữ tự nhiên. Điều này mở ra tiềm năng ứng dụng rộng rãi, từ việc tự động đăng ký tài khoản, sắp xếp dữ liệu phức tạp cho đến hỗ trợ kiểm thử phần mềm.

Google khẳng định mô hình này có độ trễ thấp và hiệu suất vượt trội so với các đối thủ cạnh tranh qua nhiều bài kiểm tra tiêu chuẩn. Trong các video minh họa, Gemini 2.5 Computer Use đã thể hiện khả năng truy cập một trang web, đọc hiểu nội dung và sắp xếp thông tin theo yêu cầu, với tốc độ xử lý được cho là nhanh hơn gấp ba lần so với trước đây.

Ứng dụng thực tiễn và giới hạn hiện tại

Hiện tại, mô hình mới chỉ hỗ trợ 13 loại hành động ở cấp độ trình duyệt và chưa thể thao tác trực tiếp trên hệ điều hành máy tính. Tuy nhiên, Google cho biết các nhóm kỹ sư nội bộ đã ứng dụng thành công công nghệ này vào việc kiểm thử giao diện người dùng (UI), giúp rút ngắn đáng kể thời gian phát triển sản phẩm.

Ngoài ra, Gemini 2.5 Computer Use cũng được tích hợp vào một số sản phẩm và dự án nội bộ quan trọng như:
- AI Mode trong Google Search
- Tác nhân kiểm tra tự động của
Firebase
- Dự án Mariner – nền tảng AI giúp người dùng giao tiếp tự nhiên để thực hiện các công việc như lập kế hoạch, nghiên cứu và nhập liệu.

Với Gemini 2.5 Computer Use, Google đang tiến một bước dài trong việc biến AI thành một "người dùng kỹ thuật số", có khả năng thao tác, phản hồi và xử lý thông tin trực tiếp trên web, hứa hẹn một tương lai nơi các tác vụ trực tuyến được tự động hóa hoàn toàn.

(Theo Báo Lao Động)