0969 627 162

Google Gemini nâng cấp: Hỗ trợ phân tích tệp âm thanh và mở rộng tìm kiếm AI

11/09/2025 207 lượt xem
Google vừa công bố một bản cập nhật quan trọng cho ứng dụng Gemini, chính thức bổ sung tính năng được người dùng yêu cầu nhiều nhất: khả năng tải lên và phân tích tệp âm thanh. Đây là bước tiến lớn, giúp Gemini trở thành một công cụ AI đa phương tiện toàn diện hơn.


Trước đây, dù đã hỗ trợ hình ảnh, văn bản và nhiều định dạng tệp khác, việc thiếu khả năng xử lý âm thanh là một hạn chế lớn của Gemini. Với bản cập nhật mới nhất, người dùng trên cả nền tảng web, Android và iOS đều có thể trực tiếp tải lên các tệp ghi âm, bài giảng hay các đoạn âm thanh khác để AI phân tích và cung cấp thông tin chi tiết.

Theo ông Josh Woodward, Phó chủ tịch Google Labs và Gemini, đây là "yêu cầu số một" từ cộng đồng người dùng. Để đáp ứng, Google cho phép người dùng gói miễn phí tải lên tệp âm thanh có độ dài tối đa 10 phút với 5 lượt nhắc mỗi ngày. Trong khi đó, các tài khoản trả phí như Google AI Pro hoặc AI Ultra có thể xử lý các tệp dài tới 3 giờ, phục vụ cho các nhu cầu phân tích chuyên sâu hơn.

Giao diện ứng dụng Google Gemini nay đã hỗ trợ tải lên tệp âm thanh để phân tích. Ảnh: Shutterstock

Không chỉ dừng lại ở đó, bản cập nhật còn nâng giới hạn số lượng tệp có thể tải lên trong mỗi lời nhắc lên tối đa 10 tệp, không phân biệt định dạng. Điều này cho phép người dùng cung cấp nhiều ngữ cảnh và dữ liệu hơn, giúp AI đưa ra những phản hồi chính xác và phù hợp hơn với thực tế.

Bên cạnh việc nâng cấp ứng dụng Gemini, Google cũng mở rộng khả năng của công cụ Tìm kiếm. Chế độ AI trong Google Search đã được bổ sung thêm năm ngôn ngữ mới, bao gồm tiếng Hindi, Indonesia, Nhật, Hàn và Bồ Đào Nha (Brazil). Những cải tiến này được vận hành bởi mô hình Gemini 2.5, hứa hẹn mang lại trải nghiệm tìm kiếm thông minh và sâu sắc hơn cho người dùng toàn cầu.

Bản cập nhật lần này một lần nữa khẳng định chiến lược của Google trong việc tích hợp sâu AI vào các sản phẩm cốt lõi. Gemini đang từng bước phát triển từ một công cụ hội thoại thành một nền tảng AI đa phương tiện và đa ngôn ngữ, sẵn sàng cạnh tranh trực tiếp với các đối thủ lớn trên thị trường.

(Theo laodong.vn)