
Ảnh minh họa Gemini 3.5 Live Translate.
Khác biệt cốt lõi của Gemini 3.5 Live Translate so với các hệ thống dịch thuật truyền thống là khả năng xử lý song song. Thay vì bắt buộc phải chờ người nói kết thúc toàn bộ câu thoại mới tiến hành chuyển ngữ, mô hình AI mới có thể tạo bản dịch liên tục ngay trong khi đối phương đang nói. Cơ chế này giúp các cuộc hội thoại diễn ra tự nhiên, mạch lạc và giảm tối đa độ trễ.
Theo thông báo từ Google, hệ thống sở hữu khả năng tự động nhận diện hơn 70 ngôn ngữ. Đáng chú ý, bản dịch không chỉ chính xác về mặt ngữ nghĩa mà còn giữ nguyên được ngữ điệu, tốc độ nói và cao độ giọng đặc trưng của người dùng. Công nghệ đã được thử nghiệm thành công trong các kịch bản thực tế như: lồng tiếng video trực tiếp, chuyển ngữ bài giảng đa quốc gia và hỗ trợ giao tiếp trực diện.
Một cải tiến kỹ thuật quan trọng của Gemini 3.5 Live Translate là việc không còn phụ thuộc vào tiếng Anh như một ngôn ngữ trung gian trong quá trình xử lý dữ liệu. Việc chuyển ngữ trực tiếp giữa các cặp ngôn ngữ giúp nâng cao độ chính xác của cấu trúc câu, đồng thời tối ưu hóa tốc độ phản hồi.
Google đã công bố lộ trình triển khai cụ thể cho công nghệ này:
- Tích hợp vào Google Meet: Trong năm nay, số ngôn ngữ hỗ trợ dịch trực tiếp trên nền tảng họp trực tuyến này sẽ tăng từ 5 lên hơn 70 ngôn ngữ, tạo ra hơn 2.000 tổ hợp dịch thuật khác nhau trong cùng một phòng họp. Phiên bản thử nghiệm đầu tiên sẽ được áp dụng cho một số doanh nghiệp sử dụng dịch vụ Google Workspace ngay trong tháng này.
- Ứng dụng di động: Gemini 3.5 Live Translate hiện đã bắt đầu được phát hành trên toàn cầu qua ứng dụng Google Translate trên hai hệ điều hành Android và iOS. Riêng người dùng Android sẽ được bổ sung chế độ "Listening Mode", hỗ trợ nghe phụ đề dịch trực tiếp qua tai nghe hoặc loa ngoài.
Đi đôi với việc nâng cao năng lực công nghệ, Google cũng thiết lập các tiêu chuẩn an toàn nghiêm ngặt nhằm hạn chế nguy cơ lạm dụng AI. Mọi đoạn âm thanh được tạo ra từ cấu trúc Gemini 3.5 Live Translate đều được tích hợp công nghệ mã hóa vô hình SynthID.
Watermark kỹ thuật số này đóng vai trò xác thực nguồn gốc nội dung do AI tạo ra, giúp các tổ chức và doanh nghiệp chủ động ngăn chặn các hình thức giả mạo thông tin hoặc deepfake giọng nói đang có xu hướng gia tăng trong môi trường số.
Sự xuất hiện của các mô hình AI dịch thuật thời gian thực như Gemini 3.5 Live Translate khẳng định vai trò không thể thay thế của công nghệ trong việc xóa bỏ rào cản ngôn ngữ tại các cơ quan quản lý và cơ sở đào tạo. Để khai thác các công nghệ AI tiên tiến một cách chính thống, an toàn và tối ưu ngân sách, quý đơn vị có thể liên hệ với FermatTech để được cấp quyền sử dụng hệ thống AI có bản quyền dùng chung.
Giải pháp từ FermatTech đem lại các giá trị bền vững:
- Tiết kiệm tối đa chi phí: Thay thế hình thức mua tài khoản cá nhân rời rạc bằng cơ chế dùng chung hạ tầng bản quyền cho toàn tổ chức.
- Phát huy toàn diện sức mạnh AI: Tiếp cận các tính năng xử lý chuyên sâu, đảm bảo hiệu suất vận hành cao và độ chính xác tối đa trong công tác hành chính, giáo dục.
- Bảo mật thông tin tuyệt đối: Hệ thống đáp ứng các tiêu chuẩn an toàn dữ liệu nghiêm ngặt, phù hợp với đặc thù quản lý của khối công quyền và học thuật.
Nguồn bài viết: https://www.vietnamplus.vn/ra-mat-ai-dich-hoi-thoai-truc-tiep-hon-70-ngon-ngu-post1115836.vnp