0969 627 162

Gemini VEO 3.1: Google định nghĩa lại cuộc đua video AI bằng chất lượng và khả năng kiểm soát

24/10/2025 158 lượt xem
Trong khi OpenAI Sora 2 theo đuổi chiến lược lan truyền (viral), Google Veo 3.1 chọn hướng tiếp cận thực tế, tập trung vào tốc độ, chất lượng hình ảnh, âm thanh theo ngữ cảnh và các công cụ chỉnh sửa chuyên sâu ngay trong mô hình.


Cuộc đua song mã trong lĩnh vực video AI đang nóng lên với hai triết lý phát triển hoàn toàn trái ngược. Với Gemini Veo 3.1, Google nhấn mạnh vào chất lượng đầu ra, tốc độ xử lý và khả năng kiểm soát nội dung, định vị sản phẩm cho các tình huống sử dụng thực tế và chuyên nghiệp. Ngược lại, OpenAI với Sora 2 chọn con đường cởi mở hơn, ưu tiên tăng trưởng lan truyền và gỡ bỏ rào cản, chấp nhận đi kèm các tranh cãi.

Google đang định vị Gemini VEO 3.1 cho các ứng dụng thực tế, ưu tiên an toàn và kiểm soát nội dung.

Với bản cập nhật VEO 3.1, Google tập trung nâng chất lượng và tốc độ tạo sinh, đồng thời tăng khả năng can thiệp của người dùng vào sản phẩm cuối. Điều này đối lập với hướng tiếp cận thiên về lan truyền (viral) và tốc độ phát tán kiểu nền tảng ngắn hạn mà Sora 2 đang theo đuổi. Theo đó, Veo 3.1 được định vị cho mục đích thực tế, ưu tiên sự an toàn và kiểm soát nội dung, thay vì tối đa hóa tính cởi mở.

Hiện tại, bản cập nhật 3.1 đang được Google triển khai, có thể bắt đầu với các đối tác sáng tạo và người dùng đăng ký các gói cao cấp (như Gemini Advanced). Đối với những người dùng có quyền truy cập sớm, đây là những nâng cấp đáng chú ý, tập trung mạnh vào khả năng can thiệp và tinh chỉnh sản phẩm.

Những năng lực cốt lõi của VEO 3.1

Bản cập nhật mới giới thiệu nhiều công cụ hậu kỳ trực tiếp, cho phép người dùng tinh chỉnh video mà không cần rời khỏi mô hình.

Bản cập nhật VEO 3.1 mang đến nhiều cải tiến về chất lượng hình ảnh và khả năng kiểm soát hậu kỳ.

- Chỉnh sửa đối tượng ngay trong cảnh quay: VEO 3.1 cho phép chèn hoặc xóa vật thể khỏi bất kỳ cảnh quay nào. Khả năng này giúp tinh chỉnh bố cục, loại bỏ chi tiết gây nhiễu hoặc thêm yếu tố mới để phù hợp ý đồ kể chuyện mà không cần quay lại.

- Kéo dài cảnh quay (Video extension): Người dùng có thể kéo dài video vượt quá điểm kết thúc ban đầu, một năng lực quan trọng để hoàn thiện nhịp kể hoặc bổ sung thời lượng khi hậu kỳ.

- Tạo chuyển cảnh từ ảnh tĩnh: Mô hình hỗ trợ tạo các chuyển cảnh mượt mà giữa hai khung hình tĩnh, mở ra cách ghép cảnh có kiểm soát dựa trên hai ảnh tham chiếu.

- Kiểm soát phong cách và cảm xúc: Người dùng có thể hướng dẫn giao diện và cảm xúc của một cảnh bằng hình ảnh, vật thể hoặc tâm trạng tham chiếu, giúp tăng độ nhất quán giữa các cảnh.

- Âm thanh theo ngữ cảnh: VEO 3.1 cải thiện đáng kể chất lượng âm thanh, đặc biệt là âm nền phong phú và chính xác hơn theo bối cảnh, giúp sản phẩm cuối gắn kết hơn giữa hình ảnh và âm thanh.

Chiến lược đối lập: Thực dụng và Lan truyền

Khi ưu tiên kiểm soát nội dung, tính cởi mở của VEO 3.1 bị thu hẹp. Google thiết lập các "guardrails" (rào cản an toàn) rõ ràng, hạn chế tạo người thật và giới hạn hình ảnh bạo lực hoặc nguy hiểm. Cách tiếp cận này giảm thiểu rủi ro nội dung không phù hợp, đáp ứng các quy định và bảo vệ an toàn thương hiệu.

Ngược lại, cách tiếp cận nới lỏng của Sora 2 đã giúp tăng đáng kể lượng người dùng và lưu lượng truy cập. Tuy nhiên, chiến lược này đi kèm rủi ro: các công ty đã đối mặt với tranh cãi vì để người dùng tạo ra nội dung không phù hợp.

Về chất lượng, nguồn tin cho biết Sora 2 dù nâng cấp vẫn gặp các lỗi đáng chú ý như vật thể bị biến dạng ở hậu cảnh. VEO 3.1 đặt mục tiêu khắc phục điểm yếu này bằng việc tăng chất lượng tổng thể và trao quyền can thiệp vào sản phẩm cuối cho người dùng.

So sánh trực diện: VEO 3.1 và Sora 2

Khía cạnh

Gemini VEO 3.1

OpenAI Sora 2

Định vị

Tập trung mục đích thực tế, chất lượng và tốc độ

Hướng tiếp cận lan truyền (viral)

Chỉnh sửa trong cảnh

Chèn/xóa vật thể, kéo dài video, chuyển giữa ảnh tĩnh

Chưa nêu trong nguồn

Điều khiển phong cách

Tham chiếu bằng hình ảnh, vật thể, tâm trạng

Chưa nêu trong nguồn

Âm thanh

Âm nền phong phú, chính xác theo ngữ cảnh

Chưa nêu trong nguồn

Kiểm soát nội dung

Hạn chế tạo người thật; giới hạn bạo lực/nguy hiểm

Cho phép người nổi tiếng opt-in; sắp có age-gating

Chất lượng đầu ra

Nhấn mạnh cải thiện chất lượng tổng thể

Vẫn gặp lỗi (glitch) ở hậu cảnh

Tốc độ

Nhấn mạnh cải thiện tốc độ xử lý

Chưa nêu trong nguồn

Ý nghĩa chiến lược

Với VEO 3.1, Google tiến sâu hơn vào quỹ đạo "thực dụng": cải thiện chất lượng, tăng khả năng can thiệp và thiết lập rào cản an toàn. Cách làm này phù hợp với bối cảnh tuân thủ, an toàn thương hiệu và yêu cầu kiểm soát cao trong sản xuất nội dung chuyên nghiệp.

OpenAI với Sora 2 chọn cách mở rộng biên độ sử dụng, áp dụng cơ chế opt-in (chủ động tham gia) cho người nổi tiếng và dự kiến giới hạn độ tuổi để cho phép các nội dung nhạy cảm. Hướng đi này có thể thúc đẩy tăng trưởng người dùng nhanh chóng, nhưng cũng khiến nền tảng phải gánh chịu rủi ro và tranh cãi nhiều hơn khi nội dung bị lạm dụng.

Tóm lại, nếu ưu tiên kiểm soát, tính nhất quán và chất lượng (bao gồm cả âm thanh theo ngữ cảnh), VEO 3.1 đang đặt ra một chuẩn mực đáng chú ý. Nếu ưu tiên tính lan truyền và biên độ sáng tạo rộng hơn, Sora 2 thể hiện một chiến lược hoàn toàn khác.

(Theo Báo Lâm Đồng)