Tin mới

"Ngã ngửa" với khả năng tạo video từ câu lệnh của Open AI Sora, xem nhiều clip mà ngỡ như cắt từ phim!

Chủ nhật, 18/02/2024 08:00:00

OpenAI vừa tiết lộ Sora, một mô hình AI có thể tạo ra các video chân thực từ các câu lệnh bằng văn bản.

OpenAI đã dẫn đầu trong lĩnh vực AI tiêu dùng, cách mạng hóa việc tạo văn bản và hình ảnh nhờ DALL-E và ChatGPT . Giờ đây, với sản phẩm mới nhất của mình, Sora , công ty đặt mục tiêu dấn thân vào lĩnh vực tạo văn bản thành video, cố gắng đẩy xa hơn nữa ranh giới của sự sáng tạo AI.

Câu lệnh: Máy quay theo sau một chiếc SUV cổ điển màu trắng với giá nóc màu đen khi nó tăng tốc trên con đường đất dốc được bao quanh bởi những cây thông trên một sườn núi dốc, bụi bay lên từ lốp xe, ánh nắng chiếu vào chiếc SUV khi nó tăng tốc trên con đường đất, tỏa ánh sáng ấm áp khắp khung cảnh. Con đường đất uốn lượn nhẹ nhàng về phía xa, không có ô tô, phương tiện nào khác trong tầm mắt. Hai bên đường là cây gỗ đỏ, rải rác khắp nơi là những mảng cây xanh. Chiếc xe được nhìn thấy từ phía sau theo đường cong một cách dễ dàng, khiến nó có vẻ như đang lái xe gồ ghề qua địa hình hiểm trở. Con đường đất được bao quanh bởi những ngọn đồi và núi dốc, với bầu trời trong xanh phía trên với những đám mây mỏng manh.

Sora tự hào về khả năng tạo video có thời lượng lên tới một phút, hoàn chỉnh với các cảnh phức tạp có nhiều nhân vật, chuyển động có sắc thái và nền chi tiết - tất cả đều được điều khiển bởi câu lệnh của người dùng. Kết quả sống động đến mức đáng kinh ngạc, cho thấy tiềm năng không thể phủ nhận của AI trong cách kể chuyện bằng hình ảnh.

Câu lệnh: Cảnh hoạt hình có cận cảnh một con quái vật lông ngắn đang quỳ bên cạnh ngọn nến đỏ đang tan chảy. Phong cách nghệ thuật là 3D và hiện thực, tập trung vào ánh sáng và kết cấu. Tâm trạng của bức tranh là sự ngạc nhiên và tò mò, khi con quái vật nhìn chằm chằm vào ngọn lửa với đôi mắt mở to và miệng há hốc. Tư thế và biểu cảm của nó truyền tải cảm giác ngây thơ và vui tươi, như thể nó đang khám phá thế giới xung quanh lần đầu tiên. Việc sử dụng màu sắc ấm áp và ánh sáng ấn tượng càng làm tăng thêm bầu không khí ấm cúng của hình ảnh.

Trong một số minh họa do OpenAI cung cấp, Sora dễ dàng đưa các câu lệnh thành video. Từ một chiếc SUV cổ điển đang di chuyển trên địa hình đồi núi cho đến khung cảnh kỳ lạ về một con quái vật lông xù như bông ngồi bên cạnh một ngọn nến đang tan chảy, những video được tạo ra đều thể hiện độ trung thực đáng kinh ngạc với các lệnh được cung cấp.

Câu lệnh: Trailer phim kể về cuộc phiêu lưu của người đàn ông mặc đồ phi hành vũ trụ 30 tuổi đội mũ bảo hiểm xe máy dệt kim len màu đỏ, bầu trời xanh, sa mạc muối, phong cách điện ảnh, quay trên phim 35mm, màu sắc sống động.

Tuy nhiên, Sora vẫn chưa thực sự hoàn hảo và OpenAI cũng không che giấu những điều này. Một số ví dụ điển hình như thành cốc trong một video mô tả 2 chiếc tàu cướp biển đồ chơi cũng sóng sánh cùng với cafe bên trong, hay chiếc ghế nhựa liên tục bị biến dạng khi các nhà khảo cổ đào lên. Nhưng nhìn chung, những video mà mô hình AI này tạo ra vẫn rất ấn tượng và có tiềm năng giảm tải bớt khối lượng công việc cho những người tạo nội dung/nhà làm phim.

Câu lệnh: Các nhà khảo cổ phát hiện ra một chiếc ghế nhựa thông thường trên sa mạc, khai quật và phủi bụi nó một cách hết sức cẩn thận.
Điểm yếu: Trong ví dụ này, Sora không mô hình hóa chiếc ghế như một vật cứng, dẫn đến các tương tác vật lý không chính xác.

Hiện tại, Sora vẫn đang được đánh giá các rủi ro và tác động tiềm ẩn của nó. Ngoài ra, OpenAI đang cộng tác với các nghệ sĩ thị giác, nhà thiết kế và nhà làm phim để thu thập phản hồi nhằm nâng cao tiện ích tổng thể của mô hình cho người sáng tạo nội dung. Khi Sora tiếp tục trải qua quá trình sàng lọc và đánh giá, nó hứa hẹn sẽ cung cấp một công cụ mạnh mẽ cho người kể chuyện và người sáng tạo để giúp biến tầm nhìn của họ thành hiện thực.

Câu lệnh: Video cận cảnh chân thực về hai con tàu cướp biển đang chiến đấu với nhau khi chúng di chuyển bên trong một tách cà phê.

Câu lệnh: Một người phụ nữ sành điệu bước xuống một con phố ở Tokyo tràn ngập ánh đèn neon rực rỡ ấm áp và biển hiệu thành phố hoạt hình. Cô ấy mặc áo khoác da màu đen, váy dài màu đỏ, đi bốt đen và mang theo một chiếc ví màu đen. Cô đeo kính râm và tô son đỏ. Cô bước đi tự tin và thản nhiên. Đường phố ẩm ướt và phản chiếu, tạo ra hiệu ứng phản chiếu của ánh đèn nhiều màu sắc. Nhiều người đi bộ đi lại.

Quang Nam

Tin mới

"Ngã ngửa" với khả năng tạo video từ câu lệnh của Open AI Sora, xem nhiều clip mà ngỡ như cắt từ phim!

Bài viết liên quan

Ngỡ ngàng trước hiệu năng "khủng" của Qualcomm Snapdragon 8 Gen 4: bị ép giảm xung mà còn khoẻ hơn 8 Gen 2 chạy hết sức

Nhanh tay tải xuống các tựa game Sony PlayStation Plus mới sẽ miễn phí trong tháng 5

Các tính năng AI trong iOS 18 của Apple vừa được tiết lộ

Google tiết lộ kết quả Passkey: Chưa đầy 1 năm ra mắt, 400 triệu tài khoản đã sử dụng hơn 1 tỷ lần

Mẫu xe điện ZDX đầu tiên của Acura ra mắt với bốn phiên bản và giá khởi điểm từ 1,46 tỷ đồng tại Mỹ

Google bị tố độc quyền do đã thỏa thuận ngầm với Apple để đặt Google Search làm công cụ tìm kiếm mặc định trong Safari

Bài đọc nhiều nhất

Video

Xu hướng

Quay lưng với máy ảnh DSLR: Hasselblad ngừng sản xuất dòng H-Series

Huawei và Changan hợp tác trong cuộc đua phát triển công nghệ ô tô

Samsung dẫn đầu về lượng bán điện thoại gập trong năm 2022, doanh số hơn tất cả các hãng cộng lại

Loa cột flagship LINN 360 mới: kỷ niệm 50 năm thương hiệu, 2 phiên bản (active và passive) với giá từ khoảng 1,6 tỉ đồng

2023 rồi mà Kodak vẫn bán máy quay dùng phim Super 8, "thét giá" đắt hàng trăm triệu đồng

Vivo sẽ đóng vai trò quan trọng trong việc định hình chipset Dimensity 9400 của MediaTek trong tương lai