Google Rilis Model AI "Veo 2", Bikin Video dari Teks Makin Realistis

Google DeepMind mengumumkan kehadiran Veo 2 pada Senin (16/12/2024). Veo 2 merupakantool AI generatif teks-ke-video (text-to-video AI).

Lihat Foto

- Google DeepMind, divisi proyek kecerdasan buatan (artificial intelligence/AI) andalan Google, mengumumkan kehadiran Veo 2 pada Senin (16/12/2024).

Veo 2 merupakan model AI generatif yang mampu membuat video berdasarkan input teks dari pengguna atau sederhananya merupakan tool AI generatif teks-ke-video (text-to-video AI).

Veo 2 hadir sebagai suksesor Veo generasi pertama yang pertama kali debut dalam ajang Google I/O 2024 yang digelar Mei lalu. Sebagai model terkini, Veo 2 disebut membawa kemampuan membuat video lebih canggih dan hasil realistis.

"Veo 2 menghadirkan pemahaman yang lebih baik tentang dunia nyata dan nuansa gerakan serta ekspresi manusia, yang membantu meningkatkan detail dan realisme secara keseluruhan," tulis Google.

Dibanding Veo generasi pertama, Veo 2 diklaim lebih mumpuni karena dapat membuat video berkualitas tinggi hingga resolusi 4K (4.096 x 2.160 piksel) dengan durasi hingga lebih dari dua menit.

Kemampuan ini meningkat dari Veo generasi pertama yang mampu men-generate klip video hingga 1080p dengan durasi hingga 60 detik.

Dalam tools pembuatan video eksperimental Google, VideoFX, tempat Veo 2 sekarang tersedia secara eksklusif, video dibatasi pada 720p dan berdurasi delapan detik.

Sebagai pembanding, Sora (model AI teks ke video milik OpenAI) dapat menghasilkan klip berdurasi 20 detik dengan resolusi hingga 1080p.

Hasil diklaim lebih realistis

Veo 2 dilaporkan memahami bahasa sinematografi yang unik, mulai dari genre, variasi lensa, efek sinematik, dan lainnya. Pengguna cukup memberikan perintah teks dengan detail seperti menyebutkan bidik dari sudut rendah dan meluncur di tengah-tengah adegan, bidikan close-up, dll.

Google Veo 2 dilaporkan memahami bahasa sinematografi yang unik, mulai dari genre, variasi lensa, efek sinematik, dan lainnya. Pengguna cukup memberikan perintah teks dengan detail seperti menyebutkan bidik dari sudut rendah dan meluncur di tengah-tengah adegan, bidikan close-up, dll.

DeepMind mengatakan model Veo 2 yang dapat menghasilkan klip dalam berbagai gaya, memiliki "pemahaman" yang lebih baik tentang fisika dan kontrol kamera, serta menghasilkan rekaman yang "lebih jernih".

Yang dimaksud DeepMind dengan lebih jernih adalah tekstur dan gambar dalam klip lebih tajam, terutama dalam adegan dengan banyak gerakan.

Mengenai kontrol kamera yang lebih baik, hal itu memungkinkan Veo 2 untuk memposisikan "kamera" virtual dalam video yang dihasilkannya dengan lebih tepat dan menggerakkan kamera tersebut untuk menangkap obyek dan orang dari berbagai sudut.

DeepMind juga mengklaim bahwa Veo 2 dapat merealisasikan gerakan, dinamika "fluida" (seperti aliran kopi yang dituangkan ke dalam cangkir), dan sifat cahaya (seperti bayangan dan pantulan) dengan lebih realistis. Ini termasuk berbagai lensa dan efek sinematik, serta ekspresi manusia yang kompleks.

Veo 2 dilaporkan memahami bahasa sinematografi yang unik, mulai dari genre, variasi lensa, efek sinematik, dan lainnya. Sampel hasil video dari Veo 2 bisa dilihat melalui tautan berikut ini atau video di bawah ini.

Pengguna cukup memberikan perintah teks dengan detail seperti menyebutkan "bidik dari sudut rendah dan meluncur di tengah-tengah adegan", "bidikan close-up", "bidik dengan lensa 18mm", "berikan efek kabur pada latar belakang, fokus pada obyek", dan sebagainya.

DeepMind bersikeras menyatakan bahwa Veo 2 cenderung lebih jarang berhalusinasi, seperti menamabahkan jari atau "objek tak terduga" ke dalam klip.

cpu-data.info

Google Rilis Model AI "Veo 2", Bikin Video dari Teks Makin Realistis

Hasil diklaim lebih realistis

Terkini Lainnya

Tautan Sahabat