Google Bikin Vlogger, AI untuk Sulap Foto Jadi Hidup dan Berbicara
- Peneliti Google tengah mengembangkan teknologi kecerdasan buatan (Artificial Intelligence/AI) yang bisa menyulap wajah seseorang dalam foto menjadi seolah hidup. Teknologi tersebut bernama Google Vlogger.
Hasil akhirnya, Google Vlogger bisa mengubah foto statis menjadi sebuah video pendek yang bisa bergerak dan berbicara.
Salah satu aplikasi utama model ini adalah pada terjemahan video. Dalam hal ini, AI Vlogger mengambil video yang ada dalam bahasa tertentu, dan mengedit area bibir dan wajah agar konsisten dengan audio baru, misalnya, bahasa Spanyol.
Teknologi ini mirip dengan tren aplikasi MyHeritage pada 2021 lalu. Situs silsilah keluarga MyHeritage, menyediakan sebuah fitur yang disebut dengan Deep Nostalgia.
Fungsinya adalah untuk menyulap wajah orang dalam foto menjadi seolah hidup, bisa bergerak dan menampilkan gerakan dalam video animasi singkat.
Ketika itu, fitur Deep Nostalgia MyHeritage banyak digunakan untuk "menghidupkan" foto orang tercinta atau anggota keluarga yang sudah wafat.
Baca juga: Nvidia Blackwell B200 Meluncur, Chip AI Diklaim Tercepat di Dunia
Model difusi
Model difusi belakang banyak digunakan oleh perusahaan AI untuk menghasilkan gambar yang realistis dari deskripsi teks.
Nah, peneliti Google kini memperluas pemanfaatan model difusi ke video. Dengan melatih kumpulan data baru yang luas, tim ini mampu menciptakan sistem AI yang dapat menghidupkan foto menjadi video bergerak yang cukup realistis.
Model AI mengambil foto seseorang dan klip audio sebagai input data. Selanjutnya, model difusi mengolah data dan menghasilkan (generate) video pendek yang cocok dengan gambar dan audio tersebut.
Hasilnya, subjek mengucapkan kata-kata sesuai audio yang di-input, lengkap dengan gerakan bibir yang menyesuaikan.
Tak hanya itu, dalam video, subjek juga terlihat menampilkan ekspresi wajah, gerakan kepala, dan gerakan tangan yang sesuai. Contoh foto yang disulap menjadi video dengan VLOGGER bisa dilihat melalui link berikut.
Baca juga: Microsoft Copilot Gratiskan AI GPT-4 Turbo
Untuk mendapatkan hasil yang realistis, Google melatih model difusi dengan kumpulan data besar baru yang disebut MENTOR, berisi lebih dari 800.000 identitas berbeda dan 2.200 jam video.
Dengan kumpulan data tersebut, VLOGGER belajar membuat video orang-orang dengan beragam etnis, usia, pakaian, pose, dan lingkungan sekitar tanpa bias, sebagaimana dihimpun KompasTekno dari TomsGuide, Rabu (20/3/2024).
Teknologi AI baru Google ini juga masih memiliki beberapa keterbatasan. Misalnya, video yang dihasilkan relatif pendek dan memiliki latar belakang statis.
Subjek tidak bergerak dalam lingkungan 3D. Di samping itu, tingkah laku serta pola bicara sibjek, meskipun realistis, masih bisa dibedakan dengan manusia sebenarnya.
Google Vlogger saat ini masih berupa produk pratinjau, bukan produk siap rilis. Untuk mengetahui lebih lanjut soal AI ini, kalian bisa membaca jurnal yang ditulis oleh tim peneliti Google bertajuk "VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis" atau lewat link berikut.
Terkini Lainnya
- Algoritma Instagram Kini Bisa Direset, Rekomendasi Konten Bisa Kembali ke Awal
- YouTube Gaming Recap 2024 Dirilis, Kilas Balik Tontonan Game Sepanjang Tahun
- Oppo Find X8 Resmi di Indonesia, HP Pertama dengan Dimensity 9400
- Oppo Find X8 Pro Resmi dengan Tombol Kamera "Quick Button", Ini Harganya di Indonesia
- Suasana Peluncuran Global Oppo Find X8 Series di Bali, Dihadiri Undangan dari Berbagai Negara
- Spesifikasi dan Harga Samsung Galaxy A16 5G di Indonesia
- Oppo Gandeng Merek Fesyen Paris Maison Kitsune, Bikin Casing Find X8 Series
- YouTube Music "2024 Recap" Dirilis, Rangkum Lagu yang Sering Diputar Mirip Spotify "Wrapped"
- Apple Sodorkan Rp 1,5 Triliun demi TKDN iPhone 16, Pemerintah RI?
- Bukti Kuat Motorola Bakal "Comeback" ke Pasar Ponsel Indonesia
- Beda Smart TV, Android TV, dan Google TV, Kenali sebelum Beli
- Oppo Find X8 Rilis Global Hari Ini di Bali, Begini Cara Nonton Peluncurannya
- Pemerintah AS Desak Google Jual Browser Chrome
- Taktik Apple Buka Blokir iPhone 16, Tawar Rp 157 Miliar lalu Rp 1,5 Triliun
- Xiaomi Redmi A4 5G Meluncur, HP Kamera 50 MP Harga Rp 1 Jutaan
- ShopBack Pangkas Karyawan, 195 Orang Di-PHK Dadakan
- Snapdragon 8s Gen 3 Bawa Tiga Fitur AI Qualcomm Ini ke Ponsel
- Huawei Nova 12 Series Meluncur Global, Bawa Kamera 108 MP
- Tampilan WhatsApp Mendadak Berubah, Menu Chat Pindah ke Bawah, Bisakah Dikembalikan?
- Smartphone Realme Narzo 70 Pro 5G Meluncur, Bawa Fitur Air Gestures