cpu-data.info

Google Umumkan Whisk, AI untuk Menggabungkan Gambar

Ilustrasi Whisk
Lihat Foto

- Google belakangan getol mengembangkan produk berbasis kecerdasan buatan (Artificial Intelligence/AI). Yang terbaru, raksasa teknologi ini merilis eksperimen AI lain yang disebut Whisk.

Whisk adalah generator gambar berbasis AI. Bedanya, pengguna bisa memberi perintah menggunakan sebuah gambar untuk membuat gambar baru lewat Whisk.

Praktik ini berbeda dengan generator gambar AI pada umumnya, yang biasanya membuat gambar dari perintah teks.

"Kami meluncurkan eksperimen terbaru kami dalam AI generatif: Whisk. Alih-alih menghasilkan gambar dengan perintah teks yang panjang, Whisk memungkinkan Anda memberikan perintah dengan gambar," kata Thomas Iljic, Director of Product Management, Google Labs dikutip KompasTekno dari blog resmi Google, Selasa (17/12/2024).

Baca juga: Fungsi Meta AI di WhatsApp yang Menarik Dicoba, Bisa buat Apa Saja?

Menurut Iljic, pengguna hanya perlu menyeret (drag) gambar ke Whisk untuk memberikan perintah. Posting blog Google juga menunjukkan bahwa pengguna bisa menginput beberapa gambar sekaligus, untuk membuat gambar baru.

Menggabungkan beberapa gambar, membuat jadi gambar baru

Intinya, AI Whisk ini dapat digunakan untuk menggabungkan beberapa gambar menjadi sebuah gambar baru sesuai keinginan pengguna.

Untuk menggunakan Whisk, Google menyediakan tiga kotak input berdasarkan jenisnya.

Kotak pertama untuk subyek gambar, kotak kedua untuk scene atau background gambar, dan kotak ketiga untuk memasukan gambar yang akan dijadikan sebagai inspirasi gaya (style) bagi gambar baru yang bakal dihasilkan Whisk. 

Selain itu, pengguna juga bisa menambahkan rincian lainnya bila diinginkan. Misalnya mengubah warna, pola atau elemen gaya lainnya. Ilustrasi pembuatan gambar lewat Whisk bisa dilihat pada gambar berikut atau video di bawah ini.

Menurut penjelasan pihak Google, Whisk sebenarnya masih mengandalkan perintah teks.

Sebab, perintah berbasis gambar yang diinput pengguna, dianalisis oleh AI Gemini milik Google, sehingga menghasilkan perintah teks yang rinci. Teks tersebut menjelaskan karakteristik utama dari perintah gambar tadi.

Contoh gambar yang dihasilkan oleh WhiskGoogle Contoh gambar yang dihasilkan oleh Whisk

 

Teks itu selanjutnya diproses oleh Imagen 3, yaitu model AI untuk membuat gambar dari Google, hingga akhirnya menghasilkan gambar baru sesuai perintah.

Perlu dicatat bahwa Whisk hanya mengekstrak karakteristik utama dari gambar yang dijadikan perintah. Karena itu, gambar baru yang dihasilkan, kemungkinan berbeda atau tidak sesuai dengan harapan pengguna.

"Misalnya subyek yang dihasilkan mungkin memiliki tinggi, bobot, gaya rambut atau warna kulit yang berbeda," ujar Iljic.

Baca juga: Google Umumkan Gemini 2.0 Flash, AI Lebih Pintar, Cepat, dan Bisa Dialog Lebih Baik

Oleh karena itu, pengguna bisa menyunting perintah kapan saja hingga menghasilkan gambar yang diinginkan.

Selain itu, hasil gambar baru dari Whisk juga hanya menggunakan beberapa subyek utama, bukan mereplikasinya secara persis seperti gambar perintah.

Adapun Whisk baru tersedia di Amerika Serikat saja. Pengguna di AS bisa mengakses tautan labs.google/whisk untuk menjajal kebolehan Whisk secara gratis.

Gambar baru yang dihasilkan Whisk juga bisa diunduh dan dibagikan ke berbagai platform digital seperti media sosial, sebagaimana dihimpun KompasTekno dari Android Authority, Selasa (17/12/2024).

Terkini Lainnya

Tautan Sahabat