ChatGPT Akhirnya Punya Generator Gambar Sendiri, Pakai GPT-4o

Lihat Foto

- Chatbot populer bikinan OpenAI, ChatGPT akhirnya kini bisa digunakan untuk menghasilkan gambar secara langsung (native).

Ini dimungkinkan karena model AI GPT-4o dibekali peningkatan dalam kemampuan membuat gambar yang diklaim lebih akurat dan realistis.

Sebelumnya, pembuatan gambar di ChatGPT mengandalkan bantuan dari model AI teks-ke-gambar Dall-E yang juga dibikin oleh OpenAI.

Menurut laman resmi OpenAI, ChatGPT-4o akan menjadi alat default untuk pembuatan gambar di ChatGPT.

Model AI dengan kemampuan multimodalitas (input teks, gambar, audio, video) ini memungkinkan pengguna menghasilkan visual berdasarkan prompt, percakapan, atau bahkan gambar yang diunggah.

OpenAI juga menyebut adanya peningkatan signifikan dalam proses render teks serta pemahaman konteks dalam gambar yang dihasilkan. Hal ini memungkinkan GPT-4o digunakan untuk pembuatan gambar yang lebih akurat dan realistis.

OpenAI Contoh hasil gambar yang dihasilkan GPT-4o.

Alat-alat baru ini ditujukan untuk penggunaan pribadi dan profesional. Dengan demikian, OpenAI memberikan sejumlah contoh tentang kegunaan jenis pembuatan gambar ini.

Contoh-contoh tersebut termasuk pembuatan infografis, grafik promosi media sosial, dan gambar dengan banyak teks, seperti yang terlihat di bawah ini.

Kemampuan pembuatan gambar GPT-4o ini ditujukan untuk penggunaan pribadi dan profesional. OpenAI mencontohkan, GOT-4o bisa membuat infografis, grafik promosi media sosial, hingga gambar ilustrasi/foto dengan teks yang jelas.

OpenAI Contoh hasil gambar yang dibuat oleh GPT-4o.

OpenAI menyebut image generator GPT-4o menawarkan "kemampuan yang kuat untuk fotorealisme, termasuk akurasi cahaya, bayangan, dan tekstur".

Pembuatan gambar GPT-4o disebut juga memiliki detail yang baik dengan mampu menangani 10-20 obyek yang berbeda dalam satu visual. Menurut OpenAI, kemampuan PT-4o ini lebih baik dari model AI lain yang kesulitan menangani dengan sekitar 5-8 obyek berbeda.

OpenAI Pembuatan gambar GPT-4o disebut juga memiliki detail yang baik dengan mampu menangani 10-20 obyek yang berbeda dalam satu visual.

Semua gambar yang dihasilkan dilengkapi dengan metadata C2PA? (Coalition for Content Provenance and Authenticity), yang akan mengidentifikasi gambar sebagai gambar yang berasal dari GPT?4o.

Kebijakan ini penting untuk memastikan transparansi dan membantu mengidentifikasi gambar AI agar tidak disalahgunakan atau diklaim sebagai buatan manusia.

OpenAI juga nengakui bahwa model AI-nya ini tidak sempurna. Misalnya, GPT?4o terkadang dapat memotong gambar yang lebih panjang, seperti poster, terlalu pendek, terutama di dekat bagian bawah. Seperti model teks OpenAI yang lain, pembuatan gambar juga dapat membuat informasi yang keliru, terutama dalam perintah konteks rendah.

OpenAI OpenAI juga nengakui bahwa model AI-nya ini tidak sempurna. Misalnya, GPT?4o terkadang dapat memotong gambar yang lebih panjang, seperti poster, terlalu pendek, terutama di dekat bagian bawah. Seperti model teks OpenAI yang lain, pembuatan gambar juga dapat membuat informasi yang keliru, terutama dalam perintah konteks rendah.

Terakhir, OpenAI juga nengakui bahwa model AI-nya ini tidak sempurna. Ada beberapa keterbatasan pembuatan gambar GPT-4o yang diungkap oleh OpenAI, sebagai berikut:

GPT-4o terkadang dapat memotong gambar yang lebih panjang, seperti poster, terlalu pendek, terutama di dekat bagian bawah.
Seperti model teks OpenAI yang lain, pembuatan gambar GPT-4o juga dapat mengandung informasi keliru (halusinasi), terutama dalam perintah dengan konteks minim.
GPT-4o terkadang kesulitan menyajikan bahasa non-Latin. Karakter hurufnya bisa tidak akurat, terutama dengan kompleksitas yang lebih tinggi.
Permintaan untuk mengedit bagian tertentu dari pembuatan gambar, seperti kesalahan ketik tidak selalu efektif dan juga dapat mengubah bagian lain dari gambar dengan cara yang tidak diminta atau menimbulkan lebih banyak kesalahan.
GPT-4o kesulitan saat diminta untuk menyajikan informasi detail pada visual dengan ukuran yang sangat kecil.

Dengan keterbatasan ini, OpenAI mengaku akan mengatasi hal ini lewat peningkatan model setelah peluncuran awal, sebagaimana dihimpun KompasTekno dari laman resmi OpenAI, Kamis (27/3/2025).

Update Kamis (27/3/2025) pukul 09.15

OpenAI saat ini menunda perilisan fitur pembuat gambar menggunakan AI GPT-4o kepada pengguna gratis. Menurut CEO OpenAI Sam Altman, ini dikarenakan tingginya antusiasme pengguna.

"Gambar di ChatGPT jauh lebih populer dari yang kami harapkan (dan kami memiliki harapan yang cukup tinggi). Peluncuran ke tingkatan gratis sayangnya akan tertunda untuk sementara waktu," tulis Altman melalui akun X Twitter resminya.

cpu-data.info

ChatGPT Akhirnya Punya Generator Gambar Sendiri, Pakai GPT-4o

Terkini Lainnya

Tautan Sahabat