OpenAI Pakai Video YouTube untuk Latih GPT-4, Google Beri Peringatan

- Perusahaan-perusahaan kecerdasan buatan dikabarkan mulai kehabisan bahan untuk melatih LLM (Large Language Model) mereka, termasuk OpenAI dan Meta.
OpenAI, perusahaan di balik ChatGPT kabarnya sedang kesulitan mengumpulkan data pelatihan untuk model LLM generasi terbaru, GPT-4.
Untuk mengatasinya, perusahaan yang dipimpin oleh Sam Altman itu memakai aneka video dari YouTube.
Ada sekitar satu juta jam video YouTube yang dipakai OpenAI untuk melatih GPT-4. Presiden OpenAI, Greg Brockman bahkan ikut terjun dalam pengumpulan video.
Video itu kemudian ditranskrip menggunakan alat transkrip audio, Whisper.
Menurut juru bicara OpenAI, Lindsay Held, pihaknya memang menyusun kumpulan data "unik" untuk setiap model agar lebih paham tentang dunia dan mempertahankan daya saingnya.
Baca juga: OpenAI Mau AI Sora Dipakai Bikin Film Hollywood, tapi Langsung Ditentang
Held menambahkan bahwa OpenAI memakai berbagai sumber data termasuk data yang tersedia untuk umum serta data non-publik dari mitra. OpenAI kini juga diklaim sedang mempertimbangkan untuk menghasilkan data pelatihan sendiri.
Meski begitu, Held tidak menyebut dari platform mana saja data diambil untuk melatih modelnya.
Outlet media The New York Times dikutip KompasTekno Minggu (14/4/2024), menyebutkan bahwa OpenAI sudah kehabisan persediaan data pelatihan pada tahun 2021.
Kemudian perusahaan kecerdasan buatan (artificial intelligence/AI) ini mendiskusikan praktik transkripsi video YouTube, podcast, hingga audiobook.
Pada tahun yang sama, OpenAI melatih modelnya dengan berbagai data termasuk kode komputer dari Github hingga konten tugas sekolah di Quizlet.
Baca juga: Potensi dan Ancaman di Balik Kloning Suara AI
Peringatan Google
Pihak Google dihubungi The Verge, menyatakan bahwa perusahaannya sudah melihat laporan soal OpenAI yang mentranskrip video YouTube, meski belum dikonfirmasi langsung oleh OpenAI. Google lantas memperingatkan larangan unduh konten tanpa izin.
"file.robots.txt dan Ketentuan Layanan kami melarang pengunduhan konten YouTube tanpa izin," ujar juru bicara Google, Matt Bryant.
Bryant juga menyatakan pihaknya akan mengambil tindakan hukum untuk mencegah praktik penggunaan YouTube secara ilegal seperti ini, bila sudah terbukti.
Google, menurut sumber dalam, sebenarnya juga sama seperti OpenAI, mengumpulkan data dengan cara transkrip video YouTube. Namun Bryant berdalih pihaknya memakai beberapa konten YouTube sesuai perjanjian antara YouTube dengan pembuat konten.
Terkini Lainnya
- Unik, Smartphone Ini Didesain Khusus untuk Hewan Peliharaan
- 11 HP Baru Harga Rp 1 Juta - Rp 3 Jutaan untuk Lebaran 2025
- SurpriseDeal Telkomsel hingga 3 April, Kuota Internet 80 GB Cuma RP 100.000
- Bocoran Kamera Samsung Galaxy S26 Ultra, Bawa Fitur Lama dan Telefoto Lebih Panjang
- 70 Link Download Twibbon Idul Fitri 1446 H Keren untuk Dibagikan ke Medsos
- 150 Ucapan Idul Fitri 2025 dan Gambar Selamat Lebaran 1446 H buat Dikirim ke Medsos
- 150 Twibbon Idul Fitri 2025 dan Poster Selamat Lebaran 1446 H, Simpel dan Keren
- Pendiri Studio Ghibli Pernah Kritik Keras soal AI
- 5 Game Seru untuk "Mabar" dengan Keluarga dan Saudara saat Lebaran
- 50 Link Download Poster Idul Fitri 2025 Keren untuk Merayakan Lebaran
- ZTE Nubia Neo 3 5G dan Neo 3 GT 5G Resmi Masuk Asia Tenggara, Ini Harganya
- Fitur Baru Google Maps dan Search Bantu Rencanakan Liburan
- Apple Watch Berikutnya Bakal Punya Kamera AI?
- Link dan Cara Cek Curah Hujan Selama Mudik Lebaran 2025
- Keyboard Unik di Dunia Punya 1.020 Tombol, Tidak Pakai Simbol Huruf
- Microsoft Tidak Akan Rilis Update jika Ada Aplikasi Ini di Windows 11
- Bos Apple dan Microsoft ke Indonesia Bulan Ini, Ini Agendanya
- Bocoran Spesifikasi Galaxy Z Fold FE dan Z Flip FE, HP Lipat “Murah” Samsung
- Fitur AI "Circle to Search" Kini Bisa Terjemahkan Kalimat Instan
- Pertama Kalinya, Apple Izinkan Aplikasi "Emulator" Game Lawas Beredar di App Store