Alibaba Rilis Model AI yang Bernalar, Pesaing OpenAI
- Perusahaan teknologi asal China, Alibaba, meluncurkan model bahasa besar (Large Language Model) baru bernama QwQ-32B-Preview. Model kecerdasan buatan (artificial intelligence/AI) ini dikembangkan oleh tim AI Alibaba yang disebut Qwen.
QwQ-32B-Preview fokus pada penalaran (reasoning) logis dan kemampuan pemecahan masalah. Menurut Qwen, model AI ini memiliki 32,5 miliar parameter dan mampu memproses hingga 32.000 kata.
Parameter dalam model AI adalah variabel internal yang dipelajari model selama pelatihan. Model dengan parameter lebih tinggi, biasanya menunjukkan bahwa model akan lebih akurat dan dapat menangani tugas yang lebih kompleks, dibanding model dengan parameter lebih sedikit.
Berdasarkan beberapa pengujian, QwQ-32B-Preview memiliki kinerja yang lebih baik dibanding model AI sejenis seperti o1-preview dan o1-mini dari OpenAI. Kedua model AI ini juga merupakan model AI dengan kemampuan bernalar.
Baca juga: Nvidia Rilis GPU H200 NVL, Gabungan Empat Chip AI H200 dalam Satu Modul
Menurut pengujian Alibaba, QwQ-32B-Preview mengalahkan o1-preview pada pengujian AIME dan MATH.
AIME adalah alat untuk mengevaluasi kinerja model AI, dengan menggunakan model AI lain, sementara MATH adalah kumpulan soal. Perbandingan pengujiannya bisa dilihat pada gambar berikut.
QwQ-32B-Preview diklaim mampu memecahkan teka-teki logika dan menjawab pertanyaan matematika yang cukup rumit. Meski begitu, model AI ini masih belum sempurna.
Menurut Alibaba, model AI itu bisa tiba-tiba beralih bahasa, terkadang macet, dan kinerjanya buruk ketika menjalankan perintah yang perlu penalaran akal sehat.
Berbeda dari model AI pada umumnya, QwQ-32B-Preview mampu memeriksa fakta secara mandiri, sehingga meminimalisasi kekeliruan yang biasanya dihasilkan model AI.
Praktik itu sama seperti o1-preview dan o1-mini, di mana QwQ-32B-Preview merencanakan jawaban terlebih dahulu, kemudian memeriksa ulang hasilnya. Hal ini memang menambah waktu pemrosesan data, tetapi meningkatkan akurasinya.
"Sebelum memutuskan jawaban, dia akan mencari tahu sendiri, mempertanyakan asumsinya, menjelajah berbagai jalur pemikiran dan mencari fakta yang mendalam," kata Qwen tentang kinerja QwQ-32B-Preview dikutip KompasTekno dari The Decoder, Jumat (29/11/2024).
Soal ketersediaannya, QwQ-32B-Preview tersedia secara terbuka dan sudah dapat diunduh dari platform pengembangan AI, Hugging Face. Model AI ini tersedia dengan lisensi Apache 2.0 yang berarti bahwa model ini bisa diadopsi untuk aplikasi komersil.
Namun Alibaba baru merilis beberapa komponen saja dan dalam mode preview, sehingga pengembang belum dapat mengadopsinya secara menyeluruh. Adapun peluncuran versi stabilnya ditaksir pada akhir tahun ini.
Baca juga: AI Baru Buatan Induk ChatGPT Bisa Ambil Alih Komputer Pengguna
OpenAI rilis model AI o1
Induk ChatGPT, OpenAI resmi merilis "o1" pada Kamis (12/9/2024). o1 adalah model kecerdasan buatan pertama OpenAI dengan kemampuan bernalar (reasoning).
Bernalar adalah proses berpikir logis untuk menentukan kesimpulan dari informasi atau premis yang menjadi alasan dasar kesimpulan tersebut.
Terkini Lainnya
- Tanda-tanda Samsung Siapkan HP Gaming Lipat
- 10 Tips Bikin Baterai HP Xiaomi Tetap Awet
- Ikon "Typing" di WhatsApp Berubah Jadi Gelembung dan Titik Tiga
- Speaker Samsung Music Frame Resmi di Indonesia, Bisa Menyamar Jadi Bingkai Foto
- Apple Bukan Perusahaan Paling Inovatif, Kalah dari Nvidia dan Microsoft
- HP iQoo Neo 10 Pro dan Neo 10 Meluncur, Kembar tapi Beda Chipset
- Kenapa Banyak Pengguna iPhone Suka Pakai Selfie 0.5?
- IDC: Penjualan iPhone Seret walaupun Pasar Smartphone Naik
- TikTok Larang Pengguna Remaja di Eropa Pakai Filter Cantik, Ini Alasannya
- Sony Akhirnya Ungkap Angka Penjualan PS2 Sepanjang Masa
- Smartwatch Coros Pace Pro Rilis di Indonesia, Harga Rp 6 Jutaan
- 11 Tips Bikin Baterai HP Android Tetap Awet dan Tidak Sering Mengecas
- Bagaimana Cara Membuat Grafik di Excel? Ini Langkah-langkahnya
- 7 Tips Foto Selfie 0.5 yang Unik dan Estetik
- Cara agar Foto WhatsApp yang Terkirim Hanya Sekali Lihat
- Ransomware, Infrastruktur Kritis, dan Urgensi UU KKS (Bagian I)
- HP "Panjang Umur" Samsung Galaxy A16 4G Resmi di Indonesia, Ini Harganya
- Vivo S20 dan S20 Pro Resmi, HP Menengah RAM 16 GB dengan Baterai Jumbo
- Jadwal M6 Mobile Legends Ronde Kedua RRQ Hoshi dan Team Liquid ID
- Resmi, Australia Larang Remaja di Bawah 16 Tahun Main Media Sosial