Alibaba Rilis Model AI yang Bernalar, Pesaing OpenAI

- Perusahaan teknologi asal China, Alibaba, meluncurkan model bahasa besar (Large Language Model) baru bernama QwQ-32B-Preview. Model kecerdasan buatan (artificial intelligence/AI) ini dikembangkan oleh tim AI Alibaba yang disebut Qwen.
QwQ-32B-Preview fokus pada penalaran (reasoning) logis dan kemampuan pemecahan masalah. Menurut Qwen, model AI ini memiliki 32,5 miliar parameter dan mampu memproses hingga 32.000 kata.
Parameter dalam model AI adalah variabel internal yang dipelajari model selama pelatihan. Model dengan parameter lebih tinggi, biasanya menunjukkan bahwa model akan lebih akurat dan dapat menangani tugas yang lebih kompleks, dibanding model dengan parameter lebih sedikit.
Berdasarkan beberapa pengujian, QwQ-32B-Preview memiliki kinerja yang lebih baik dibanding model AI sejenis seperti o1-preview dan o1-mini dari OpenAI. Kedua model AI ini juga merupakan model AI dengan kemampuan bernalar.
Baca juga: Nvidia Rilis GPU H200 NVL, Gabungan Empat Chip AI H200 dalam Satu Modul
Menurut pengujian Alibaba, QwQ-32B-Preview mengalahkan o1-preview pada pengujian AIME dan MATH.
AIME adalah alat untuk mengevaluasi kinerja model AI, dengan menggunakan model AI lain, sementara MATH adalah kumpulan soal. Perbandingan pengujiannya bisa dilihat pada gambar berikut.

QwQ-32B-Preview diklaim mampu memecahkan teka-teki logika dan menjawab pertanyaan matematika yang cukup rumit. Meski begitu, model AI ini masih belum sempurna.
Menurut Alibaba, model AI itu bisa tiba-tiba beralih bahasa, terkadang macet, dan kinerjanya buruk ketika menjalankan perintah yang perlu penalaran akal sehat.
Berbeda dari model AI pada umumnya, QwQ-32B-Preview mampu memeriksa fakta secara mandiri, sehingga meminimalisasi kekeliruan yang biasanya dihasilkan model AI.
Praktik itu sama seperti o1-preview dan o1-mini, di mana QwQ-32B-Preview merencanakan jawaban terlebih dahulu, kemudian memeriksa ulang hasilnya. Hal ini memang menambah waktu pemrosesan data, tetapi meningkatkan akurasinya.
"Sebelum memutuskan jawaban, dia akan mencari tahu sendiri, mempertanyakan asumsinya, menjelajah berbagai jalur pemikiran dan mencari fakta yang mendalam," kata Qwen tentang kinerja QwQ-32B-Preview dikutip KompasTekno dari The Decoder, Jumat (29/11/2024).
Soal ketersediaannya, QwQ-32B-Preview tersedia secara terbuka dan sudah dapat diunduh dari platform pengembangan AI, Hugging Face. Model AI ini tersedia dengan lisensi Apache 2.0 yang berarti bahwa model ini bisa diadopsi untuk aplikasi komersil.
Namun Alibaba baru merilis beberapa komponen saja dan dalam mode preview, sehingga pengembang belum dapat mengadopsinya secara menyeluruh. Adapun peluncuran versi stabilnya ditaksir pada akhir tahun ini.
Baca juga: AI Baru Buatan Induk ChatGPT Bisa Ambil Alih Komputer Pengguna
OpenAI rilis model AI o1
Induk ChatGPT, OpenAI resmi merilis "o1" pada Kamis (12/9/2024). o1 adalah model kecerdasan buatan pertama OpenAI dengan kemampuan bernalar (reasoning).
Bernalar adalah proses berpikir logis untuk menentukan kesimpulan dari informasi atau premis yang menjadi alasan dasar kesimpulan tersebut.
Terkini Lainnya
- Menkomdigi Minta Platform Digital Perketat Perlindungan Anak dari Konten Berbahaya
- 8 Ciri-ciri Chat Penipuan WhatsApp, Jangan Terkecoh
- Harga Laptop Akan Naik, Bos Acer Ungkap Alasannya
- 25 Tablet dan HP Xiaomi yang Kebagian HyperOS dengan AI DeepSeek
- Mencoba MSI Claw 8 AI Plus, Konsol Gaming Windows 11 dengan Joystick RGB
- Cara Pakai WhatsApp Bisnis buat Promosi UMKM
- Cara Buat Kartu Ucapan Ramadan 2025 untuk Hampers lewat Canva
- Databricks Ekspansi ke Indonesia: Buka Potensi AI dan Pengelolaan Data
- GPU Nvidia RTX 5070 Ti Mulai Dijual di Indonesia, Ini Harganya
- Oppo Rilis Case dan Wallet Edisi Timnas Indonesia untuk Reno 13 F 5G
- 5 Aplikasi Al Quran untuk Mengaji Selama Puasa Ramadhan 2025
- Akamai Rilis Laporan "Defender Guide 2025" untuk Mitigasi Ancaman Siber
- Layanan Indosat HiFi Dikeluhkan Gangguan, Ada yang Sampai 9 Hari
- Cara Melihat Password WiFi di Laptop Windows 11 dengan Mudah dan Praktis
- Tabel Spesifikasi Nubia V70 Design di Indonesia, Harga Rp 1 Jutaan
- Ransomware, Infrastruktur Kritis, dan Urgensi UU KKS (Bagian I)
- HP "Panjang Umur" Samsung Galaxy A16 4G Resmi di Indonesia, Ini Harganya
- Vivo S20 dan S20 Pro Resmi, HP Menengah RAM 16 GB dengan Baterai Jumbo
- Jadwal M6 Mobile Legends Ronde Kedua RRQ Hoshi dan Team Liquid ID
- Resmi, Australia Larang Remaja di Bawah 16 Tahun Main Media Sosial