cpu-data.info

Alibaba Rilis Model AI yang Bernalar, Pesaing OpenAI

Ilustrasi Alibaba
Lihat Foto

- Perusahaan teknologi asal China, Alibaba, meluncurkan model bahasa besar (Large Language Model) baru bernama QwQ-32B-Preview. Model kecerdasan buatan (artificial intelligence/AI) ini dikembangkan oleh tim AI Alibaba yang disebut Qwen.

QwQ-32B-Preview fokus pada penalaran (reasoning) logis dan kemampuan pemecahan masalah. Menurut Qwen, model AI ini memiliki 32,5 miliar parameter dan mampu memproses hingga 32.000 kata.

Parameter dalam model AI adalah variabel internal yang dipelajari model selama pelatihan. Model dengan parameter lebih tinggi, biasanya menunjukkan bahwa model akan lebih akurat dan dapat menangani tugas yang lebih kompleks, dibanding model dengan parameter lebih sedikit.

Berdasarkan beberapa pengujian, QwQ-32B-Preview memiliki kinerja yang lebih baik dibanding model AI sejenis seperti o1-preview dan o1-mini dari OpenAI. Kedua model AI ini juga merupakan model AI dengan kemampuan bernalar.

Baca juga: Nvidia Rilis GPU H200 NVL, Gabungan Empat Chip AI H200 dalam Satu Modul

Menurut pengujian Alibaba, QwQ-32B-Preview mengalahkan o1-preview pada pengujian AIME dan MATH.

AIME adalah alat untuk mengevaluasi kinerja model AI, dengan menggunakan model AI lain, sementara MATH adalah kumpulan soal. Perbandingan pengujiannya bisa dilihat pada gambar berikut.

Perbandingan benchmark model AI Alibaba QwQ-32B-Preview dengan model AI lainQwen Perbandingan benchmark model AI Alibaba QwQ-32B-Preview dengan model AI lain

QwQ-32B-Preview diklaim mampu memecahkan teka-teki logika dan menjawab pertanyaan matematika yang cukup rumit. Meski begitu, model AI ini masih belum sempurna. 

Menurut Alibaba, model AI itu bisa tiba-tiba beralih bahasa, terkadang macet, dan kinerjanya buruk ketika menjalankan perintah yang perlu penalaran akal sehat.

Berbeda dari model AI pada umumnya, QwQ-32B-Preview mampu memeriksa fakta secara mandiri, sehingga meminimalisasi kekeliruan yang biasanya dihasilkan model AI. 

Praktik itu sama seperti o1-preview dan o1-mini, di mana QwQ-32B-Preview merencanakan jawaban terlebih dahulu, kemudian memeriksa ulang hasilnya. Hal ini memang menambah waktu pemrosesan data, tetapi meningkatkan akurasinya.

"Sebelum memutuskan jawaban, dia akan mencari tahu sendiri, mempertanyakan asumsinya, menjelajah berbagai jalur pemikiran dan mencari fakta yang mendalam," kata Qwen tentang kinerja QwQ-32B-Preview dikutip KompasTekno dari The Decoder, Jumat (29/11/2024).

Soal ketersediaannya, QwQ-32B-Preview tersedia secara terbuka dan sudah dapat diunduh dari platform pengembangan AI, Hugging Face. Model AI ini tersedia dengan lisensi Apache 2.0 yang berarti bahwa model ini bisa diadopsi untuk aplikasi komersil.

Namun Alibaba baru merilis beberapa komponen saja dan dalam mode preview, sehingga pengembang belum dapat mengadopsinya secara menyeluruh. Adapun peluncuran versi stabilnya ditaksir pada akhir tahun ini.

Baca juga: AI Baru Buatan Induk ChatGPT Bisa Ambil Alih Komputer Pengguna

OpenAI rilis model AI o1

Induk ChatGPT, OpenAI resmi merilis "o1" pada Kamis (12/9/2024). o1 adalah model kecerdasan buatan pertama OpenAI dengan kemampuan bernalar (reasoning).

Bernalar adalah proses berpikir logis untuk menentukan kesimpulan dari informasi atau premis yang menjadi alasan dasar kesimpulan tersebut.

Terkini Lainnya

Tautan Sahabat