cpu-data.info

Kecerdasan ChatGPT Diuji, Unggul di Matematika hingga Esai

Ilustrasi chatbot ChatGPT
Lihat Foto

- ChatGPT menjadi chatbot berbasis kecerdasan buatan (Artificial Intelligence/AI) yang banyak digunakan oleh orang di seluruh dunia.

Pengguna aktif bulanan (monthly active users/MAUs) layanan chatbot bikinan OpenAI ini diklaim sudah tembus 100 juta orang per Januari 2023.

Salah satu yang menjadi daya tarik ChatGPT adalah kemampuan chatbot AI ini dalam menjawab pertanyaan pengguna secara luwes, tak seperti chatbot pada umumnya yang kaku seperti robot.

Secara umum, ChatGPT mampu menyelesaikan beragam tugas/perintah dan mendukung 95 bahasa. Tak heran bila ChatGPT akhirnya dimanfaatkan untuk mengerjakan pekerjaan rumah (PR), tugas, atau memudahkan pekerjaan lainnya.

Yang menjadi pertanyaan, sebenarnya seberapa pintar ChatGPT ini?

Baca juga: Bill Gates Prediksi ChatGPT Bisa Jadi Guru

Menguji kecerdasan ChatGPT

ChatGPT dari OpenAI./Wahyunanda Kusuma ChatGPT dari OpenAI.
ChatGPT sendiri merupakan chatbot AI yang dibuat berdasarkan model bahasa (language model) GPT-3.5.

OpenAI juga sudah memperkenalkan program AI language model terbarunya, yaitu GPT-4 yang disebut lebih pintar ketimbang ChatGPT.

Untuk melihat "kepintaran" keduanya, OpenAI menguji kemampuan ChatGPT (GPT-3.5) dan GPT-4 dengan ujian profesional dan akademik yang biasa digunakan di Amerika Serikat.

Pengujian tersebut termasuk ujian Scholastic Aptitude Test (SAT), ujian bar, Graduate Record Exam (GRE), hingga berbagai ujian Advanced Placement (AP).

Total ada 16 kategori ujian yang diuji kepada ChatGPT. Hasil pengujiannya pun di visualisasikan oleh Visual Capitalist.

Unggul di matematika, biologi, hingga penulisan essai

Dari infografik yang dipublikasi Visual Capitalist, ChatGPT terlihat unggul dalam enam kategori ujian, yaitu Verbal (GRE), Evidence-based reading & writing (SAT), Matematika (SAT), Biologi (AP), Psikologi (AP), Penulisan/essai (GRE).

Baca juga: Wali Kota di Australia Ancam Gugat ChatGPT gara-gara Skandal Suap Pejabat Indonesia

Dalam keenam kategori tersebut, ChatGPT mendapatkan skor di atas 50 persentil. Dari 6 kategori tersebut, ChatGPT paling unggul di ujian evidence-based reading & writing (SAT) dengan skor 87 persentil.

Persentil ini menjelaskan peringkat skor peserta ujian dibandingkan dengan yang lain.

Misalnya, bila ChatGPT mendapatkan 87 persentil di kategori evidence-based reading & writing (SAT), maka artinya sebanyak 87 persen peserta ujian lainnya mendapatkan skor lebih rendah dibandingkan ChatGPT. Lalu ada 13 persen peserta ujian yang memiliki skor lebih tinggi dibandingkan ChatGPT.

Persentil tersebut didasarkan pada distribusi skor terbaru yang tersedia untuk peserta ujian dari setiap jenis ujian. Dalam kasus ini, hasil ujian ChatGPT (GPT-3.5) dibandingkan dengan milik siswa/mahasiswa AS yang baru-baru ini mengikuti ujian yang sama.

Terkini Lainnya

Tautan Sahabat