Apple Temukan Kelemahan Kecerdasan Buatan

- Tim peneliti dari perusahaan teknologi Apple mengeklaim telah menemukan kelemahan kecerdasan buatan (artificial intelligence/AI).
Penelitian yang dipimpin oleh insinyur riset pembelajaran mesin (machine learning/ML), Iman Mirzadeh, menemukan bahwa perubahan kecil terhadap susunan pertanyaan matematika yang diberikan kepada model bahasa besar (large language model/LLM), dapat menyebabkan perbedaan besar dalam kinerja model itu.
Akurasi jawaban LLM menurun sekitar 65 persen, sehingga LLM tersebut kurang bisa diandalkan dalam skenario yang membutuhkan logika yang konsisten.
Untuk diketahui, LLM adalah program atau model yang dapat mengenali dan menghasilkan teks, serta memproses bahasa. Hal ini membuatnya dapat berinteraksi dengan pengguna memakai bahasa yang natural.
Model bahasa besar dilatih menggunakan kumpulan data (dataset) yang sangat besar. Oleh karena itu, LLM disebut sebagai model bahasa yang large alias besar.
LLM ini mendukung program AI generatif (generative AI/AI yang bisa menghasilkan teks, video, audio), seperti ChatGPT dan Microsoft Copilot.
Baca juga: Ramalan Sam ChatGPT Altman soal Masa Depan AI
Pertanyaan soal buah kiwi
Studi tim peneliti dari Apple menguji berbagai model bahasa besar unggulan, seperti milik OpenAI dan Meta, untuk melihat bagaimana model tersebut dapat menangani tugas penalaran matematika.
Model bahasa besar tersebut dites menggunakan alat pengujian (benchmark) baru bernama GSM-Symbolic.
Dalam beberapa pengujian, peneliti mendemonstrasikan bahwa menambahkan informasi yang tidak penting ke pertanyaan matematika, justru bisa menghasilkan jawaban yang berbeda di berbagai model bahasa besar.
Padahal, detail ini seharusnya tidak berpengaruh terhadap hasil perhitungan matematika yang dilakukan LLM.
Sebagai contoh, peneliti memberikan pertanyaan matematika sederhana terkait berapa jumlah buah kiwi yang dikumpulkan seseorang dalam beberapa hari.
Ketika peneliti menambahkan keterangan, seperti ukuran buah kiwi itu, model LLM seperti OpenAI o1 dan Llama milik Meta jadi salah menghitung total jumlah buah kiwi.
Baik model LLM sumber terbuka (open-source) maupun LLM yang dilisensi (proprietary) sama-sama mengalami penurunan akurasi.
Baca juga: OpenAI Rilis o1, AI yang Bisa Bernalar Mirip Manusia
Kerapuhan dalam penalaran ini mendorong para peneliti, untuk menyimpulkan bahwa LLM yang diuji tidak menggunakan logika nyata untuk memecahkan masalah, tetapi sebaliknya mengandalkan pengenalan pola canggih yang dipelajari selama pelatihan.
Terkini Lainnya
- Akun Non-aktif X/Twitter Akan Dijual mulai Rp 160 Juta
- ChatGPT Dituntut karena "Asbun", Tuding Pria Tak Bersalah Pembunuh
- Cara Hapus GetContact Permanen biar Identitas Kontak Tetap Aman
- Cara Melihat Garis Lintang dan Bujur di Google Maps dengan Mudah dan Praktis
- Apa Itu Grok AI dan Bagaimana Cara Menggunakannya?
- 7 Cara Menghapus Cache di HP untuk Berbagai Model, Mudah dan Praktis
- Samsung Rilis Vacuum Cleaner yang Bisa Tampilkan Notifikasi Telepon dan Chat
- 3 Cara Menggunakan Chatbot Grok AI di X dan Aplikasi HP dengan Mudah
- Poco M7 Pro 5G Resmi di Indonesia, Harga Rp 2,8 Juta
- Siap-siap, Harga iPhone Bakal Semakin Mahal gara-gara Tarif Trump
- Grok Jadi Aplikasi Terpisah, Bisa Diunduh di HP dan Desktop
- Meta Rilis 2 Model AI Llama 4 Baru: Maverick dan Scout
- Kisah Kejatuhan HP BlackBerry: Dibunuh oleh Layar Sentuh
- AI Google Tertipu oleh April Mop, Tak Bisa Bedakan Artikel Serius dan Guyonan
- Smartwatch Garmin Vivoactive 6 Meluncur, Pertama dengan Fitur Alarm Pintar
- Microsoft Perbarui Copilot Studio, Kini Bisa Lahirkan "Karyawan AI"
- Daftar 64 Chip Qualcomm yang Bikin HP Android Rentan Kena Hack
- Anak Magang di Induk Tiktok Sabotase AI, Ini Hukumannya
- Game "Age of Empires Mobile" Bisa Dimainkan Gratis di Android dan iOS, Ini Linknya
- Qualcomm Snapdragon 8 Elite Resmi, Chip 3 Nm Penerus Snapdragon 8 Gen 3