Apple Temukan Kelemahan Kecerdasan Buatan

Lihat Foto

- Tim peneliti dari perusahaan teknologi Apple mengeklaim telah menemukan kelemahan kecerdasan buatan (artificial intelligence/AI).

Penelitian yang dipimpin oleh insinyur riset pembelajaran mesin (machine learning/ML), Iman Mirzadeh, menemukan bahwa perubahan kecil terhadap susunan pertanyaan matematika yang diberikan kepada model bahasa besar (large language model/LLM), dapat menyebabkan perbedaan besar dalam kinerja model itu.

Akurasi jawaban LLM menurun sekitar 65 persen, sehingga LLM tersebut kurang bisa diandalkan dalam skenario yang membutuhkan logika yang konsisten.

Untuk diketahui, LLM adalah program atau model yang dapat mengenali dan menghasilkan teks, serta memproses bahasa. Hal ini membuatnya dapat berinteraksi dengan pengguna memakai bahasa yang natural.

Model bahasa besar dilatih menggunakan kumpulan data (dataset) yang sangat besar. Oleh karena itu, LLM disebut sebagai model bahasa yang large alias besar.

LLM ini mendukung program AI generatif (generative AI/AI yang bisa menghasilkan teks, video, audio), seperti ChatGPT dan Microsoft Copilot.

Pertanyaan soal buah kiwi

Studi tim peneliti dari Apple menguji berbagai model bahasa besar unggulan, seperti milik OpenAI dan Meta, untuk melihat bagaimana model tersebut dapat menangani tugas penalaran matematika.

Model bahasa besar tersebut dites menggunakan alat pengujian (benchmark) baru bernama GSM-Symbolic.

Dalam beberapa pengujian, peneliti mendemonstrasikan bahwa menambahkan informasi yang tidak penting ke pertanyaan matematika, justru bisa menghasilkan jawaban yang berbeda di berbagai model bahasa besar.

Padahal, detail ini seharusnya tidak berpengaruh terhadap hasil perhitungan matematika yang dilakukan LLM.

Sebagai contoh, peneliti memberikan pertanyaan matematika sederhana terkait berapa jumlah buah kiwi yang dikumpulkan seseorang dalam beberapa hari.

Ketika peneliti menambahkan keterangan, seperti ukuran buah kiwi itu, model LLM seperti OpenAI o1 dan Llama milik Meta jadi salah menghitung total jumlah buah kiwi.

Baik model LLM sumber terbuka (open-source) maupun LLM yang dilisensi (proprietary) sama-sama mengalami penurunan akurasi.

Kerapuhan dalam penalaran ini mendorong para peneliti, untuk menyimpulkan bahwa LLM yang diuji tidak menggunakan logika nyata untuk memecahkan masalah, tetapi sebaliknya mengandalkan pengenalan pola canggih yang dipelajari selama pelatihan.

cpu-data.info

Apple Temukan Kelemahan Kecerdasan Buatan

Terkini Lainnya

Tautan Sahabat