cpu-data.info

Google, Meta, dan Microsoft Kembangkan "SLM", Model Bahasa untuk Program AI Lebih Murah

ilustrasi AI atau kecerdasan buatan
Lihat Foto

- Setelah model bahasa besar (large language model/LLM), kini deretan perusahaan teknologi berbondong-bondong membangun model bahasa kecilnya (small language model/SLM) versinya masing-masing.

Perusahaan teknologi raksasa seperti Google, Meta, Microsoft, hingga Apple mulai membuat SLM demi membuat program AI menjadi lebih murah.

LLM dan SLM merupakan dua model bahasa yang menjadi aspek penting dan mendasar untuk menjalankan program/tools kecerdasan buatan (artificial intelligence/AI).

Perbedaannya, LLM memiliki parameter yang besar dan sumber daya yang besar, sehingga bisa mengerjakan tugas yang lebih kompleks. Sementara, SLM memiliki parameter yang lebih sedikit dengan sumber daya terbatas, sehingga tugasnya pun jauh lebih sederhana dan spesifik.

Baca juga: Apa Itu LLM? Mengenal Program di Balik Kepintaran AI

Contoh LLM yang umum dikenal adalah "GPT" buatan OpenAI yang digunakan di chatbot AI ChatGPT dan "Gemini" buatan Google yang ada di chatbot Gemini (dulu Bard).

Ilustrasi ChatGPTForbes Ilustrasi ChatGPT
LLM dilatih menggunakan kumpulan data (dataset) yang sangat besar, bisa mencapai ratusan miliar bahkan triliunan parameter. Itulah sebabnya LLM disebut sebagai model bahasa yang “large” atau "besar".

Secara teknis, semakin banyak jumlah parameternya, semakin baik dan pintar kinerja perangkat lunak AI, serta semakin kompleks tugas yang bisa diselesaikannya.

Model terbaru OpenAI GPT-4o dan Google Gemini 1.5 Pro, misalnya, diperkirakan memiliki lebih dari 1 triliun parameter. Meta disebut juga sedang melatih model AI Llama versi 400 miliar parameter.

Namun, salah satu tantangannya, model bahasa besar seperti GPT dan Gemini ini membutuhkan daya komputasi dan memori yang juga sangat besar, sehingga bujet yang dibutuhkan juga besar.

Hal ini pun disebut membuat perusahaan teknologi kesulitan meyakinkan beberapa pelanggan perusahaan untuk mau membayar sejumlah besar uang demi mengadopsi LLM ini.

Menurut data yang dibagikan Financial Times, model AI tercanggih OpenAI, GPT 4-o memakan biaya 5 dollar AS (sekitar Rp 79.800) per 1 juta token (setara dengan sekitar 1 juta kata yang dimasukkan atau dihasilkan). Sementara, biaya Gemini 1.5 Pro setara 7 dollar AS (sekitar Rp 111.800) per 1 juta token.

Baca juga: OpenAI Rilis Model AI GPT-4o Gratis, Lebih Cepat dan Humanis

Biaya masing-masing model AI untuk setiap 1 juta token (setara dengan sekitar 1 juta kata yang dimasukkan atau dihasilkan).Financial Times Biaya masing-masing model AI untuk setiap 1 juta token (setara dengan sekitar 1 juta kata yang dimasukkan atau dihasilkan).
Nah, perusahaan seperti Meta dan Google memperkenalkan model bahasa kecil dengan hanya menggunakan beberapa miliar parameter sebagai alternatif yang lebih murah, hemat energi, dan dapat disesuaikan dengan kebutuhan.

SLM juga memerlukan lebih sedikit daya untuk melatih dan menjalankannya, yang juga dapat melindungi data sensitif.

Misalnya, Google memperkenalkan dua SLM bersumber terbuka (open-source), yakni Gemma 2B dan Gemma 7B pada Februari lalu. SLM ini memiliki 2-7 miliar parameter. 

Pada akhir April, Micorosoft juga mengumumkan model Phi-3 yang memiliki 3,8 miliar hingga 7 miliar parameter.

Terkini Lainnya

Tautan Sahabat