cpu-data.info

Microsoft Rilis Phi-3 Mini, Model Bahasa AI Kecil untuk Smartphone

Ilustrasi Microsoft
Lihat Foto

- Microsoft memperkenalkan model kecerdasan buatan (artificial intelligence/AI) barunya bernama Phi-3 Mini, pada Selasa (23/4/2024).

Phi-3 Mini merupakan model bahasa kecil (small language model/SLM) pertama dari tiga SLM yang akan dirilis Microsoft dalam beberapa bulan mendatang. Model bahasa AI ini dirancang untuk perangkat kecil seperti smartphone.

Seperti namanya, model bahasa kecil Phi-3 Mini ini dilatih menggunakan parameter dengan jumlah yang lebih sedikit, yaitu sekitar 3,8 miliar parameter.

Sebagai perbandingan, model bahasa besar (large language model/LLM) seperti GPT-4 dilatih oleh sekitar 1,7 triliun parameter. Parameter itu sendiri adalah jumlah instruksi kompleks yang bisa dipahami model AI.

Perbedaan ini bisa dibilang wajar karena SLM dan LLM memiliki tujuan yang berbeda. SLM dirancang untuk menjalankan perintah yang lebih sederhana di smartphone dan laptop secara lokal (on-device), sehingga memungkinkan perusahaan yang lebih kecil untuk mengadopsi AI.

Di sisi lain, LLM didesain untuk menyimulasikan kecerdasan manusia dalam level yang luas, sehingga membutuhkan daya komputasi yang lebih besar. Alhasil, LLM lebih mahal digunakan daripada SLM.

Baca juga: Tool AI Baru Microsoft Bisa Bikin Video Deepfake Hanya dari Foto

"Phi-3 tidak hanya sedikit lebih murah, tetapi jauh lebih murah. Kita berbicara tentang perbedaan biaya 10 kali lebih murah dibandingkan model di luar sana dengan kemampuan serupa," kata Sébastien Bubeck selaku Vice President of GenAI Research di Microsoft.

Menurut Microsoft, Phi-3 dengan mudah mengungguli performa Phi-2 yang dirilis Desember 2023 lalu. Phi-3 juga diklaim bisa memberikan respons serupa seperti model yang 10 kali lebih besar.

Eric Boyd, Corporate Vice President Microsoft Azure AI Platform, mengatakan bahwa Phi-3 Mini sama mumpuninya dengan LLM seperti GPT 3.5, tetapi dengan bentuk yang lebih kecil.

Dua model SLM lainnya yang akan dirilis dalam beberapa waktu ke depan adalah Phi-3 Small dan Phi-3 Medium. Phi-3 Small bakal dilatih dengan 7 miliar parameter, dan Phi-3 Medium dilatih 14 miliar parameter.

Dilatih layaknya menggunakan buku cerita anak

Boyd juga mengatakan, model bahasa Phi-3 dilatih menggunakan sebuah kurikulum. Mereka terinspirasi dari anak-anak yang umumnya belajar dari buku cerita, buku dengan kata-kata yang lebih sederhana, dan struktur kalimat yang membahas topik lebih besar.

"Tidak ada banyak buku anak-anak di luar sana, jadi kami mengambil daftar lebih dari 3.000 kata dan meminta LLM membuat buku anak-anak untuk mengajarkan Phi," ungkap Boyd.

Ia menambahkan bahwa Phi-3 hanya membangun apa yang dipelajari oleh pendahulunya. Phi-1 fokus pada pengodean, sedangkan Phi-2 mulai belajar untuk bernalar. Nah, Phi-3 lebih mumpuni dalam pengodean dan penalaran.

Baca juga: Microsoft dan OpenAI Dikabarkan Bikin Stargate, Superkomputer AI Terbesar

Phi-3 masih belum bisa mengalahkan kemampuan GPT-4 dan LLM. Sebab, LLM dilatih menggunakan keseluruhan internet, berbeda dari SLM yang lebih terbatas.

Meskipun begitu, berbagai perusahaan yang lebih kecil lebih memilih model SLM seperti Phi-3, mengingat kumpulan data internal mereka lebih kecil dan SLM cenderung lebih murah.

Phi-3 Mini sudah tersedia secara gratis di platform cloud Azure, platform model pembelajaran mesin (machine learning) Hugging Face, dan kerangka kerja untuk menjalankan model AI pada mesin lokal, Ollama.

SLM ini juga akan tersedia di software Nvidia Inference Microservices (NIM), dan sudah dioptimalkan untuk unit pengolah grafis (GPU) Nvidia, sebagaimana dikutip KompasTekno dari Reuters, Rabu (24/4/2024).

Terkini Lainnya

Tautan Sahabat