Meta Rilis Model AI Llama Versi Ringan, Bisa Dipakai di Smartphone
- Meta merilis model bahasa besar (Large Language Model/LLM) Llama 3.2 1B dan 3B versi ringan atau "quantized" (terkuantisasi).
Llama 3.2 1B dan 3B sebelumnya sudah diumumkan dalam acara Meta Connect yang digelar September 2024 lalu. Model kecerdasan buatan (AI) ini merupakan LLM paling kecil di antara LLM bikinan Meta lainnya, karena ditujukan agar bisa berjalan di perangkat berdaya rendah seperti perangkat seluler macam smartphone.
Llama 3.2 1B dan 3B terkuantitasi yang rilis kali ini merupakan versi ringan dari dari LLM tersebut. Untuk diketahui, kuantisasi merupakan teknik yang bisa diterapkan untuk mengurangi ukuran model AI dengan memodifikasi bobot presisi (indikator seberapa bagus model memprediksi sesuatu) model.
Menurut Meta, Llama 3.2 1B dan 3B terkuantitasi, menggunakan memori yang lebih rendah saat menjalankan program dan inferensi yang cepat. Meski lebih rendah, akurasinya tetap sama seperti Llama 3.2 1B dan 3B biasa karena Meta menggunakan dua metode kuantisasi, yaitu QLoRA dan SpinQuant.
Baca juga: Meta Rilis Fitur Keamanan untuk Lindungi Remaja dari Pemerasan Seksual
Hasil pengujian internal yang dilakukan Meta menunjukkan bahwa ukuran Llama 3.2 1B dan 3B terkuantitasi, kurang lebih 56 persen lebih ringan dibanding model aslinya. Pemrosesan inferensinya (pengambilan kesimpulan) juga 2-4 kali lipat lebih cepat.
Induk Facebook itu juga menguji model AI terkuantisasi ini pada smartphone Android OnePlus 12, dan menemukan bahwa penggunaan sumber daya memori berkurang sebesar 41 persen. Padahal kinerjanya hampir setara dengan model AI versi asli.
Agar lebih optimal lagi di perangkat mobile, Meta mengembangkan model AI versi ringan ini bersama perusahaan semikonduktor Qualcomm serta MediaTek. Meta juga memakai kernel AI Kleidi guna memaksimalkan model AI versi ringannya di CPU mobile.
Dengan memungkinkan model Llama bisa berjalan di CPU mobile, pengembang nantinya dapat menciptakan pengalaman AI yang lebih unik disertai privasi yang lebih baik. Dan yang paling penting, semua prosesnya berlangsung di perangkat, dihimpun KompasTekno dari SiliconAngle, Sabtu (26/10/2024).
Llama 3.2 1B dan 3B terkuantitasi sudah tersedia dapat diunduh dari situs Llama serta Huging Face, atau bisa diakses melalui tautan berikut ini.
Jadi pesaing GPT-4o Mini
Model AI Llama 3.2 dirilis Meta dalam acara Meta Connect, Rabu (25/9/2024). Model AI ini ini hadir sebagai pesaing GPT-4o Mini milik OpenAI yang baru dirilis Juli lalu.
Menurut CEO Meta Mark Zuckerberg, model AI ini sejauh ini telah mencapai pertumbuhan 10 kali lipat sejak 2023, bahkan kini diklaim menyamai GPT-4o Mini dalam pengenalan gambar dan tugas pemahaman visual lainnya.
Baca juga: Meta Umumkan Movie Gen, AI untuk Bikin Video dan Audio dari Teks
Sementara itu, Llama 3.2 diklaim mengungguli model AI open-source milik Google (Gemma) dan Microsoft (Phi 3.5-mini) dalam bidang-bidang seperti mengikuti instruksi, meringkas, penggunaan alat, dan penulisan ulang perintah.
“Llama terus meningkat dengan cepat, Ini memungkinkan semakin banyak kemampuan,” kata Zuckerberg.
“Llama 3.2 adalah model multimodal sumber terbuka pertama kami. Model ini akan memungkinkan banyak aplikasi yang memerlukan pemahaman visual,” kata CEO Meta Mark Zuckerberg dalam pidato pembukaannya di acara Meta Connect, Rabu.
Seperti Llama 3.1, Llama 3.2 juga diposisikan sebagai model bahasa besar bersumber terbuka alias open-source. Jadi, pengembang bisa menggunakan model AI ini dengan bebas dan gratis.
Terkini Lainnya
- Bagaimana Cara Registrasi Kartu Telkomsel Baru?
- Arti Kata "Angst" Istilah Slang yang Sering Digunakan di Media Sosial
- Cara Menolak Otomatis Panggilan dari Nomor yang Disembunyikan di HP Android
- Cara Mengatasi Last Seen WhatsApp Tidak Berubah dengan Mudah dan Praktis
- Qualcomm Umumkan Chip Baru untuk Smart Home dan IoT
- Hati-hati, Hacker Gunakan File ZIP untuk Menyusup ke Windows
- Headphone Vs Earphone, Mana yang Lebih Aman Digunakan?
- Advan ForceOne Rilis di Indonesia, PC AIO dengan AMD Ryzen 5 6600H
- Dampak Memakai Headset Terlalu Sering dengan Volume Tinggi yang Penting Dihindari
- Lantai Data Center Microsoft Pakai Bahan Kayu, Ini Alasannya
- Steam Setop Dukungan Windows 7 dan 8, Gamer Diminta Upgrade ke OS Baru
- AI Baru Buatan Induk ChatGPT Bisa Ambil Alih Komputer Pengguna
- Spotify Mulai Gaji Kreator Video Podcast
- Berapa Lama WhatsApp Diblokir karena Spam? Ini Dia Penjelasannya
- Sejarah Silicon Valley, Tempat Bersarangnya Para Raksasa Teknologi
- Indonesia Pengguna TikTok Terbesar di Dunia, Kalahkan AS
- Game "Call of Duty: Black Ops 6" Resmi Meluncur di PC dan Konsol, Ini Harganya di Indonesia
- Samsung Rilis Exynos 1580, Chip Kelas Menengah dengan Peningkatan CPU dan GPU
- Qualcomm Terancam, HP Android Batal Pakai Snapdragon 8 Elite?
- Jadwal MPL ID S14 Hari Ini, RRQ dan Team Liquid Rebutan Tiket ke Grand Final