cpu-data.info

Meta Rilis 2 Model AI Llama 4 Baru: Maverick dan Scout

Ilustrasi perusahaan Meta
Lihat Foto

- Meta menambah dua anggota large language model (LLM/model bahasa besar) baru untuk keluarga Llama 4 series, yang diberi nama Llama 4 Scout dan Llama 4 Maverick pada Sabtu (5/4/2025).

“Hari ini, kami memperkenalkan Llama 4 Scout dan Llama 4 Maverick, model natif open-weight  yang mendapat dukungan memproses jumlah teks yang lebih besar dari model sebelumnya, dan pertama kali dikembangkan dengan arsitektur Mixture of Experts (MoE),” ungkap Meta dalam situs resminya.

Secara teknis, model natif open weight merujuk pada parameter dari “bobot” model LLM yang dapat diakses secara terbuka untuk umum. Sementara itu, MOE merupakan teknik menggunakan beberapa sub model khusus (experts) untuk menangani berbagai bagian input dari perintah teks.

Baca juga: Meta Rilis Model AI Llama Versi Ringan, Bisa Dipakai di Smartphone

Meta mengungkapkan bahwa seluruh model LLM terbarunya dilatih untuk memproses sejumlah teks, gambar, dan data video tanpa label, untuk memberikan pemahaman pada cakupan visual yang lebih luas.

Mengingat kedua model juga dibangun menggunakan arsitektur MOE, Meta mengklaim pemrosesan komputasional Maverick dan Scout lebih efisien dalam melakukan pelatihan ataupun menjawab pertanyaan.

Soal spesifikasinya, Scout dapat berjalan menggunakan satu GPU Nvidia H100 dan Maverick membutuhkan tenaga yang lebih besar, yakni satu sistem Nvidia H100 DGX atau model yang setara,

Model LLM Maverick juga terdiri dari 400 miliar parameter secara total. Akan tetapi, hanya terdapat 17 parameter aktif dan 128 experts, sedangkan Scout memiliki 109 parameter ttotal, 17 miliar parameter aktif, dan 16 ahli.

Baca juga: 5 Trik biar Meta AI Bisa Jadi Tambahan Penghasilan

Dalam konteks LLM, paramter aktif adalah variabel internal yang disesuaikan oleh model selama pelatihan guna meningkatkan kinerja dan kemampuan dalam menghasilkan teks. Konteks “ahli” dan “parameter” ini untuk menunjukkan submodel khusus dan variabel internal yang masing-masing digunakan untuk memproses dan menghasilkan teks.

Ilustrasi pengujian model LLM Llama 4, yakni Maverick dan ScoutMeta Ilustrasi pengujian model LLM Llama 4, yakni Maverick dan Scout

Maverick juga bisa diposisikan sebagai model LLM yang lebih unggul daripada Scout. Sebab, dari hasil pengujian internal, Maverick menjadi model yang cocok untuk dijadikan sebagai asisten virtual dan menjawab obrolan ringan. Dikarenakan model ini mampu menghasilkan penulisan kreatif yang diklaim lebih unttul dari GPT-40 milik Open AI dan Gemini 2.0 Google.

Maverick juga ditemukan lebih unggul dalam pemecahan masalah, penalaran, multibahasa, menjawab pertanyaan kompoleks dengan konteks panjang, pengkodean, hingga menjadi indikator dalam melihat gambar tertentu.

Adapun “saudaranya”, Scout memiliki keunggulan dalam pengerjaan tugas-tugas yang lebih ringan, seperti meringkas dokumen, penalaran berbasis kode besar. Scout juga memiliki “jendela” konteks yang terbilang besar, yakni 10 juta token.

Token di model LLM merujuk pada potongan teks mentah yang dapat membagi satu kalimat menjadi beberapa suku kata. Misalnya, fantastis, akan dipecah menjadi “fan”, “tas”, “tos”. Dalam bahasa Inggris sederhana, Scout dapat mengambil gambar hingga jutaan kata yang memungkinkannya merespons dan memproses dokumen panjang.

“Llama Scout adalah model terbaik di kelasnya yang dapat mengolah gambar, menyeleraskan petunjuk pengguna dengan konsep visual yang relevan, dan model respons yang dapat dijadikan rujukan dalam konteks visual,” ungkap Meta. 

Meta pun tengah mengembangkan model LLM lain yang diberi nama Behemoth. Hanya saja, model ini masih dalam tahap pengembangan dan diposisikan lebih unggul dari Maverick dan Scout. 

Behemoth hadir dengan 2 triliun parameter total, 288 miliar parameter aktif, dan 16 experts. Keunggulan ini mencatat Behemoth mampu lebih unggul daripada model AI kompetitornya, seperti GPT-4.5, Claude 3.7 Sonnet, dan Gemini 2.0 Pro.

Terkini Lainnya

Tautan Sahabat