cpu-data.info

Facebook Rilis Llama 3.1, Model AI Gratis Sekelas GPT-4

ilustrasi model bahasa besar Meta Llama 3.1
Lihat Foto

- Meta (perusahaan induk Facebook, Instagram, WhatsApp) telah meluncurkan model bahasa besar (large language model/LLM) terbarunya, Llama 3.1 405B, Selasa (23/7/2024).

Llama 3.1 405B diklaim sebagai model bahasa besar gratis dan open-source pertama, yang memiliki performa setara model kecerdasan buatan (artificial intelligence/AI) kelas atas seperti GPT-4o dan GPT-4 milik OpenAI, Claude 3.5 Sonnet, serta Google Gemini 1.5 Pro.

Karena gratis, pengguna bisa mengunduh Llama 3.1 405B di komputernya kemudian menjalankannya tanpa pungutan biaya. Namun, tentunya pengguna membutuhkan komputer dengan spesifikasi yang mumpuni.

Baca juga: OpenAI Rilis GPT-4o Mini, Model AI Ringan, Pintar, dengan Harga Murah

Sementara itu, open-source memiliki arti bahwa pengguna bisa memodifikasi atau menyempurnakan model bahasa besar tersebut, berbeda dari model bisnis yang dimiliki perusahaan AI lainnya, seperti OpenAI, yang justru memonetisasi model bahasa besarnya.

Adapun kehadiran model bahasa besar Llama 3.1 405B diumumkan lewat blog resmi Meta.

"Kami merilis Meta Llama 3.1 405B secara publik, yang kami yakini merupakan model bahasa terbuka terbesar dan paling mumpuni di dunia," tulis Meta dalam blog resminya.

"Llama 3.1 405B adalah model (bahasa besar) pertama yang tersedia secara terbuka, yang menyaingi model AI teratas dalam hal kemampuan tercanggih seperti pengetahuan umum, kemampuan pengendalian, matematika, penggunaan alat, dan terjemahan multi-bahasa," sambung Meta.

Baca juga: Microsoft, Meta, Google, dan Amazon Berlomba Investasi AI pada 2024

Secara rinci, pengujian Meta menunjukkan bahwa Llama 3.1 405B mampu mengalahkan Nemotron 4 340B Instruct, GPT-4, GPT-4o, dan Claude 3.5 Sonnet dalam pengujian IFEval, GSM8K, ARC Challenge, Nexus, serta ZeroSCROLLS/QuALITY.

Hasil benchmark Llama 3.1 405B dibandingkan dengan model bahasa besar AI teratas lainnya.Meta Hasil benchmark Llama 3.1 405B dibandingkan dengan model bahasa besar AI teratas lainnya.
Hal ini dimungkinkan karena Llama 3.1 405B memiliki 405 miliar parameter, dan dilatih menggunakan lebih dari 15 triliun token data, dengan 16.000 unit pengolah grafis (GPU) Nvidia H100.

Perlu dicatat, hasil benchmark ini merupakan hasil evaluasi dari Meta. Dengan begitu, hasil ini tidak mempertimbangkan pengalaman subjektif dalam berinteraksi dengan model bahasa AI.

Yang jelas, Meta memastikan bahwa Llama 3.1 405B berguna untuk peringkasan teks panjang, agen percakapan multibahasa, dan asisten coding, serta untuk membuat data sintetis yang digunakan untuk melatih model bahasa AI pada masa depan.

Pembuatan data sintetis itu secara resmi didukung oleh lisensi Meta Llama 3.1 untuk pertama kalinya.

Meta turut bekerja sama dengan Amazon, Databricks, Nvidia, IBM, dan perusahaan lainnya untuk meluncurkan berbagai layanan, yang membantu developer atau perusahaan menyempurnakan dan melatih model AI mereka sendiri.

Selain Llama 3.1 405B, Meta juga meluncurkan peningkatan dari Llama 8B dan 70B. Kini, keduanya dilengkapi dukungan multibahasa dan panjang konteks (kapasitas memori LLM) yang diperluas sebanyak 128.000 token.

Model bahasa besar Llama 3.1 405B, 8B, dan 70B diunduh lewat situs resmi Meta. Llama 3.1 405B juga bisa dijajal di chatbot Meta AI, tetapi sejauh ini Indonesia belum kebagian Meta AI.

Terkini Lainnya

Tautan Sahabat