cpu-data.info

Meta Rilis LLama 3.2, Model AI Pesaing OpenAI GPT-4o Mini

Llama 3.2 juga hadir sebagai versi upgrade dari Llama 3.1 yang dirilis sekitar dua bulan lalu. Peningkatan terbesar yang dibawa Llama 3.2 adalah dukungan multimodal sehingga mengerti input gambar dan teks sekaligus.
Lihat Foto

- Meta (perusahaan induk Facebook, Instagram, WhatsApp) meluncurkan model bahasa besar (large language model, LLM) terbarunya, Llama 3.2 dalam acara Meta Connect, Rabu (25/9/2024).

Model AI ini ini hadir sebagai pesaing GPT-4o Mini milik OpenAI yang baru dirilis Juli lalu.

Menurut CEO Meta Mark Zuckerberg, model AI ini sejauh ini telah mencapai pertumbuhan 10 kali lipat sejak 2023, bahkan kini diklaim menyamai GPT-4o Mini dalam pengenalan gambar dan tugas pemahaman visual lainnya.

Sementara itu, Llama 3.2 diklaim mengungguli model AI open-source milik Google (Gemma) dan Microsoft (Phi 3.5-mini) dalam bidang-bidang seperti mengikuti instruksi, meringkas, penggunaan alat, dan penulisan ulang perintah..

“Llama terus meningkat dengan cepat, Ini memungkinkan semakin banyak kemampuan,” kata Zuckerberg.

Baca juga: OpenAI Rilis GPT-4o Mini, Model AI Ringan, Pintar, dengan Harga Murah

Model AI yang paham input gambar dan teks

Skenario penggunaan Llama 3.2 di aplikasi asisten Interior Design.Llama.com Skenario penggunaan Llama 3.2 di aplikasi asisten Interior Design.
Llama 3.2 juga hadir sebagai versi upgrade dari Llama 3.1 yang dirilis sekitar dua bulan lalu. Peningkatan terbesar yang dibawa Llama 3.2 adalah dukungan multimodal. Dengan ini, Llama 3.1 mampu memahami input gambar dan teks sekaligus.

Baca juga: Facebook Rilis Llama 3.1, Model AI Gratis Sekelas GPT-4

“Llama 3.2 adalah model multimodal sumber terbuka pertama kami. Model ini akan memungkinkan banyak aplikasi yang memerlukan pemahaman visual,” kata CEO Meta Mark Zuckerberg dalam pidato pembukaannya di acara Meta Connect, Rabu.

Meta tampaknya sedang berusaha mengejar ketertinggalannya di perlombaan AI global ini. Pasalnya, pengembang AI lainnya, termasuk OpenAI (induk ChatGPT) dan Google, telah meluncurkan model AI yang mendukung multimodal tahun lalu.

Seperti Llama 3.1, Llama 3.2 juga diposisikan sebagai model bahasa besar bersumber terbuka alias open-source. Jadi, pengembang bisa menggunakan model AI ini dengan bebas dan gratis.

Llama 3.2 mencakup model berukuran kecil dengan 11 miliar (11 Billion/11B) parameter dan versi sedang dengan 90 miliar parameter. Model dengan parameter lebih tinggi biasanya menunjukkan bahwa model akan lebih akurat dan dapat menangani tugas yang lebih kompleks.

Seperti pendahulunya, Llama 3.2 memiliki panjang konteks 128.000 token, yang berarti pengguna dapat memasukkan banyak teks (setara ratusan halaman buku teks).

Baca juga: Meta Pamer Orion, Kacamata AR Paling Ringkas dan Canggih

Hasil pengolahan gambar dan teks di aplikasi asisten interior design yang ditenagai Llama 3.2.Llama.com Hasil pengolahan gambar dan teks di aplikasi asisten interior design yang ditenagai Llama 3.2.
Di samping itu, dengan Llama 3.2, pengembang dimungkinkan untuk membuat aplikasi AI yang lebih canggih, seperti aplikasi realitas tertambah yang memberikan pemahaman video secara real-time, mesin pencari visual yang mengurutkan gambar berdasarkan konten, atau analisis dokumen yang meringkas potongan teks yang panjang untuk Anda.

Karena memahami gambar, Llama 3.2 dengan parameter 11B dan 90B memiliki kemampuan untuk memahami bagan dan grafik, memberi keterangan pada gambar, dan menentukan obyek dari deskripsi bahasa alami.

Misalnya, pengguna dapat bertanya pada bulan apa perusahaan mereka mengalami penjualan terbaik, dan model akan memberikan alasan berdasarkan grafik yang tersedia. Model dengan parameter yang lebih besar juga dapat mengekstrak detail dari gambar untuk membuat teks.

Llama 3.2 juga hadir dalam versi teks-saja yang lebih ringan (parameter 1B dan 3B). Model ini dapat membantu pengembang membangun aplikasi yang dipersonalisasi, seperti meringkas pesan terkini atau mengirim undangan kalender untuk rapat lanjutan.Llama.com Llama 3.2 juga hadir dalam versi teks-saja yang lebih ringan (parameter 1B dan 3B). Model ini dapat membantu pengembang membangun aplikasi yang dipersonalisasi, seperti meringkas pesan terkini atau mengirim undangan kalender untuk rapat lanjutan.
Llama 3.2 juga hadir dalam versi teks-saja yang lebih ringan (parameter 1B dan 3B). Model ini dapat membantu pengembang membangun aplikasi yang dipersonalisasi, seperti meringkas pesan terkini atau mengirim undangan kalender untuk rapat lanjutan. Demonstrasinya bisa dilihat lewat video berikut.

Model yang lebih kecil ini dirancang untuk bekerja pada Qualcomm, MediaTek, dan perangkat keras Arm lainnya, dengan Meta jelas berharap untuk melihatnya digunakan pada perangkat seluler, sebagaimana dihimpun KompasTekno dari The Verge, Kamis (26/9/2024).

Model Llama 3.2 tersedia untuk diunduh di situs llama.com dan Hugging Face serta di seluruh platform mitra Meta.

Baca juga: Chatbot Meta AI Punya Fitur Imagine Me, Bisa Animasikan Foto Jadi Apapun

Terkini Lainnya

Tautan Sahabat