AWS Umumkan Amazon Nova, AI "Multimodal" Pesaing Google Gemini dan GPT-4V
LAS VEGAS, - Perusahaan cloud computing, Amazon Web Service (AWS) merilis rangkaian model generative AI multimodal yang diberi nama Amazon Nova.
AI multimodal adalah model yang mampu memproses informasi dari berbagai modalitas, termasuk gambar, video, dan teks. Misalnya ketika model AI diberi sebuah gambar, AI dapat memberikan respons yang lebih akurat berdasarkan gambar tersebut.
Model AI ini diumumkan secara khusus oleh CEO Amazon, Andy Jassy di salah satu sesi acara "re:Invent 2024" yang berlangsung di Las Vegas, Selasa (3/12/2024) pagi atau sekitar Rabu dini hari waktu Indonesia.
Jurnalis KompasTekno Wahyunanda Kusuma Pertiwi hadir langsung di Las Vegas dalam acara peluncuran tersebut.
"Dengan senang hati saya mengumumkan peluncuran Amazon Nova, yaitu serangkaian pondasi model yang menawarkan kecerdasan mutakhir," jelas Andy.
Andy menjelaskan, salah satu alasan mengapa AWS mengembangkan model generative AI sendiri adalah untuk memenuhi kebutuhan pelanggannya.
Baca juga: AWS Umumkan Chip Generative AI Trainium3
"Kami terus bekerja menggarap frontier model (model AI mutakhir) kami sendiri. Dan perkembangan frontier model itu luar biasa dalam 4-5 bulan terakhir," kata Andy di atas panggung.
Sebagai gambaran, model generative AI multimodal seperti Amazon Nova adalah jenis model AI yang bisa menghasilkan (generate) berbagai jenis konten, mulai dari teks, gambar, audio, video, atau kombinasi dari semuanya.
Konsepnya sama seperti GPT-4V(ision) milik OpenAI atau Google Gemini.
Total, Amazon Nova memiliki empat model, yakni Mikro, Lite, Pro, dan Premier. Untuk Micro, Lite, dan Pri sudah tersedia untuk pelanggan AWS. Sementara Premier baru akan hadir pada kuartal-I tahun depan. Adapun perbedaan empat model AI di atas adalah sebagai berikut:
- Amazon Nova Micro: Model ini khusus men-generate konten teks, menawarkan lantensi rendah dan biaya yang lebih hemat.
- Amazon Nova Lite: Multimodal untuk memproses konten gambar, video, dan teks dengan biaya yang sangat murah.
- Amazon Nova Pro: Multimodal tingkat tinggi dibanding dua jenis sebelumnya, menawarkan akurasi, kecepatan dan harga yang didasarkan pada kebutuhan.
- Amazon Nova Premier: Multimodal paling tinggi di antara jenis lainnya, mampu memproses beragam jenis konten yang lebih kompleks dan bisa menjadi "guru" untuk melatih model "custom".
Model generative AI multimodal di atas akan tersedia di AWS Bedrock, yakni platform pengembangan AI milik AWS.
Baca juga: AWS re:Invent 2024 Resmi Digelar, Umumkan Solusi Cloud Computing Baru
Pada saat yang bersamaan, Andy juga mengumumkan dua model lain. Pertama adalah Nova Canvas, yakni model art image generation, yang lebih diperuntukan untuk segmen periklanan, marketing, publikasi, dan sebagainya, yang membutuhkan materi visual berupa gambar, bukan video.
Model ini memungkinkan pelanggan AWS untuk menyunting gambar menggunakan input teks bahasa yang lebih natural (text to image).
"Model ini juga memiliki kontrol bawaan (built-in control) untuk penggunaan yang lebih bertanggungjawab, seperti watermark untuk keterterlusuran, dan moderasi konten untuk membatasi konten berbahaya," jelas Andy.
Model kedua adalah Amazon Nova Reel, yang lebih fokus untuk menghasilkan konten video.
Dengan model ini, pelanggan AWS bisa mengendalikan kamera secara penuh, sehingga bisa mengatur gerakan, membuat efek panning, membuat video 360 derajat atau zoom.
Model ini juga dibekali kontrol bawaan sama seperti Nova Canvas. Untuk saat ini, Nova Reel masih terbatas untuk membuat video berdurasi enam detik dengan proses generate sekitar tiga detik.
Andy menjanjikan, durasi video yang lebih panjang, yakni hingga dua menit akan hadir beberapa bulan ke depan.
Semua model AI baru Amazon ini mendukung lebih dari 200 bahasa dan modalitas. AWS mengeklaim, Amazon Nova Pro leih murah 75 persen dibanding model AI multimodal sekelasnya.
Terkini Lainnya
- Membidik Objek Wisata di Kota Canggih Chongqing China dengan Tecno Camon 30 Premier 5G
- 4 Cara Menonaktifkan Download Otomatis di WhatsApp buat Hemat Memori, Mudah
- Ramai Meme Chill Guy di Media Sosial, Begini Arti dan Asal-usulnya
- Arti Istilah “We Listen We Don’t Judge” yang Ramai di Media Sosial
- Sekian Ketebalan iPhone 17 Air, Tertipis Sepanjang Sejarah iPhone?
- Pabrikan Chip AI yang Pendirinya Orang Indonesia Kini Lebih Kaya daripada Intel
- Mantan Karyawan Tipu Apple Rp 2,4 Miliar, Pakai Modus Sumbangan Palsu
- Nvidia Investasi di Vietnam, Bangun Pusat Pengembangan AI
- Kata POV Sering Keliru di Medsos, Begini Arti yang Benar
- OpenAI Akhirnya Rilis Sora, AI Pembuat Video dari Teks
- Sejarah YouTube, Berawal dari Situs Kencan Online hingga Dibeli Google
- Pengiriman Laptop Global Naik berkat AI dan Gaming
- 10 Hal Pertama di Internet Sepanjang Sejarah, Mulai dari E-mail hingga Video YouTube
- Muncul Menu Baru “Meta AI” di WhatsApp, Apa Fungsinya?
- AWS Beberkan Strategi Pengembangan Talenta Digital di Asia Tenggara
- Pabrikan Chip AI yang Pendirinya Orang Indonesia Kini Lebih Kaya daripada Intel
- Presiden Direktur XL Axiata Dian Siswarini Mengundurkan Diri dari Jabatan
- Apple Music Replay 2024 Dirilis, Rekap Musik Paling Sering Didengar Sepanjang Tahun
- Xiaomi Bikin Chipset Smartphone Sendiri untuk Tahun Depan?
- Investasi Apple di Indonesia Bertambah Jadi Rp 15 Triliun?
- AWS Umumkan Chip Generative AI Trainium3