cpu-data.info

Google Rilis Gemini 1.5 Flash 8-B, Model AI Ringan, Cepat, dan Murah

Ilustrasi chatbot Gemini, pengganti chatbot Bard bikinan Google
Lihat Foto

- Pada Mei lalu, Google memperkenalkan model bahasa kecerdasan buatan (AI) Gemini 1.5 Flash. Seperti namanya, model AI ini dapat merespons pertanyaan pengguna dengan lebih cepat dari model Gemini lainnya.

Kini, Gemini 1.5 Flash diperbarui. Google merilis Gemini 1.5 Flash-8B yang dibuat lebih kencang dengan peningkatan rate limit dalam sebuah permintaan (prompt) mencapai dua kali lipat yaitu dari 2.000 ke 4.000 request per menit (RPM).

Selain itu, model AI ini juga disebut lebih ringan dan efisien karena memiliki latensi (latency) atau jeda respons lebih rendah, terutama ketika menjawab sejumlah prompt yang dianggap ringan pula atau tak terlalu memakan resource

Dengan peningkatan ini, Google menyebut Gemini 1.5 Flash-8B dapat bekerja dan merespons lebih baik dan cepat di sejumlah bidang, seperti menjawab pertanyaan, melakukan transkrip dari sebuah audio atau secara langsung, dan menerjemahkan suatu bahasa asing. 

Baca juga: AI Gemini Bisa Bikin Balasan E-mail, Lebih Luwes dan Paham Konteks

Selain ringan dan kencang, penggunaan Gemini 1.5 Flash-8B untuk aplikasi (API) juga kini 50 persen lebih murah dibanding Gemini 1.5 Flash, dengan detail sebagai berikut:

  Gemini 1.5 Flash Gemini 1.5 Flash-8B
Input (token kurang dari 128.000)

0,075 dolar AS/1 juta token

0,0375 dolar AS/1 juta token
Output (token kurang dari 128.000)

0,30 dolar AS/1 juta token

0,15 dolar AS/1 juta token

Caching (token kurang dari 128.000)

0,01875 dolar AS/1 juta token

0,01 dolar AS/1 juta token

Storage (token kurang dari 128.000)

1 dolar AS/1 juta token

0,25 dolar AS/1 juta token

Input (token lebih dari 128.000)

 0,15 dolar AS/1 juta token

0,075 dolar AS/1 juta token

Output (token lebih dari 128.000)

0,60 dolar AS/1 juta token

0,30 dolar AS/1 juta token

Caching (token lebih dari 128.000)

0,0375 dolar AS/1 juta token

0,02 dolar AS/1 juta token

Storage (token lebih dari 128.000)

1 dolar AS/1 juta token/jam

 0,25 dolar AS/1 juta token/jam

Gemini 1.5 Flash-8B bisa diakses dan dijajal gratis oleh para pengembang (developer) melalui Google AI Studio di tautan berikut ini, serta di Gemini API yang bisa diakses di tautan berikut ini.

Akses gratis ini berlaku bagi mereka yang ingin menguji coba Gemini 1.5 Flash-8B dengan jumlah token (satuan kata/kalimat dalam sebuah prompt) terbatas untuk pemakaian Gemini API.

Jika sudah melampaui jumlah token tertentu, pemakaian Gemini 1.5 Flash-8B untuk Gemini API akan dikenakan biaya yang tertera di atas.

Baca juga: Google Gemini Kembali Bisa Buat Gambar Orang, Pakai Imagen 3

Adapun harga Gemini 1.5 Flash-8B di atas akan berlaku bagi para developer berbayar mulai 14 Oktober 2024 mendatang, sebagaimana dirangkum KompasTekno dari BlogGoogle, Senin (7/10/2024).

"Model AI dan harga terbaru kami untuk Gemini 1.5 Flash-8B ini memungkinkan para pengembang membuat aplikasi mereka sesuai dengan kategori produk dan beban kerjanya, sehingga bisa meningkatkan penggunaan AI secara luas," ungkap Google. 

Terkini Lainnya

Tautan Sahabat