Google Rilis Gemini 2.5 Flash, Model AI yang Irit Daya dan Kencang

Gemini 2.5 Flash merupakan model AI terbaru buatan Google yang berfokus pada efisiensi dan kecepatan.

Lihat Foto

- Google resmi merilis Gemini 2.5 Flash, model AI terbaru ini fokus pada efisiensi daya dan kecepatan. Model AI ini dirancang untuk memberikan kinerja tinggi namun dengan biaya operasional yang lebih rendah.

Gemini 2.5 Flash disebut akan segera hadir di Vertex AI, platform pengembangan kecerdasan buatan milik Google. Di sana, pengembang bisa menyesuaikan kecepatan, akurasi, dan biaya pemrosesan sesuai kebutuhan.

Menurut Google, model ini menawarkan komputasi yang “dinamis dan dapat dikendalikan”. Fitur ini memungkinkan penyesuaian beban kerja berdasarkan kompleksitas permintaan.

Dengan begitu, pengembang dapat menyeimbangkan performa dan efisiensi biaya secara fleksibel.

“Fleksibilitas ini merupakan kunci untuk mengoptimalkan performa Flash dalam aplikasi bervolume tinggi dan sensitif terhadap biaya,” tulis Google dalam blog resmi, sebagaimana dirangkum KompasTekno dari TechCrunch, Kamis (10/4/2025).

Gemini 2.5 Flash merupakan model AI “reasoning” atau penalaran, mirip seperti o3-mini milik OpenAI dan DeepSeek R1. Model seperti ini dirancang untuk menjalankan proses berpikir yang lebih kompleks dibanding model biasa.

Artinya, Gemini 2.5 Flash menganalisis dan melakukan verifikasi informasi terlebih dahulu sebelum memberikan jawaban. Pendekatan ini membuatnya lebih mengedepankan akurasi, meskipun bisa sedikit mengorbankan kecepatan.

Google menyebut model Gemini 2.5 Flash sangat ideal digunakan untuk aplikasi yang membutuhkan "volume tinggi" dan penggunaan real-time. Beberapa contohnya seperti chatbot layanan pelanggan atau sistem penguraian dokumen (document parsing).

Dinilai ideal

Dalam posting blognya, Google menyebut Gemini 2.5 Flash sebagai "workhorse" atau kuda pekerja. Istilah ini menggambarkan bahwa model tersebut dirancang untuk bekerja secara andal dan konsisten dalam menangani beban kerja berat di berbagai situasi.

Google juga menekankan bahwa model ini dioptimalkan secara khusus untuk latensi (waktu respons cepat) dan biaya operasional yang rendah.

Oleh karena itu, 2.5 Flash dinilai ideal untuk digunakan dalam asisten virtual yang cepat merespons serta alat peringkasan informasi secara real-time, terutama dalam konteks penggunaan berskala besar.

“Ini adalah mesin ideal untuk asisten virtual responsif dan alat ringkasan real-time, di mana efisiensi dalam skala besar sangat krusial,” ujar Google. Fokusnya adalah menciptakan performa tinggi dalam konteks penggunaan sehari-hari yang padat dan cepat.

Peluncuran Gemini 2.5 Flash dilakukan di tengah tren meningkatnya biaya penggunaan model AI canggih. Model seperti ini menawarkan alternatif yang lebih ringan secara biaya, meskipun mungkin mengorbankan sedikit akurasi.

Namun, Google tidak menerbitkan laporan teknis untuk model 2.5 Flash. Hal ini mempersulit publik untuk mengevaluasi kelebihan dan kekurangan AI tersebut secara menyeluruh.

Google sebelumnya menyampaikan kepada TechCrunch bahwa mereka memang tidak merilis laporan untuk model yang masih dikategorikan “eksperimental”. Pernyataan ini memperjelas alasan di balik minimnya informasi teknis terkait model 2.5 Flash.

Google juga mengumumkan bahwa model Gemini, termasuk 2.5 Flash, akan tersedia untuk lingkunan on-premise. Rencana ini dijadwalkan dimulai pada kuartal ketiga (Q3) tahun 2025.

Adapun model AI Gemini tersebut nantinya akan dijalankan di Google Distributed Cloud (GDC), solusi on-prem milik Google yang ditujukan untuk perusahaan dengan standar tata kelola data tinggi.

Google turut mengumumkan bahwa pihaknya tengah bekerja sama dengan Nvidia untuk menghadirkan model Gemini di sistem Nvidia Blackwell. Perangkat ini nantinya dapat dibeli langsung melalui Google atau saluran resmi mereka.

cpu-data.info

Google Rilis Gemini 2.5 Flash, Model AI yang Irit Daya dan Kencang

Dinilai ideal

Terkini Lainnya

Tautan Sahabat