tinomaria.com – Google baru saja meluncurkan Gemini 2.5 Flash Lite, anggota terbaru keluarga model kecerdasan buatan (AI) Gemini. Diumumkan pada Selasa (17/6/2025), model AI ini diklaim sebagai yang tercepat dan paling efisien secara biaya dibandingkan model Gemini lainnya.
Senior Director, Product Management Gemini, Tulsee Doshi, dalam blog resmi Google menyatakan, “Kami memperkenalkan pratinjau untuk model Gemini 2.5 Flash Lite, model 2.5 paling cepat dan efisien secara biaya. Anda bisa mulai mengembangkan pratinjau untuk model terbaru dan kami menunggu saran dan masukan dari Anda.” Saat ini, Gemini 2.5 Flash Lite masih dalam tahap pengembangan (versi beta) dan baru dapat diakses oleh para pengembang melalui Google AI Studio atau platform Vertex AI. Akses publik masih belum tersedia.
Hasil pengujian benchmarking menunjukkan performa Gemini 2.5 Flash Lite yang mengesankan. Model ini melampaui pendahulunya, Gemini 2.0 Flash Lite, dalam berbagai tes, termasuk pemrograman, matematika, sains, logika penalaran, dan tugas multimoda. Skornya sangat tinggi pada pengujian GPQA (Graduate-Level Google-Proof Q7A Benchmark), AIME (American Invitational Mathematics Examination), dan LiveCodeBench, secara konsisten melampaui Gemini 2.0 Flash Lite. Bahkan, pada beberapa tes seperti penalaran visual, performa multi-bahasa, dan AIME 2025, performanya hampir menyaingi Gemini 2.5 Flash.
Keunggulan lain dari Gemini 2.5 Flash Lite adalah biaya operasionalnya yang rendah. Biaya dalam mode Standard dan Thinking masing-masing sekitar 0,10 dollar AS (Rp 1.631) dan 0,40 dollar AS (Rp 6.527) per juta token output. Meskipun biaya mode Thinking lebih tinggi, Google menekankan bahwa biaya aktual akan bergantung pada kompleksitas tugas. Efisiensi biaya ini menjadikan Gemini 2.5 Flash Lite ideal untuk tugas-tugas berat dan rendah latensi, seperti penerjemahan dan klasifikasi teks. Hal ini terbukti dari skor benchmark yang tinggi, yaitu 86,8 persen untuk FACTS Grounding dan 84,5 persen untuk Multilingual MMLU. FACTS Grounding mengukur kemampuan memberikan respons berdasarkan informasi aktual dan terverifikasi, sementara Multilingual MMLU mengevaluasi pengetahuan umum dan kemampuan penalaran dalam berbagai bahasa.
Lebih lanjut, Gemini 2.5 Flash Lite juga menunjukkan performa tinggi dalam penalaran visual, dengan skor 72,9 persen pada MMMU (Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark) dan 57,5 persen untuk penalaran visual dan pemahaman gambar. Seperti model Gemini 2.5 series lainnya, Gemini 2.5 Flash Lite mendukung input multi-modal terintegrasi, termasuk Google Search, eksekusi kode, dan pemahaman konteks.
Bersamaan dengan peluncuran Gemini 2.5 Flash Lite, Google juga mengumumkan akses publik resmi untuk Gemini 2.5 Flash dan Gemini 2.5 Pro. Kedua model ini telah mencapai skor benchmark yang tinggi dan kini tersedia di Android dan iOS melalui aplikasi Gemini.
Seluruh anggota keluarga Gemini 2.5 dirancang dengan pendekatan penalaran hibrida, menggabungkan logika dan metode statistik untuk menghasilkan solusi yang andal dan optimal untuk tugas-tugas kompleks. Strategi ini bertujuan menyeimbangkan kinerja tinggi dengan biaya dan latensi rendah, diposisikan oleh Google sebagai bagian dari “Pareto Front,” yaitu kemampuan memberikan solusi optimal dalam permasalahan optimasi multi-objektif dengan mengoptimalkan satu aspek dengan sedikit mengorbankan aspek lainnya. Hal ini memungkinkan pengguna mendapatkan solusi paling efektif sesuai kebutuhan dan prioritas.