Google DeepMind

Gemini family — multimodal models with massive context windows and hybrid reasoning.

Available models

Starting rate

6.1 RODI / 1M

Max context

Provider website Provider docs

Gemini 3.5 Flashgoogle/gemini-3.5-flash

chatvisionreasoninglong-context

Gemini 3.5 Flash is Google's high-efficiency multimodal model, bringing near-Pro level coding and reasoning at Flash-tier cost and speed. It is highly optimized for coding proficiency and parallel agentic execution...

Price

In909.1RODI/M~1.50 USD/M
Out5454.6RODI/M~9.00 USD/M
Cached91.0RODI/M~0.150 USD/M

Context1.0MSpeedFastInput:textimagedocumentaudiovideoOutput:textModel details

Gemini 3.1 Pro PreviewNewgoogle/gemini-3.1-pro-preview

chatvisionreasoningpreviewcoding

Most capable model in Gemini lineup. 2M token context window — largest in industry. Tiered pricing: input/output roughly doubles above 200K tokens. Paid tier only, no free access. Preview status: may change before GA, more restrictive rate limits. Supports multimodal understanding, agentic capabilities, and coding.

Price

In1212.2RODI/M~2.00 USD/M
Out7272.8RODI/M~12.00 USD/M
Cached121.3RODI/M~0.200 USD/M

Context2MSpeedFastInput:textimagedocumentaudiovideoOutput:textModel details

Gemini 3.1 Flash Litegoogle/gemini-3.1-flash-lite

chatvisionaffordablemultimodal

Most cost-efficient model in Gemini API. Moved from preview to GA on May 7, 2026. Optimized for high-volume agentic tasks, translation, and simple data processing. Audio input priced 2x higher than text/image/video. Flat pricing regardless of context length.

Price

In151.6RODI/M~0.250 USD/M
Out909.1RODI/M~1.50 USD/M
Cached15.2RODI/M~0.0250 USD/M

View all rates

Context1.0MSpeedFastInput:textimagedocumentaudiovideoOutput:textModel details

Gemini 3.1 Flash Lite PreviewNewgoogle/gemini-3.1-flash-lite-preview

chatvisionpreviewaffordable

Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across...

Price

In151.6RODI/M~0.250 USD/M
Out909.1RODI/M~1.50 USD/M
Cached15.2RODI/M~0.0250 USD/M

View all rates

Context1.0MSpeedFastInput:textimagedocumentaudiovideoOutput:textModel details

Gemini 2.5 Progoogle/gemini-2.5-pro

chatvisionreasoningmultimodal

Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks. It employs “thinking” capabilities, enabling it to reason through responses with enhanced accuracy...

Price

In757.6RODI/M~1.25 USD/M
Out6060.7RODI/M~10.00 USD/M
Cached187.9RODI/M~0.310 USD/M

Context1.0MSpeedDeepInput:textimagedocumentaudiovideoOutput:textModel details

Gemini 2.5 Flash Litegoogle/gemini-2.5-flash-lite

chatvisionaffordablemultimodal

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance...

Price

In60.7RODI/M~0.100 USD/M
Out242.5RODI/M~0.400 USD/M
Cached15.2RODI/M~0.0250 USD/M

View all rates

Context1.0MSpeedFastInput:textimagedocumentaudiovideoOutput:textModel details

Gemini 2.5 Flashgoogle/gemini-2.5-flash

chatvisionreasoningmultimodal

Gemini 2.5 Flash is Google's state-of-the-art workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks. It includes built-in "thinking" capabilities, enabling it to provide responses with greater...

Price

In181.9RODI/M~0.300 USD/M
Out1515.2RODI/M~2.50 USD/M
Cached181.9RODI/M~0.300 USD/M

View all rates

Context1.0MSpeedFastInput:textimagedocumentaudiovideoOutput:textModel details

Text Embedding 004EmbeddingTemporarily unavailablegoogle/text-embedding-004

Temporarily unavailable

This model is temporarily unavailable on RodiumAi. Please try another model or check back later.

chataffordable

Standard embedding model for vector generation. Free tier available. Used for semantic search, RAG, and similarity tasks. Grounding with Google Search available on top: $0.15/MTok embedding tokens plus standard retrieval costs. via Google Gemini API (direct).

Price

In89.9RODI/M~0.150 USD/M

Context2KSpeedDeepInput:textOutput:embeddingModel details

Text Multilingual Embedding 002google/text-multilingual-embedding-002

embeddingsemantic-searchragmultilingual

Google multilingual text embedding model for semantic search, RAG, clustering, and similarity across 100+ languages.

Price

In6.1RODI/M~0.0100 USD/M

Context2KSpeedFastInput:textOutput:embeddingModel details

Gemini Embedding 001google/gemini-embedding-001

embeddingsemantic-searchraggemini

Google Gemini embedding model for high-quality vector representations, semantic search, and RAG.

Price

In15.2RODI/M~0.0250 USD/M

Context2KSpeedBalancedInput:textOutput:embeddingModel details

Gemini 3 Flash Previewgoogle/gemini-3-flash-preview

chatvisionreasoningpreview

Gemini 3 Flash Preview is a high speed, high value thinking model designed for agentic workflows, multi turn chat, and coding assistance. It delivers near Pro level reasoning and tool...

Price

In303.1RODI/M~0.500 USD/M
Out1818.2RODI/M~3.00 USD/M

Context1.0MSpeedFastInput:textimagedocumentaudiovideoOutput:textModel details

Gemini 2.5 Flash Lite Preview 09-2025google/gemini-2.5-flash-lite-preview-09-2025

chatvisionpreviewaffordable

Price

In60.7RODI/M~0.100 USD/M
Out242.5RODI/M~0.400 USD/M
Cached15.2RODI/M~0.0250 USD/M

View all rates

Context1.0MSpeedFastInput:textimagedocumentaudiovideoOutput:textModel details

Gemini 3.1 Pro Preview Custom Toolsgoogle/gemini-3.1-pro-preview-customtools

chatvisionreasoningtoolspreview

Variant of Gemini 3.1 Pro Preview optimized for custom tool selection and multi-turn tool calling. Most capable model in Gemini lineup. 2M token context window — largest in industry. Tiered pricing: input/output roughly doubles above 200K tokens. Paid tier only, no free access. Preview status: may change before GA, more restrictive rate limits. Supports multimodal understanding, agentic capabilities, and coding.

Price

In1212.2RODI/M~2.00 USD/M
Out7272.8RODI/M~12.00 USD/M
Cached121.3RODI/M~0.200 USD/M

Context2MSpeedDeepInput:textimagedocumentaudiovideoOutput:textModel details

Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image)google/gemini-3.1-flash-lite-image

image-gennano-bananamultimodal

Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image) is Google's fastest, most cost-efficient Gemini image model, built for high-velocity developer pipelines and rapid-fire visual exploration. It delivers text-to-image generation...

Price

In151.6RODI/M~0.250 USD/M
Out909.1RODI/M~1.50 USD/M

Context66KSpeedFastInput:textimageOutput:textimageModel details

Nano Banana Pro (Gemini 3 Pro Image)google/gemini-3-pro-image

image-gennano-banana

Nano Banana Pro is Google’s most advanced image-generation and editing model, built on Gemini 3 Pro. It extends the original Nano Banana with significantly improved multimodal reasoning, real-world grounding, and...

Price

In1212.2RODI/M~2.00 USD/M
Out7272.8RODI/M~12.00 USD/M

Context66KSpeedDeepInput:textimageOutput:textimageModel details

Nano Banana Pro (Gemini 3 Pro Image Preview)google/gemini-3-pro-image-preview

image-gennano-bananapreview

Price

In1212.2RODI/M~2.00 USD/M
Out7272.8RODI/M~12.00 USD/M

Context66KSpeedDeepInput:textimageOutput:textimageModel details

Nano Banana 2 (Gemini 3.1 Flash Image)google/gemini-3.1-flash-image

image-gennano-banana

Gemini 3.1 Flash Image, a.k.a. "Nano Banana 2," is Google’s latest state of the art image generation and editing model, delivering Pro-level visual quality at Flash speed. It combines advanced...

Price

In303.1RODI/M~0.500 USD/M
Out1818.2RODI/M~3.00 USD/M

Context131KSpeedBalancedInput:textimageOutput:textimageModel details

Nano Banana 2 (Gemini 3.1 Flash Image Preview)google/gemini-3.1-flash-image-preview

image-gennano-bananapreview

Gemini 3.1 Flash Image Preview, a.k.a. "Nano Banana 2," is Google’s latest state of the art image generation and editing model, delivering Pro-level visual quality at Flash speed. It combines...

Price

In303.1RODI/M~0.500 USD/M
Out1818.2RODI/M~3.00 USD/M

Context131KSpeedBalancedInput:textimageOutput:textimageModel details

Veo 3.1google/veo-3.1

videoveomultimodal

Google Veo 3.1 — high-quality text/image-to-video with synchronized audio. GA on Vertex AI (us-central1). Default output 4/6/8 seconds at 720p or 1080p.

Price

Per second242.5RODI/s~0.400 USD/s
With audio / s242.5RODI/s~0.400 USD/s
No audio / s121.3RODI/s~0.200 USD/s

View all rates

Context—SpeedDeepInput:textimageOutput:videoModel details

Veo 3.1 Fastgoogle/veo-3.1-fast

videoveomultimodal

Google Veo 3.1 Fast — lower-latency text/image-to-video with synchronized audio. GA on Vertex AI (us-central1). Optimized for faster iteration at 720p, 1080p, or 4K.

Price

Per second60.7RODI/s~0.100 USD/s
With audio / s60.7RODI/s~0.100 USD/s
No audio / s48.5RODI/s~0.0800 USD/s

View all rates

Context—SpeedFastInput:textimageOutput:videoModel details

Veo 3.1 Litegoogle/veo-3.1-lite

videoveomultimodalaffordable

Google Veo 3.1 Lite — fastest, most cost-efficient Veo tier for text/image-to-video. GA on Vertex AI (us-central1). Best for rapid prototyping at 720p or 1080p.

Price

Per second30.4RODI/s~0.0500 USD/s
With audio / s30.4RODI/s~0.0500 USD/s
No audio / s18.2RODI/s~0.0300 USD/s

View all rates

Context—SpeedFastInput:textimageOutput:videoModel details