Gemini 3.5 Flash vs Granite 4.0 H Small

Google vs IBM — benchmarks, pricing, and capabilities side by side.

•Gemini 3.5 Flash has the higher intelligence index (92.2 vs 35.7)
•Granite 4.0 H Small is cheaper ($0.10 vs $1.50 per 1M input)
•Granite 4.0 H Small is faster

	Gemini 3.5 Flash	Granite 4.0 H Small
Intelligence index	92.2	35.7
Developer	Google	IBM
Type	Multimodal	LLM
Access	API only	—
Context window	1,048,576 tokens	—
Input price	$1.50 / 1M	$0.10 / 1M
Output price	$9.00 / 1M	$0.30 / 1M
Speed	221 tok/s	524 tok/s
Released	May 19, 2026	September 22, 2025
Parameters	—	—
Input modalities	Text, Image, Audio, Video	—
Output modalities	Text	—

Shared benchmarks

Gemini 3.5 Flash

Granite 4.0 H Small

GPQA Diamond

92.2

41.6

Humanity’s Last Exam

41

3.7

Gemini 3.5 Flash details Granite 4.0 H Small details