Gemini 3.5 Flash vs Llama 3 8B Instruct

Google vs Meta — benchmarks, pricing, and capabilities side by side.

•Gemini 3.5 Flash has the higher intelligence index (92.2 vs 32.4)
•Llama 3 8B Instruct is cheaper ($0.04 vs $1.50 per 1M input)
•Gemini 3.5 Flash is faster
•Gemini 3.5 Flash has a larger context window (1M)

	Gemini 3.5 Flash	Llama 3 8B Instruct
Intelligence index	92.2	32.4
Developer	Google	Meta
Type	Multimodal	LLM
Access	API only	Open weights
Context window	1,048,576 tokens	8,192 tokens
Input price	$1.50 / 1M	$0.04 / 1M
Output price	$9.00 / 1M	$0.04 / 1M
Speed	221 tok/s	81 tok/s
Released	May 19, 2026	April 18, 2024
Parameters	—	—
Input modalities	Text, Image, Audio, Video	Text
Output modalities	Text	Text

Shared benchmarks

Gemini 3.5 Flash

Llama 3 8B Instruct

GPQA Diamond

92.2

29.6

Humanity’s Last Exam

41

5.1

Gemini 3.5 Flash details Llama 3 8B Instruct details