Gemini 3.5 Flash vs Hermes 4 - Llama-3.1 70B

Google vs Nous Research — benchmarks, pricing, and capabilities side by side.

•Gemini 3.5 Flash has the higher intelligence index (92.2 vs 71.3)
•Hermes 4 - Llama-3.1 70B is cheaper ($0.10 vs $1.50 per 1M input)
•Gemini 3.5 Flash is faster

	Gemini 3.5 Flash	Hermes 4 - Llama-3.1 70B
Intelligence index	92.2	71.3
Developer	Google	Nous Research
Type	Multimodal	LLM
Access	API only	—
Context window	1,048,576 tokens	—
Input price	$1.50 / 1M	$0.10 / 1M
Output price	$9.00 / 1M	$0.40 / 1M
Speed	221 tok/s	60 tok/s
Released	May 19, 2026	August 27, 2025
Parameters	—	—
Input modalities	Text, Image, Audio, Video	—
Output modalities	Text	—

Shared benchmarks

Gemini 3.5 Flash

Hermes 4 - Llama-3.1 70B

GPQA Diamond

92.2

69.9

Humanity’s Last Exam

41

7.9

Gemini 3.5 Flash details Hermes 4 - Llama-3.1 70B details