GPT-5.1-Codex vs Phi-4-multimodal-instruct

OpenAI vs Microsoft — benchmarks, pricing, and capabilities side by side.

•GPT-5.1-Codex has the higher intelligence index (88.2 vs 46.2)
•Phi-4-multimodal-instruct is cheaper ($0.05 vs $1.25 per 1M input)
•GPT-5.1-Codex is faster
•GPT-5.1-Codex has a larger context window (400K)

	GPT-5.1-Codex	Phi-4-multimodal-instruct
Intelligence index	88.2	46.2
Developer	OpenAI	Microsoft
Type	Multimodal	Multimodal
Access	API only	Open weights
Context window	400,000 tokens	128,000 tokens
Input price	$1.25 / 1M	$0.05 / 1M
Output price	$10.00 / 1M	$0.10 / 1M
Speed	188 tok/s	25 tok/s
Released	November 13, 2025	February 1, 2025
Parameters	—	5600000000
Input modalities	Text, Image	—
Output modalities	Text	—

Shared benchmarks

GPT-5.1-Codex

Phi-4-multimodal-instruct

GPQA Diamond

86

31.5

Humanity’s Last Exam

23.4

4.4

LiveCodeBench

84.9

13.1

MMLU-Pro

86

48.5

GPT-5.1-Codex details Phi-4-multimodal-instruct details