Benchmarks

			Leader
AI2D	Multimodal	17	Claude 3.5 Sonnet	94.7/100
ChartQA	Multimodal	24	Claude 3.5 Sonnet	90.8/100
DocVQA	Multimodal	26	Qwen2.5 VL 72B Instruct	96.4/100
MathVista	Multimodal	34	o3	86.8/100
MMMU	Multimodal	52	GPT-5	84.2/100
MMMU-Pro	Multimodal	13	GPT-5	78.4/100