AI Leaderboard

AI Models & Tools Benchmark

Real-time tracking of global AI model benchmarks and rankings.

LLM Benchmarks

Rank	Model	Code Arena	Chat Arena	GPQA	Pricing (In/Out)
#1	Gemini 3.1 Pro Google• Ctx: 1.0MModel	2151	-	94.3	$2.5 / $15
#2	Claude Opus 4.6 Anthropic• Ctx: 1.0MModel	2127	-	91.3	$5 / $25
#3	Claude Opus 4.7 Anthropic• Ctx: 1.0MModel	1933	-	94.2	$5 / $25
#4	Gemini 3 Flash Google• Ctx: 1.0MModel	1720	-	90.4	$0.5 / $3
#5	Qwen3.7 Max Alibaba Cloud / Qwen Team• Ctx: 1.0MModel	1692	-	92.4	$1.25 / $3.75
#6	Claude Sonnet 4.6 Anthropic• Ctx: 200kModel	1673	-	89.9	$3 / $15
#7	Claude Opus 4.5 Anthropic• Ctx: N/AModel	1614	-	87	N/A
#8	Gemini 3 Pro Google• Ctx: N/AModel	1579	-	91.9	N/A
#9	GPT-5.2 OpenAI• Ctx: 400kModel	1542	-	92.4	$1.75 / $14
#10	Claude Sonnet 4.5 Anthropic• Ctx: 200kModel	1451	-	83.4	$3 / $15
#11	Gemma 4 31B Google• Ctx: 262kModel	1301	-	84.3	$0.13 / $0.38
#12	Qwen3.5-397B-A17B Alibaba Cloud / Qwen Team• Ctx: N/AModel	1296	-	88.4	N/A
#13	Gemma 4 26B-A4B Google• Ctx: 262kModel	1248	-	82.3	$0.13 / $0.4
#14	Qwen3.6 Plus Alibaba Cloud / Qwen Team• Ctx: 1.0MModel	1211	-	90.4	$0.5 / $3
#15	Claude Opus 4.1 Anthropic• Ctx: N/AModel	1189	-	80.9	N/A
#16	GPT-4.1 mini OpenAI• Ctx: 1.0MModel	1068	-	65	$0.4 / $1.6
#17	Qwen3.7-Plus Alibaba Cloud / Qwen Team• Ctx: 1.0MModel	1033	-	90.3	$0.32 / $1.28
#18	Gemini 3.1 Flash-Lite Google• Ctx: 1.0MModel	977	-	86.9	$0.25 / $1.5
#19	Claude Haiku 4.5 Anthropic• Ctx: 200kModel	969	-	73	$1 / $5
#20	Claude Opus 4 Anthropic• Ctx: N/AModel	932	-	79.6	N/A

Selected AI Coding Tools

Claude Code

Free (Beta)

Anthropic

Anthropic's terminal Agent tool. Excel at understanding complex logic, debugging, and executing Shell commands. Extremely hardcore.

AI-native editor known for deep context understanding and Agent mode. Supports multi-model switching (Claude 3.5/GPT-4).

Google's Agent-first IDE with built-in Manager & Editor views. Capable of autonomously completing complex engineering tasks via AI Agents.

Core model powering Copilot, offering raw API access. Excel at translating natural language to code with multi-language support.

Amazon's AI IDE based on Spec-driven development. Generates requirement specs before implementing code, excel at structured development for complex projects.

Industry standard AI assistant, deeply integrated into VS Code/JetBrains. New Agent mode handles complex tasks autonomously.

Next-gen AI IDE focusing on Flow mode. Cascade engine supports multi-model collaboration and deep code understanding.

Cascade Flow

Multi-Model

Fast Completion