实时追踪全球 AI 模型最新指标排名。
| 排名 | 模型 | 编程 | 聊天 | 科学 | 价格 (输入/输出) |
|---|---|---|---|---|---|
| #1 | Claude Opus 4.6 Anthropic Ctx: 1.0MModel | 2101 | 1491 | 91.3 | $5 / $25 |
| #2 | Gemini 3.1 Pro Google Ctx: 1.0MModel | 2076 | 1222 | 94.3 | $2.5 / $15 |
| #3 | Claude Opus 4.7 Anthropic Ctx: 1.0MModel | 1923 | 358 | 94.2 | $5 / $25 |
| #4 | Gemini 3 Flash Google Ctx: 1.0MModel | 1703 | 1143 | 90.4 | $0.5 / $3 |
| #5 | Claude Sonnet 4.6 Anthropic Ctx: 200kModel | 1697 | 956 | 89.9 | $3 / $15 |
| #6 | Claude Opus 4.5 Anthropic Ctx: N/AModel | 1614 | 1342 | 87 | N/A |
| #7 | Gemini 3 Pro Google Ctx: N/AModel | 1579 | 1045 | 91.9 | N/A |
| #8 | GPT-5.2 OpenAI Ctx: 400kModel | 1519 | 1170 | 92.4 | $1.75 / $14 |
| #9 | Qwen3.5-397B-A17B Alibaba Cloud / Qwen Team Ctx: 262kModel | 1289 | 963 | 88.4 | $0.6 / $3.6 |
| #10 | Gemma 4 26B-A4B Google Ctx: 262kModel | 1251 | 594 | 82.3 | $0.13 / $0.4 |
| #11 | Claude Sonnet 4.5 Anthropic Ctx: 200kModel | 1248 | 1308 | 83.4 | $3 / $15 |
| #12 | Claude Opus 4.1 Anthropic Ctx: N/AModel | 1189 | 1180 | 80.9 | N/A |
| #13 | Qwen3.6 Plus Alibaba Cloud / Qwen Team Ctx: 1.0MModel | 1162 | 750 | 90.4 | $0.5 / $3 |
| #14 | Gemma 4 31B Google Ctx: 262kModel | 1134 | 881 | 84.3 | $0.14 / $0.4 |
| #15 | GPT-4.1 mini OpenAI Ctx: 1.0MModel | 1043 | 528 | 65 | $0.4 / $1.6 |
| #16 | Gemini 3.1 Flash-Lite Google Ctx: 1.0MModel | 977 | 756 | 86.9 | $0.25 / $1.5 |
| #17 | Claude Haiku 4.5 Anthropic Ctx: 200kModel | 948 | 1188 | 73 | $1 / $5 |
| #18 | Claude Opus 4 Anthropic Ctx: N/AModel | 932 | 1088 | 79.6 | N/A |
| #19 | Claude Sonnet 4 Anthropic Ctx: N/AModel | 882 | 856 | 75.4 | N/A |
| #20 | GPT-4.1 OpenAI Ctx: 1.0MModel | 842 | 1237 | 66.3 | $2 / $8 |
Anthropic 推出的终端 Agent 工具,擅长理解复杂逻辑、调试及执行 Shell 命令,极其硬核。
AI 原生编辑器,以其深度上下文理解和 Agent 模式著称,支持多模型切换 (Claude 3.5/GPT-4)。
Google 推出的 Agent-first IDE,内置 Manager 与 Editor 视图,通过 AI Agent 能够自主完成复杂的工程任务。
驱动 Copilot 的核心模型,提供原始 API 访问,擅长将自然语言转化为代码,支持多语言。
Amazon 推出的 AI IDE,基于 Spec-driven 开发理念,先生成需求规格再实现代码,擅长复杂项目的结构化开发。
行业标准 AI 助手,深度集成 VS Code/JetBrains,新增 Agent 模式可自主完成复杂任务。
主打 Flow 心流模式的新一代 AI IDE,Cascade 引擎支持多模型协作与深层代码理解。