返回竞技场

Arena

真实任务模型对战场

Arena 网站截图快照

网站地址

月访问量

44.3M Exploding Topics

软件许可证

闭源

最近检查

2026-06-18

编辑摘要

用自己的任务测模型差异。写代码、做页面、生成内容时，直接看多个模型的同题输出，比只看总分更快。

适用场景

把同一个提示交给多个模型，对比回答、代码、图片或设计结果。

不适用场景

需要严格私密输入、企业合规或离线推理的人。

核心价值

任务级模型对比，带社区反馈和公开榜单。

同题对比，结果比静态榜单更接近日常使用。

敏感内容不要投喂，输入会经过第三方模型。

AI ModelsModel ComparisonLeaderboardsBenchmarkingPrompt Workflow