
Chatbot Arena
Chatbot Arena AI大模型竞技场排行榜
清华大学携手中国软件评测中心在GOSIM2025大会上联合发布了《2025大模型服务性能排行榜》,该排行榜背后的技术来自平台AI Ping
AI Ping 是一款由清华系团队打造的免费大模型服务性能评测平台,通过7×24小时实时监控与多维度对比200多家大模型服务商,为开发者提供客观、全面的选型参考,到底谁家的大模型服务最好??
它不同于传统仅关注模型精度的评测,而是从开发者实际应用场景出发,聚焦于延迟、吞吐量、可靠性等直接影响生产环境用户体验和成本效益的性能指标。
如果你正在需要使用大模型,不知道使用哪家服务商可靠,那么AI Ping 可以你帮你更好的做出选择。
目前,AI Ping 已覆盖了 20多家供应商的220多个模型服务,包括 DeepSeek、Qwen3、Kimi-K2 等主流模型
平台提供基于 7×24小时持续监测 的实时性能排行榜单(如首 Token 延迟榜、吞吐量榜)。独特的性能坐标图(以延迟为横轴,吞吐量为纵轴)让你能直观对比不同供应商在同一个模型上的表现,快速识别出“低延迟高吞吐”的优质服务商
以我们常用的deepseek r1大模型为例,通过性能排行榜和性能坐标图,我们可以直观的了解到,吞吐量大且延迟低的服务商是”蓝耘元生代”。
每个模型和供应商都有详细的详情页面,列出其实时性能数据(延迟、吞吐、可靠性)、价格信息、技术支持背景及关键参数(如上下文长度)。
许多详情页还提供了近期的性能波动曲线,帮助你判断服务的稳定性