LongCat(龙猫)

3天前更新 20 00

美团自主研发的大规模生成式 AI 模型家族

收录时间:
2025-08-31
问小白

LongCat是美团自主研发的大模型,发布于2024年3月21日,并于8月31日正式发布了LongCat-Flash-Chat 开源大模型。

该模型在参数规模、训练数据和性能基准上基本匹配世界一线大语言模型(GPT-4o、Claude、PaLM 2)的水平。

目前可在:https://longcat.ai 进行体验。

使用美团APP扫码登录,暂不不支持深度思考模式。

LongCat-Flash-Chat 大模型

参数规模达5600亿,总参数量极大,但动态激活参数仅在18.6亿到31.3亿之间,平均每个token激活约270亿参数,这种动态计算机制极大提升了计算效率,避免了传统大模型对所有参数的全量调用。

经过20万亿tokens的训练,推理速度超过每秒100个token,具备高吞吐量和低延迟,适合实际应用场景。

在主流行业基准TerminalBench上得分为39.5,τ²-Bench得分高达67.7,显示出优秀的综合性能和适应复杂推理任务的能力。

采用创新的“零计算专家”动态分配模式和Shortcut连接Mixture-of-Experts架构,有效缓解了模型在规模扩展时的通信瓶颈,提升了大规模训练和推理效率。

LongCat模型的这一动态激活和高效架构设计,使其在保持庞大模型容量的同时,兼顾了能耗和响应速度,具有较强竞争力和实用价值。

数据统计

相关导航

暂无评论

none
暂无评论...