
通义千问
阿里云推出大语言模型聊天机器人
LongCat是美团自主研发的大模型,发布于2024年3月21日,并于8月31日正式发布了LongCat-Flash-Chat 开源大模型。
该模型在参数规模、训练数据和性能基准上基本匹配世界一线大语言模型(GPT-4o、Claude、PaLM 2)的水平。
目前可在:https://longcat.ai 进行体验。
使用美团APP扫码登录,暂不不支持深度思考模式。
参数规模达5600亿,总参数量极大,但动态激活参数仅在18.6亿到31.3亿之间,平均每个token激活约270亿参数,这种动态计算机制极大提升了计算效率,避免了传统大模型对所有参数的全量调用。
经过20万亿tokens的训练,推理速度超过每秒100个token,具备高吞吐量和低延迟,适合实际应用场景。
在主流行业基准TerminalBench上得分为39.5,τ²-Bench得分高达67.7,显示出优秀的综合性能和适应复杂推理任务的能力。
采用创新的“零计算专家”动态分配模式和Shortcut连接Mixture-of-Experts架构,有效缓解了模型在规模扩展时的通信瓶颈,提升了大规模训练和推理效率。
LongCat模型的这一动态激活和高效架构设计,使其在保持庞大模型容量的同时,兼顾了能耗和响应速度,具有较强竞争力和实用价值。