美团发布并开源LongCat-Flash-Chat
今年以来,美团人工智能的消息频繁传出。
记者获悉,9月1日,美团宣布LongCat-Flash-Chat正式发布,在GithubH股上市公司、Hugging Face平台开源。据悉,LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts,MoE)架构,总参数560B,激活参数18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。此外,面向推理效率的设计和创新,LongCat-Flash-Chat具有明显更快的推理速度,更适合于耗时较长的复杂智能体应用。
记者了解到,美团此前就公布了AI Coding Agent工具NoCode、AI经营决策助手“袋鼠参谋”、酒店经营的垂类AI Agent“美团既白”等多款AI应用。美团方面表示,公司AI战略会建立在三个层面:AI at work、AI in products以及Building LLM,此次模型开源是其Building LLM进展的首度曝光。
具体来看,LongCat-Flash模型在架构层面引入“零计算专家(Zero-Computation Experts)”机制,实现算力按需分配和高效利用。此外,LongCat-Flash在层间铺设跨层通道,使MoE的通信和计算能很大程度上并行,提高了训练和推理效率。LongCat-Flash还对常用大模型组件和训练方式进行了改进,使用了超参迁移和模型层叠加的方式进行训练,并结合了多项策略保证训练稳定性,使得训练全程高效且顺利。
针对智能体(Agentic)能力,LongCat-Flash自建了Agentic评测集指导数据策略,并在训练全流程进行了全面的优化,包括使用多智能体方法生成多样化高质量的轨迹数据等,实现了优异的智能体能力。
(文章来源:广州日报新花城)
责任编辑:10 原标题:美团发布并开源LongCat-Flash-Chat美团发布并开源LongCat-Flash-Chat