LongCat AI

2个月前更新 1.1K 0 0

LongCat AI 是美团于 2025 年 9 月开源的 560B 参数 MoE 架构大模型,平均仅激活 27B 参数实现 100+ tokens/s 推理速度与 5 元 / 百万 Token 低成本,在智能体任务、中文指令遵循上表现全球领先,自带美团业务适配能力,已通过 MIT 协议开放给行业使用。

收录时间:
2025-09-02
LongCat AILongCat AI

LongCat AI美团开源大模型,重新定义 AI 高效推理时代。随着 AI 大模型竞赛进入深水区,美团于 2025 年 9 月 1 日正式发布自研大语言模型LongCat AI(全称 LongCat-Flash-Chat,中文名 “龙猫”),同步在 Github、Hugging Face 平台开源,并上线官方网站(https://longcat.ai/)。这款带着 “美团基因” 的大模型,凭借创新性架构设计和极致性能表现,迅速成为行业焦点,为企业级 AI 应用落地提供了全新选择。

LongCat AI 官网
LongCat AI 官网

一、LongCat AI 核心技术:MoE 架构打造 “高效算力引擎”

LongCat AI 的突破核心在于采用混合专家模型(Mixture-of-Experts,MoE)架构,通过 “动态激活” 机制实现算力与性能的平衡,彻底改变传统大模型 “全参数参与计算” 的资源浪费问题。

1. 创新参数分配:560B 总参数,仅激活 27B 实现高效推理

LongCat AI 总参数量高达 5600 亿(560B),但基于对每个 Token 重要性的智能判断,仅激活 18.6B-31.3B 参数(平均约 27B)。这种设计源于 “零计算专家(Zero-Computation Experts)” 机制 —— 部分 Token 可根据上下文需求 “做空” 复杂计算,实现算力按需分配。

为进一步控制算力消耗,美团团队引入PID 控制器实时微调专家偏置,将单 Token 平均激活量稳定在 27B 左右,既保证性能不缩水,又大幅降低硬件成本。

2. 工程优化:100+ tokens/s 推理速度,30 天完成 20 万亿 Token 训练

在架构层面,LongCat AI 通过Shortcut-connected MoE(ScMoE)设计扩大计算与通信的重叠窗口,配合定制化底层优化,实现数万张加速卡的高效并行训练。最终,模型仅用 30 天就完成 20 万亿 Token 的预训练,刷新业内纪录。

推理速度方面,LongCat AI 在 H800 显卡上实现100+ tokens/s 的生成速度,远超同类模型;同时,输出成本低至5 元 / 百万 Token,为长周期、高复杂度的智能体任务提供了低成本解决方案。

二、LongCat AI 性能表现:多维度评测位居全球前列

通过权威基准测试验证,LongCat AI 在通用知识、智能体能力、编程效率、指令遵循四大核心领域表现卓越,部分指标超越国际顶级模型。

1. 通用知识:中文能力领先,比肩国内头部模型

  • MMLU(多任务语言理解基准):得分 89.71,展现扎实的跨领域知识储备;
  • CEval(中文通用能力评估基准):得分 90.44,在中文语境理解、文化适配性上优势显著;
  • 数学推理(MATH500):得分 96.4,复杂计算与逻辑推导能力突出。

2. 智能体能力:复杂场景处理全球第一

作为 LongCat AI 的核心优势,其智能体(Agentic)能力在多个专业基准中位列榜首:

  • VitaBench(复杂场景智能体基准):得分 24.30,超越所有参评模型,擅长处理多步骤、高交互的业务场景;
  • τ²-Bench(智能体工具使用基准):即便与参数规模更大的模型对比,仍保持性能领先,工具调用准确率高;
  • TerminalBench(终端命令行任务基准):得分 39.51,位列第二,可高效完成服务器运维、自动化脚本执行等技术任务。

3. 指令遵循:中英文场景 “零偏差” 执行

在指令理解与执行可靠性上,LongCat AI 表现出极强的严谨性:

  • IFEval(指令遵循评估基准):得分 89.65,全球第一,能精准识别复杂指令中的细节要求;
  • COLLIE(中文指令遵循基准):得分 57.10,Meeseeks-zh(中文多场景指令基准):得分 43.03,两项均获最佳成绩,适配中文商业场景需求。

三、LongCat AI 应用场景:从美团业务到行业开源生态

1. 美团内部落地:降本增效覆盖全业务链

LongCat AI 已在美团客服、销售、研发、无人配送等核心业务中规模化应用:

  • 智能客服:运营效率提升 20%,自动解决 80% 以上的常见咨询;
  • 商家助手:为 120 万美团商家提供营销策划、库存管理建议,降低中小商家运营门槛;
  • 研发工具:AI 代码生成效率提升 27%,支持多语言开发与 bug 自动修复;
  • 无人配送:优化无人车、无人机路径规划,已完成数百万次配送任务并拓展至海外市场。

值得注意的是,LongCat AI 自带 “美团基因”—— 在生成营销文案、策划方案时,会自动结合美团业务场景(如 “美团买菜”“美团出行”),提供可直接落地的商业建议,这一特性使其成为商家与企业用户的 “定制化助手”。

2. 开源生态:MIT 协议降低行业使用门槛

LongCat AI 采用MIT 开源协议,允许开发者自由下载、修改模型,甚至通过蒸馏训练衍生新模型。美团同步提供基于 SGLang 和 vLLM 的两种部署方案,普通技术团队无需复杂配置即可快速上线模型服务。

这一举措打破了 “大模型仅由 AI 公司主导” 的行业认知,为中小企业、科研机构提供了低成本接入高性能大模型的机会,推动 AI 技术在生活服务、零售、物流等领域的普惠应用。

四、LongCat AI 背后:美团 AI 战略的 “三步走” 布局

LongCat AI 的诞生并非偶然,而是美团 “AI at Work(赋能员工)、AI in Products(升级产品)、Building LLM(自研大模型)” 三层战略的落地成果。早在 2023 年,美团就通过整合光年之外团队积累 AI 技术;2024 年明确大模型研发方向后,投入数十亿元建设 GPU 资源与基础设施,最终实现 “30 天高效训练 + 高性价比推理” 的工程突破。

美团 CEO 王兴表示,LongCat AI 是公司 “技术驱动业务” 的核心载体,未来将持续加码 AI 投入,推动线上线下业务的全面数字化升级。

数据统计

数据评估

LongCat AI浏览人数已经达到1.1K,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:LongCat AI的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找LongCat AI的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于LongCat AI特别声明

本站啊哦导航提供的LongCat AI都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由啊哦导航实际控制,在2025年9月2日 上午6:38收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,啊哦导航不承担任何责任。

相关导航