WayToClawEarn
中等影响Liquid AI / Max Woolf

小而便宜的 AI 模型正在占领市场:Liquid AI 8B MoE 发布,Hy3 登顶 OpenRouter 排行榜

Liquid AI 发布 LFM2.5-8B-A1B 边缘 MoE 模型(128K 上下文 + 推理模式),同时腾讯 Hy3 神秘登顶 OpenRouter 排行榜——两个信号指向同一趋势:小而便宜的 AI 模型正在占领市场。对 AI Agent 用户意味着什么?

2026年5月30日 · 阅读约 6 分钟

核心结论

2026 年 5 月最后一周,两个看似无关的 AI 事件指向同一个趋势:小而便宜的模型,正在成为 AI 行业的主流选择

一边是 Liquid AI 发布了 LFM2.5-8B-A1B——仅 8B 总参数、1B 激活参数的 MoE 边缘模型,在消费级硬件上实现了媲美大模型的工具调用能力。另一边,腾讯开源模型 Hy3 神秘登顶 OpenRouter 使用量排行榜,用户疯狂用它不是因为质量最好,而是因为 0.066 美元/百万 token 的价格足够低

两个信号叠加:AI 行业正在从「谁的模型最大」转向「谁的模型最划算」。

关键要点

  • 事件时间:2026 年 5 月 28 日(Liquid AI 发布)& 5 月 26 日(Hy3 登榜分析)
  • 核心变化:边缘/低成本模型进入主流,MoE 架构 + 小激活参数成为性价比最优解
  • 对 AI Agent 用户的直接影响:本地运行高质量模型的门槛大幅降低,API 成本持续下探

事件一:Liquid AI LFM2.5-8B-A1B — 真正的「边缘 AI」

5 月 28 日,Liquid AI 发布了 LFM2.5-8B-A1B,这是一款专为消费级硬件设计的 MoE(混合专家)模型。核心参数一览:

参数上一代 LFM2-8B-A1BLFM2.5-8B-A1B变化
总参数8B8B不变
激活参数~1B~1B不变
上下文窗口32,768128,000+4x
词表大小65,536128,000+2x(非拉丁语系压缩率提升)
预训练 token12T38T+3x
推理策略标准输出推理模式(CoT)新增

最令人印象深刻的是基准测试的飞跃。AA-Omniscience 指数从 -78.42 提升到 -24.70(+53.62),非幻觉率从 7.46 飙升到 63.47(+56.01)。对于 8B 参数、仅 1B 激活的模型来说,这是质的突破。

在工具调用能力方面,BFCLv3 从 45.07 提升到 64.36(+19.29),Multi-IF 从 58.54 提升到 79.93(+21.39)。这条路线直接面向 AI Agent 场景——在本地设备上执行复杂的工具链调用。

Liquid AI 强调,该模型的定位是「每次 token 都很便宜」:MoE 模型天然适合计算约束环境,少量激活参数让每个推理 token 成本极低。模型已支持 llama.cpp、MLX、vLLM、SGLang,意味着可以在 M4 Mac、笔记本电脑甚至树莓派上运行。

Liquid AI 基准测试对比表

事件二:Hy3 的神秘登顶 — 用户用脚投票

几乎同一时间,Max Woolf 在博客中揭露了一个有趣的现象:一个名为 Hy3 preview 的模型在 OpenRouter 排行榜上超越了 Claude,以超过 50% 的差距成为使用量最高的模型。

Hy3 是腾讯开源的一个大语言模型,Hugging Face 页面简陋、基准测试结果平平(与同级别中国开源模型相当),但它在 OpenRouter 上的使用量一骑绝尘。价格呢?0.066 美元/百万 token——比 DeepSeek V4 Flash(0.10 美元)还便宜 34%。

更诡异的是,Hy3 preview 的输入输出比高达 98% 输入 / 2% 输出——这意味着用户几乎只用它做「读」任务(文档处理、信息提取、代码审查),而不是「写」任务(生成、创作)。它在非编程场景中的使用量同样旺盛。

而且这不是免费试用导致的虚高数据:Hy3 最初有一个免费阶段(5 月 6 日前),但目前的排名数据来自 付费用户

OpenRouter 排行榜 Hy3 使用量

共同趋势:市场正在用脚投票

这两个故事看似独立,但讲述的是同一个故事——AI 市场正在从供给驱动转向需求驱动

对比维度Liquid AI LFM2.5-8B-A1BTencent Hy3 preview
模型规模8B 总参 / 1B 激活未公开
定价开源免费0.066 美元/百万 token
核心卖点边缘设备工具调用极致低价
目标场景AI Agent、本地推理批量文档处理、信息提取
对用户的价值本地免费跑高质量 Agent比 Claude 便宜 4x 以上的替代品

2025 年的 AI 行业焦点是「谁的模型最聪明」,但到 2026 年中,焦点已经转向「谁能用最低成本完成任务」。大模型的能力提升进入了平台期,而用户的付费意愿在持续的"sticker shock"中变得越来越敏感。

OpenRouter 的数据格外有说服力:Hy3 没有大规模营销、没有 AI 社区的口碑推荐、甚至模型质量并非顶尖,但用户就是选择了它——因为足够便宜,且足够好用

对 AI Agent 用户的实操启示

  1. 本地推理不再是玩具:LFM2.5-8B-A1B 的 IFEval 91.84 和 BFCLv3 64.36 说明,1B 激活参数的模型已经可以胜任多数工具调用任务。如果你的 Agent 工作流可以在本地运行,这会大幅降低运行成本和延迟。
  2. 成本和质量的权衡正在重新定义:如果你在用 Claude 或 GPT 做批量文档处理和代码审查,尝试用 Hy3 或 DeepSeek V4 Flash 替代——你可能发现 80% 的任务同样完成,但成本只有 1/4。
  3. 关注 OpenRouter 排行榜:它是最真实的市场信号——用户用真金白银投票的结果,比任何基准测试都更能反映「什么模型在实际工作中好用」。

参考来源

工具词条

本文涉及以下 AI 工具和平台:OpenAIClaudeDeepSeekvLLMHugging FaceOpenRouterllama.cppMLX

内链引导

免责声明:本站案例均为知识分享内容,仅供灵感与参考,不构成收益承诺;由此进行的外部执行与结果请自行判断并承担相应责任。
小而便宜的 AI 模型正在占领市场:Liquid AI 8B MoE 发布,Hy3 登顶 OpenRouter 排行榜 · WayToClawEarn