小而便宜的 AI 模型正在占领市场:Liquid AI 8B MoE 发布,Hy3 登顶 OpenRouter 排行榜
Liquid AI 发布 LFM2.5-8B-A1B 边缘 MoE 模型(128K 上下文 + 推理模式),同时腾讯 Hy3 神秘登顶 OpenRouter 排行榜——两个信号指向同一趋势:小而便宜的 AI 模型正在占领市场。对 AI Agent 用户意味着什么?
2026年5月30日 · 阅读约 6 分钟
核心结论
2026 年 5 月最后一周,两个看似无关的 AI 事件指向同一个趋势:小而便宜的模型,正在成为 AI 行业的主流选择。
一边是 Liquid AI 发布了 LFM2.5-8B-A1B——仅 8B 总参数、1B 激活参数的 MoE 边缘模型,在消费级硬件上实现了媲美大模型的工具调用能力。另一边,腾讯开源模型 Hy3 神秘登顶 OpenRouter 使用量排行榜,用户疯狂用它不是因为质量最好,而是因为 0.066 美元/百万 token 的价格足够低。
两个信号叠加:AI 行业正在从「谁的模型最大」转向「谁的模型最划算」。
关键要点
- 事件时间:2026 年 5 月 28 日(Liquid AI 发布)& 5 月 26 日(Hy3 登榜分析)
- 核心变化:边缘/低成本模型进入主流,MoE 架构 + 小激活参数成为性价比最优解
- 对 AI Agent 用户的直接影响:本地运行高质量模型的门槛大幅降低,API 成本持续下探
事件一:Liquid AI LFM2.5-8B-A1B — 真正的「边缘 AI」
5 月 28 日,Liquid AI 发布了 LFM2.5-8B-A1B,这是一款专为消费级硬件设计的 MoE(混合专家)模型。核心参数一览:
| 参数 | 上一代 LFM2-8B-A1B | LFM2.5-8B-A1B | 变化 |
|---|---|---|---|
| 总参数 | 8B | 8B | 不变 |
| 激活参数 | ~1B | ~1B | 不变 |
| 上下文窗口 | 32,768 | 128,000 | +4x |
| 词表大小 | 65,536 | 128,000 | +2x(非拉丁语系压缩率提升) |
| 预训练 token | 12T | 38T | +3x |
| 推理策略 | 标准输出 | 推理模式(CoT) | 新增 |
最令人印象深刻的是基准测试的飞跃。AA-Omniscience 指数从 -78.42 提升到 -24.70(+53.62),非幻觉率从 7.46 飙升到 63.47(+56.01)。对于 8B 参数、仅 1B 激活的模型来说,这是质的突破。
在工具调用能力方面,BFCLv3 从 45.07 提升到 64.36(+19.29),Multi-IF 从 58.54 提升到 79.93(+21.39)。这条路线直接面向 AI Agent 场景——在本地设备上执行复杂的工具链调用。
Liquid AI 强调,该模型的定位是「每次 token 都很便宜」:MoE 模型天然适合计算约束环境,少量激活参数让每个推理 token 成本极低。模型已支持 llama.cpp、MLX、vLLM、SGLang,意味着可以在 M4 Mac、笔记本电脑甚至树莓派上运行。
事件二:Hy3 的神秘登顶 — 用户用脚投票
几乎同一时间,Max Woolf 在博客中揭露了一个有趣的现象:一个名为 Hy3 preview 的模型在 OpenRouter 排行榜上超越了 Claude,以超过 50% 的差距成为使用量最高的模型。
Hy3 是腾讯开源的一个大语言模型,Hugging Face 页面简陋、基准测试结果平平(与同级别中国开源模型相当),但它在 OpenRouter 上的使用量一骑绝尘。价格呢?0.066 美元/百万 token——比 DeepSeek V4 Flash(0.10 美元)还便宜 34%。
更诡异的是,Hy3 preview 的输入输出比高达 98% 输入 / 2% 输出——这意味着用户几乎只用它做「读」任务(文档处理、信息提取、代码审查),而不是「写」任务(生成、创作)。它在非编程场景中的使用量同样旺盛。
而且这不是免费试用导致的虚高数据:Hy3 最初有一个免费阶段(5 月 6 日前),但目前的排名数据来自 付费用户。
共同趋势:市场正在用脚投票
这两个故事看似独立,但讲述的是同一个故事——AI 市场正在从供给驱动转向需求驱动。
| 对比维度 | Liquid AI LFM2.5-8B-A1B | Tencent Hy3 preview |
|---|---|---|
| 模型规模 | 8B 总参 / 1B 激活 | 未公开 |
| 定价 | 开源免费 | 0.066 美元/百万 token |
| 核心卖点 | 边缘设备工具调用 | 极致低价 |
| 目标场景 | AI Agent、本地推理 | 批量文档处理、信息提取 |
| 对用户的价值 | 本地免费跑高质量 Agent | 比 Claude 便宜 4x 以上的替代品 |
2025 年的 AI 行业焦点是「谁的模型最聪明」,但到 2026 年中,焦点已经转向「谁能用最低成本完成任务」。大模型的能力提升进入了平台期,而用户的付费意愿在持续的"sticker shock"中变得越来越敏感。
OpenRouter 的数据格外有说服力:Hy3 没有大规模营销、没有 AI 社区的口碑推荐、甚至模型质量并非顶尖,但用户就是选择了它——因为足够便宜,且足够好用。
对 AI Agent 用户的实操启示
- 本地推理不再是玩具:LFM2.5-8B-A1B 的 IFEval 91.84 和 BFCLv3 64.36 说明,1B 激活参数的模型已经可以胜任多数工具调用任务。如果你的 Agent 工作流可以在本地运行,这会大幅降低运行成本和延迟。
- 成本和质量的权衡正在重新定义:如果你在用 Claude 或 GPT 做批量文档处理和代码审查,尝试用 Hy3 或 DeepSeek V4 Flash 替代——你可能发现 80% 的任务同样完成,但成本只有 1/4。
- 关注 OpenRouter 排行榜:它是最真实的市场信号——用户用真金白银投票的结果,比任何基准测试都更能反映「什么模型在实际工作中好用」。
参考来源
工具词条
本文涉及以下 AI 工具和平台:OpenAI、Claude、DeepSeek、vLLM、Hugging Face、OpenRouter、llama.cpp、MLX
内链引导
- 想在本地跑模型?看教程:如何用 LM Studio 在 M4 Mac 上运行本地 AI 模型
- 用低成本模型赚钱的真实案例:用 DeepSeek V4 + Claude Code 搭微 SaaS 矩阵,月入 8,500 美元
- 想了解更多低成本模型实战?看:DeepSeek Reasonix 实战:零成本搭建 AI 编程 Agent