小模型占领市场：Liquid AI 8B MoE + Hy3 登顶实录

Liquid AI 发布 LFM2.5-8B-A1B 边缘 MoE 模型（128K 上下文 + 推理模式），同时腾讯 Hy3 神秘登顶 OpenRouter 排行榜——两个信号指向同一趋势：小而便宜的 AI 模型正在占领市场。对 AI Agent 用户意味着什么？

核心结论

2026 年 5 月最后一周，两个看似无关的 AI 事件指向同一个趋势：小而便宜的模型，正在成为 AI 行业的主流选择。

一边是 Liquid AI 发布了 LFM2.5-8B-A1B——仅 8B 总参数、1B 激活参数的 MoE 边缘模型，在消费级硬件上实现了媲美大模型的工具调用能力。另一边，腾讯开源模型 Hy3 神秘登顶 OpenRouter 使用量排行榜，用户疯狂用它不是因为质量最好，而是因为 0.066 美元/百万 token 的价格足够低。

两个信号叠加：AI 行业正在从「谁的模型最大」转向「谁的模型最划算」。

关键要点

事件时间：2026 年 5 月 28 日（Liquid AI 发布）& 5 月 26 日（Hy3 登榜分析）
核心变化：边缘/低成本模型进入主流，MoE 架构 + 小激活参数成为性价比最优解
对 AI Agent 用户的直接影响：本地运行高质量模型的门槛大幅降低，API 成本持续下探

事件一：Liquid AI LFM2.5-8B-A1B — 真正的「边缘 AI」

5 月 28 日，Liquid AI 发布了 LFM2.5-8B-A1B，这是一款专为消费级硬件设计的 MoE（混合专家）模型。核心参数一览：

参数	上一代 LFM2-8B-A1B	LFM2.5-8B-A1B	变化
总参数	8B	8B	不变
激活参数	~1B	~1B	不变
上下文窗口	32,768	128,000	+4x
词表大小	65,536	128,000	+2x（非拉丁语系压缩率提升）
预训练 token	12T	38T	+3x
推理策略	标准输出	推理模式（CoT）	新增

最令人印象深刻的是基准测试的飞跃。AA-Omniscience 指数从 -78.42 提升到 -24.70（+53.62），非幻觉率从 7.46 飙升到 63.47（+56.01）。对于 8B 参数、仅 1B 激活的模型来说，这是质的突破。

在工具调用能力方面，BFCLv3 从 45.07 提升到 64.36（+19.29），Multi-IF 从 58.54 提升到 79.93（+21.39）。这条路线直接面向 AI Agent 场景——在本地设备上执行复杂的工具链调用。

Liquid AI 强调，该模型的定位是「每次 token 都很便宜」：MoE 模型天然适合计算约束环境，少量激活参数让每个推理 token 成本极低。模型已支持 llama.cpp、MLX、vLLM、SGLang，意味着可以在 M4 Mac、笔记本电脑甚至树莓派上运行。

Liquid AI 基准测试对比表

事件二：Hy3 的神秘登顶 — 用户用脚投票

几乎同一时间，Max Woolf 在博客中揭露了一个有趣的现象：一个名为 Hy3 preview 的模型在 OpenRouter 排行榜上超越了 Claude，以超过 50% 的差距成为使用量最高的模型。

Hy3 是腾讯开源的一个大语言模型，Hugging Face 页面简陋、基准测试结果平平（与同级别中国开源模型相当），但它在 OpenRouter 上的使用量一骑绝尘。价格呢？0.066 美元/百万 token——比 DeepSeek V4 Flash（0.10 美元）还便宜 34%。

更诡异的是，Hy3 preview 的输入输出比高达 98% 输入 / 2% 输出——这意味着用户几乎只用它做「读」任务（文档处理、信息提取、代码审查），而不是「写」任务（生成、创作）。它在非编程场景中的使用量同样旺盛。

而且这不是免费试用导致的虚高数据：Hy3 最初有一个免费阶段（5 月 6 日前），但目前的排名数据来自 付费用户。

OpenRouter 排行榜 Hy3 使用量

共同趋势：市场正在用脚投票

这两个故事看似独立，但讲述的是同一个故事——AI 市场正在从供给驱动转向需求驱动。

对比维度	Liquid AI LFM2.5-8B-A1B	Tencent Hy3 preview
模型规模	8B 总参 / 1B 激活	未公开
定价	开源免费	0.066 美元/百万 token
核心卖点	边缘设备工具调用	极致低价
目标场景	AI Agent、本地推理	批量文档处理、信息提取
对用户的价值	本地免费跑高质量 Agent	比 Claude 便宜 4x 以上的替代品

2025 年的 AI 行业焦点是「谁的模型最聪明」，但到 2026 年中，焦点已经转向「谁能用最低成本完成任务」。大模型的能力提升进入了平台期，而用户的付费意愿在持续的"sticker shock"中变得越来越敏感。

OpenRouter 的数据格外有说服力：Hy3 没有大规模营销、没有 AI 社区的口碑推荐、甚至模型质量并非顶尖，但用户就是选择了它——因为足够便宜，且足够好用。

对 AI Agent 用户的实操启示

本地推理不再是玩具：LFM2.5-8B-A1B 的 IFEval 91.84 和 BFCLv3 64.36 说明，1B 激活参数的模型已经可以胜任多数工具调用任务。如果你的 Agent 工作流可以在本地运行，这会大幅降低运行成本和延迟。
成本和质量的权衡正在重新定义：如果你在用 Claude 或 GPT 做批量文档处理和代码审查，尝试用 Hy3 或 DeepSeek V4 Flash 替代——你可能发现 80% 的任务同样完成，但成本只有 1/4。
关注 OpenRouter 排行榜：它是最真实的市场信号——用户用真金白银投票的结果，比任何基准测试都更能反映「什么模型在实际工作中好用」。

参考来源

工具词条

本文涉及以下 AI 工具和平台：OpenAI、Claude、DeepSeek、vLLM、Hugging Face、OpenRouter、llama.cpp、MLX

内链引导

想在本地跑模型？看教程：如何用 LM Studio 在 M4 Mac 上运行本地 AI 模型
用低成本模型赚钱的真实案例：用 DeepSeek V4 + Claude Code 搭微 SaaS 矩阵，月入 8,500 美元
想了解更多低成本模型实战？看：DeepSeek Reasonix 实战：零成本搭建 AI 编程 Agent

小模型占领市场：Liquid AI 8B MoE + Hy3 登顶实录

核心结论

关键要点

事件一：Liquid AI LFM2.5-8B-A1B — 真正的「边缘 AI」

事件二：Hy3 的神秘登顶 — 用户用脚投票

共同趋势：市场正在用脚投票

对 AI Agent 用户的实操启示

参考来源

工具词条

内链引导

这个趋势怎么赚钱？

n8n + OpenAI 内容联盟站

Claude + n8n 自动化代运营

相关教程

相关资讯