神秘登场:无人知晓的视频模型突然登顶
2026 年 4 月初,一个神秘的 AI 视频模型突然出现在全球排行榜上。
它叫 Happy Horse。
没有官网介绍,没有团队信息,没有技术博客。
只有两个惊人的数字:
- Text-to-Video:#1(Elo 1333)
- Image-to-Video:#1(Elo 1392)
它打败了字节跳动的 Seedance 2.0,登上了 Artificial Analysis 视频排行榜榜首。
全网都在问:这是谁做的?
网友侦探游戏:猜测满天飞
神秘模型的身份引发了一场「侦探游戏」。
“线索一:语言顺序” – 官网语言顺序:中文 > 英文。对于面向全球的产品,这个顺序不正常。基本确认:中国团队。
“线索二:名字暗示” – 2026 是马年。「Happy Horse」藏着明显的马年玩笑。之前「Pony Alpha」也玩过类似梗。
“线索三:马姓大佬” – 腾讯创始人马化腾,阿里创始人马云。两人都是「马」,自然成为嫌疑人。
还有猜测小米雷军(低调喜欢突然出手)、DeepSeek(之前悄悄上线过视觉模型)。
各种猜测满天飞,但都没有确凿证据。
谜底揭晓:阿里巴巴 ATH AI
2026-04-10,谜底揭晓。
阿里巴巴在 X官号宣布:Happy Horse 是阿里 ATH AI Innovation Unit 的项目。
阿里巴巴股价当日上涨 2.12%。
这是阿里巴巴史上最强的视频生成产品。
为什么在这个时候火了?
竞争对手都出事了。
OpenAI Sora:停止视频生成业务。官方理由是「战略调整」,聚焦 coding tools 和企业客户。实际原因可能是计算成本太高。
字节 Seedance:暂停发布。原因:版权争议。好莱坞制片厂(迪士尼、Netflix、索尼)联合投诉。
两个最强对手都倒下了。
阿里趁势上位,填补了市场空白。
技术亮点:原生音视频联合生成
Happy Horse 的核心能力是什么?
原生音视频联合生成 – 不是后期配音。单次前向传播,同时输出视频 + 同步音频。
这是业界首创。之前的视频模型都是:生成视频 → 后期加音频。
Happy Horse 把音频和视频放在同一个 token 序列里处理,真正的「一体化」。
多语言唇同步 – 中文、英文、日语、韩语、德语、法语……口型自动同步。
基于开源模型 – Happy Horse 基于 daVinci-MagiHuman 开源模型:
- 上海创新研究所 GAIR + Sand.ai 合作
- 2026-03-23 开源
- 15B 参数,40层 Transformer
一个开源模型,经过阿里优化后,打败了闭源竞品。
行业格局变了
视频生成赛道的格局正在重塑。
OpenAI Sora:停止 | 字节 Seedance:暂停 | 阿里 Happy Horse:第一
这是阿里 CEO Eddie Wu 的 AI 战略落地。他上任后就把 AI 作为最高优先级。
Happy Horse 可能集成到阿里的电商、广告、娱乐产品中。
能用吗?
目前状态:官网 happy-horse.ai | 论文公开 | API 待开放 | 权重待公开
可以关注官网,等待 API 发布。
对行业的启示
开源模型首次盲测超越闭源竞品。
这打破了「闭源效果更好」的共识。开源模型经过优化,也能达到商业级水平。
对开发者来说,这是好消息:
- 自部署成本大幅降低
- 数据、模型、推理都在自己控制
- 定制深度和隐私合规,闭源方案难以提供
总结
神秘模型登榜第一,阿里揭晓身份。
对手出事,阿里上位。
开源模型打败闭源,打破行业共识。
这是阿里 AI 战略的关键一步,也是视频生成赛道的格局重塑。



