一文解析 CZ 为何看好 Vana 打造更好的 AI_文章_鏈補手：赋能 Web3 探索者，把握数字新机遇

作者：Biteye 核心贡献者 Jesse

编辑：Biteye 核心贡献者 Crush

* 全文约 6000 字，预计阅读时间为 12 分钟

一个月前，YZi Labs 宣布投资 Vana，币安创始人 CZ 加入担任顾问, 确立了 Vana 在 AI 数据赛道的领军地位。四天后在和 Vana 的 AMA 中，CZ 表示数据则是 AI 的核心燃料，公共数据已耗尽，而私有数据尚待开发，看好 Vana 的产品市场契合度（PMF）和用户增长。

为什么 YZi Labs、Coinbase Venture、Paradigm 纷纷投资 Vana? 为什么 CZ 看好 Vana 的发展？

本报告将系统分析 AI 数据困境、Vana 的核心价值主张、实际应用场景及其未来增长轨迹，揭示 Vana 如何成为 AI 生态系统的关键基础设施。

01 AI 与数据困境：突破封闭壁垒

根据 Pitchbook 数据，2025 年第一季度美国 AI 行业已吸引近 200 亿美元投资。截止 2024 年 AI 初创公司占据全球风险投资的三分之一，累计达 1315 亿美元，其中近四分之一的新兴创业实体专注于 AI 领域。Statista 数据进一步证实了这一爆发式增长轨迹——AI 和机器学习赛道的风投资金从 2011 年的 6.7 亿美元激增至 2020 年的 360 亿美元，增长超过 50 倍。这一现象明确表明，AI 已成为聪明资本和顶尖创业者的共同选择。

然而，AI 的根本架构—"数据 + 模型 + 算力"正面临结构性瓶颈。AI 模型性能的核心驱动因素并非算力优势或算法突破，而是训练数据集的质量与规模。当前大语言模型来到训练数据枯竭的临界点。Meta 的 Llama 3 已基于约 15 万亿个 Token 进行训练，这一数据量已几乎耗尽整个公共互联网上可获取的高质量数据资源。尽管公共互联网数据量庞大，但这仅是冰山一角。市场普遍忽视的关键事实是：高价值数据大多被锁定在需要授权访问的私有系统中。公共互联网数据在所有数据中占比不足 0.1%。而这一问题超出了 AI 行业自身的解决能力范畴，需要借助区块链技术重构数据生产关系，建立全新激励机制，催化高质量数据的大规模涌现。

另一方面，今天绝大多数数据都被掌握在 Web2 科技公司的封闭生态系统中。人工智能的发展正面临数据墙的挑战，而这一壁垒的存在，正是因为这些企业深知数据的巨大价值。高质量的人工智能模型具有极高的经济回报，例如 OpenAI 的年收入已达到约 34 亿美元。而要构建优秀的 AI 模型，就需要大量的数据支撑，数据的获取往往需要支付高昂的成本。

例如，Reddit 每年通过销售数据获利约 2 亿美元，PhotoBucket 的图片数据每张售价在 1 至 2 美元之间，苹果的新闻数据交易更是达到了 5000 万美元。数据所有权已从简单的隐私偏好转变为重大的经济问题。在 AI 模型驱动大部分经济的世界中，数据所有权相当于持有未来 AI 模型的股权。

一文解析 CZ 为何看好 Vana 打造更好的 AI

相关文章