" />

一文解析 CZ 为何看好 Vana 打造更好的 AI

2025-03-27 14:56:14

作者:Biteye 核心贡献者 Jesse

编辑:Biteye 核心贡献者 Crush

* 全文约 6000 字,预计阅读时间为 12 分钟

一个月前,YZi Labs 宣布投资 Vana,币安创始人 CZ 加入担任顾问, 确立了 Vana 在 AI 数据赛道的领军地位。四天后在和 Vana 的 AMA 中,CZ 表示数据则是 AI 的核心燃料,公共数据已耗尽,而私有数据尚待开发,看好 Vana 的产品市场契合度(PMF)和用户增长。

为什么 YZi Labs、Coinbase Venture、Paradigm 纷纷投资 Vana? 为什么 CZ 看好 Vana 的发展?

本报告将系统分析 AI 数据困境、Vana 的核心价值主张、实际应用场景及其未来增长轨迹,揭示 Vana 如何成为 AI 生态系统的关键基础设施。

01 AI 与数据困境:突破封闭壁垒

根据 Pitchbook 数据,2025 年第一季度美国 AI 行业已吸引近 200 亿美元投资。截止 2024 年 AI 初创公司占据全球风险投资的三分之一,累计达 1315 亿美元,其中近四分之一的新兴创业实体专注于 AI 领域。Statista 数据进一步证实了这一爆发式增长轨迹——AI 和机器学习赛道的风投资金从 2011 年的 6.7 亿美元激增至 2020 年的 360 亿美元,增长超过 50 倍。这一现象明确表明,AI 已成为聪明资本和顶尖创业者的共同选择。

然而,AI 的根本架构—"数据 + 模型 + 算力"正面临结构性瓶颈。AI 模型性能的核心驱动因素并非算力优势或算法突破,而是训练数据集的质量与规模。当前大语言模型来到训练数据枯竭的临界点。Meta 的 Llama 3 已基于约 15 万亿个 Token 进行训练,这一数据量已几乎耗尽整个公共互联网上可获取的高质量数据资源。尽管公共互联网数据量庞大,但这仅是冰山一角。市场普遍忽视的关键事实是:高价值数据大多被锁定在需要授权访问的私有系统中。公共互联网数据在所有数据中占比不足 0.1%。而这一问题超出了 AI 行业自身的解决能力范畴,需要借助区块链技术重构数据生产关系,建立全新激励机制,催化高质量数据的大规模涌现。

另一方面,今天绝大多数数据都被掌握在 Web2 科技公司的封闭生态系统中。人工智能的发展正面临数据墙的挑战,而这一壁垒的存在,正是因为这些企业深知数据的巨大价值。高质量的人工智能模型具有极高的经济回报,例如 OpenAI 的年收入已达到约 34 亿美元。而要构建优秀的 AI 模型,就需要大量的数据支撑,数据的获取往往需要支付高昂的成本。

例如,Reddit 每年通过销售数据获利约 2 亿美元,PhotoBucket 的图片数据每张售价在 1 至 2 美元之间,苹果的新闻数据交易更是达到了 5000 万美元。数据所有权已从简单的隐私偏好转变为重大的经济问题。在 AI 模型驱动大部分经济的世界中,数据所有权相当于持有未来 AI 模型的股权。#p#分页标题#e#

随着数据的商业化变得愈发普遍,数据访问的难度也在不断增加。许多平台开始调整服务条款和 API 政策,以限制外部开发者的访问权限。例如,Reddit 和 Stack Overflow 相继修改了 API 规则,使得数据获取变得更加困难。这一趋势正在扩展,那些掌握重要数据的平台正逐步走向封闭化。

然而,仍有一个群体可以自由访问这些数据,那就是用户自己。许多人并未意识到,在法律层面上,他们对自己的数据享有完全的所有权。就像将汽车停放在停车场,停车场无权随意处置车辆一样,用户在社交平台上存储的数据依然属于自己。

用户在注册时,通常会勾选“允许平台使用我的数据”的选项,这只是给予平台一定的授权,使其能够利用数据来运营服务,但并不意味着用户失去了对数据的所有权。

事实上,用户可以随时申请导出自己的数据。即使平台对开发者的 API 访问进行了严格限制,个人用户仍然可以合法获取属于自己的数据。例如,Instagram 允许用户导出其账号数据,其中不仅包括发布的照片、评论,甚至是附带 AI 生成的营销标签。在 23andMe 平台,用户可以申请导出自己的基因数据,尽管平台可能不会主动提醒你这一点,且流程可能并不直观。

在全球范围内,相关法规正在不断完善,以确保用户能够顺利取回自己的数据。在数据价值日益突出的今天,用户需要充分认识到自己对个人数据的所有权,并积极行使这一权利。

02 VANA

声明:投资有风险,入市须谨慎。本资讯不作为投资建议。
本文链接: - 链补手