第一章:为何生物数据正成为现实世界资产资本
2025/12/1
1.1 资本演进
纵观经济史,资本总是持续流向最具生产力且可衡量的源泉。每一次重大的技术或制度飞跃,都会催生全新的资本类别,并从根本上重塑市场与价值捕获的方式。在农业时代,土地成为首个被普遍认可的资本基础,其生产力能直接转化为经济实力(Smith, 1776)。工业时代则诞生了工厂股权和公司股票等新资本形式,实现了前所未有的工业规模化(Chandler, 1977)。全球贸易时代,在通信网络与互操作性银行系统(如SWIFT)的推动下,外汇本身也演变成一个庞大的资本市场(Eichengreen & Flandreau, 2010)。
随后,数字商业催生了新的资产类别:信用网络(如Visa、Mastercard)、可交易的数据副产品以及广告注意力流——所有这些都将信号转化为了资本(Zuboff, 2019)。过去十年间,一个清晰的模式已然显现:有价值的现实世界资产正在被搬上区块链。
房地产通过Propy和RealT等平台实现代币化;黄金等大宗商品以数字资产的形式呈现;艺术品作为NFT进行认证和交易;公司债券和国库券由Ondo和Securitize引入链上;发票和贸易金融工具通过Centrifuge实现代币化(Boston Consulting Group & ADDX, 2022)。
如今,发展的焦点再次转变。 生理传感器的改进、可穿戴设备的普及以及健康信号的数字化,已使人类生物学——这个此前难以交易且不透明的领域—— poised to become 经济价值创造的主导源泉。
到2025年,全球可穿戴技术市场规模预计将达到842亿美元,年增长率达13.6%,其中医疗保健领域占据主导地位(Grand View Research, 2024)。今年,将有超过5.9亿台可穿戴设备出货,产生至少1.5万亿条独立的健康记录(Market.us Scoop, 2025)。先进设备如今不仅能捕捉步数或卡路里,还能以临床级精度持续记录心电图、血氧水平、血糖、压力指数甚至睡眠周期。
健康领域的经济利益极为庞大。全球健康数据与分析市场年增长率超过22%,2024年达到2880亿美元,预计六年后将飙升至9460亿美元。以患者为主导的细分领域——如家庭监护和移动诊断——正占据最大份额,这与个体日益重视自身数据价值的趋势相符(Grand View Research, 2024)。
1.2 生物数据的实质
生物数据并非单一类型的信息。它包含八个不同类别的生物信号,共同描绘出人类健康与生理状态的完整图景。这八大关键生物数据领域包括:
1. 生理数据——生命体征、心率变异性、呼吸 心率、血压、呼吸频率、心率变异性、血氧饱和度。这些是生命的基础信号,由消费级可穿戴设备、医疗设备和临床监护仪持续捕获。
2. 神经数据——脑电图、大脑活动 脑电波模式、认知状态、注意力水平、冥想深度。传统上仅在临床环境中捕获,如今通过Muse和Emotiv等消费级脑电图头带日益普及。
3. 睡眠与昼夜节律数据——快速眼动睡眠、深度睡眠、入睡潜伏期 睡眠结构(浅睡、深睡、快速眼动期)、入睡潜伏期、觉醒时段、昼夜节律一致性。是最常被追踪的生物数据类别之一,每年产生数十亿晚的睡眠数据。
4. 生化数据——血液、唾液、DNA、激素 血糖、胆固醇、激素水平(皮质醇、褪黑激素、睾酮)、代谢物、遗传标记。属于高价值的临床级数据,通常需要实验室分析或专用传感器获取。
5. 行为数据——压力、情绪、运动 身体活动模式、久坐时间、应激反应、情绪状态、行为惯例。通常源自运动传感器、自我报告及相关的生理数据。
6. 环境数据——空气、噪音、光线 影响健康的环境条件:空气质量、噪音水平、光照暴露、温度、海拔。越来越多地由智能家居设备和带环境传感器的可穿戴设备捕获。
7. 影像/诊断数据——核磁共振、超声波 医学影像数据、X射线、CT扫描、超声波、病理切片。属于临床级视觉数据,需要专用设备,但信息密度极高。
8. 生活方式/人口统计数据——习惯、历史 年龄、性别、地点、饮食模式、用药史、家族病史、吸烟状况、职业。作为背景数据,能使其他生物信号变得可解读,并对研究产生价值。
这八个类别代表了人类生物信号的完整集合,它们具有以下特点:
可连续或定期测量
与健康状况存在因果关联
是任何声称具有预测有效性的AI健康模型所必需的
对制药、研究和人工智能机构具有价值
1.3 生物数据何以成为现实世界资产
传统的现实世界资产代表外部价值:您可以居住的楼房、可以持有的黄金、承诺兑付的债券。生物数据则 fundamentally 不同。
个人生成 每个人都在所有八个领域持续不断地产生生物信号。每晚的睡眠模式、每次心跳的心律、每个念头的神经活动、每餐饭的代谢信号、每时每刻的环境暴露。与房地产或大宗商品不同,生物数据不需要开采、制造或机构创造——个体仅凭生存即可持续产生。
不可替代 您的睡眠结构是独一无二的。您的心率变异性特征、压力反应模式、昼夜节律、基因构成,皆是如此。这些信号无法被复制、购买或替代。一处房地产尚有可比替代品,而生物数据是唯一的——只有您能产生您特有的生物模式。
聚合后价值呈指数增长 单个人的睡眠数据价值有限——对研究人员而言,每年可能价值50至200美元。但若将一万个经过验证的、涵盖所有八个领域的数据集聚合起来,其价值将呈非线性倍增。群体层面的洞察随之涌现:
睡眠质量如何与代谢健康相关联(领域3 + 4)
环境因素如何影响心脏功能(领域6 + 1)
神经模式如何预测压力反应(领域2 + 5)
哪些遗传标记与睡眠障碍相关(领域4 + 3 + 8)
个体的生物信号只是数据点。跨多个领域聚合的、经过验证的生物信号,则能形成价值数百万美元的市场。
法律上归个人所有 在大多数司法管辖区,健康数据默认归个人所有。欧盟《通用数据保护条例》第9条将健康数据归类为“特殊类别数据”,要求获取明确同意(European Parliament & Council of the European Union, 2016)。美国《健康保险携带和责任法案》授予个人访问和控制其健康信息的权利(U.S. Department of Health & Human Services, 1996)。类似的框架正在亚洲和拉丁美洲涌现。这并非区块链“您拥有自己的数据”的意识形态,而是现行法律。
用户已然拥有法律所有权,他们所缺乏的,是行使这一权利的经济基础设施。
经济上未充分利用 尽管拥有法律所有权,但如今生物数据几乎不为个体创造任何经济价值。这些数据沉睡在:
可穿戴公司服务器(Apple Health, Google Fit)——捕获领域1、3、5、6
临床系统数据库(Epic, Cerner)——存储领域4、7、8
研究机构存储库——持有领域2、4、7
制药公司档案——控制领域3、4、7
用户在全部八个领域创造了数据,机构将其货币化,而用户却未获得相应回报。
这正是区块链RWA基础设施可以解决的效率低下问题。
1.4 需求已然存在
对经过验证的人类生物信号的需求,此刻就已大规模存在,遍及多个行业——并且涵盖了所有八个生物数据领域。
制药公司需要真实的患者信号进行药物验证 一家睡眠药物制造商在测试新失眠疗法时,需要5000个经过验证的、结合以下内容的数据集:
睡眠结构(领域3)
睡眠期间的心脏功能(领域1)
皮质醇和褪黑激素等生化标记物(领域4)
用于队列分析的人口统计与历史数据(领域8)
每种获批药物的临床试验平均成本高达13亿美元,从发现到上市需10至15年(DiMasi et al., 2016)。获取经过验证、获得同意、跨领域的真实世界数据,可将试验成本降低20%至40%,并加快审批流程(Wouters et al., 2020)。
当前制约:缺乏跨多个领域、在适当同意和质量验证下,规模化获取此类数据的方法。
AI实验室需要经过验证的训练数据来构建可靠的健康模型 一家构建综合健康诊断模型的AI公司,需要数十万个跨领域的标记记录:
睡眠模式(领域3)
神经活动(领域2)
生理生命体征(领域1)
生化标记物(领域4)
行为模式(领域5)
使用合成数据或未经验证的爬取数据进行训练,会产生听起来权威却无法通过临床验证的模型。美国食品药品监督管理局已加强对基于AI/ML的医疗设备的审查,要求提供训练数据质量与代表性的证据(U.S. Food & Drug Administration, 2021)。
当前制约:缺乏能够提供具备可靠来源、跨多个领域的已验证生物信号训练数据的市场。
设备制造商需要多样化的人群数据进行校准 一家推出追踪睡眠、压力和心脏健康的新可穿戴设备的公司,需要针对不同人群特征校准算法,涉及:
生理基线(领域1)
睡眠模式(领域3)
压力反应(领域5)
环境背景(领域6)
人口统计差异(领域8)
若无此类多领域校准数据,设备可能对硅谷的25岁男性工程师有效,但对印度农村的55岁女性则可能失效。
当前制约:构建多样化、多领域的校准数据集,需要与睡眠实验室和研究机构建立昂贵的合作伙伴关系——过程缓慢、零散且规模有限。
研究机构需要可重复、符合伦理来源的数据集 一所研究睡眠质量与代谢健康关系的大学,需要10,000名以上参与者的数据,涵盖:
睡眠结构(领域3)
生化标记物(领域4)
行为模式(领域5)
人口统计背景(领域8)
传统的研究招募速度慢(数月到数年)、成本高(每位参与者500至2000美元)且地域有限。生物医学研究中的“可重复性危机”,部分原因就在于原始数据难以获取和数据来源不明(Ioannidis, 2005)。
当前制约:缺乏能够大规模、跨所有八个领域、许可访问经过验证、获得同意、纵向生物数据的基础设施。
市场规模是可量化的
睡眠障碍诊断市场:2023年全球规模78亿美元(Grand View Research, 2024)
AI健康训练数据市场:预计到2026年达到30至50亿美元
可穿戴设备市场:2022年为613亿美元,预计到2030年达1861亿美元(Fortune Business Insights, 2023)
临床试验成本:每年在患者招募和数据收集上超过480亿美元(IQVIA Institute, 2021)
精准医疗市场:2023年为965亿美元,预计到2028年达2178亿美元(MarketsandMarkets, 2023)
即使仅捕获该市场的1%至2%,也意味着将有数十亿美元的价值流经生物数据RWA基础设施。
这并非“将来时”,而是“现在时”。
1.5 经过验证的生物信号何以稀缺
生物数据大量存在——每天从可穿戴设备、医学检测和临床记录中产生数十亿小时的数据,覆盖所有八个领域。但经过验证的生物信号——即买家能够信任的数据——却异常稀缺。
技术稀缺性:真实的人类生理变异无法大规模模拟 AI研究人员能生成足以欺骗人类的合成人脸、合成语音和合成文本。但合成的多领域生物信号无法捕捉医学研究至关重要的边缘案例:
早期帕金森病期间,睡眠结构(领域3)如何变化,并与神经模式(领域2)产生关联?
糖尿病确诊前,亚临床代谢标记物(领域4)表现为何,当其与行为模式(领域5)相关联时?
昼夜节律失调(领域3)在不同遗传背景(领域4 + 8)和环境暴露(领域6)的轮班工人中如何呈现?
真实的人类生物学在所有八个领域都存在变异、噪声和边缘案例,这是合成模型所遗漏的。制药公司测试睡眠药物时,不想要“干净”的模拟数据——他们需要反映真实患者群体、跨越多个生理系统的、杂乱的真实世界信号。
FDA已指出,基于合成或非代表性数据训练的AI/ML模型,在真实临床环境中可能无法可靠运行(U.S. Food & Drug Administration, 2021)。
验证稀缺性:来源不明的数据毫无价值 一位分析10,000个同时包含心脏和生化数据的睡眠数据集的研究人员需要知道:
这些数据是来自佩戴认证设备并使用已验证实验室测试的真实人物吗?
还是由某人为骗取数据市场报酬而伪造的?
若所有数据源缺乏加密认证,买家将无法区分:
来自真实睡眠人类的Apple Watch睡眠数据(领域3)
由脚本生成的模拟神经数据(领域2)
来自在某人口袋中摇晃以伪造运动的数据(领域5)
从他人医疗记录复制的实验室结果(领域4)
由一人控制的多个账户的数据
一个多领域训练集中若有一个被污染的数据集,就足以损害整个AI模型。一项捏造的研究可能浪费数年的后续研究。验证并非可选项——它是可用数据与无价值数据之间的分水岭。
现有平台无一能跨所有八个领域解决此问题。消费者健康平台不提供硬件级认证。研究机构无法大规模验证实验室数据来源。声称解决此问题的区块链项目,并未真正在设备层面与硬件集成,或在机构层面与临床系统整合。
质量稀缺性:实验室级信号成本高昂且受严格控制 并非所有生物信号都生而平等——质量在八个领域间差异巨大。
消费级(易获取,保真度较低):
可穿戴睡眠追踪(领域3):设备附带免费
基本心率监测(领域1):设备附带免费
运动追踪(领域5):设备附带免费
环境传感(领域6):传感器50-200美元
实验室级(高保真度,昂贵,严格控制):
多导睡眠监测——专业睡眠研究(领域3):每晚1,000-3,000美元(American Academy of Sleep Medicine, 2023)
连续血糖监测仪(领域4):每月200-400美元
临床级脑电图(领域2):每次500-2,000美元
综合血液检测(领域4):每次500-2,000美元
基因测序(领域4):每个基因组1,000-5,000美元(National Human Genome Research Institute, 2023)
医学影像——核磁共振、CT扫描(领域7):每次500-5,000美元
这些高质量信号存在于所有领域,但受到严格控制:
医院和睡眠实验室(领域2、3、7)
临床实验室(领域4、7)
研究机构(所有领域,受机构审查委员会限制)
制药公司(跨多个领域的专有数据集)
研究人员需要这种跨多个领域的高质量数据,但无法规模化获取。临床机构出于责任担忧、缺乏同意基础设施和监管不确定性,不愿共享。
最高价值的多领域生物数据已然存在,但在功能上却难以获取。
1.6 制约因素
跨八个领域的、经过验证、获得同意、高质量的生物信号的供应量,与AI健康应用的需求相比,存在数量级上的不足。
考量以下差距:
供应方(现状):
数十亿人佩戴消费级可穿戴设备(捕获领域1、3、5、6)
数百万人每晚产生睡眠数据(领域3)
数十万人每年产生临床实验室结果(领域4、7)
数万人使用脑电图头带(领域2)
每个人都拥有 demographic 和生活方式数据(领域8)
零基础设施用于跨所有领域规模化地验证、授权和交易这些数据
需求方(当下,非未来):
制药公司每个药物试验需要5,000-50,000个经过验证的多领域数据集
AI实验室每个健康模型需要100,000-1,000,000个跨多个领域的标记生物信号
设备制造商每个产品发布需要10,000-100,000个多领域校准数据集
研究机构需要纵向数据集(对同一批个体跨所有八个领域追踪多年)
瓶颈在于: 问题不在于这八个类别中不存在数据。问题在于没有方法能够:
证明其真实性(所有数据源的可靠来源)
获得适当的用户同意(每个领域的细粒度权限)
评估其质量(每种信号类型的元数据和评分)
在无灾难性责任风险的情况下访问(分布式架构)
公平地补偿用户(能够评估多领域贡献价值的经济基础设施)
这正是RWA基础设施可以填补的结构性空白。
1.7 时机:为何是现在
四股力量正在汇聚,使得生物数据RWA不仅成为可能,而且不可避免——它们正助力实现跨所有八个领域的价值捕获。
1. 消费级设备现已能同时捕获多个生物数据领域 Apple Watch:领域1、3、5、6(全球超过2亿活跃用户) Fitbit:领域1、3、5(1.2亿用户) Whoop、Oura、Garmin:领域1、3、4、5(合计数千万用户) 脑电图头带(Muse、Emotiv):领域2(消费级神经追踪日益普及) 连续血糖监测仪:领域4(仅美国就有超过300万用户) 智能家居传感器:领域6(数亿台设备)
有史以来第一次,数十亿小时的多领域生物信号正由经过认证的设备持续捕获,而这些数据的合法所有者正是佩戴者本人。
捕获基础设施已经存在——并且它涵盖了生物数据领域的全谱。
2. AI健康应用亟需经过验证的多领域数据 2023-2024年标志着一个转折点。基础模型展现了多模态能力——包括健康和医疗应用。但这些基于合成或未经验证的健康数据训练的模型,其输出听起来权威,却无法通过临床验证。
更重要的是:先进的健康AI需要多领域整合。一个睡眠障碍检测模型需要领域1、2、3、4和8的数据;一个代谢健康预测模型需要领域1、3、4、5、8的数据;一个压力管理系统需要领域1、2、5、6的数据。
单领域数据是不足够的。多领域验证数据才能创造突破。
FDA已发布指南,强调基于AI/ML的医疗设备需要具有代表性、高质量的训练数据(U.S. Food & Drug Administration, 2021)。欧盟的《人工智能法案》将健康AI归类为“高风险”,要求验证训练数据来源并进行持续监控(European Parliament & Council of the European Union, 2024)。
AI实验室如今面临抉择:是继续使用未经验证的单领域数据进行训练并面临监管否决,还是寻找经过验证的多领域生物信号来源。后者目前尚不存在规模化的供应。
需求拐点已经到来。
3. 区块链基础设施使多领域代币化成为可能 五年前,对连续多领域生物信号进行代币化将成本高昂且技术不成熟。但如今:
IPFS提供大规模去中心化存储(可处理所有八个领域)
NFT标准支持富含元数据的代币化(可编码领域类型、质量评分、权限)
智能合约实现权限管理自动化(可指定共享哪些领域)
第二层解决方案降低交易成本(使微交易可行)
跨链协议实现可组合性(整合来自不同来源的多领域数据)
技术基础设施已准备就绪,能够处理八个独特生物数据类别在捕获方法、质量标准和权限要求方面的复杂性。
4. 用户希望控制并获取其全部生物数据的补偿 Web2平台曾训练用户接受:“您在所有领域生成数据,我们拥有并将其货币化,您则获得免费服务。”
这种社会契约正在破裂。GDPR赋予了用户对所有个人数据类别的合法权利(European Parliament & Council of the European Union, 2016)。高调的数据泄露事件——剑桥分析(2018)、23andMe撞库攻击(2023)——让用户意识到他们跨所有领域的数据具有价值。Web3则引入了个人应拥有并货币化其数字资产的理念。
用户现在会问:“如果我的睡眠数据对研究人员有价值,那我的心脏数据呢?我的实验室结果呢?我的遗传信息呢?为什么我不能控制所有这些数据并从中获利?”
文化觉醒的时刻已经到来——并且它涵盖了所有八个生物数据领域。
1.8 机遇所在
个体掌握着现存质量最高、尚未开发的生物信号库——涵盖所有八个领域。数十亿小时的睡眠数据、心脏节律、代谢信号、神经活动、环境暴露、医学影像、行为模式和人口统计背景——合法所有、持续产生、静待解锁。
但目前没有任何系统能够:
跨所有八个领域验证来源(证明数据来自认证设备、实验室和真实人类)
对每种领域类型进行质量评分(区分实验室级与消费级信号)
管理每个领域的细粒度同意(用户共享睡眠数据但不共享基因数据;共享心脏数据但不共享影像数据)
分散责任(避免集中式多领域存储带来的灾难性泄露风险)
实现直接补偿(价值根据数据领域质量与全面性流向用户)
此乃结构性空白,而非技术瓶颈。
可穿戴平台、临床系统、云存储乃至现有的RWA平台,其设计初衷均非针对多领域生物数据。它们优化的目标各异:消费者参与度、医疗服务交付、通用存储或金融工具。
多领域生物数据需要专门构建的RWA基础设施。
一种将跨所有八个类别的生物信号视为以下属性的基础设施:
现实世界资产(稀缺、有价值、可交易)
用户控制(加密所有权,而非平台空头承诺)
可验证(从设备到交易的全程认证,针对每个领域)
可授权(架构内置的每个领域的细粒度同意机制)
可组合(开发者可构建使用多个领域数据的应用程序)
此类基础设施目前尚不存在。
这正是 Matrix 致力把握的机遇。
并非作为另一款可穿戴应用。并非作为另一个健康平台。并非作为另一个数据市场。
而是作为个人生物数据RWA的区块链主网——将跨所有八个领域的人类生物学转化为可验证、可交易、用户控制的数字资产的基础设施层。
需求存在。供应存在。技术存在。时机已然汇聚。
缺失的,正是能够在毫不破坏信任的前提下,将它们连接起来的基础设施。
1.9 这意味着什么
生物数据并非未来的资产类别。它是一种现存的资产类别——涵盖八个独特的、可衡量、有价值的领域——却从未被恰当资本化。
用户每日都在所有领域产生它。机构迫切需要它来获得多领域洞察。价值流经那些既未创造数据也不拥有其合法权利的中介机构。
RWA模式——获取有价值但管理低效的资产,并以更优的所有权、转移和货币化模型将其引入链上——完美适用于跨所有八个类别的生物数据。
事实上,生物数据或许是最自然的RWA类别:
跨多个领域持续生成(非如房地产般一次性)
默认在所有类别中归个人所有(非机构控制)
多领域数据聚合时价值呈指数增长(内置网络效应)
在大多数领域已完成数字化(无需物理至数字的转换)
涵盖人类生物学的全谱系(全面而非碎片化)
问题不在于“生物数据是否会成为RWA资产类别?”
问题在于“何种基础设施将使多领域生物数据能够作为现实世界资产实现规模化运作?”
Last updated