字数:约 9,281 字|预计阅读:17 分钟
有人从2800只股票里筛出20多只基因组学公司同周走强。他问的是轮动还是噪音,但更值得回答的问题藏在后面:人类读取生命代码这件事,走到哪了?
一个比答案更有价值的问题
最近海外投资社区有一条帖子,质量高于通常水平。
发帖人说自己筛了大约2800只纳斯达克股票,观察不同周期收益率、距52周高点的距离、相对成交量和离散度。筛完之后他注意到一件事——20到25只基因组学、DNA测序、分子诊断相关的股票,几乎在同一周接近或突破新高。
他没有问"该买什么"。
他问的是:"这是一个真实的板块轮动,还是我在随机波动里硬看出了图案?"
然后他自己又补了一层怀疑:很多名字价格涨了,但相对成交量没有明显放大,可能只是安静的漂移,算不上什么有意义的趋势。
我喜欢这个问题,因为它没有假装已经知道答案。
不过它也提示了一种更大的错位。基因组学确实是正在发生的人类进步,但资本市场每次突然"重新看见"它的时候,掺进去的东西远比科学本身复杂得多。我们不打算回答"这20只股票接下来会怎样"——这类问题既回答不了,也不该由一篇产业观察来回答。
我们准备做的事情是:把这个市场现象当入口,顺着它往后看三条速度完全不同的时间线。科学如何把生命变成可读取的数据,医学如何把数据变成对具体的人更早的诊断和更具体的治疗,资本市场又如何把一条跨越几十年的曲线塞进几周的价格波动。
不炒股的读者,后面的内容跟你的家庭也有关系。关注市场的读者,后面也会拆解为什么同向走强不等于产业拐点。
先从科学说起。
人类第一次读自己的生命代码,花了30亿美元
1990年,人类基因组计划启动。
国际合作、政府资助、专用设备、几千名科学家。根据美国国家人类基因组研究所(NHGRI)的介绍,这个项目按15年计划估算,初始预计成本约30亿美元。这不是一个实验室能做的事,甚至不是一个国家单独能做的事。
2003年,项目完成。人类第一次拥有了自己的基因组参考序列。
如果只理解为"花了很多钱读出了一串字母",那就把最重要的部分忽略了。人类基因组计划做的事情,是把生命科学的基础设施改了。在它之前,生物学研究很大程度上是各个实验室各自做各自的发现。在它之后,基因组数据变成了可以公开下载、反复分析、跨学科使用的公共资源。
这种"把生命变成可读取、可存储、可比较的信息"的思路——它是后面所有故事能够发生的前提。
一组值得被记住的数字
如果关于基因组学只留一组数字在脑子里,我觉得应该是这个。
NHGRI持续维护着一张DNA测序成本数据表,从2001年一直更新到近年。
2001年9月,测序一个人类大小的基因组,成本约为9526万美元。
2022年5月,同样的事——约525美元。
从9526万降到525。大约18.2万倍。
我不打算拿这个倍数去跟日常消费品作类比,因为日常消费品不存在这种量级的变化,任何类比都会显得不严肃。但可以这样想:如果你拿一样东西的价格在坐标轴上画线,大多数技术降本曲线是一条平缓向下的斜坡,偶尔出现一段陡坡。测序成本在2008年之后画出的那条线,接近自由落体。
NHGRI在数据页面上特别标注了:2008年1月之后,DNA测序成本的下降速度显著超过了摩尔定律对应的曲线。摩尔定律——半导体芯片上晶体管密度大约每两年翻倍、成本减半——已经是技术史上最被反复引用的降本参照系了。测序还跑得更快。
这跟不关心技术的人有什么关系?
关系在一个简单的逻辑:当一种测量工具从"只有国家级实验室才用得起"变成"临床检测机构开一张单子就能做",它能触及的人群就从研究队列里的几百人变成了医疗体系里的几十万人、几百万人。测序成本的坍塌改变的不仅仅是仪器市场的生意,它改变的是医学能提出什么问题——不再追问"能不能测",开始追问"测完之后怎么解读,怎么保护数据,怎么变成对一个人有用的临床决策"。
一张只画了92%的地图
有一个问题很少被提起。
2003年完成的那份人类基因组参考序列,主要来源于少数个体的DNA。这意味着几十亿人的基因组分析一直在拿少数人的数据当全人类的模板。
如果接触过地图学的历史就会明白这有多不对劲。一张地图选择对哪些区域投入最多的测量精度,就决定了哪些地方被充分理解,哪些地方在所有后续分析中被系统性忽视。基因组学的参考序列也是一张地图。当它主要来自欧洲裔个体的DNA时,一个非洲裔或亚裔患者拿着基因检测报告,他得到的检出率和解读准确性就可能天然打折。
这不是谁的恶意。这是数据从哪里来的问题。
2023年,Human Pangenome Reference Consortium发布了新的人类"泛基因组"参考。47名来自不同祖源人群的基因组序列。每个人有两套染色体,所以当前参考实际包含94条不同的基因组序列。最终目标是采集350人、700条序列。
一个值得停下来想一想的数据点:泛基因组参考纳入了此前缺失的约8%的人类基因组序列,增加了超过1亿个新碱基。
8%好像不大。但换个说法——如果一座城市的地图有8%的街区从来没被画进去,那些街区里有什么建筑、什么路口、住着什么人,你全部不知道。在那些区域发生的任何事情你都解释不了。
NHGRI的措辞很直白:使用单一参考基因组分析所有人的基因组,可能造成分析不平等。
泛基因组在做的事情,是让更多人群的生物学差异进入同一张地图。让"精准医学"这个词不只对部分人群兑现。
这一段跟任何一家公司的股价都没关系。它关系到的是:一个非欧洲血统的患者去做基因检测,拿到的结果能不能被合理解读。
测完之后,正在发生什么
很多人对基因组学的印象还停在"测了之后给你一份遗传风险报告"。这个印象不算错,但它大约是十年前的画面了。下面四件事,每一件都有公开的监管数据或正在进行的大规模研究支撑,不是概念展望。
血液里的癌症信号。 结直肠癌是全球高发癌症之一。早发现和晚发现之间的预后差距很大。但结肠镜需要提前清肠、侵入性操作、占用时间,很多人因为怕麻烦或者不适而一拖再拖。
一种叫Shield的体外诊断检测,2024年7月26日获得了美国FDA的PMA批准(编号P230009)。根据openFDA的记录,它检测的是血液中来自结直肠肿瘤的cell-free DNA甲基化改变和血红蛋白信号。适用范围:45岁及以上、平均风险人群的结直肠癌筛查。
有一个必须讲清楚的边界。FDA批准文本明确写着:阳性结果应接受结肠镜随访。它不是诊断性结肠镜的替代品,也不是高风险人群监测结肠镜的替代品。
所以这不是"抽个血就不用做肠镜了"的故事。它在现有筛查体系中增加了一条入口——对那些原本根本不会走进内镜室的人来说,一个门槛更低的血液检测或许能把他们纳入筛查覆盖范围。而灵敏度和特异度不可能是100%,假阳性带来不必要的焦虑和后续检查,假阴性带来虚假的安全感。这些限制跟好处同时存在。
从监管批准到大规模临床采用,中间还横着支付体系认可、临床路径调整、医患沟通更新等很多关卡。一个产品过了FDA跟它能被广泛使用是两回事。
但对一个具体的家庭来说,早几年发现和晚几年发现之间的差距不是医学论文里的百分比。是治疗方案的强度,是生活质量,是整个家庭几年甚至十几年的走向。
从读基因到改写疾病。 测序是"读"。基因编辑在尝试"改写"。
镰刀型细胞病患者的红细胞变形导致血管堵塞,反复发作剧烈疼痛,这种痛被形容为骨头里面在碎。输血依赖型β地中海贫血严重的情况下,患者终身每几周就要输一次血。两种病的根源都在血红蛋白基因的突变。治疗手段长期以来集中在症状管理:止痛、输血、防感染、排铁。
CASGEVY(通用名exagamglogene autotemcel)是一种自体基因编辑造血干细胞疗法。openFDA的药物标签显示,适应症包括12岁及以上、存在反复血管闭塞危象的镰刀型细胞病患者,以及12岁及以上的输血依赖型β地中海贫血患者。原理是把患者自己的造血干细胞取出来,在体外用基因编辑工具修改,再回输体内。目的是让患者自身能产生功能正常的血红蛋白。
对那些出生起就被这两种病困住的人来说,这类疗法跟终身管理症状之间的区别,不需要医学知识就能感受到。
但同一份标签也列出了"脱靶基因编辑风险"等安全性警示。这是一个非常诚实的提醒:基因编辑工具在目标位点之外的地方造成意外修改——这件事的长期后果目前不完全清楚,需要长期随访。再加上费用极高,全球大多数镰刀型细胞病患者集中在撒哈拉以南非洲,他们能不能接触到这种治疗是一个跟技术突破同样沉重的问题。
监管批准打开了一扇门。但门后面站着支付、可及性和长期安全监测。
新生儿等不起的那几年。 罕见病诊断的延迟是一个会让人安静下来的话题。在很多国家,一个罕见病患者从首次出现症状到最终确诊,平均要走过好几年,有时超过五年。反复就医,反复误诊,反复被告知"再观察"。对婴幼儿期发病的遗传病,晚几个月开始干预就可能意味着不可逆的损伤。
英国Genomics England正在进行的Generation Study,计划对100,000名新生儿的基因组进行测序,筛查200多种罕见疾病相关的基因变化。
项目对入选疾病有一条筛选标准值得注意:这些病通常在出生后头几年出现,早发现有可能改善结果,并且相关治疗在英格兰NHS体系中是可及的。
最后一条看起来只是操作细节,其实是一道伦理防线。如果测到了一种目前完全没有干预手段的疾病,给新手父母的主要产出可能是焦虑。所以筛查的前提不只是"技术上查得到",还有"查到之后这个家庭有路可走"。
这大概是这篇文章里离股票代码最远、离真实生活最近的一段。一个家庭少走三年诊断弯路、少跑十家医院、少经历几十次"查不出来"——这种差异不需要数据支撑,经历过的人自己知道。
当然,新生儿基因组检测不是普通体检。它可能揭示的信息远超当前能处理的范围。这份数据保存多久?谁能访问?孩子长大之后对自己的基因组信息享有什么权利?如果检测结果包含"未来也许会发病但现在不确定"的风险信号,该不该告诉父母?怎么告诉?每一个问题都还在被讨论,没有标准答案。
读完DNA还得理解蛋白质。 基因组告诉我们遗传信息怎么写的,但遗传信息发挥功能主要靠蛋白质。一个基因突变怎么导致具体的疾病,很多时候要搞清楚它编码的蛋白在三维空间里是什么形状、怎么跟别的分子互作、什么条件下折叠会出问题。
过去确定一个蛋白的三维结构需要X射线晶体学或冷冻电镜,一个结构可能花几个月到几年。
2022年,Google DeepMind和EMBL-EBI合作维护的AlphaFold数据库更新到超过2亿个蛋白结构预测,覆盖了几乎所有已编目的蛋白。这些结构数据可以批量下载,已经在被用于药物发现、疾病机制研究、被忽视热带病等方向。
测序让读取生命文本变得越来越便宜。AI让推测蛋白质形状和互作方式变得越来越快。两种能力叠加起来的长期影响可能很大。
但"长期"这个词在这里不是客套。从一个AI预测出来的蛋白结构到一个患者手上拿到的药,中间依然隔着实验验证、动物模型、三期临床试验、监管审批和支付准入。AI确实加速了"从数据到假说"这个环节。但后面的验证成本不会消失,每一步都可能要几年时间,每一步都有失败的可能。
那些股票说明了什么,又说明不了什么
到这里可以回到开头那个问题了。
我们参考了2026年6月26日前后的公开市场数据(来源Yahoo Finance图表端点),只用来说明一个现象确实存在,不做任何方向判断。
大背景:近三个月,SPDR标普500 ETF(SPY)涨约13.3%,纳斯达克100 ETF(QQQ)约23.3%,罗素2000小盘股ETF(IWM)约21.5%,SPDR生物科技ETF(XBI)约25.5%,ARK基因组学革命ETF(ARKG)约56.3%。
一眼就能看出来的格局:市场整体在修复。小盘股比大盘强。生物科技比大盘强。基因组学主题又比生物科技整体更强。在Reddit帖子提到的那些具体名字里,三个月涨幅从百分之二三十到超过百分之一百不等,大部分站在50日和200日均线上方。
这说明什么?
能说明的:确实有一批基因组学、测序、诊断相关公司在同向走强。发帖人没有在噪音里产生幻觉。
说明不了的东西更多。
往远了讲,它没法告诉你这是不是"产业拐点"。往近了讲,它也没法告诉你明天或者下月这些名字还走不走。
XBI、IWM这些宽基ETF同步走强,提醒了一件事——这轮上涨不只是基因组学自己的故事。小盘成长股整体在修复,生物科技整体在修复,利率预期的变化让长久期资产(现金流或利润预期在较远未来的公司)的估值弹性被放大。这些因素本身就能让一批公司同步涨跌,跟它们各自的基本面是否恰好在同一个时间点改善关系不大。
还有ETF结构的问题。ARKG这类主题型ETF如果有资金流入,它要按权重去成分股里下单。做测序仪器的、做液体活检的、做基因编辑的、做生物信息平台的——业务方向差别很大的公司,会因为坐在同一只ETF的持仓里而表现出高度同步的价格运动。这种同步性来自资金管道结构,不来自经营拐点。
另外一层容易被忽略的问题是:科学进步跟公司经营之间的距离。测序成本降18万倍是已经发生了的技术事实。但一家具体公司能从中赚到多少钱,取决于定价权、客户结构、耗材模式、竞争格局和管理层执行力这些非常世俗的变量。一个产品获得监管批准,到季度收入走到盈亏平衡——中间可能还有好几年的商业化爬坡。把FDA批准当作利润确认来理解,差距可能很大。
最后,长久期资产的估值天然波动大。利率预期往下走一点,它们的估值往上弹一截。利率预期往上走一点,又回去了。这种波动跟产业基本面是否在改善可以完全脱钩。
所以那个诚实的疑问——"真实轮动还是噪音"——大概率两者都有。同向走强是事实,基因组学的长期进步也是事实。但从后一个事实里推导出前一个事实的合理性,中间需要穿过的因果链条比直觉上想的长得多。
四条速度完全不同的线
如果这篇文章能留给读者一个思考工具,我希望是这个。
科学时间线、临床时间线、支付时间线和市场时间线,各走各的速度。大部分时候它们是不同步的。
科学最快。测序成本20年降18万倍。泛基因组2023年发布。首个完整无缺口的人类基因组序列2022年由Telomere-to-Telomere Consortium用长读长等新技术完成——读到了此前短读长测序无法解析的重复区域和结构变异。AlphaFold在同一年覆盖了2亿蛋白结构。这些进步留下了可下载可复现的数据。
临床慢一个量级。从实验室里能做到,到临床试验验证安全有效,到监管批准,通常5到15年。基因编辑从CRISPR-Cas9在2012年被发表到CASGEVY获批上市,用了超过十年。多癌种液体活检早筛、更多适应症的基因编辑、基于基因组的个体化用药,眼下还分布在临床试验的不同阶段。
支付可能是最慢的。产品过了FDA或拿到CE认证,不等于能被大规模使用。医保或商保覆不覆盖?报销比例多少?医院愿不愿意为此改变现有临床流程?不同国家的卫生经济学评估有没有可能得出相反的结论?定价极高的基因编辑类疗法,支付谈判可能拖上数年。支付体系大概是基因组学整个叙事里面最不起眼、但最能决定实际可及性的那个环节。
市场最短。几周之内可以把一个5到10年的技术愿景定到价格里,也可以在下一个季度把它全部吐出来。2020到2021年零利率环境下的估值扩张,2022到2023年加息周期里的估值收缩,然后是利率预期再次变化之后的估值修复——整个过程里,科学进步没有停过一天,临床试验照常推进,支付谈判也在继续。但价格信号跟这三件事之间的时序对应关系,远没有表面看起来那么紧密。
四条线画在一张图上,交叉点不多。科学持续向前推的时候,股价可能在跌(因为在加息)。股价猛涨的时候,关键的临床验证可能还没做完。临床获批之后,支付准入可能再拖两三年。
"20只股票同时动了"背后最值得理解的事情不是它在预告什么结果,而是四条线在某个窗口期碰巧对齐了一小段。对齐不会持续太久。它们会再次分叉。
不能被省略的那些卡点
写到这里应该诚实列一下,从实验室里的"能做到"到普通人的健康真正被改变之间,还有什么硬障碍。列出来不是泼冷水的意思,是帮助校准预期。
解读。 测序越来越便宜,但基因组数据的解读依然昂贵、复杂,充满不确定。人类基因组约30亿碱基对,大部分功能尚不完全清楚。检测发现了一个变异之后,判断它到底是致病、可能致病、意义不明还是良性,需要大量人群频率数据、功能实验和临床关联证据。"意义不明变异"在基因检测报告里占比不低,给医生和患者带来的困扰都是实实在在的。
数据伦理。 基因组数据跟密码不同——没法重置。你的基因组信息天然涉及你的血亲:父母、子女、兄弟姐妹的遗传特征被部分揭示。防止基因组数据被用于保险歧视、雇佣歧视或未经授权的研究,新生儿筛查数据的长期保管和使用权限,这些话题各国监管机构正在讨论,远没有到尘埃落定的时候。
公平性。 泛基因组是在缩小参考层面的人群偏差。但偏差不只存在于参考基因组里。它渗透在临床试验招募的人群构成、基因检测的定价、基因咨询服务的地理分布、医疗基础设施的覆盖面——每一个环节里。一种定价在几十万甚至上百万美元的基因疗法,如果对全球范围内最需要它的那群患者不可及,技术进步在公共健康层面的实际影响力就会被严重削弱。
监管的未完成。 在不同国家,基因检测面临不同的监管框架。实验室自行开发的检测在很多市场里监管灰度比较大。基因编辑疗法的长期随访要求仍在制定之中。多癌种早筛到底有没有临床效用——注意,这问的不是检测性能好不好,而是筛查完了之后患者结局是否真的改善——在很多适应症里还缺少大型随机对照试验的回答。
这些障碍不改变方向。但它们决定速度。
5到10年,可能和未必
比较可能的事。
液体活检在更多癌种的筛查中拿到更多监管批准或临床指南推荐。血液检测不会取代所有影像和内镜,但有可能变成分层筛查策略里的前置步骤:先用门槛更低的方式筛出高风险人群,再引导他们做更确定性的检查。对那些原本根本不会主动走进内镜室或者体检中心的人,这个前置步骤可能是早期发现癌症的唯一机会。
新生儿基因组筛查如果在Generation Study等项目中确认了净效益为正,可能在更多国家启动试点。筛查病种的范围会慢慢扩展,但只会纳入那些已有可行干预手段且早期干预明确获益的疾病。这个"慢"不是保守。对一个还没有任何行为能力的新生儿做基因组决策,谨慎本身就是责任。
基因编辑疗法可能从镰刀型细胞病和β地中海贫血扩展到更多单基因遗传病。体内基因编辑——不用取出细胞体外修改,直接把编辑工具递送到体内靶组织——是下一个技术前沿,也是安全性门槛更高的前沿,落地时间更加难以预测。
测序技术本身继续迭代。更长的读长、更高的准确性、更低的成本。便携式测序设备可能进入更多现场场景,感染暴发时的快速病原体鉴定就是一个已经在发生的应用。
AI在生物学中的角色从蛋白结构预测扩展到药物-靶点互作预测、基因调控网络建模、多组学数据整合。
未必那么快的事。
测序降到几十美元不会自动意味着所有人的健康都改善了。瓶颈不在测序这一步,在测序后面的解读、咨询、随访、治疗和支付,这是一整条链,链条里最便宜的环节降价不能解决最贵的环节没跟上的问题。
基因编辑在短期内还不太可能适用于大多数常见病。心血管疾病、二型糖尿病、大多数精神疾病——这些是多基因加环境因素的组合结果,复杂度跟单基因病完全不在一个层面。当前的基因编辑思路还集中在单基因靶点上。
隐私和伦理的问题不会被技术进步自动解决。恰好相反。技术越强大,数据越详细越敏感,伦理和隐私保护就越依赖主动的制度设计和公众参与。指望技术自己搞定这些事情是不现实的。
一轮市场行情也没法告诉你哪些公司将来会赢。测序仪器、液体活检、基因编辑、基因合成、生物信息平台——这些细分方向的竞争格局在5到10年内可能变得完全不同。
不看股票代码,这件事跟一个普通人的关系
一个从来不关注市场的人,基因组学的进步也可能在未来几年跟他的生活发生具体的交集。
如果家庭里有人被不明原因的疾病困扰多年,做了很多检查一直诊断不清楚,全基因组测序或外显子测序可能已经是一个现实中存在的选项,只不过你和你的医生还没正式讨论过它。罕见病之所以叫罕见病,部分原因只是过去的诊断工具不够灵敏、不够便宜。工具在变化,"罕见"的边界也在变化。
如果你是适龄的癌症筛查对象,未来面对的筛查选项可能不再只有影像和内镜,还会包括血液分子检测。它不替代其他手段,但可以是跟医生讨论筛查策略时多问的一层。
如果准备成为父母,新生儿基因组筛查在一些地区已经以研究项目或临床服务的形式存在了。遇到这样的选项时,同时需要理解检测结果的局限性和不确定性,以及你和孩子对这些数据长期享有的权利和承担的责任。
即使只是一个对世界如何运作感到好奇的人——蛋白怎么折叠、基因怎么表达、种群怎么分化、疾病怎么发生——30年前这些问题需要国家级工程才能触及。现在,很多原始数据是公开可下载的。好奇心的门槛从来没有今天这么低过。
回到开头那条帖子。
发帖人的直觉没有错。同向走强是在发生的事实。他的怀疑也没有错。他确实有可能在一组真实信号上过度读取了因果关系。
基因组学代表的进步不需要任何一周的涨跌来背书。人类基因组计划花了约30亿美元和13年。测序成本降了大约18.2万倍。泛基因组正在把更多人群纳入同一张地图。血液检测和基因编辑疗法各自带着各自的边界进入了临床。新生儿筛查正在十万人规模上被严肃地评估。AI正在加速对蛋白结构和疾病机制的理解。
这些事情已经发生了,跟某一周的价格曲线无关。
市场的信号之所以要谨慎看待,是因为它在做一件信息压缩的事——把一条横跨几十年的进步曲线塞进几周的价格波动,上面还叠加了利率预期、流动性周期、ETF资金流和风险偏好。把这种混合信号当作"产业拐点的确认"会出问题。但把它当作"纯粹噪音可以无视"同样不准确。
如果只把基因组学看成一组股票代码,我们会错过它真正重要的那个部分。
它让一个罕见病家庭有可能少等几年。它让一种曾经意味着终身输血的遗传病有了被从底层改写的可能性。它让癌症不一定非要等到长出症状、引发不适之后才被发现。它让更多人群的生物学差异被纳入同一张生命地图,而不是在分析中被系统性地忽略。
但越是这样的技术曲线,越需要边界、需要验证、需要隐私保护、需要公平的可及性设计。进步本身不自动等于每个人都能受益。从"技术上能做到"到"公平地惠及需要的人"——这段路比实验室里的突破漫长得多,也重要得多。
人类进步是真的。市场信号未必总是。大概合理的态度是对前者保持敬畏,对后者保持清醒,然后多关心一下那些真正可能被这条曲线改变命运的人。
*免责声明:本文为产业观察与公共知识内容,不构成对任何股票、ETF、基金、公司、产品或疗法的推荐。文中数据来源包括NHGRI、openFDA、Genomics England、DeepMind及公开市场信息。海外社区帖子仅作为选题入口,不作为事实证据。*