|
亲爱的FLOWER,加入流式中文网,一起讨论,一起学习,享受更多福利吧!
您需要 登录 才可以下载或查看,没有账号?加入流式中文网
×
在生物医学领域,科学家们一直试图理解细胞如何通过空间位置和分子表达“交流”。传统单细胞技术(如流式细胞术)虽能分析细胞特性,却像听单音节单词——丢失了细胞间的“对话语境”。最新发表于预印平台的研究《Spatial Coordinates as a Cell Language》提出突破性框架 Spatial2Sentence,首次将细胞空间坐标转化为“语言”,让AI听懂细胞群体的完整故事。
一、为何要教AI理解细胞的“空间语言”?
传统单细胞分析存在两大瓶颈:
1. 空间盲区:现有模型(如scGPT、C2S)仅分析基因/蛋白表达量(如CD4+ T细胞活化标志物CD25),却忽略细胞在组织中的物理位置。而肿瘤微环境中,免疫细胞与癌细胞的“贴身距离”直接影响免疫治疗效果。
2. 孤立分析:模型将每个细胞视为独立个体(如单独分析记忆T细胞或肿瘤细胞),无视细胞群体间的相互作用(如T细胞-B细胞协同活化)。这导致临床预测准确率受限——在糖尿病数据集上,现有模型细胞分类准确率仅36.37%。
二、如何将细胞坐标转化为“句子”?
Spatial2Sentence 核心技术分为三步:
三、结果突破:空间信息让AI诊断能力飞跃
1、细胞分类准确率提升5.98%
- 在糖尿病数据集上:
- Spatial2Sentence 细胞类型分类准确率达41.35%(vs scGPT的32.45%)
- 临床状态(糖尿病vs健康)预测准确率64.12%,提升4.18%
- 在脑肿瘤数据集(胶质瘤vs脑转移)中:
- 成功捕捉脑转移灶中M1样巨噬细胞扩增现象,与临床发现一致:
> “M1-like MDMs在脑转移患者中比例激增,与肿瘤免疫微环境重塑相关”
2、空间信息贡献量化
- 移除空间邻近句子 → 细胞分类准确率下降3.19%(脑肿瘤数据集)
- 随机替换空间距离计算 → 准确率暴跌至48.12%(证明欧氏距离不可替代)
3、多任务学习优势显著
联合预测细胞类型和临床状态时:
- 糖尿病数据集:多任务比单任务细胞分类精度提升3.44%
- 模型学会利用“β细胞减少+免疫细胞浸润”空间模式联合诊断糖尿病
这项技术已开源(GitHub: UNITES-Lab/Spatial2Sentence)。当AI不仅读懂细胞“单词”,更能理解它们的“空间对话”,人类距离解密疾病密码又近了一步。
参考文献:https://arxiv.org/abs/2506.01918 |
|