翟巍巍/馬亮團隊提出空間細胞類型組分解析新算法——SONAR
2023年8月7日,必威精装版app西汉姆联 的翟巍巍/馬亮團隊在Nature Communications 發表了題為“SONAR enables cell type deconvolution with spatially weighted Poisson-Gamma model for spatial transcriptomics”的研究論文,提出了一項新穎的基於空間轉錄組數據解析空間細胞類型組分的算法模型,命名為SONAR。
生物體由各種類型的細胞組成,生物係統的結構功能和動態變化很大程度取決於細胞的空間分布,揭示和利用其規律對理解生命現象和探究疾病進化機製具有重要意義。當前,空間轉錄組測序(spatial transcriptomics)提供了強有力的手段,可以在保留空間信息的同時測量組織中的基因表達,從而為解析細胞的空間分布和功能提供了可能。由於受到空間分辨率的限製,此類技術的每個空間位點(spot)上的基因表達通常來自於多個細胞的混合。因此,需要通過有效的解卷積算法(deconvolution) 才能有效獲得細胞類型空間組成。目前已發表的對空間轉錄組數據解卷積的算法,或未能充分考慮轉錄組的高度稀疏、高噪聲等特性,或未能在解卷積過程中充分利用空間近鄰的相似性信息,在實際的應用中常常出現推斷錯誤或不穩健等問題。
作者提出的SONAR算法是基於空間加權回歸框架的概率模型,采用Poisson-Gamma 分布對空間轉錄組數據的原始計數進行建模,且可以根據空間轉錄組數據的特點對位置特異性偏移(location shift)和表達計數的過度離散(overdispersion)進行綜合可慮(圖1)。為了防止在高異質性的組織區域中過度使用空間信息(如,在跨結構邊界或腫瘤中,其細胞的空間構成可能發生劇烈變化),SONAR同時引入三個模塊(空間核函數、預聚類、彈性加權)對空間信息加以篩選並進行有效利用。
作者在大量具有不同局部特征(如主導類型細胞豐度/類型數量等)和不同全局特征(如空間分布/區域轉變模式等)的模擬集上,以及基於真實的單細胞精度空間轉錄組數據集(小鼠大腦/人類心髒數據集)上驗證了SONAR相較於其他算法在細胞組分解析準確性上的優勢。特別的,在諸多方法中,僅SONAR能夠解析心髒流出道區域上心神經脊細胞(cNCC)和雪旺祖細胞(SPC)的細微分布 (圖2)
作者將SONAR應用於具有高異質性的人類胰腺導管癌(PDAC)和人類肝細胞癌(HCC)數據中,刻畫了具有區域特異性細胞類型的空間分布。特別在HCC數據中,SONAR精細地揭示了在腫瘤/正常組織的過渡區域上,腫瘤微環境中的免疫細胞和成纖維細胞的共定位變化趨勢(圖3)。
綜上所述,作者開發了精準利用空間信息的解析空間細胞類型組分的新算法SONAR,設計並應用在具有不同空間模式的模擬集上,並在各類真實數據集上進行了解析和探索。隨著空間轉錄組技術的普及和細胞圖譜數據的不斷累積,SONAR將為解析生命過程和疾病進展、精確探索大規模空間轉錄組數據提供助力。
必威精装版app西汉姆联 研究生劉誌遠為該論文第一作者,馬亮副研究員與翟巍巍研究員是論文的共同通訊作者。該研究得到了國家科技部重點研發項目和國家自然科學基金委麵上項目等項目的資助。
原文鏈接: https://doi.org/10.1038/s41467-023-40458-9


圖1. SONAR算法工作流程圖

圖2. SONAR顯著提升了對大腦皮層的結構解析以及穩定識別出心髒的細微結構

圖3. SONAR肝髒腫瘤與正常組織過渡區域上免疫細胞和成纖維細胞的共定位趨勢
人類活動和氣候變化加速生物多樣性的減少,導致物種範圍的轉移、收縮和擴張。在全球範圍內,人類活動和氣候變化已對生物多樣性構成了嚴重威脅,目前已導致全球522種靈長類動物中約68%的物種麵臨滅絕風險。
植物病毒素有“植物頑疾”之稱,每年引起全球作物經濟損失高達4000億元。水稻作為人類重要的糧食作物之一,供給全世界一半以上的人口,主要種植於亞洲、非洲和南美洲等地區。

