全球癌症新聞

《自然》:癌症液體活檢大突破!利用人工智能分析血液微生物DNA可以檢測癌症

原文转自奇點網

微生物無處不在,與人體健康也有著千絲萬縷的聯繫。

近日,加州大學聖地亞哥分校的Gregory D. Poore和Rob Knight等使用機器學習分析了癌症基因組圖譜(TCGA)中來自微生物的基因片段,發現僅靠這些微生物基因,就可以很好地區分出不同的癌種

甚至於一般靠ctDNA無法檢測的Ia~IIc期腫瘤,或者缺乏可檢測基因組改變的腫瘤,也能通過血液中的微生物基因也能很好的識別出來

這一研究發表在Nature上[1]。

(來自pxfuel.com)

人體中有不少腫瘤都跟微生物密切相關,比如幽門螺桿菌和胃癌、HPV和宮頸癌、腸道菌群和結腸癌等等。或許它們也可以用來診斷癌症。

研究人員對TCGA中,來自10481名患者,涉及33個癌種的18116份全基因組和全轉錄組數據進行了重新分析。此前也有人在TCGA的數據中研究過EBV、HPV等特定微生物與癌症的關係[2,3],也有人進行過小規模的系統性研究[4]。但大規模的系統性研究,這還是第一次。

在TCGA總共6.4萬億個測序結果中,有7.2%並非人類的基因,其中的35.2%來自細菌、古細菌或病毒,12.6%可以確定到屬。

不同癌症中來自微生物的DNA比例和可以確定到屬的比例

在不同腫瘤中,檢測到的微生物類型存在很大差別,比如HPV與宮頸癌、頭頸癌有關,一些梭菌屬的細菌和胃腸道的癌症相關等等。不少腫瘤樣本中的微生物都來自腫瘤生長的部位,像結腸癌中檢測到的微生物DNA,大多就來自糞便菌群。

分析中,研究人員還發現了一種新的與結腸癌相關的細菌—— 費氏桿菌,它的存在可以很好的把結腸癌和其它癌症區分開來。

結腸癌中的細菌大多來自糞便菌群

利用這些數據,研究人員訓練了機器學習模型來區分癌症的類型和分期。在判斷參與者有沒有患癌症,患的是哪種癌症上,基於組織微生物的機器學習模型表現十分良好,曲線下面積大多在0.9以上。

對腎上腺皮質癌的曲線下面積達到了0.9999以上,接近完全準確

不過對於腫瘤的分期,微生物DNA的區分效果並不好,僅能在結腸癌、胃腺癌和腎透明細胞癌中區分I期和IV期腫瘤,對於其它腫瘤類型的分期都無法區分,也無法區分II期、III期的腫瘤。

由於TCGA中採集樣品的時候並沒有嚴格控制微生物污染,表皮葡萄球菌、痤瘡丙酸桿菌、分歧桿菌等微生物經常混入TCGA的樣本中[5],研究人員又通過最嚴格的生物信息學淨化處理排除了這些污染的影響只留下了肯定來自組織樣本的大約10%的微生物數據。而僅靠這10%的微生物數據,機器學習模型也足以區分出不同的癌症患者了

腫瘤組織裡的微生物特徵可以很好的區分各種癌症,但要是用於檢測就有些多此一舉了。那能不能通過血液來檢測呢,就像液體活檢一樣?

研究人員使用同樣的方法對TCGA中血液樣本的全基因組數據進行了分析。在嚴格排除了可能存在的微生物污染後,研究人員發現,來自血液的微生物DNA(mbDNA)同樣可以區分出很多種癌症,曲線下面積也大多在0.9以上

而且研究人員發現,對於通過ctDNA無法檢測的Ia~IIc期腫瘤和無可檢測基因組改變的腫瘤,通過mbDNA也能很好的識別

通過mbDNA可以很好的區分多種癌症

(FD為全數據,LCR、APCR、PCCR、MSF是依次逐漸嚴格的去除污染後的結果)

隨後,研究人員招募了59位前列腺癌患者、25位肺癌患者和16位黑色素瘤患者,以及69名健康人,採集了他們的血樣,使用機器學習模型進行了分析。

在單獨區分前列腺癌或肺癌患者和健康人時,機器學習模型分別達到了87.5%和91.5%的準確度,識別出來89.8%和88%的前列腺癌和肺癌患者,對黑色素瘤的判斷也有80%的準確度當把這100名癌症患者和69名健康人混在一起時,機器學習模型也能將其中71%的人正確診斷

通過血液樣本中的微生物,169人中的71%被正確診斷

除了用於癌症診斷外,這一研究還可能改變癌症的治療。論文作者之一的Sandrine Miller-Montgomery表示:“這種對微生物種群隨癌症變化方式的新認識可能會開闢一條全新的治療途徑。我們現在知道微生物在那裡,但它們在做什麼呢?我們能否操縱或模仿這些微生物來治療癌症?”

參考文獻:

1. Poore GD, Kopylova E, Zhu Q, et al. Microbiome analyses of blood and tissues suggest cancer diagnostic approach[J]. Nature, 2020: 1-8.

2. Cancer Genome Atlas Research Network. Comprehensive molecular characterization of gastric adenocarcinoma[J]. Nature, 2014, 513(7517): 202-209.

3. Analytical BS, Barretos CH, Cancer Genome Atlas Research Network. Integrated genomic and molecular characterization of cervical cancer[J]. Nature, 2017, 543(7645): 378.

4. Tang KW, Alaei-Mahabadi B, Samuelsson T, et al. The landscape of viral expression and host gene fusion and adaptation in human cancer[J]. Nature communications, 2013, 4: 2513.

5. Robinson KM, Crabtree J, Mattick JSA, et al. Distinguishing potential bacteria-tumor associations from contamination in a secondary data analysis of public cancer genome sequence data[J]. Microbiome, 2017, 5(1): 9.

頭圖來自pxfuel.com