NIH 研究發現,HGMD Professional 的精確度比 AI 產生的資料庫高出 126%
由專家彙粹或人工智慧進行變異分類:哪種方法更適合臨床基因檢測實驗室?
雖然用於變異分類的人工智慧(AI)可以分析大量資料集,但它缺乏複雜、細緻的決策所需的人類洞察力。在臨床基因檢測中,準確性就是一切,專家決策仍然是黃金標準(Gold standard),確保可靠、前後相呼應的合理解讀。
在精準醫療不斷發展的背景下,基因檢測變得越來越重要,臨床基因檢測實驗室面臨著一個重要的決策:應該依賴專家彙粹的資料,還是利用人工智慧(AI)來進行自動變異分類?這兩種方法各具優勢與挑戰,理解它們的優缺點對於提供準確且具臨床價值的結果至關重要。
變異分類在基因檢測中的核心作用
多年來,變異解釋主要依賴經驗豐富的遺傳學家和生物資訊學家,他們通過手動審查科學文獻、資料庫和其他資源來分類基因變異,並確定其是否為良性(Benign)、致病(Pathogenic)或意義不確定的變異(Variant of uncertain significance , VUS)。然而,隨著基因體資料的爆炸性增長,僅依賴人工處理資料的方式變得越來越低效,進而推動了人工智慧解決方案的發展。
但在臨床環境中,能否完全依賴人工智慧來進行變異解釋呢?專家彙粹的資料是否仍是黃金標準?在接下來的內容中,我們將深入探討這兩種方法的優缺點,並介紹美國國家衛生研究院(NIH)進行的一項研究結果,該研究比較了四種熱門的文獻探勘工具在臨床變異管理中的效用。
人工智慧在變異管理中的應用案例
人工智慧提供了一個強大且可擴展的工具,來處理和分析日益增多的基因體資料。然而,儘管人工智慧能夠提升速度與效率,但它在某些關鍵領域仍有局限。
人工智慧的優勢
- 速度與效率:人工智慧能夠以前所未有的速度篩選來自多種來源的龐大資料集,包括科學出版物、資料庫及變異資料庫(如 ClinVar 和 HGMD)。機器學習演算法能快速識別模式並進行初步分類,顯著縮短分析大型資料集所需的時間。例如,處理上千個基因變異的時間可以從數天縮短至數小時。
- 大規模資料探勘:人工智慧能夠掃描龐大的公開資料庫,從中找出變異與臨床結果之間的相關性。這對於快速獲取最新研究文獻、變異資料及其相關臨床資訊非常有幫助。像 ClinVar 這類資料庫中包含大量變異的詳細記錄,AI 可以迅速掃描這些資料,並尋找與某特定變異相關的臨床證據。
- 持續學習能力:人工智慧模型具有自我學習的能力,隨著更多數據的輸入,AI 系統會逐漸改進。機器學習演算法能夠根據新資料更新其模型,從而提高未來的預測準確性。這意味著隨著時間的推移,人工智慧將能夠更加準確地解釋變異並提供更可靠的臨床建議。
人工智慧的侷限
- 缺乏上下文理解:人工智慧主要依賴統計模式和資料相關性進行判斷,而基因變異的臨床意義往往涉及到複雜的背景因素,例如患者的表型、家族史、遺傳模式和環境因素等。AI 難以充分理解這些細微差別。相比之下,專家能夠考慮到這些多層次的背景資訊,並做出更為準確的解釋。
- 資料品質的影響:人工智慧工具的效能取決於它們所訓練的資料。如果資料不完整、含有衝突資訊,或者已過時,AI 可能會錯誤分類變異。即便是使用如 ClinVar 這樣的資料庫,資料的品質不一樣,可能導致 AI 做出不正確的判斷。
- 難以處理罕見或新穎變異:解釋罕見或意義不明確的變異(VUS)是臨床遺傳學中最大的挑戰之一。人工智慧的模型通常依賴現有的資料模式,當面對新穎或罕見變異時,可能沒有足夠的支持證據來得出可靠的結論。而專家可以運用臨床專業知識和邏輯推理來解釋這些變異,即使是現有資料有限的情況之下。
專家彙粹在變異管理中的應用案例
儘管AI具有快速處理大量資料的優勢,但專家彙粹的方式在解釋複雜遺傳變異時仍然是不可或缺的。由人類專家進行彙粹能夠綜合背景資訊,特別是當需要進行細緻且多層次的決策時,專家知識往往能夠填補AI無法處理的空白。
專家彙粹的優勢
- 綜合背景資訊:遺傳變異的重要性通常取決於基因功能、遺傳模式、臨床表現等多方面因素,這些資訊往往涉及複雜的生物學與臨床背景。專家彙粹能夠將這些背景資訊整合進來,為變異的臨床意義提供更全面的解釋。
- 資料品質把控:專家能夠仔細審查資料的來源與品質,確保使用高品質的科學文獻與資料進行變異解釋。相比於人工智慧快速處理的模式,專家能對資料進行更細緻的過濾,特別是當資料存在衝突或不足時,專家可以根據其經驗做出判斷,篩選出最具可信度的證據。
- 精細的決策能力:某些變異的證據可能不完整或相互矛盾。在這種情況下,專家憑藉其專業知識和經驗,能夠做出精細的思考與判斷,運用臨床推理與科學洞察力對變異進行合理的解釋。這是目前AI無法完全替代的。
專家彙粹的局限
- 可擴展性有限:人類專家的數量和他們的處理速度無法輕易擴展。隨著基因檢測需求的增加,專家數量可能無法跟上變異數據的快速增長。這就是為什麼一些專家彙粹資料庫,如 HGMD professional,結合機器學習技術來大規模處理文獻,並由專家審查,確保分類準確性與一致性。
- 資源密集型:維持專家彙粹團隊需要大量的資源投入,包括專家的培訓、雇用和持續的專業發展。這對於較小的實驗室來說可能是一個挑戰,但像 HGMD Professional這樣的資料庫能提供經過專家審查的資料,幫助實驗室節省資源並確保變異分類的高準確性。
人工智慧與專家彙粹的比較
根據美國國家衛生研究院(NIH)的一項獨立研究,專家彙粹的資料在變異分類的精確度上比 AI 衍生資料庫高出 126%。這項研究由 NIH 精準健康研究中心的主任 Wermers 等人發表於《Genetics in Medicine》期刊,研究比較了四種文獻探勘工具對 50 個 RYR1 基因變異的分類效用,這些工具包括 QIAGEN 的 HGMD Professional專業版、Genomenon® Mastermind®、ClinVar 和 LitVar2。該研究強調了在臨床變異解釋中,專家彙粹的資料庫能夠提供更高的準確性,尤其在面對複雜或具挑戰性的變異時,專家所提供的洞察力是無可替代的。
資料來源
https://www.gimjournal.org/article/S1098-3600(24)00016-9/abstract
https://digitalinsights.qiagen.com/news/blog/clinical/expert-curation-vs-artificial-intelligence-for-variant-classification-which-approach-is-better-for-clinical-genetic-testing-labs/