M痘疫情出現跨國傳播,CLC Genomics Workbench提供快速且自動化的分子分型鑑定分析流程
世界衛生組織(WHO)於8月14日針對近期一波跨國傳播的M痘疫情召開緊急委員會,並表示非洲疫情以剛果民主共和國為主。依據WHO及各國的監測資料顯示,今(2024)年全球M痘疫情緩步升溫,但非洲地區自五月起病例數明顯上升,主因是剛果共和國開始流行能快速傳播的Ib型病毒株。
M痘病毒(Monkeypox virus)屬痘病毒科(Poxviridae),正痘病毒屬(Orthopoxvirus),主要由嚙齒動物和靈長類動物傳播給人,為人畜共通傳染病。分子分型可分為第一分支(I)和第二分支(II)病毒,其中第二分支病毒包括IIa與IIb兩種子分支,後者為目前全球疫情主要的流行株。然而,此波跨國傳播是傳播力和致死率較為嚴重的第一分支Ib子型。從疫情防治的角度,針對Ib子型的流行病學監測工作儼然成為當前最重要的任務。
Figure 1. 以CLC Genomics Workbench建置M痘病毒基因體參考序列資料庫及分子分型鑑定流程
分子分型的流行病學監測仰賴全基因體定序技術來鑑定M痘病毒的子型,且需要來自世界各地的病毒株序列建置成比對的資料庫,以進行感染源的溯源分析。由QIAGEN開發用來分析基因體定序資料的軟體-CLC Genomics Workbench,提供了監測工作所需的分析工具。2022年12月發表的一篇文章 [1],實現了以該軟體建置監測工作所需的病毒序列資料庫及快速完成子型鑑定的分析流程(Figure 1)。本篇介紹該文章是如何透過CLC Genomics Workbench完成鑑定分析工作。
首先,自NCBI收集M痘病毒基因體序列資料(n = 218),並以Whole Genome Alignment (WGA) 工具比較序列間的相關性。Figure 2 顯示 218株M痘病毒基因體具同線性(synteny)的保守序列區域(conserved genomic regions)。
Figure 2. 以WGA比較M痘病毒基因體序列後得知具同線性(synteny)的保守序列區域(conserved genomic regions)
Figure 3則為218株M痘病毒基因體序列的平均鹼基相似度(Average Nucleotide Identity, ANI)及比對百分比(Alignment Percentage, AP)。ANI結果顯示218株M痘病毒基因體序列有比對上的區域,鹼基相似度兩兩相比皆超過99%;AP則顯示比對一致的區域長度佔定序序列總長度的88%,觀察到的12%的差異主要源自於基因體的末端(distal ends)。
Figure 3. 以WGA比較M痘病毒基因體序列後得知兩兩基因體序列之平均鹼基相似度(average nucleotide identity, ANI)與比對百分比(alignment percentage, AP)。
作者進一步再依據平均鹼基相似度建構M痘病毒基因體演化樹,同時將時間、空間與宿主的資訊附加到演化樹上,揭露了M痘病毒不同 Clade 之間的關係(Figure 4)。其中 Clade 1與Clade 2分別起源於中非和西非, Clade 3則源自於Clade 2,係由2022年引發全球流行的M痘病毒株所組成。Figure 4B將M痘病毒株的分離年份、宿主及其國家分別附加演化樹,結果顯示1958年是為M痘病毒從哺乳類動物傳到人類族群的起始點,接著在2022年迅速從非洲傳播到歐洲各地及北美洲。
作者透過CLC Genomics Workbench內建的分析流程 – Analyze Viral Capture Panel Data Workflow以及內建的M痘病毒參考基因體資料庫,分析來自於黑猩猩(Chimpanzee)的病毒序列。該分析流程可以一鍵完成分析,內容包含確認最佳的基因體參考序列為何、自動執行序列比對和變異位點偵測,同時將變異位點所在的基因及所導致的氨基酸變化一併註解(Figure 5A)。
Figure 4.(A)以平均鹼基相似度(average nucleotide identity, ANI)所建構的不同Clades間演化樹。(B)於演化樹上附加M痘病毒株之收集時間、空間以及宿主的資訊。
後續透過演化樹的分析,作者發現人類和黑猩猩的M痘病毒株在基因體的序列有相當的差異(Figure 5B)。再以Identify Viral Integration Sites功能分析後發現,暫無證據能夠顯示M痘病毒可以鑲嵌到宿主黑猩猩的基因體上(Figure 5C)。
Figure 5.(A)深度定序由黑猩猩糞便中取得的病毒株,並以CLC Genomic Workbench自動化分析;workflow提供序列比對到參考序列的資訊,並給予變異位點及氨基酸變化的註解。(B)以來自人類及黑猩猩的M痘病毒株基因體序列所建構的親緣關係。(C)Virus Integration Sites分析顯示,在宿主黑猩猩的基因體中並未發現M痘病毒的插入位點(integration sites)。
另一方面,M痘病毒的基因體上存在反向末端重複序列(inverted terminal repetitions, ITRs)的區域,第二代定序技術由於讀長較短,定序讀長在ITR區域容易比對到多重位置,造成序列比對不專一。三代定序技術由於讀長較長,足以跨過ITR區域,因此可以反映ITR區域的真實序列,並偵測變異位點確切的位置。CLC Genomics Workbench同時支援一代、二代及三代的序列分析,能夠支持多種分析的需求(Figure 6)。
Figure 6. 以CLC Genomics Workbench分析自第二代、三代定序平台所定序的M痘病毒基因體資料。(黃色線段為比對到多重位置的讀長,藍色、紅色和綠色線段均為比對到唯一位置的讀長。)
2022年引發M痘病毒疫情的病毒株為IIb子分支,且IIb目前已分離到較多的亞型(subtypes),包括A.1、B.1及C.1等。然而,2024年這波跨國傳播,較多為Ib子分支的M痘病毒感染。鑑於其傳播力與致死率較其他病毒株亞型來得嚴重,病毒株分子分型的流行病學監測工作變得舉足輕重。CLC Genomics Workbench可依Nextclade所定義分支特有的變異來對分離到的M痘病毒進行鑑定並製作報告,在流行病學監測工作中提供莫大的幫助(Figure 7)。
Figure 7. 依Nextclade所定義分支特有的變異來對分離到的M痘病毒進行分子分型鑑定的結果。
參考文獻:
- Shen-Gunther J, Cai H, Wang Y. A Customized Monkeypox Virus Genomic Database (MPXV DB v1.0) for Rapid Sequence Analysis and Phylogenomic Discoveries in CLC Microbial Genomics. Viruses. 2023; 15(1):40. https://doi.org/10.3390/v15010040