分子數位產品資訊

QIAGEN ® Ingenuity Pathway Analysis 2024秋季更新

全新 RNA-seq 分析入口網站,搭配 Analysis Match Explorer 授權提供

我們推出全新的 RNA-seq analysis portal,讓資料分析更加簡單。從 FASTQ 檔案到路徑分析,現在只需數小時!無論您使用 QIAseq 還是其他主流 RNA 文庫製備套件(如 Illumina、Thermo Fisher、NEB),該入口皆能兼容並支援 20 種物種的分析,並運用已發表的主流算法進行處理。

 

透過這個網頁介面,您可以輕鬆將數據來自於SRA 或是 BaseSpace上傳至雲端(AWS),進行品質控制(QC),並將差異表達的結果直接推送至 IPA,快速進行生物學解讀。整個流程幾乎不需要人工干預,僅需 1-2 小時即可完成。

免付費專線 我想諮詢

要使用此功能,您需擁有 Analysis Match 和 Land Explorer 的授權。如果您具備這些授權,您將在 IPA 使用者頁面右上角找到 "Process RNA-seq data" 的按鈕,如圖 1 所示。
圖片
圖1:RNA-seq 分析介面連結。標題為”Process RNA-seq data”的連結以紅色虛線框顯示。僅供持有 IPA 中 Analysis Match 和 Land Explorer 授權的用戶使用。

 

RNA-seq portal將引導您利用三個簡單的步驟分析與查看數據,如圖2所示
圖片
圖2: 處理 RNA-seq 資料的三個簡單步驟。 1) 上傳,2) 比對和計算表現亮,3) 實驗設計,利用實驗設計來比較出差異表現量。

 

RNA-seq portal 分析流程

全新的 RNA-seq portal 提供了一個直觀且高效的數據處理平台,從原始的 FASTQ 檔案開始,到最終差異基因表達分析,只需經過幾個簡單步驟即可完成。以下是 RNA-seq 數據處理流程的詳細說明:

1. 數據上傳與預處理

首先,您可以將原始的 FASTQ 檔案從多種來源上傳至雲端(AWS)。無論您的數據來自 QIAseq、Illumina、Thermo Fisher 或 NEB 等主流的 RNA 文庫製備套件,該入口都能支持處理。此外,您還可以從 SRA(Sequence Read Archive)或 Illumina 的 BaseSpace 下載公開的研究數據,直接跳過數據上傳步驟。

這一過程透過入口的網頁介面進行,無需複雜的命令操作,適合各種背景的研究人員。系統會自動執行數據的品質控制,包括檢查數據完整性、讀取長度、定序品質等。這些品質控制過程可確保後續分析的準確性。

 

2. 對齊與計數

在數據上傳並通過初步品質控制後,RNA-seq portal將使用已發表且驗證的對齊算法(如 STAR、HISAT2 等)將您的讀數(reads)對齊至所選物種的參考基因組。這個過程會自動化地進行,無需使用者干預。

完成比對(alignment),系統會自動計算每個基因的讀數,生成 read counts 矩陣並將基因表達數據進行歸一化處理,排除低表達背景訊號。這個高效的處理過程通常可在 1-2 小時內完成。

 

3. 差異表達分析設置

完成對齊和計數後,您可以根據研究需求進行樣本分組(如基因敲除與對照組),設定差異表達基因(DEGs)的分析條件。系統會使用 DESeq2、EdgeR 等算法,計算每個基因的 fold change 和 p 值,生成差異基因結果。分析完成後,系統會自動生成火山圖、熱圖等視覺化結果,幫助您快速瀏覽基因差異。火山圖可以顯示顯著變化的基因,而熱圖則能幫助您觀察樣本間的基因表達模式。此外,RNA-seq portal還提供了 PCA(主成分分析) 圖,幫助您檢查數據是否合理地群聚在各自的樣本組中(圖4)。這樣的視覺化工具可即時幫助您進行品質控制與數據檢查,確保後續分析結果的可靠性。完成這些步驟後,您可以查看您的數據,如圖3所示
圖片
圖 3.RNA-seq portal「實驗視圖」的註釋視圖。將樣本根據實驗所設定的分組條件,可以進行基因差異表現量的分析。並且將差異表現量基因已

熱圖與火山圖的方式進行可視化。設定閾值,您可以將資料傳送到您的 IPA 帳戶進行路徑分析與生物解釋。

 

圖片
圖4.PCA(主成分分析)。每個樣本都標有屬於他們分組的關鍵屬性。理想情況下,就像本例中的「基因型」一樣,樣本可以根據其基因型清晰地聚集。 PCA 結果可以顯示樣本是否確實存在由組別差異驅動的 RNA 表現量差異,例如 IRF1 是否如本例所示被敲除(數據源自GSE215771)。

 

其他QC 工具

在RNA-seq Portal也有其他 QC 工具可依基因組區域(例如內含子、外顯子或基因間區域)、生物型(圖 5)或污染生物體的分類特徵(圖 6)進行繪製。
圖片
圖5. 依基因組區域(上)或以生物型(下)劃分的 RNA 作圖。RNA-seq portal 可以描述每一個樣本讀取在基因組(廣義)中的位置(上圖),以及 RNA類型(例如蛋白質編碼區或 lncRNA)的指標(下圖)。

圖片
圖 6. 污染 RNA 的定量。如果您的樣本被細菌序列污染,將提供此圖表來定量細菌類型。

除了上述功能,RNA-seq portal 還提供了多種數據共享選項。您可以與團隊成員分享數據集,生成文氏圖 (Venn-diagram)來比較不同實驗的基因重疊情況,或將數據傳送至 IPA 中進行核心分析。這使得多個實驗間的比較與分析變得簡單,讓您輕鬆獲得關鍵的生物學模式。

 

修正的同源基因群集

IPA 已更新同源基因的定義,在此版本之前,IPA利用NCBI HomoloGene 定義同源基因,但HomoloGene已在2014年停止更新,現在轉而採用NCBI 真核基因組註釋流程(NCBI Eukaryotic Genome Annotation Pipeline)中的新方法。這項變更影響了大約 10% 的同源基因,新的同源基因定義優於舊的定義。對於已經更改的同源基因,舊的同源基因將視為”棄用”,過去的分析可能需要重新運行,以確保您能受益於更精確、最新的基因定義。可利用右鍵單擊分析並選擇“重新運行分析”。

 

氣泡圖改進

當您自訂典型路徑(canonical pathway)氣泡圖以路徑類別為氣泡著色時,Reactome Pathways 將與 Ingenuity Signaling 和 Metabolic 路徑分開著色,如下圖 7 所示。
圖片
圖 7. 依路徑類別為典型路徑氣泡圖著色。現在,Reactome 路徑的顏色與 Ingenuity Signaling 和 Metabolic Pathways 不同。

 

內容更新

11 個新的 Ingenuity 訊號路徑

  • 親環蛋白訊號路徑(Cyclophilin Signaling Pathway)
  • 糖化訊號路徑(Glycation Signaling Pathway)
  • 乙型肝炎慢性肝臟發病機轉訊號路徑(Hepatitis B Chronic Liver Pathogenesis Signaling Pathway)
  • 腸躁症訊號路徑(Irritable Bowel Syndrome Signaling Pathway)
  • 肺離子平衡訊號路徑(Lung Ionic Balance Signaling Pathway)
  • 粒線體分裂訊號路徑 (Mitochondrial Division Signaling Pathway)
  • mRNA 3 端加工訊號路徑 (mRNA 3 Prime End Processing Signaling Pathway)
  • NAP1L1 轉錄調控訊號路徑 (NAP1L1 Transcription Regulation Signaling Pathway)
  • 核醣體品質控制訊號路徑 (Ribosomal Quality Control Signaling Pathway)
  • Sheddase 訊號路徑 (Sheddase Signaling Pathway)
  • TRIM21 細胞內抗體訊號路徑(TRIM21 Intracellular Antibody Signaling Pathway)

54個Reactome 路徑

GWAS 新發現

超過60,000項來自NHGRI-EBI資料庫的人類全基因組關聯研究(GWAS)結果現已整合到IPA中。這些資料中,所有能夠與基因相關的關係(而非位於基因間區域的變異)都已納入IPA中的“開放存取的全基因組關聯結果資料庫”。同時,約2,000項來自2009年的發現因不符合當前的標準被移除。

 

如圖8所示,展示了一個使用這些GWAS發現建立的小型網絡範例。僅包含p值小於或等於1e-05的關聯結果,且具體的p值會在IPA的未來版本中顯示。
圖片

圖8. IPA中新GWAS關聯關係的範例。

僅導入了p值小於或等於1e-05的關聯結果。具體的p值資訊將在IPA的未來版本中顯示。

更新機器學習疾病路徑

ML 疾病途徑已透過最佳化、新內容和新直系同源基因定義重新計算。

免付費專線 我想諮詢