分子數位產品資訊

QIAGEN OmicSoft Lands 的2024R3版本

重點整理

  • 新增經由網頁訪問 OmicSoft Lands 與 IPA analysis 的方式
  • HPA 資料庫新增來自 U-CAN 人體資料庫計畫使用 Olink™ 的 PEA 技術建立的蛋白質體學資料
  • 可以透過 OmicSoft Lands API 查詢來自 AACR Project GENIE® 的突變資料

免付費專線 我想諮詢

一般性更新

用來探索 OmicSoft Lands 資料的新工具

透過最新的 IPA 版本,您可以使用 IPA Interpret 網頁工具分享 OmicSoft Lands 比較分析的結果。能夠以易於使用的格式存取及分享 IPA 與 OmicSoft 結合後的分析能力,而且無需安裝任何額外的軟體。了解更多

接下來將發表一款新的網頁工具 OmicSoft Explorer ,可比以往更輕鬆地查詢 OmicSoft 資料集並揭示重要的差異表達基因,現已提供預覽版。了解更多

HPA 資料庫更新──新增 Olink 蛋白質體學資料
圖片
 

Figure 1. 來自 U-CAN 人體資料庫所收錄,藉由 Olink™ PEA 技術所量測的數千個癌症病患血液樣本中 PAEP 蛋白質的表現量。樣本按疾病狀態分組並依性別標顏色。

在 HPA 資料庫中,新增了來自 U-CAN (Uppsala Umeå Comprehensive Cancer Consortium) 人體資料庫計畫中使用 Olink™ 技術的蛋白質體學資料集 (S-BSST935)。在這個計畫中,透過 Olink 的 PEA (Proximity Extension Assay) 技術對泛癌症患者的血漿蛋白質體進行了辨識,該技術利用抗體結合能力來檢測血漿中 1463 個目標蛋白質的表現量,並結合 NGS 進行量化計算。

除了加入 1477 個使用 PEA 技術的蛋白質體學樣本外,還引入了 25 個與疾病相關的統計比較。

DiseaseLand

HumanDisease 資料庫
圖片
 

Figure 2. HumanDisease 資料庫中的新增樣本,依照疾病類別分組並根據組織類別標色。

此版本新增了來自 76 個資料集的 3689 個樣本和 453 個比對結果,包括以下方面的研究:
 

疾病 資料集

關節炎

GSE113117; GSE128641; GSE143725; GSE145019; GSE151937; GSE152638; GSE152782; GSE157364; GSE158875; GSE162510; GSE172291; GSE192982; GSE192983; GSE201779; GSE205196; GSE205431; GSE208277; GSE210826; GSE216832; GSE217012; GSE243421

肌萎縮側索硬化症(ALS)

GSE153960; GSE183204; GSE192755; GSE109177; GSE118336; GSE122261; GSE143680; GSE145676; GSE212131; GSE224138; GSE233881; GSE37640; GSE49657; GSE77685

乾燥症

GSE173670; GSE194234; GSE208260; GSE231691; GSE231692

多發性硬化症

GSE172009; GSE235357; GSE249381; GSE250453

腎臟病

GSE134720; GSE141740; GSE35831; GSE7869

青光眼

GSE123100; GSE13534; GSE236302; GSE4316

脊髓損傷

E-GEOD-69901; GSE151371; GSE226238

肌肉病

ERP022260; GSE125977

血管炎

GSE165254; GSE198533

動脈粥狀硬化

GSE198600

發炎性腸道疾病(IBD)

GSE186507

甲狀腺疾病

HRA001684

其他資料集

GSE109350; GSE119709; GSE171745; GSE173129; GSE191040; GSE213217; GSE215875; GSE218153; GSE236652; GSE2705; GSE27275; GSE40314; GSE53985; GSE6819

刪除或重新處理的資料集或比對結果

作為標準審查流程的一部分,我們會對已收錄於 HumanDisease 的專案中的比對結果與詮釋資料 (metadata) 進行重新檢視。本次更新中有重新檢視其內容的資料,可以透過篩選 OSModifiedDate 欄位為 “2024R3” 的方式取得。

MouseDisease 資料庫
圖片
 

Figure 3. MouseDisease 資料庫中的新增樣本,依照疾病類別分組並根據組織類別標顏色。

此版本新增了來自 22 個資料集的 326 個樣本和 124 個比對結果,包括以下方面的研究:
 

疾病 資料集

關節炎

GSE207875; GSE214587; GSE226983; GSE230800; GSE241409; GSE246029; GSE252509

青光眼

GSE186750; GSE237073; GSE241782; GSE251685; GSE274793

糖尿病腎病變

GSE185801; GSE200322; GSE228727; GSE246576

腎臟病

GSE121410; GSE145053; GSE24352

肌萎縮側索硬化症(ALS)

GSE109177; GSE121069

肝臟疾病

PRJNA906730

刪除或重新處理的資料集或比對結果

作為標準審查流程的一部分,我們會對已收錄於 MouseDisease 的專案中的比對結果與詮釋資料 (metadata) 進行重新檢視。本次更新中有重新檢視其內容的資料,可以透過篩選 OSModifiedDate 欄位為 “2024R3” 的方式取得。

OncoLand

GENIE 計劃
圖片
 

Figure 4. 可在 OmicSoft Lands API 中查詢到來自 GENIE 計劃的 CNV(藍色)與體細胞突變(橘色)樣本。

來自美國癌症研究協會 (American Association for Cancer Research,AACR) 的 GENIE (Genomics、Evidence、Neoplasia、Information、Exchange) 計劃中近 200,000 例體細胞變異和 CNV 分析可經由 OmicSoft Lands API 查詢。

在 GENIE 計劃的樣本中,每個樣本都將被歸屬於一個診斷 (diagnosis) 和一個子診斷 (sub-diagnosis)。患者層級的診斷摘要紀錄在 DiseaseState 或 DiseaseSubtype 欄位,個別樣本的疾病資訊則在 DiseaseState[ReportedForSample] 和 DiseaseSubtype[ReportedForSample] 中。

Tissue 欄位表示疾病的主要組織,並根據疾病狀態[ReportedForSample]中提供的資訊進行整理。

SampleMaterial 欄位是從基因檢測平台中每個檢測代號 (SeqAssayID) 的數據指引中取得。

-OncoSampleType 紀錄標本是原發性、轉移性還是復發性腫瘤。當 AACR 未提供具體資訊時,樣本被標記為「血源性癌症──其他」(血液系統癌症)、「其他正常」(通常被確定為良性) 或「其他腫瘤」。

多個與年齡相關的欄位紀錄患者的後續追蹤情況,例如 AgeAtSequencingRange[years]、AgeAtLastFollowupRange[days]、AgeAtDeathRange[days] 等。

ClinicalProteomicTumor 資料庫
圖片
 

Figure 5. ClinicalProteomicTumor 資料庫中新增的癌症相關 miRNA-seq 資料集比對分佈。比對按 Case.TissueCategory 分組並按 ComparisonCategory 標顏色。

此版本沒有新增新的資料集,但新增了 844 個 miRNA-seq 資料的統計比對。

OncoHuman 資料庫
圖片
 

Figure 6. -OncoHuman 中的新樣本,按疾病類別分組並根據 -OncoSampleType 標顏色。

此版本新增了來自 80 個資料集的 3423 個樣本和 338 個比較,包括以下方面的研究:
其中癌症登月計劃 IOTN (Immuno-Oncology Translational Network) 聯盟相關的樣本可以透過篩選 Project.Keywords 欄位為 “Cancer Moonshot;Immuno-Oncology Translational Network;IOTN” 的方式篩選出來。
 

癌症類別 資料集

肝癌

GSE103729; GSE117116; GSE143233; GSE161858; GSE169084; GSE182593; GSE186280; GSE207439; GSE213615; GSE214432; GSE23991; GSE240109; GSE252988; GSE62813; GSE75620; GSE77322; GSE96792; GSE96793; GSE96794; GSE180876

肺癌

GSE151101; GSE179879; GSE192475; GSE225620; GSE226773; GSE239389; GSE242843; GSE247584; GSE249258; GSE249370; GSE249721; GSE252587; GSE272045; GSE66499; GSE68465; GSE71181; GSE80796

子宮頸癌

GSE220879; GSE232587; GSE235031; GSE236168; GSE240565; GSE252369; GSE253261; GSE261673; GSE263143; GSE265772

腎癌

GSE216494; GSE223806; GSE228525; GSE235908; GSE244498; GSE252600

乳癌

GSE212169; GSE217132; GSE240244; GSE247667

卵巢癌

GSE137238; GSE146553; GSE172016

攝護腺癌

GSE174618; GSE179133

急性骨髓性白血病(AML)

GSE212013; GSE215432

膠質母細胞瘤

GSE218860; GSE223607

大腸直腸癌

GSE147626

肉瘤 (sarcoma)

GSE163359

T 細胞淋巴瘤 (TCL)

GSE201871

睪丸癌

GSE262137

甲狀腺癌

GSE54958

膀胱癌

GSE252406

其他數據集

GSE191255; GSE228680; GSE249527; GSE253091; GSE253468; GSE255803; GSE268568; PRJNA1049053

刪除或重新處理的資料集或比對結果

作為標準審查流程的一部分,我們會對已收錄於 -OncoHuman 的專案中的比對結果與詮釋資料 (metadata) 進行重新檢視。本次更新中有重新檢視其內容的資料,可以透過篩選 OSModifiedDate 欄位為 “2024R3” 的方式取得。

Single Cell Land

此次版本更新的 Single Cell Lands 包括了 HumanUMI Land 的更新,其中包含來自 21 個專案的 860 萬個新細胞,其中包括 59 種新驗證的細胞類型。
 

目標疾病 專案 實驗設計

急性骨髓性白血病(AML)

GSE235063

來自代表不同 pAML 亞型的患者的診斷、緩解和復發細胞

急性骨髓性白血病(AML);骨髓造血不良症候群

GSE223844

晚期骨髓疾病;對治療有反應或抗性;在治療前、decitabine 治療一個週期後、decitabine 和 ipilimumab 聯合治療後以及治療結束時等階段未經篩選的骨髓來源單核球細胞

阿休曼症候群 (Asherman syndrome,子宮腔沾黏)

GSE215968

來自患者子宮內膜類器官的細胞

阿休曼症候群 (Asherman syndrome,子宮腔沾黏)

GSE216748

治療前阿休曼症候群子宮內膜切片的上皮細胞衍生類器官及對照組

乳癌

GSE141665

PBC 分析

乳癌

GSE141665

Her2 受體陽性乳癌和三重陰性乳癌 (TNBC) 中的乳房腫瘤

慢性腎臟病(CKD)

GSE130888

來自腹膜透析患者的腹膜細胞與對照組(正常腹膜細胞)

糖尿病;糖尿病足

GSE165816

來自非糖尿病患者、 糖尿病足潰瘍的糖尿病患者以及無糖尿病足的糖尿病患者各自的足部、前臂和周邊血單核球的單細胞檢體

子宮內膜異位症

GSE179640

子宮內膜異位症與對照組的研究(在位子宮內膜與異位腹膜、異位腹膜相鄰、異位卵巢)

女性生殖器官癌症

GSE173682

從子宮內膜或卵巢收集的腫瘤

正常控制組

GSE235326

成人乳房細胞圖譜

正常控制組

GSE156793

多種胎兒組織分析

正常控制組

GSE196735

人類 PBMC 中的 mRNA 組成

正常控制組

GSE235326

成人乳房細胞圖譜

正常控制組

GSE168323

分化過程中不同時間點的人腦類器官細胞,用以尋找人腦類器官中正在發育與發育成熟的多巴胺神經元 (dopaminergic neuron,DA 神經元) 特徵

正常控制組

GSE114530

五個不同年齡的胎兒腎臟

正常控制組

GSE116555

iPSC-EC 分化的兩個時間點

口咽鱗狀細胞癌

GSE182227

HPV 陽性口咽癌之初治病患的腫瘤分析以及腫瘤與鄰近正常細胞的比較

攝護腺癌

GSE175975

比較以 CRISPR 基因編輯 TP53/RB1/JAK1 或 enzalutamide 或空載體處理的前列腺癌細胞株差異

乾燥症 (Sjögren’s syndrome, SS)

GSE214974

來自原發性乾燥症患者(具有不同自體抗體狀態)和對照組週邊血液的 B 細胞

泌尿系統癌症

GSE145281

膀胱移行上皮細胞癌、腎透明細胞癌 (KIRC) 的反應者與無反應者

ATCC Cell Line Land

ATCC Human 資料庫

此版本增加了 286 個樣本使樣本總數達到 2001 個,由 418 個獨特的細胞系組成。
圖片

Figure 7: ATCC_Human_B38_GC33 資料庫中的樣本在不同組織類別的分佈

ATCC Mouse 資料庫

新版本增加了 15 個新樣本,使使樣本總數達到 220 個,由 55 個獨特細胞系組成。
圖片
 

Figure 8: ATCC_Mouse_B38 資料庫中的樣本在不同組織類別的分佈

ATCC 更新重點

根據動物背景 (Animal background) 快速找到同源腫瘤模型的細胞系,並搜尋該細胞株是否是建議細胞株且是否已知是會形成腫瘤的細胞株。
圖片

Figure 9: 根據動物背景分組並依組織標顏色的小鼠細胞株的分佈。選取顯示 BALB/c 小鼠的樣本,並蒐索元數據以獲取是否造成腫瘤的資訊。

資料處理或驗證流程更新

資料驗證流程更新內容

將 HumanDisease、-OncoHuman 和 MouseDisease 三個資料庫所有內容中屬於 EASCII (Extended ASCII) 或 Unicode 字碼集的字元替換為 ASCII 可列印字元(字元代碼 32~127 https://www.ascii-code.com/ )。由於此變更影響了大量資料,因此並未以更新 OSModifiedDate 欄位的方式標示受影響的資料。

免付費專線 我想諮詢