QIAGEN OmicSoft Lands 的2024R3版本
重點整理
- 新增經由網頁訪問 OmicSoft Lands 與 IPA analysis 的方式
- HPA 資料庫新增來自 U-CAN 人體資料庫計畫使用 Olink™ 的 PEA 技術建立的蛋白質體學資料
- 可以透過 OmicSoft Lands API 查詢來自 AACR Project GENIE® 的突變資料
一般性更新
用來探索 OmicSoft Lands 資料的新工具
透過最新的 IPA 版本,您可以使用 IPA Interpret 網頁工具分享 OmicSoft Lands 比較分析的結果。能夠以易於使用的格式存取及分享 IPA 與 OmicSoft 結合後的分析能力,而且無需安裝任何額外的軟體。了解更多
接下來將發表一款新的網頁工具 OmicSoft Explorer ,可比以往更輕鬆地查詢 OmicSoft 資料集並揭示重要的差異表達基因,現已提供預覽版。了解更多
HPA 資料庫更新──新增 Olink 蛋白質體學資料

Figure 1. 來自 U-CAN 人體資料庫所收錄,藉由 Olink™ PEA 技術所量測的數千個癌症病患血液樣本中 PAEP 蛋白質的表現量。樣本按疾病狀態分組並依性別標顏色。
在 HPA 資料庫中,新增了來自 U-CAN (Uppsala Umeå Comprehensive Cancer Consortium) 人體資料庫計畫中使用 Olink™ 技術的蛋白質體學資料集 (S-BSST935)。在這個計畫中,透過 Olink 的 PEA (Proximity Extension Assay) 技術對泛癌症患者的血漿蛋白質體進行了辨識,該技術利用抗體結合能力來檢測血漿中 1463 個目標蛋白質的表現量,並結合 NGS 進行量化計算。
除了加入 1477 個使用 PEA 技術的蛋白質體學樣本外,還引入了 25 個與疾病相關的統計比較。
DiseaseLand
HumanDisease 資料庫

Figure 2. HumanDisease 資料庫中的新增樣本,依照疾病類別分組並根據組織類別標色。
此版本新增了來自 76 個資料集的 3689 個樣本和 453 個比對結果,包括以下方面的研究:
| 疾病 | 資料集 |
|
關節炎 |
GSE113117; GSE128641; GSE143725; GSE145019; GSE151937; GSE152638; GSE152782; GSE157364; GSE158875; GSE162510; GSE172291; GSE192982; GSE192983; GSE201779; GSE205196; GSE205431; GSE208277; GSE210826; GSE216832; GSE217012; GSE243421 |
|
肌萎縮側索硬化症(ALS) |
GSE153960; GSE183204; GSE192755; GSE109177; GSE118336; GSE122261; GSE143680; GSE145676; GSE212131; GSE224138; GSE233881; GSE37640; GSE49657; GSE77685 |
|
乾燥症 |
GSE173670; GSE194234; GSE208260; GSE231691; GSE231692 |
|
多發性硬化症 |
GSE172009; GSE235357; GSE249381; GSE250453 |
|
腎臟病 |
GSE134720; GSE141740; GSE35831; GSE7869 |
|
青光眼 |
GSE123100; GSE13534; GSE236302; GSE4316 |
|
脊髓損傷 |
E-GEOD-69901; GSE151371; GSE226238 |
|
肌肉病 |
ERP022260; GSE125977 |
|
血管炎 |
GSE165254; GSE198533 |
|
動脈粥狀硬化 |
GSE198600 |
|
發炎性腸道疾病(IBD) |
GSE186507 |
|
甲狀腺疾病 |
HRA001684 |
|
其他資料集 |
GSE109350; GSE119709; GSE171745; GSE173129; GSE191040; GSE213217; GSE215875; GSE218153; GSE236652; GSE2705; GSE27275; GSE40314; GSE53985; GSE6819 |
刪除或重新處理的資料集或比對結果
作為標準審查流程的一部分,我們會對已收錄於 HumanDisease 的專案中的比對結果與詮釋資料 (metadata) 進行重新檢視。本次更新中有重新檢視其內容的資料,可以透過篩選 OSModifiedDate 欄位為 “2024R3” 的方式取得。
MouseDisease 資料庫

Figure 3. MouseDisease 資料庫中的新增樣本,依照疾病類別分組並根據組織類別標顏色。
此版本新增了來自 22 個資料集的 326 個樣本和 124 個比對結果,包括以下方面的研究:
| 疾病 | 資料集 |
|
關節炎 |
GSE207875; GSE214587; GSE226983; GSE230800; GSE241409; GSE246029; GSE252509 |
|
青光眼 |
GSE186750; GSE237073; GSE241782; GSE251685; GSE274793 |
|
糖尿病腎病變 |
GSE185801; GSE200322; GSE228727; GSE246576 |
|
腎臟病 |
GSE121410; GSE145053; GSE24352 |
|
肌萎縮側索硬化症(ALS) |
GSE109177; GSE121069 |
|
肝臟疾病 |
PRJNA906730 |
刪除或重新處理的資料集或比對結果
作為標準審查流程的一部分,我們會對已收錄於 MouseDisease 的專案中的比對結果與詮釋資料 (metadata) 進行重新檢視。本次更新中有重新檢視其內容的資料,可以透過篩選 OSModifiedDate 欄位為 “2024R3” 的方式取得。
OncoLand
GENIE 計劃

Figure 4. 可在 OmicSoft Lands API 中查詢到來自 GENIE 計劃的 CNV(藍色)與體細胞突變(橘色)樣本。
來自美國癌症研究協會 (American Association for Cancer Research,AACR) 的 GENIE (Genomics、Evidence、Neoplasia、Information、Exchange) 計劃中近 200,000 例體細胞變異和 CNV 分析可經由 OmicSoft Lands API 查詢。
在 GENIE 計劃的樣本中,每個樣本都將被歸屬於一個診斷 (diagnosis) 和一個子診斷 (sub-diagnosis)。患者層級的診斷摘要紀錄在 DiseaseState 或 DiseaseSubtype 欄位,個別樣本的疾病資訊則在 DiseaseState[ReportedForSample] 和 DiseaseSubtype[ReportedForSample] 中。
Tissue 欄位表示疾病的主要組織,並根據疾病狀態[ReportedForSample]中提供的資訊進行整理。
SampleMaterial 欄位是從基因檢測平台中每個檢測代號 (SeqAssayID) 的數據指引中取得。
-OncoSampleType 紀錄標本是原發性、轉移性還是復發性腫瘤。當 AACR 未提供具體資訊時,樣本被標記為「血源性癌症──其他」(血液系統癌症)、「其他正常」(通常被確定為良性) 或「其他腫瘤」。
多個與年齡相關的欄位紀錄患者的後續追蹤情況,例如 AgeAtSequencingRange[years]、AgeAtLastFollowupRange[days]、AgeAtDeathRange[days] 等。
ClinicalProteomicTumor 資料庫

Figure 5. ClinicalProteomicTumor 資料庫中新增的癌症相關 miRNA-seq 資料集比對分佈。比對按 Case.TissueCategory 分組並按 ComparisonCategory 標顏色。
此版本沒有新增新的資料集,但新增了 844 個 miRNA-seq 資料的統計比對。
OncoHuman 資料庫

Figure 6. -OncoHuman 中的新樣本,按疾病類別分組並根據 -OncoSampleType 標顏色。
此版本新增了來自 80 個資料集的 3423 個樣本和 338 個比較,包括以下方面的研究:
其中癌症登月計劃 IOTN (Immuno-Oncology Translational Network) 聯盟相關的樣本可以透過篩選 Project.Keywords 欄位為 “Cancer Moonshot;Immuno-Oncology Translational Network;IOTN” 的方式篩選出來。
| 癌症類別 | 資料集 |
|
肝癌 |
GSE103729; GSE117116; GSE143233; GSE161858; GSE169084; GSE182593; GSE186280; GSE207439; GSE213615; GSE214432; GSE23991; GSE240109; GSE252988; GSE62813; GSE75620; GSE77322; GSE96792; GSE96793; GSE96794; GSE180876 |
|
肺癌 |
GSE151101; GSE179879; GSE192475; GSE225620; GSE226773; GSE239389; GSE242843; GSE247584; GSE249258; GSE249370; GSE249721; GSE252587; GSE272045; GSE66499; GSE68465; GSE71181; GSE80796 |
|
子宮頸癌 |
GSE220879; GSE232587; GSE235031; GSE236168; GSE240565; GSE252369; GSE253261; GSE261673; GSE263143; GSE265772 |
|
腎癌 |
GSE216494; GSE223806; GSE228525; GSE235908; GSE244498; GSE252600 |
|
乳癌 |
GSE212169; GSE217132; GSE240244; GSE247667 |
|
卵巢癌 |
GSE137238; GSE146553; GSE172016 |
|
攝護腺癌 |
GSE174618; GSE179133 |
|
急性骨髓性白血病(AML) |
GSE212013; GSE215432 |
|
膠質母細胞瘤 |
GSE218860; GSE223607 |
|
大腸直腸癌 |
GSE147626 |
|
肉瘤 (sarcoma) |
GSE163359 |
|
T 細胞淋巴瘤 (TCL) |
GSE201871 |
|
睪丸癌 |
GSE262137 |
|
甲狀腺癌 |
GSE54958 |
|
膀胱癌 |
GSE252406 |
|
其他數據集 |
GSE191255; GSE228680; GSE249527; GSE253091; GSE253468; GSE255803; GSE268568; PRJNA1049053 |
刪除或重新處理的資料集或比對結果
作為標準審查流程的一部分,我們會對已收錄於 -OncoHuman 的專案中的比對結果與詮釋資料 (metadata) 進行重新檢視。本次更新中有重新檢視其內容的資料,可以透過篩選 OSModifiedDate 欄位為 “2024R3” 的方式取得。
Single Cell Land
此次版本更新的 Single Cell Lands 包括了 HumanUMI Land 的更新,其中包含來自 21 個專案的 860 萬個新細胞,其中包括 59 種新驗證的細胞類型。
| 目標疾病 | 專案 | 實驗設計 |
|
急性骨髓性白血病(AML) |
GSE235063 |
來自代表不同 pAML 亞型的患者的診斷、緩解和復發細胞 |
|
急性骨髓性白血病(AML);骨髓造血不良症候群 |
GSE223844 |
晚期骨髓疾病;對治療有反應或抗性;在治療前、decitabine 治療一個週期後、decitabine 和 ipilimumab 聯合治療後以及治療結束時等階段未經篩選的骨髓來源單核球細胞 |
|
阿休曼症候群 (Asherman syndrome,子宮腔沾黏) |
GSE215968 |
來自患者子宮內膜類器官的細胞 |
|
阿休曼症候群 (Asherman syndrome,子宮腔沾黏) |
GSE216748 |
治療前阿休曼症候群子宮內膜切片的上皮細胞衍生類器官及對照組 |
|
乳癌 |
GSE141665 |
PBC 分析 |
|
乳癌 |
GSE141665 |
Her2 受體陽性乳癌和三重陰性乳癌 (TNBC) 中的乳房腫瘤 |
|
慢性腎臟病(CKD) |
GSE130888 |
來自腹膜透析患者的腹膜細胞與對照組(正常腹膜細胞) |
|
糖尿病;糖尿病足 |
GSE165816 |
來自非糖尿病患者、 糖尿病足潰瘍的糖尿病患者以及無糖尿病足的糖尿病患者各自的足部、前臂和周邊血單核球的單細胞檢體 |
|
子宮內膜異位症 |
GSE179640 |
子宮內膜異位症與對照組的研究(在位子宮內膜與異位腹膜、異位腹膜相鄰、異位卵巢) |
|
女性生殖器官癌症 |
GSE173682 |
從子宮內膜或卵巢收集的腫瘤 |
|
正常控制組 |
GSE235326 |
成人乳房細胞圖譜 |
|
正常控制組 |
GSE156793 |
多種胎兒組織分析 |
|
正常控制組 |
GSE196735 |
人類 PBMC 中的 mRNA 組成 |
|
正常控制組 |
GSE235326 |
成人乳房細胞圖譜 |
|
正常控制組 |
GSE168323 |
分化過程中不同時間點的人腦類器官細胞,用以尋找人腦類器官中正在發育與發育成熟的多巴胺神經元 (dopaminergic neuron,DA 神經元) 特徵 |
|
正常控制組 |
GSE114530 |
五個不同年齡的胎兒腎臟 |
|
正常控制組 |
GSE116555 |
iPSC-EC 分化的兩個時間點 |
|
口咽鱗狀細胞癌 |
GSE182227 |
HPV 陽性口咽癌之初治病患的腫瘤分析以及腫瘤與鄰近正常細胞的比較 |
|
攝護腺癌 |
GSE175975 |
比較以 CRISPR 基因編輯 TP53/RB1/JAK1 或 enzalutamide 或空載體處理的前列腺癌細胞株差異 |
|
乾燥症 (Sjögren’s syndrome, SS) |
GSE214974 |
來自原發性乾燥症患者(具有不同自體抗體狀態)和對照組週邊血液的 B 細胞 |
|
泌尿系統癌症 |
GSE145281 |
膀胱移行上皮細胞癌、腎透明細胞癌 (KIRC) 的反應者與無反應者 |
ATCC Cell Line Land
ATCC Human 資料庫
此版本增加了 286 個樣本使樣本總數達到 2001 個,由 418 個獨特的細胞系組成。

Figure 7: ATCC_Human_B38_GC33 資料庫中的樣本在不同組織類別的分佈
ATCC Mouse 資料庫
新版本增加了 15 個新樣本,使使樣本總數達到 220 個,由 55 個獨特細胞系組成。

Figure 8: ATCC_Mouse_B38 資料庫中的樣本在不同組織類別的分佈
ATCC 更新重點
根據動物背景 (Animal background) 快速找到同源腫瘤模型的細胞系,並搜尋該細胞株是否是建議細胞株且是否已知是會形成腫瘤的細胞株。

Figure 9: 根據動物背景分組並依組織標顏色的小鼠細胞株的分佈。選取顯示 BALB/c 小鼠的樣本,並蒐索元數據以獲取是否造成腫瘤的資訊。
資料處理或驗證流程更新
資料驗證流程更新內容
將 HumanDisease、-OncoHuman 和 MouseDisease 三個資料庫所有內容中屬於 EASCII (Extended ASCII) 或 Unicode 字碼集的字元替換為 ASCII 可列印字元(字元代碼 32~127 https://www.ascii-code.com/ )。由於此變更影響了大量資料,因此並未以更新 OSModifiedDate 欄位的方式標示受影響的資料。


