用地表最強運算力分析全球最大基因庫 推進精準醫療再進化
2020 年以來新冠病毒肆虐全球,醫療產業不僅積極找尋有效療法與研發疫苗,更迫切想從基因角度洞悉這場世紀浩劫,避免未來有更多大規模流行性傳染病的發生。為此,台大醫院參與微軟全球 AI for Health 計畫,運用 Azure HPC(高效能運算)在全球最大英國 Bio Bank 的基因資料庫進行大規模運算,不僅大幅提升 40 倍以上運算效率,也成功完成亞洲第一大規模的基因插補程序,實質推動基因研究進展,為將來科學研究鋪下基礎,推動疾病預防落實。
台大醫院智慧醫療中心副主任李建璋表示:「隨著許多研究證實疾病和基因有密切關聯,基因定序逐漸受到醫療界重視;既有的伺服器不足以運算龐大的基因資料量,加上暴增的數據量難以即時擴大投資設備,是研究團隊普遍面臨的兩大難題。此次參與微軟 AI for Health 專案,接軌全球運算資源與技術專家,讓台大醫院不僅成功突破運算瓶頸,推進基因研究邁向新的里程碑。期盼未來可以持續攜手科技創新力量,加速醫療產業研究歷程,為全球醫療產業開啟新扉頁。」
微軟全球助理法務長及台灣微軟公共暨法律事務部總經理施立成表示:「AI for Good 期盼以科技之力,協助組織在面對全球環境、無障礙、文化遺產保護與人道行動挑戰時,能加速落實理想並擴大影響力;而 AI for Health 是其中計畫之一,旨在運用微軟 AI 技術協助開發健康照護技術,助力醫療單位解決全球醫療問題,包含癌症檢測與治療系統的優化、流感傳染分佈等。時至今日,微軟已於全球資助超過 180 個組織,未來也將繼續投入、賦能更多醫療組織,貫徹微軟對於全世界人類、社會共好的承諾。」
翻轉傳統研究方法 以 HPC 加值基因分析 運算效率遽增40倍以上
身為國家級教學醫院,台大醫院研究團隊多年來致力發展前瞻醫療研究,以高品質與人性化醫療,守護台灣民眾。在疫情期間,台大醫院即觀察到許多非典型案例,如患有慢性病的長者雖得到新冠肺炎但卻在短期內痊癒,或是不具有慢性病病史的年輕人得病後卻很快地去世,若能透過交叉比對基因位點資料,找出關鍵基因並建立風險評分機制,將可防範疾病於未然,大幅提升國民健康。
每個人的基因皆是世上獨一無二的組成,世界衛生組織研究顯示,多數重大疾病是由先天基因體質與後天生活環境交互作用之下累積而成的結果。透過基因檢測不僅可讓人們充分了解先天體質,也能預知罹患疾病的風險。目前數據中每人會有大約73萬個比較常見的基因變異位點,在基因採檢時常有部分基因位點缺漏的狀況發生,因此醫療團隊在透過 AI 分析基因前,都需要花費至少數個月的時間,以機器學習方式預測遺失位點,補齊所有基因資料。
面對此次英國 Bio Bank 所提供 50 萬筆的人體生物樣本資料,台大醫院現有的傳統伺服器在運行數個月後仍停留於插補程序運算,遲遲無法進展至分析階段,因此去年九月開始與微軟Azure專業技術團隊合作。微軟全球黑帶專家-亞洲區 HPC/AI 解決方案副總經理馮立偉表示:「面對現有研究環境在處理巨量資料的侷限性,微軟不僅頃注 Azure HPC 高速算力與技術團隊,更尋求R程式套件國外創辦者協助與 Intel 技術合作,共同進行演算法的修正與優化,找出最佳雲端硬體規格及資料量大小切割方式,進行基因插補與分析,因此能在合規、安全的 Azure 雲端環境下,透過 Azure HPC 提升基因運算速度 40 倍以上,大幅縮短分析時間、推進研究進程並確保醫學資料安全。」
奠基在 Azure HPC 運算優勢上,原需耗費數個月的 1 萬 8 千名 COVID-19 患者基因資料插補與分析,成功縮短至僅僅 5 小時,雙方團隊更將原需要計算超過二年以上的 50 萬筆基因,提前至四週內完成分析,下一步更預計將基因庫內每筆人體生物樣本近億個基因位點資料運算完畢,成為未來精準醫療的基礎。微軟全球黑帶專家-亞洲區 HPC/AI 解決方案總經理磯貝直之表示:「此次成果為亞洲最大規模針對 UK Biobank 基因資料進行插補運算,未來台灣各醫療研究機構若使用 Biobank 資料將不須重複進行插補程序,可有效縮短基因分析時間、提升研究效率與加速進程。我們很高興微軟可以運用 Azure 全球豐富 HPC 資源及緊密合作夥伴關係為全球醫療發展貢獻一己之力。」
微軟與台大醫院期望研究成果將可帶動多基因風險分數等評估方式的建立,協助罹病高風險族群提早預防與治療,更促進學術研究正向發展,並將人類基因研究拓展到更多醫療領域上,推進醫療產業研究歷程,實現以事前預防取代事後治療的目標,賦能全世界醫療組織守護全球人民健康。