微焦點X射線檢查系統 Xslicer S
島津、富士通、富士通研究所共同研究成果:人工智能在質譜數據處理中的應用
株式會社島津制作所(以下簡稱“島津制作所”)、富士通株式會社(以下簡稱“富士通”)、株式會社富士通研究所(以下簡稱“富士通研究所”)經共同研究※1,成功開發出可應用于大數據處理中的AI(人工智能)技術,該技術在質譜分析結果的解析過程中*。截至目前的所有研究成果,已在日前召開的“第11屆代謝組學研討會”上發表。
作為ICT(信息通信技術)企業,富士通為實現數字革新,不斷探究AI新型商業模式。作為分析儀器制造商,島津公司受客戶委托,致力于“實現復雜數據的高精度自動解析”。訴求一致的兩家企業自去年11月起,開始推進數據自動化解析領域AI的共同研究。隨著儀器靈敏度、分析速度的不斷提升,用于疾病早期發現的技術確立、食品農殘檢測等各領域研究以及品質管理等用途的質譜分析儀,獲得的數據量也急劇增加。在此影響下,被稱為“peak picking ”※2的數據解析方式成為作業工程中的一大瓶頸。由于較難實現*的自動化,并且在一定程度上仍需手動調整,該作業方式存在操作人員操作失誤或數據篡改的漏洞,各操作人員間的解析準確率亦參差不齊。近年,在醫療及制藥領域,對排除屬人為屬性的高精度自動化需求愈演愈烈。
為此,3家企業模仿腦神經細胞的神經網DEEP LEARNING(深度學習)的適用性開展探討,欲通過活用AI解決上述問題。但在研究過程中,遇到兩大難題:其一, 訓練數據※3不充分;其二,將分析儀器輸出數據直接導入深度學習網絡后,無法開展學習訓練。通過共同研究期間的不懈努力,島津成功開發出“可彌補訓練數據不足的數據生成技術”,富士通?富士通研究所成功開發出“分析儀器輸出特征的圖像轉換技術”及“可學習熟練工解析訣竅的特征提取技術”。目前,已將通過上述技術生成的3萬多條訓練數據輸入深層學習網,供其學習。
與經驗者手動peak picking 結果比對后發現,AI自動peak picking 的錯誤率為7%、未檢率為9%※4。即自動peak picking 并不遜色于經驗者操作,相關結果達到可使用狀態。
在島津公司2017年4月開展的中期經營計劃中,制定了“致力*醫療、為預防、診斷、治療以及制藥領域提供革新產品及服務”的目標。本次開發的AI,其zui初使用的“代謝組學”研究即為其中的一環。代謝組學是一種檢測代謝產物并根據其性狀特征對細胞開展檢查的生物技術。在生理?病理組織的解析、疾病生物標志物的探索等領域備受矚目。
2015年11月,富士通將積累了超過30年的AI(人工知能)相關知識技術,以“FUJITSU Human Centric AI Zinrai”形式公開發表,積極推進面向各領域用戶、商品服務的AI實際應用。目前,又在深度學習的全新領域聚焦“代謝組學”,積極開展可實現數據分析自動化的AI研發。
島津與富士通的目標為,2018年能將本次成功研發的AI技術導入質譜分析儀器軟件。
※1 從大阪大學研究生院工學研究專業福崎英一郎教授、該校信息科學研究專業松田史生教授處獲得研究人員需求。在島津制作所、大阪大學開設以代謝組學分析技術研發為目的的“大阪大學?島津分析革新共同研究講座”。
※2 從質譜分析數據(圖表)中,讀取峰寬及峰高的工程。
※3 供深度學習網絡開展學習的數據。對輸入網絡的數據及其輸出結果進行編組。本技術應用中,為分析儀器輸出數據與相應經驗者peak picking 結果的比對組合。
※4 將經驗者手動peak picking 結果稱作“正確范圍”,與AI自動peak picking 結果“預測范圍”進行比較。如兩者重疊率超過50%,則判斷為“匹配”,反之則為“不匹配”。在“匹配”情況下,除被正確檢測的峰值外,將預測范圍中出現、但無法與正確范圍匹配的項目定義為“錯誤檢測”,將正確范圍中出現、但無法與預測范圍匹配的項目定義為“未檢測”。錯誤檢測率計算公式為:錯誤檢測數 / (檢測數+錯誤檢測數)、未檢測率計算公式為:未檢測數 / (檢測數+未檢測數)。