「Nature」網站日前發表了一項開創性的研究,該研究透過深度學習技術,來提升兒童行為聽力測驗的可行性與精確度。
研究人員構建了一個專用設計的兒童姿勢檢測數據集,該數據集收錄了大量來自兒童行為聽力測試的珍貴影像資料,細膩地記錄了各式典型的聽力測試動作。
基於此數據基礎,研究人員進一步開發了一個智能檢測平台,此平台的核心技術在於一個同步開發的患者骨骼關鍵點估計模型 (POTR),該模型同樣基於優化Transformer架構,專職於精準估算人體骨骼的關鍵節點。透過POTR的精確骨骼點定位能力,DoT平台得以對兒童在行為聽力測試過程中的影片進行細緻的姿勢辨識,進而實現聽力測試流程的自動化分析。
這項技術使醫護人員能夠即時監測和分析兒童在測試中的動作,客觀地評估其聽力水平。更重要的是,研究團隊透過將特定的動作與聽力學的專業知識相結合,制定了一套基於動作的決策規則,藉此根據兒童的動態表現來輔助判斷其聽力狀況。
實驗結果顯示,在2.5至4歲的兒童群體中,傳統人工行為聽力測驗的敏感性 (0.900) 相較於人工智慧行為聽力測驗 (0.929) 略遜一籌,但在特異性 (0.824) 和曲線下面積 (AUC) (0.901) 方面則表現更優。而在4至6歲的兒童群體中,人工行為聽力測驗的敏感性 (0.943)、特異性 (0.947) 和 AUC (0.924) 均優於人工智慧行為聽力測驗。
研究團隊的下一步計畫將聚焦於探索人工智慧行為聽力測驗在更年幼(2.5歲以下)的嬰幼兒中的準確性,以期進一步拓展這項科技在兒童聽力健康領域的應用價值。