「Nature」网站日前发表了一项开创性的研究,该研究透过深度学习技术,来提升儿童行为听力测验的可行性与精确度。
研究人员构建了一个专用设计的儿童姿势检测数据集,该数据集收录了大量来自儿童行为听力测试的珍贵影像资料,细腻地记录了各式典型的听力测试动作。
基於此数据基础,研究人员进一步开发了一个智能检测平台,此平台的核心技术在於一个同步开发的患者骨骼关键点估计模型 (POTR),该模型同样基於优化Transformer架构,专职於精准估算人体骨骼的关键节点。透过POTR的精确骨骼点定位能力,DoT平台得以对儿童在行为听力测试过程中的影片进行细致的姿势辨识,进而实现听力测试流程的自动化分析。
这项技术使医护人员能够即时监测和分析儿童在测试中的动作,客观地评估其听力水平。更重要的是,研究团队透过将特定的动作与听力学的专业知识相结合,制定了一套基於动作的决策规则,藉此根据儿童的动态表现来辅助判断其听力状况。
实验结果显示,在2.5至4岁的儿童群体中,传统人工行为听力测验的敏感性 (0.900) 相较於人工智慧行为听力测验 (0.929) 略逊一筹,但在特异性 (0.824) 和曲线下面积 (AUC) (0.901) 方面则表现更优。而在4至6岁的儿童群体中,人工行为听力测验的敏感性 (0.943)、特异性 (0.947) 和 AUC (0.924) 均优於人工智慧行为听力测验。
研究团队的下一步计画将聚焦於探索人工智慧行为听力测验在更年幼(2.5岁以下)的婴幼儿中的准确性,以期进一步拓展这项科技在儿童听力健康领域的应用价值。