随着医学影像技术的快速发展,临床对于智能化影像诊断系统的需求日益增长。尽管基于云端的人工智能技术在医学影像分析领域取得了显著进展,但其在实际医疗场景中的推广仍面临诸多挑战,包括网络延迟、数据传输带宽限制、患者隐私保护以及基层医疗机构计算资源不足等问题。针对这些挑战,我院田宜彬特聘教授团队博士后Khalil ur Rehman围绕X射线医学影像诊断开展了一系列边缘人工智能研究,致力于构建兼具高精度、高效率和可部署性的智能诊断技术,实现医学影像人工智能从云端向终端设备的延伸。

图1:X射线摄影图像示例。(a)私有数据集合PINUM;(b)公开数据集DDSM。
Rehman博士的研究聚焦于乳腺癌早期筛查的X射线摄影(Mammography)。乳腺结构扭曲是乳腺癌最早期、最隐匿的征兆之一,由于其形态复杂且对比度较低,传统计算机辅助诊断系统难以实现稳定识别。为此,提出一种融合卷积神经网络与Transformer架构的注意力增强诊断模型,通过同时建模局部纹理特征与全局上下文信息,实现对细微结构异常的精准检测,有效提升了乳腺癌早期筛查的敏感性和可靠性 [1]。在此基础上,进一步探索了放射组学与轻量化深度学习网络的融合方法,以满足边缘端部署需求。设计了一种融合放射组学特征的诊断框架,在保持较高诊断性能的同时,提取具有临床可解释性的影像标志。与依赖高性能服务器的深度学习模型不同,系统针对Jetson Nano、Raspberry Pi以及Snapdragon移动芯片等嵌入式平台进行了优化,实现了在低功耗设备上的实时运行,为移动筛查以及偏远地区医疗服务提供可行的技术方案[2]。
图1:模型在不同扰动幅度FGSM对抗攻击下的鲁棒性评价。

为了进一步提高诊断精度并降低计算开销,提出基于小波变换和Mamba状态空间模型的波段驱动通道-空间注意力网络。该方法利用小波变换提取多尺度频域特征,并结合轻量化Mamba长程依赖建模能力,实现对低对比度病灶和复杂组织结构的高效识别。通过频域信息与空间注意力机制的协同优化,模型在保证诊断性能的同时显著降低了计算复杂度,更适合部署于资源受限的边缘计算设备 [3]。面向资源受限的实时诊断需求,研究工作强调模型轻量化、低延迟推理、端侧部署以及隐私保护 [2][4]。

图2:PINUM 数据集上的诊断结果示例。(a–c) 正确判定为良性的乳腺X线图像;(d–f) 正确判定为恶性的乳腺X线图像。为保持图像细节和视觉清晰度,图中展示的是未经任何可视化标注或叠加处理的原始乳腺X线摄影图像。
考虑到高质量医学诊断往往依赖于准确的解剖结构理解,还开展了基于半监督学习的X射线图像分割研究(DTS-OA)。针对牙科X射线影像中标注数据获取困难的问题,将解剖先验知识融入深度学习模型,在显著减少人工标注需求的同时,提高了牙根及根管等关键结构的分割精度 [5]。该研究验证了领域知识与人工智能融合的有效性,有助于数据稀缺场景下医学影像智能分析系统的构建。

图3. (a) 根管治疗结果示例。(b) DTS-OAP与其他模型的比较。白色和蓝色区域分别表示牙齿和根管,红色标记突出显示根管分割中的不准确之处。
从乳腺癌筛查到牙科影像分析,从轻量化网络设计到解剖先验引导学习,各项工作围绕高精度诊断、低资源部署、实时智能分析这一核心目标展开。相关成果为构建低延迟、隐私安全、普惠可及的新一代智慧医疗系统奠定了技术基础,有望广泛应用于乳腺癌筛查、口腔疾病诊断、基层医疗服务以及移动医疗设备等多个领域,为实现医疗资源均衡化和智能化提供重要支撑。
上述工作和北京工业大学、南方医科大学、重庆师范大学和新加坡管理大学等国内外高校进行了广泛合作。部分工作得到广东省教育厅新一代信息技术重点项目支持(No.2021ZDZX1024)。
参考文献:
[1] Rehman, et al. (2026), A feature fusion attention-based deep learning algorithm for mammographic architectural distortion classification. IEEE Journal of Biomedical and Health Informatics. (IF 6.8 中科院TOP)
//ieeexplore.ieee.org/document/10908823
[2] Rehman, et al. (2026), Radiomic V-Net deep learning architecture for breast cancer prediction deployed on medical consumer electronics. IEEE Transactions on Consumer Electronics. (IF 10.7 中科院二区)
//ieeexplore.ieee.org/document/11230575
[3] Rehman, et al. (2026), WCMA-Net: Enhancing mammographic cancer diagnosis using wavelet-driven channel-spatial Mamba attention. Tsinghua Science and Technology. Early access. (IF 3.5 中科院二区)
//www.sciopen.com/article/10.26599/TST.2026.9010016
[4] Rehman, et al. (2026), Automated denoising of mammographic microcalcifications using wavelet-based attention deep network for the medical internet of things. IEEE Internet of Things Journal. Early access.(IF 8.9 中科院TOP)
//ieeexplore.ieee.org/document/11556221
[5] Pan, et al (2026). Semi-supervised segmentation of teeth and root canals for bitewing X-ray images incorporating one-dimensional anatomical priors. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). (信号处理旗舰会议,CCF B)
//ieeexplore.ieee.org/document/11462988
撰写:Khalil Rehman
排版:陈仕发
一审一校:任露洋
二审二校:马将
三审三校:郑纯