文章来源于互联网:首个公开发表的SAR图像目标识别基础模型!国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0
-
技术层面,SAR 目标识别方法多为有监督、静态、单任务、单模型、单平台,对特定类别的检测和分类,都需要各自的算法模型,每个任务都必须从头开始独立学习,这导致计算冗余、算法设计周期长、泛化能力严重不足、高标注依赖等问题。 -
生态层面,由于 SAR 图像数据敏感性、标注代价昂贵等因素,缺乏良好的、开源的代码、评估基准和数据生态,导致很多 SAR 目标识别算法不开源、算法评估基准不统一、目前尚无公开的百万 / 千万级大规模高质量 SAR 目标识别基准数据集等问题。

研究成果以 “SARATR-X:面向 SAR 目标识别的基础模型(SARATR-X: Towards Building A Foundation Model for SAR Target Recognition)” 和 “预测梯度更好:探索联合嵌入-预测框架的 SAR ATR 自监督学习(Predicting gradient is better: Exploring self-supervised learning for SAR ATR with a joint-embedding predictive architecture)”,被国际顶级学术期刊《IEEE Transactions on Image Processing》录用和《ISPRS Journal of Photogrammetry and Remote Sensing》发表。
团队的代表性工作一经发表、录用后,已经引起国内外同行关注,获得积极评价。引文单位包括美国空军研究实验室、法国古斯塔夫・埃菲尔大学、新加坡南洋理工大学、北京大学、武汉大学、北京航空航天大学等。
例如,ISPRS Journal 主编、LASTIG 实验室主任 Clement Mallet 在其论文《AnySat: An Earth Observation Model for Any Resolutions, Scales, and Modalities》中认为 “SAR-JEPA [41] 首次将联合嵌入预测框架概念应用于对地观测,专门用于 SAR 数据。(引文原文:SAR-JEPA [41] introduces the first implementation of JEPA concepts for EO, focusing exclusively on SAR data. In this paper, we combine JEPA with a versatile spatial encoder architecture, allowing a single model to handle diverse data scales, resolutions, and modalities.)”
此外,该团队正在加紧研制 SARATR-X 2.0,预计参数规模 3 亿,SAR 目标切片样本规模 200 万,其中收集的数据将形成开源数据集以服务生态建设,近期将发布 SAR 车辆目标识别数据集 NUDT4MSTAR。






-
题目:SARATR-X: Towards Building A Foundation Model for SAR Target Recognition -
期刊:IEEE Transactions on Image Processing -
论文:https://arxiv.org/abs/2405.09365 -
代码:https://github.com/waterdisappear/SARATR-X -
年份:2025 -
单位:国防科技大学、上海人工智能实验室 -
作者:李玮杰、杨威、侯跃南、刘丽、刘永祥、黎湘
-
题目:Predicting gradient is better: Exploring self-supervised learning for SAR ATR with a joint-embedding predictive architecture -
期刊:ISPRS Journal of Photogrammetry and Remote Sensing -
论文:https://www.sciencedirect.com/science/article/pii/S0924271624003514 -
代码:https://github.com/waterdisappear/SAR-JEPA -
年份:2024 -
单位:国防科技大学、上海人工智能实验室、南开大学 -
作者:李玮杰、杨威、刘天鹏、侯跃南、李宇轩、刘振、刘永祥、刘丽