跨場景持續行人重識別技術,是目標檢測和目標跟蹤的重要環節,通過從連續的數據流中不斷學習,隨著時間的推移進行非重疊相機檢索相同身份的行人。該項技術可用于視頻監控、智能安防、多機協同檢測等場景。
然而,在跨場景持續行人重識別任務中,往往存在著任務間隔閡和模型表征能力受限等問題,限制了模型在舊知識抗遺忘與新信息自適應學習之間的平衡能力。
近日,中國科學院沈陽自動化研究所機器人學研究室機器智能研究組科研團隊提出了一種多樣化表征嵌入框架,可有效地提升模型的抗遺忘和自適應學習能力。該框架采用基于Transformer的主干網絡,通過最大化嵌入和多重類別令牌技術,為每個實例生成多個表征。為了提升模型的表征能力,科研團隊設計了自適應約束模塊,通過對多個表征執行整合和判別操作,確保特征多樣性的同時消除冗余信息??蒲袌F隊還提出了知識更新和知識保護策略,強化模型對新信息適應能力的同時保護歷史知識。在大規模數據集、遮擋場景等11個數據集上,驗證了所提方法的有效性。
該研究以Diverse Representations Embedding for Lifelong Person Re-Identification為題發表于IEEE?Transactions?on?Neural?Networks?and?Learning?Systems。沈陽自動化所博士生劉世本為第一作者,范慧杰研究員為通訊作者。
上述研究得到了國家自然科學基金和機器人與智能系統全國重點實驗室等項目支持。