近日,我校未來交通學院智慧城市智能交通團隊在交通運輸領域國際頂級期刊《IEEE Transactions on Intelligent Transportation Systems》(T-ITS)上發表題為《MAGAE: Multi-level Alignment over Aggregation Semantic Graph with Attribute Enhancement for Text-based Vehicle Retrieval》的研究成果。未來交通學院2021級本科生張瑞軒、楊喆普分別為論文第一和第二作者,戴濤副教授為通訊作者,長安大學為第一署名單位和第一通訊單位。這是我校近年首次由本科生為第一作者在該行業頂級期刊發表論文。
隨著城市和交通的數字化程度不斷提高,車輛檢索技術已成為智能交通系統的重要組成部分。近年來,基于自然語言的車輛檢索以其高靈活性和更廣闊的應用價值,受到了學術界和工業界的廣泛關注。為彌合自然語言和車輛圖像之間存在巨大的語義鴻溝,本研究提出了一種新方法,稱為“基于多層次對齊聚合語義圖與屬性增強的自然語言車輛檢索方法(MAGAE)”。

圖1.基于自然語言和基于圖像的車輛檢索方法流程對比
研究采用大型語言模型(LLMs)和預訓練視覺模型提取自然語言和全局視覺的特征嵌入,提出了一種全新用于動態集成車輛局部和全局特征的F-Encoder架構,設計了一種協同注意力學習機制,用于提取并增強車輛屬性嵌入的魯棒性;為彌合視覺與自然語言之間的顯著差距,論文引入多層次語義圖對齊模塊,以有效對多模態數據屬性進行聚合和交互。最后,為提高神經網絡學習能力,引入學習損失函數,利用多任務學習優點有效提升檢索效果,并在國際公開數據集CityFlow-NL上驗證了所提出MAGAE算法的有效性。本研究成果為自然語言車輛檢索提供了新的研究視角,有助于推動基于大模型的城市交通管理能力與運行效率提升。

圖2.MAGAE模型架構示意圖

圖3.MAGAE自然語言車輛檢索結果示意圖
長安大學未來交通學院是學校響應國家“交通強國”戰略、推進交通運輸工程國家“雙一流”學科建設和落實教育部“未來技術學院”建設要求而設立的特色學院。自成立以來,學院始終將人才培養放在首位,積極探索“主輔修結合,培養個性化、學術國際化”的本碩博貫通培養模式,致力于全面激發學生科研潛能與創造力。此次,本科生張瑞軒以第一作者身份在交通領域頂級學術期刊發表論文,正是學校和學院高水平育人成果的詮釋。

圖4.論文已在IEEE Xplore數據庫在線開放
注:IEEE T-ITS是國際電氣和電子工程師協會(IEEE)智能交通系統分會的旗艦期刊,關注交通系統中信息技術的設計、分析和控制,其主題涉及智能交通系統技術諸多領域。該刊當前影響因子為7.9,H-index指數112,在科睿唯安JCR分區屬于Q1類Top期刊。
論文鏈接:https://ieeexplore.ieee.org/document/11005612
(審稿:湯穎穎 網絡編輯:和燕)