12月8日上午,由研究生院/研究生工作部主辦、運輸工程學院承辦、校研究生科學技術協會協辦的“虹”學講堂第528講在南校區東院伯聲報告廳舉行。西北工業大學周琛淏教授作題為“競合模式下的水平運輸充電與作業調度”的報告,相關學院共200余名師生參加講座。

周琛淏教授作報告
本次報告主要圍繞基于多智能體強化學習的水平運輸充電與作業調度優化和基于多智能體構架的水平運輸在線路徑優化與仿真兩個方面展開。周琛淏教授提出了自動導引車(AGV)任務分配的多智能體Q學習模型,該模型通過將每一個學習智能體與一臺AGV關聯,實現智能體之間的信息交互,使每個智能體的學習過程既競爭又合作,實現集中訓練和分散執行。針對隨機速度下的車輛充電與作業調度問題,周琛淏教授構建了馬爾科夫決策過程模型,精確地反映車輛與環境間的動態交互。周琛淏教授還引入了基于演員-評論家框架的多智能體深度強化學習算法,該算法克服了狀態空間巨大的問題,訓練好的模型能夠適用于集裝箱碼頭不同規模的水平運輸充電與作業調度實時求解。周琛淏教授針對在線路徑優化提出了兩階段在線算法,并結合實際情況搭建了仿真平臺,驗證了該算法在大型復雜網絡交通中能夠科學高效地規劃車輛路徑,解決了大規模無死鎖車輛路徑規劃問題,證明了其落地應用的可行性。
報告結束后,周琛淏教授回答了老師們和同學們的問題,使大家對競合模式下的水平運輸充電與作業調度有了更為深入的了解。
(審稿:胡錦玉 網絡編輯:和燕)