日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號(hào)
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

清華大學(xué)車輛與運(yùn)載學(xué)院智能駕駛課題組榮獲ICCAS 2020最佳學(xué)生論文獎(jiǎng)

2020-11-04 23:08:36·  來源:清華大學(xué)車輛與運(yùn)載學(xué)院  
 
2020年10月13-16日,第20屆國際控制自動(dòng)化與系統(tǒng)大會(huì)(ICCAS 2020)于韓國釜山市召開。車輛學(xué)院李升波老師指導(dǎo)穆堯、彭柏寓等人,以清華大學(xué)為第一單位發(fā)表論文
2020年10月13-16日,第20屆國際控制自動(dòng)化與系統(tǒng)大會(huì)(ICCAS 2020)于韓國釜山市召開。車輛學(xué)院李升波老師指導(dǎo)穆堯、彭柏寓等人,以清華大學(xué)為第一單位發(fā)表論文《Mixed Reinforcement Learning for Efficient Policy Optimization in Stochastic Environments》,榮獲“最佳學(xué)生論文獎(jiǎng)”(Student Best Paper Award)。此次會(huì)議總共錄用全世界25個(gè)國家和地區(qū)的近500篇論文,其中12篇入圍“最佳學(xué)生論文獎(jiǎng)”的提名環(huán)節(jié),這是最終獲獎(jiǎng)的5篇優(yōu)秀論文之一。

車輛學(xué)院穆堯、彭柏寓等同學(xué)發(fā)表的論文榮獲第20屆ICROS國際控制自動(dòng)化與系統(tǒng)大會(huì)(ICCAS 2020)“最佳學(xué)生論文獎(jiǎng)”
知識(shí)與數(shù)據(jù)聯(lián)合驅(qū)動(dòng)學(xué)習(xí)是人工智能領(lǐng)域最重要的發(fā)展方向之一。該研究工作以探索能力受限且不確定性環(huán)境為對象(典型例子是行駛于城市道路的自動(dòng)駕駛汽車),提出了模型與數(shù)據(jù)同步驅(qū)動(dòng)的混合強(qiáng)化學(xué)習(xí)(MAC,Mixed Actor-Critic)算法,突破了收斂快速性和策略準(zhǔn)確性難以同時(shí)保障的難題。該法以經(jīng)驗(yàn)解析模型和真實(shí)交互數(shù)據(jù)的混合表征模型為基礎(chǔ),首次將策略迭代(Policy Iteration)的兩步結(jié)構(gòu)擴(kuò)展為三步結(jié)構(gòu),即:迭代貝葉斯估計(jì)(IBE)、策略評估(PEV)、策略改進(jìn)(PIM),且理論證明了該三步迭代學(xué)習(xí)結(jié)構(gòu)的收斂性與最優(yōu)性,這為模型與數(shù)據(jù)混合驅(qū)動(dòng)學(xué)習(xí)提供了全新的統(tǒng)一框架。


以自動(dòng)駕駛汽車的運(yùn)動(dòng)控制任務(wù)為例,驗(yàn)證表明:該法有效提升了自動(dòng)駕駛控制策略的學(xué)習(xí)速度,與純數(shù)據(jù)驅(qū)動(dòng)法相比提速近25倍,同時(shí)保證了所求解策略的最優(yōu)性,與純模型驅(qū)動(dòng)法相比性能提升約15%。該算法為高級別智能汽車進(jìn)一步發(fā)展自我進(jìn)化型駕駛智能奠定了基礎(chǔ)。

注:ICCAS全稱” The International Conference on Control, Automation, and Systems”, 是機(jī)器人與智能控制領(lǐng)域的頂級學(xué)術(shù)會(huì)議之一,每年召開一次。 
分享到:
 
反對 0 舉報(bào) 0 收藏 0 評論 0
滬ICP備11026917號(hào)-25