基于異步優勢執行器評價器學習的自適應PID控制設計

摘要:針對已有自適應PID控制器收斂速度慢和計算效率低的不足,基于異步優勢行動者評論家(Asynchronous Advantage Actor-Critic,A3C)算法設計了一種新的自適應PID控制器.該控制器利用A3C結構的多線程異步學習特性,并行訓練多個行動者評論家(Actor-Critic,AC)結構的智能體,每個智能體采用多層前饋神經網絡逼近策略函數和值函數實現在連續動作空間中搜索最優的參數整定策略,以達到最佳的控制效果.算法在提高計算效率的同時降低了學習樣本的相關性.在仿真實驗中通過與已有的多種自適應PID控制器性能的對比分析說明,該方法具有收斂速度快、自適應能力強的特點.

關鍵詞:
  • 深度強化學習  
  • 異步優勢執行器評價器  
  • 自適應pid控制  
作者:
孫歧峰; 任輝; 段友祥
單位:
中國石油大學(華東)計算機與通信工程學院; 山東青島266580
刊名:
信息與控制

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

期刊名稱:信息與控制

信息與控制雜志緊跟學術前沿,緊貼讀者,國內刊號為:21-1138/TP。堅持指導性與實用性相結合的原則,創辦于1972年,雜志在全國同類期刊中發行數量名列前茅。

主站蜘蛛池模板: 成人免费一区二区三区 | 中文字幕av无码不卡免费| 久久综合综合久久| 亚洲色图黄色小说| 国产又大又粗又猛又爽的视频 | 99国产欧美久久久精品| 中美日韩在线网免费毛片视频| 久久国产高潮流白浆免费观看| 久久午夜福利电影| 亚洲伊人久久大香线蕉综合图片 | 亚洲国产模特在线播放| 视频一区中文字幕| 欧美最猛黑人xxxx黑人猛交 | 久久天天躁狠狠躁夜夜呲| 高跟丝袜美女一级毛片| 日本最新免费二区三区| 亚洲精品视频久久久| 四虎影视永久费观看在线| 国产精品影音先锋| 天堂精品高清1区2区3区| 在线不卡一区二区三区日韩| 天天av天天翘天天综合网| 在线资源天堂www| 国产精品色午夜免费视频| 天天狠天天透天干天天怕∴| 强行交换配乱婬bd| 女人18毛片a级毛片免费视频 | 国产裸体美女永久免费无遮挡 | 成人精品一区二区久久| 天天爽夜夜爽人人爽一区二区| 国产美女久久精品香蕉69| 国模吧双双大尺度炮交gogo| 国产精品一卡二卡三卡| 国产麻豆剧传媒精品国产免费| 大香伊蕉国产av| 国产精品亚洲欧美大片在线看| 国产在视频线在精品| 免费看黄a级毛片| 免费午夜爽爽爽WWW视频十八禁| 加勒比色综合久久久久久久久| 亚洲精品综合久久|