![]() ![]() |
大規(guī)模強(qiáng)化學(xué)習(xí)中的新型函數(shù)近似技術(shù)研究 本書(shū)主要研究如何通過(guò)新型函數(shù)近似技術(shù)提升大規(guī)模強(qiáng)化學(xué)習(xí)器的性能。本書(shū)首先分析了傳統(tǒng)的函數(shù)近似技術(shù),如Tile編碼與Kanerva編碼在處理大規(guī)模問(wèn)題性能不佳的原因,即原型沖突與不均勻的原型訪問(wèn)頻率分布。為了解決這些問(wèn)題,本書(shū)分別應(yīng)用自適應(yīng)Kanerva函數(shù)近似、模糊邏輯函數(shù)近似與基于粗糙集的函數(shù)近似等方法對(duì)強(qiáng)化學(xué)習(xí)中的函數(shù)近似方法進(jìn)行改進(jìn)。本書(shū)還將以上函數(shù)近似方法分別應(yīng)用于強(qiáng)化學(xué)習(xí)中不同難度的捕食者-獵物追逐問(wèn)題與認(rèn)知無(wú)線電網(wǎng)絡(luò)應(yīng)用問(wèn)題,以此進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明:本書(shū)所提方法不僅提高了類似問(wèn)題的求解率,同時(shí)減少了所需原型數(shù)量,最終顯著提高了函數(shù)近似技術(shù)解決大規(guī)模強(qiáng)化學(xué)習(xí)與多智能體問(wèn)題的有效性。
你還可能感興趣
我要評(píng)論
|