![]() ![]() |
基于信息度量的高維數據特征選擇模型和方法
高維數據特征選擇是數據挖掘的重要組成部分,可廣泛應用于生物信息學、統計學及圖像處理等領域。有效選擇信息特征可顯著提高學習精度和結果的可解釋性。為提高分類精度,許多現有特征選擇方法通過去除數據中的冗余和不相關特征來識別信息特征。由于特征維數隨數據規(guī)模的增大而增加,易出現維數災難和過擬合問題;數據高維性不僅增加算法的時間和空間復雜度,也會降低算法的求解精度。針對高維數據特征選擇所存在的問題,本書通過引入互信息、聯合互信息、條件互信息等信息度量,設計合理有效的特征選擇模型和方法來降低數據維度、保留數據的重要特征。本書主要包括自適應結構稀疏回歸模型、多項式自適應稀疏組Lasso模型、最大相關性和最小監(jiān)督冗余準則、加權廣義組Lasso模型等內容。
你還可能感興趣
我要評論
|