擷取選取區域_266.png

Label Encoding (標簽編碼)

  • 把每個類別 mapping 到某個整數,不會增加新欄位
  • 用來解決類別型數據的離散值問題
  • 離散特徵的取值有大小意義
  • 例如尺寸

# from sklearn.preprocessing import LabelEncoder

# le = LabelEncoder( )

# le.fit(DataFrame[欄位名])

# DataFrame[欄位名] = le.transform(DataFrame[欄位名])

 

One Hot Encoding (獨熱編碼)

  • 為每個類別新增一個欄位,用 0/1 表示是否
  • 用來解決類別型數據的離散值問題
  • 離散特徵的取值沒有大小意義
  • 例如顏色、車種

# DataFrame = pd.get_dummies(DataFrame)

  • 新增欄位名為 : 原始欄位_類別
  • 若有3個類別及新增3個欄位
創作者介紹
創作者 Rex-Software-Blog 的頭像
Rex

Rex-Software-Blog

Rex 發表在 痞客邦 留言(0) 人氣( 253 )