close

擷取選取區域_266.png

Label Encoding (標簽編碼)

  • 把每個類別 mapping 到某個整數,不會增加新欄位
  • 用來解決類別型數據的離散值問題
  • 離散特徵的取值有大小意義
  • 例如尺寸

# from sklearn.preprocessing import LabelEncoder

# le = LabelEncoder( )

# le.fit(DataFrame[欄位名])

# DataFrame[欄位名] = le.transform(DataFrame[欄位名])

 

One Hot Encoding (獨熱編碼)

  • 為每個類別新增一個欄位,用 0/1 表示是否
  • 用來解決類別型數據的離散值問題
  • 離散特徵的取值沒有大小意義
  • 例如顏色、車種

# DataFrame = pd.get_dummies(DataFrame)

  • 新增欄位名為 : 原始欄位_類別
  • 若有3個類別及新增3個欄位
arrow
arrow
    文章標籤
    python pandas dataframe
    全站熱搜
    創作者介紹
    創作者 Rex 的頭像
    Rex

    Rex-Software-Blog

    Rex 發表在 痞客邦 留言(0) 人氣()