close
Label Encoding (標簽編碼)
- 把每個類別 mapping 到某個整數,不會增加新欄位
- 用來解決類別型數據的離散值問題
- 離散特徵的取值有大小意義
- 例如尺寸
# from sklearn.preprocessing import LabelEncoder
# le = LabelEncoder( )
# le.fit(DataFrame[欄位名])
# DataFrame[欄位名] = le.transform(DataFrame[欄位名])
One Hot Encoding (獨熱編碼)
- 為每個類別新增一個欄位,用 0/1 表示是否
- 用來解決類別型數據的離散值問題
- 離散特徵的取值沒有大小意義
- 例如顏色、車種
# DataFrame = pd.get_dummies(DataFrame)
- 新增欄位名為 : 原始欄位_類別
- 若有3個類別及新增3個欄位
文章標籤
全站熱搜
留言列表