4.2 ビニング
(60m)08:30~09:30
4.2 ビニング(決定木、線形モデル)
ビニング(離散化):データを分割する。
bins=np.linspace(-3,3,11)
bins:[-3. -2.4 -1.8 -1.2 -0.6 0. 0.6 1.2 1.8 2.4 3. ]
#10個のビン(離散化)ができた
#これをワンホットエンコダー(ダミー)する。
from sklearn.preprocessing import OneHotEncoder
encoder=OneHotEncoder(sparse=False)
encoder.fit(which_bin)
X_binned=encoder.transform(which_bin)
[ 0. 1. 0. 0. 0. 0. 0. 0. 0. 0.]]…