4.3 交互作用と多項式
(60m)13:00~14:00
ビニング毎の傾き:
binsはダミーして0or1状態なので
X_product=np.hstack([X_binned,X*X_binned])で
bin + bin*特徴量を作ると傾きも出る。
Plynomial Features:
(degree=X)に応じて特徴量を拡張する。
どのような拡張したかは
poly.get_feature_names()で確認。
二乗していったり特徴量をかけ合わせたり。
多項式化は1次元のデータに対し有用であるが
複雑なモデル(SVR・・・)などを使えば特徴量の拡張を行わずとも
同様の結果を導き出せる。
RidgeとRandomForesstRegressorとの比較でも明らかで
①特徴量を拡張しないRidge
②特徴量を拡張したRidge
③特徴量を拡張しないrf
④特徴量を拡張したrf
スコアは以下である。
③>④>②>①
(rfでは特徴量を拡張すると性能が下がる)
多項式化は単純な線形モデルに対して有用である。