離婚後の日記

離婚した。

4.3 交互作用と多項式

(60m)13:00~14:00

 

ビニング毎の傾き:

binsはダミーして0or1状態なので

X_product=np.hstack([X_binned,X*X_binned])で

bin + bin*特徴量を作ると傾きも出る。

 

Plynomial Features:

(degree=X)に応じて特徴量を拡張する。

どのような拡張したかは

poly.get_feature_names()で確認。

二乗していったり特徴量をかけ合わせたり。

多項式化は1次元のデータに対し有用であるが
複雑なモデル(SVR・・・)などを使えば特徴量の拡張を行わずとも
同様の結果を導き出せる。

RidgeとRandomForesstRegressorとの比較でも明らかで

①特徴量を拡張しないRidge

②特徴量を拡張したRidge

③特徴量を拡張しないrf

④特徴量を拡張したrf

スコアは以下である。

③>④>②>①

(rfでは特徴量を拡張すると性能が下がる)

多項式化は単純な線形モデルに対して有用である。