7章 コードにわからない部分が多い。導入も苦労した。 ・BOW(bag of words) 1-トークン分割 スぺースや句読点で句切り、細かい単位(単語…)にする。 2-ボキャブラリ構築 ボキャブラリとして整理し番号をつける。 3-エンコード 個々の文章に現れる回数を数…
間が空いてしまって色々忘れる。 継続しなければならない。 6章 前処理を検証用テストデータにも適用してしまうと過度な汎化が起きる。(? 例えばMinMaxを全データにかけてしまうと、汎化能力が上がる(場合もある)が 実際にはテストデータは未知なもので…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。