離婚後の日記

離婚した。

2019-05-01から1ヶ月間の記事一覧

7章 テキストデータの処理

7章 コードにわからない部分が多い。導入も苦労した。 ・BOW(bag of words) 1-トークン分割 スぺースや句読点で句切り、細かい単位(単語…)にする。 2-ボキャブラリ構築 ボキャブラリとして整理し番号をつける。 3-エンコード 個々の文章に現れる回数を数…

6章 アルゴリズムチェーンとパイプライン

間が空いてしまって色々忘れる。 継続しなければならない。 6章 前処理を検証用テストデータにも適用してしまうと過度な汎化が起きる。(? 例えばMinMaxを全データにかけてしまうと、汎化能力が上がる(場合もある)が 実際にはテストデータは未知なもので…