運動・勉強・記録

python勉強中。

5.2.3.3~5.3 評価基準とスコア

(60m)15:00~16:00

 

 

5.3評価基準とスコア

実際には偏ったデータが多い為、R2スコアではわからない部分がたくさんある。

以下に注意。

 

エラーの種類:
陽性 :TP(True positive 求めている成果)
偽陽性:FP(False positive)
陰性 :TN(True negative)
偽陰性:FN(False negative)
 
精度の種類:
精度 :TP+TN/TP+FP+TN+FP
適合率(precision):
TP/TP+NP(陽性を陽性と判断したもので割る→偽陽性を数値化)
再現率(recall):
TP/TP+NF(陽性を陽性と間違えて陰性と判断したもので割る→偽陰性を数値化)
f1_score:
2*((適合率*再現率)/適合率+再現率) これで適合率、再現率ともに総合的に判断できる。
classification_report:
使うとわかりやすい。

 

from sklearn.metrics import classification_report

print(classification_report(y_test,pred_logreg,target_names=["not nine","nine"]))

 
             precision    recall  f1-score   support
             (適合率) (再現率)(f1スコア)(支持度 サンプル数)
   not nine       0.98      1.00      0.99       403
       nine       0.95      0.83      0.89        47

avg / total       0.98      0.98      0.98       450