展開指数の精度をランダムフォレストを使って上げる事にした。
普通の単回帰LMよりも若干精度があがる。
今までは予測値と結果の誤差の指標のRMSEが11.40だったが、
ある特徴量を加えてランダムフォレストで予測すると9.63まで誤差が少なくなった。
グラフは横軸が結果で縦軸が予測値だ。まだ誤差だらけだが、予測値と結果に
なんとか相関がみられる。グラフ左側の疎な点の集まりは出遅れですから、気にしないことにします。
さてRMSEという指標でどこまで誤差を少なくできるか、コツコツと精度を上げていきます。
以前読んだ「超予測力」という本にこう書かれている。
予測をする人々は
自分たちの予測の正確さがどれくらいか分かっていない。
予測の正確さをどこまで高められるか分かっていない。
せいぜい「この程度」というぼんやりとした感覚がある程度だ。
その原因は「予測・測定・見直し」という手続きを実践していないからだ。
ビル・ゲイツはこう書いている
「人々の置かれた状況を改善するうえで、
測定する事がいかに重要かを痛切に感じた。
明確な目標を設定し、その目標に向けた進歩を促すような指標を見つければ、
素晴らしい進歩を達成できる。(中略)
当たり前のことに思えるかもしれないが、
それがなされていないことが驚くほど多く、
またきちんとやるのはとても難しい。」
ようやく「超予測力」の意味が分かりました。
The Best is yet to come.
tigeroddsのmy Pick