展開指数の精度をランダムフォレストを使って上げる事にした。

普通の単回帰LMよりも若干精度があがる。

今までは予測値と結果の誤差の指標のRMSEが11.40だったが、

ある特徴量を加えてランダムフォレストで予測すると9.63まで誤差が少なくなった。

グラフは横軸が結果で縦軸が予測値だ。まだ誤差だらけだが、予測値と結果に

なんとか相関がみられる。グラフ左側の疎な点の集まりは出遅れですから、気にしないことにします。

 

さてRMSEという指標でどこまで誤差を少なくできるか、コツコツと精度を上げていきます。

 

以前読んだ「超予測力」という本にこう書かれている。

 

予測をする人々は
自分たちの予測の正確さがどれくらいか分かっていない。
予測の正確さをどこまで高められるか分かっていない。
せいぜい「この程度」というぼんやりとした感覚がある程度だ。
その原因は「予測・測定・見直し」という手続きを実践していないからだ。

ビル・ゲイツはこう書いている
「人々の置かれた状況を改善するうえで、
測定する事がいかに重要かを痛切に感じた。
明確な目標を設定し、その目標に向けた進歩を促すような指標を見つければ、
素晴らしい進歩を達成できる。(中略)
当たり前のことに思えるかもしれないが、
それがなされていないことが驚くほど多く、
またきちんとやるのはとても難しい。」

 

ようやく「超予測力」の意味が分かりました。

The Best is yet to come.