BigQuery ML 機械学習で 2020年桜の開花日を予測する!Part 4

Part 1・2・3 では桜の開花日予測モデルの作成と、それに基づいて今年 2020年の桜の開花日予測を行った。

BigQuery ML 機械学習で 2020年桜の開花日を予測する!Part 3

この Part 4 では、

  • その後の実績データの更新に基づく予測のアップデート
  • 気象協会等他の機関や気象予報会社の予想との比較

について記載しよう。

 

2020年 桜開花予測更新情報

前回の予測時は 1/28 迄が実績データ、それ以降は前年までの同じクラスタ年の平均を用いた。
その後 1ヶ月程経過したのでこの冬の気温データを更新し、再度予測を実施してみよう。

この約 1ヶ月の平均気温・最高気温実績で上書きすると、この冬の平均気温は前回の 8.9℃から 9.2℃約 0.3℃上昇。やはりこの冬は相当な暖冬だ。

 

ロジスティック回帰での予想

 

新しいデータでの予測では、3/21 と出た。前回予想の 3/20 から一日後ろにズレた。暖冬の傾向が更に強まって累積気温がもっと必要になったと考えると妥当かもしれない。

 

線形回帰での予測

 

一方線形回帰では、3/19 と逆に一日前倒しになった。
前回予測まではロジスティック回帰モデルも線形回帰モデルも 3/20 と同じ日を返していたが、これで前後に一日ずつずれて異なることになった。
どちらが正しいのか。あるいは両方とも違うのか。どうなるか様子をみてみよう。

 

その他気象予報会社等の予測は?

さて、気象予報協会等他の機関、気象予報会社の今年の予報はどうなっているだろう?
なお、気象庁は実績の把握・公表しかしておらず、予報は行っていない。

 

ウェザーニュース社

https://weathernews.jp/s/topics/202001/140195/

3/21
僕の予想と近い。

 

日本気象協会 tenki.jp

https://tenki.jp/sakura/expectation/

3/17
少し早めだね

 

日本気象株式会社

https://n-kishou.com/corp/news-contents/sakura/

3/15
これは早い! 各社の中でも最速!

 

まとめ

という訳で各社の予報にもバラつきがあった。

実は、僕が最初に BigQuery ML で予測した 1月下旬〜 2月頭の頃は各社の予想も 3/20前後に集中していた。かなりの暖冬にもかかわらずむしろ早めの予測が出てちょっと不安だったが、他社も同じような予想だったので正直ホッとしたものだ。
が、その後 1ヶ月が経って更に暖冬の実績が積み重なるに伴い各社の予測もバラけてきた。
それぞれどんなデータや予測手法を使っているのか興味がある。僕と同じように機械学習を使っているのであればどんなモデルを使って、ハイパーパラメーターはどのように調整 / チューニングしているのだろうか?

そして、どこが的中させるだろう? あと一ヶ月もしないうちに答えが出るハズだ。どうなるか様子をみてみよう。

 

各種 SNS アカウントでコメントできます