ビッグデータ時代の分析手法として注目されるARIMAモデル
ARIMAモデルという予測分析の手法に注目が集まっている。
流通業で多用されているPOS(販売時点情報管理)など時間とともに変化する大量のデータを分析するために、従来の欠点が是正され、有用性が増している。
重回帰分析とARIMAモデル
よく用いられている予測手法に重回帰分析がある。原因から事態を分析する手法だが、欠点は、過去の原因が解明できたとしても、次はその原因事態を予測しなければならず、「予測の予測」といった矛盾が生じてしまう点だ。また、実績値を説明する変数と係数を定めるのに人間の判断を必要とするため、モデル構築の作業負荷が大きい。
一方、ARIMA(Autoregressive Integrated Moving Average:自己回帰和分移動平均)モデルは、重回帰分析に比較するとデータ取得・メンテナンスのコストが低い。予測に使用する変数は予測対象の実績値のみで済むからだ。
ところが、「ARIMAモデルはあまり活用が進んでいない」と野村総合研究所の今井恒上級コンサルタントは解説する。その理由はパラメータの推計に時間がかかること、多変量解析と同様にモデルの構築に人的な負担が大きいことにある。
ARIMAモデルの実証
しかし、実務の分野ではさまざまなパターンの時系列変動データに対して、少数の専門家が限られた事例ではあるが、ARIMAモデルを構築・研究してきた。
NPOビュー・コミュニケーションではこの数年、ARIMAモデルの解析力、現場適応性について研究を進め、一見するとパターンが見られない変動を日常的に生じる現実の時系列データでその適用性を検証してきた。対象となったデータは食品売上高、商品販売高、個人販売高、GDP、市場全体の日次、週次などのデータである。
その結果、ARIMAモデルは現実データに対する説明力、予測力を超えたきわめて優秀な適合性を持つことが判明したとしている。
改良されるARIMAモデル
また、ARIMAモデルの弱点を解決するための取り組みも始まっている。その一例が野村総合研究所(NRI)での取り組みだ。
NRI 上級コンサルタントの今井恒氏によると、NRIではARIMAモデルを用いた時系列解析による予測エンジンの開発・改良を行っており、最近では、推計アルゴリズムの進化により、予測計算ごとに自動的に次数・係数を十分に実用的な処理速度で推計することが可能になったという。
この予測エンジンでは多数のセンサーについて1秒ごとに予測を行うような用途では、コストを含めまだ実用的ではないが、流通業での受発注数量の予測のように、1日ごとに予測計算を行う場合や、数分ごとに予測計算を行う程度であれば「十分に実用的だ」と今井氏は語っている。
参考:
野村総合研究所「ITソリューションフロンティア」2013年8月号「進化するARIMAモデル」
特定非営利活動法人 ビュー・コミュニケーションズ「時系列解析法としてのARIMAモデルと予測についての概説」
http://www.viewcom.or.jp/images/OutlineoOfARIMA.pdf
画像:
photo credit: SalFalko via photopin cc