2024年4月
分析設計/データ理解
分析をはじめるにあたり、まずはデータが持つ性質について理解することは分析の方針を決める際に重要です。
ここでは、時系列データがもつ基本的な性質を説明し、 特に、時系列データの時間依存性、季節性やトレンドに関する性質について説明します。
時系列データとは、時間の経過に伴って連続的または一定の間隔で記録されたデータのことです。 (※ 時間間隔が一定ではない時系列データもありますが、本コンテンツでは、日次や年次などの一定の時間間隔で観測された時系列データのみを対象とします)。
例えば、株価データや Web サイトのアクセス数、IoT デバイスから得られるセンサーデータなども時系列データの例として挙げられます。
また、身近な例としては気温データなどの気象データは時系列データの典型例です。 特定の地点における日々の最高気温や最低気温を記録することで、長期的な気候変動の観測だけでなく短期的な天候の変化も把握でき、 季節ごとの周期的な変化を分析することで、農作物の生産管理などの意思決定に役立てることができます。
時系列データは、次のような特徴を持つことがあります。
時間依存性:過去の値が未来の値に影響を与える可能性があります。例えば、株価は過去の経済動向や市場心理に影響を受けます。
季節変動:特定の時間周期(日、週、月、年)におけるパターンや繰り返しが見られます。例えば、小売業の売上は年末年始や夏季休暇などの季節によって変動します。
傾向変動(トレンド):長期的な上昇または下降の傾向が存在することがあります。例えば、ある企業の成長に伴い、その売上は数年にわたって上昇傾向を示すかもしれません。
残差変動(ノイズ):トレンドや季節性によって説明されないデータの変動が存在することがあります。ランダムなノイズやデータ内の他の非定型的なパターンが含まれる可能性があります。例えば、株価は時々、予測モデルに影響を与えないランダムな変動を示すことがあります。
例えば、株価データに対して STL 分解(Seasonal Decomposition Of Time Series By Loess)を行うことで、傾向変動、季節変動、残差変動などの各成分に分解されたデータを視覚的に確認できます。 このように時系列データをいくつかの成分に分割することでデータの理解を深めることができます。