\r\n\r\n
エクセルの時系列予測機能は、提供されたデータを使って、将来起こりうるデータを推定することができます。完璧ではありませんが、データが実際に何を語っているのかを知ることができます。未来を垣間見ることができる、とでも言いましょうか。
エクセルでの予測には、2種類の方法があります。まず、いくつかの予測関数は、スプレッドシートのセル内で直接使用することができます。2番目の方法は、グラフィカルなインターフェイスを使用し、より簡単に使用できるので、これを中心に説明します。
これらの関数の使い方を本当に知りたい場合は、マイクロソフトのExcel forecast functi***ガイドを参照してください。ただし、「予測表」ボタンを押すことをお勧めします。
その前に、Excelを使ってデータを予測したときに得られる結果を理解することが重要です。
予測機能は、三重指数平滑化(ETS)と呼ばれるプロセスを使用して、既存のデータを取得し、現在のパターンに基づいて予測を行います。ETSは、最新の値がより重く、過去の値がより軽くなるように、系列の過去の値に重みを付けます。
Gregory Trubetkoiの指数平滑化の説明は、私が見つけた非数学者の中で最も理解しがたいものの一つです。複雑な処理ではあるが、結果的に直近の数値の系列が予測値に大きな影響を与えるという事実がある。
Excelには、ETSの動作方法を調整するためのオプションがいくつか用意されていますが、これについては後ほど説明します。
Excelの予測機能を正しく動作させるには、データが特定の形式であることが必要です。
1つは時刻表で、日付、時刻、または時刻の変化を指定する一連の数字を含む必要があります。
1月1日、2月1日、3月1日、4月1日、4月15日、5月1日に売上がないことはありえません。これらの日付を数字に置き換えることは可能ですが、そうすると予測の精度が落ちる可能性があります。
2列目はデータで、これは将来の予測です。
データ予測の一例として、架空の月次売上高を記載したスプレッドシートを作成しました。
Excelの予測を使い始めるには、データをハイライトし、「データ」 > 「予測表」に進みます。
予測シート」ボタンをクリックすると、青色でデータ、オレンジ色で予測データを含む整形されたグラフが表示されます。
新しいウィンドウで「作成」をクリックすると、より永続的なバージョンのグラフと予測値の表が表示されます。また、表には95%信頼区間(グラフ上でも表現されている)も記載されている。
これはすでに価値あるものですが、いくつかの設定をいじることで、得られるデータをカスタマイズして、よりよい予測を得ることができます。
予測表の作成」ウィンドウでは、デフォルトではドロップダウン・メニュー「予測の終了」だけが表示されます。
予測終了日では、どの程度先の未来を予測するかを選択することができます。
上のグラフでは、時間と共に信頼区間が拡大する拡張予想を見ることができます。
追加の予測オプションにアクセスするには、ウィンドウの下部にあるオプションをクリックします。
それぞれの選択肢について、順を追って説明します。
Forecast Startは、Excelがデータの予測を開始するタイミングを選択することができます。ほとんどの場合、タイムライン上の最後のポイントから取得することになります。
Excelの予測値と実際のデータが一致するかどうか、確認のために早めに設定しておく必要があるかもしれませんね。しかし、一般的にはこのオプションは無視しても大丈夫です。
信頼区間線のオン・オフや計算の有無を選択するのに使用します。95%はほとんどの場合、信頼区間の標準値です。
これは、Excelが予測値がこの2行の間に入ることを95%確信していることを意味します。
季節性はタイムラインの繰り返しを定義します。ほとんどの場合、Excelは自動的に計算しますが、他の場合は自分で変更する必要があります。
例えば、この表計算ソフトの例では、季節性を4に変更すると、より良いデータが得られます(各繰り返しサイクルに4つのポイントがあるため、4を使用します)。以下は、季節感の自動検出の予測結果である。
季節感を4にしてみるとこんな感じです。
これは、10月頃の一般的な販売不振をよりよく反映したものです。可能な限り最適な数値を得るために、ご自身のスプレッドシートで試してみる価値があります。
ただ、季節ごとの数値は正確にしてください。月次データなら季節性は12、1年間の週次データなら52、半年ごとなら26を使用する。
予測統計を含む」がチェックされている場合、Excelは最終ワークシートに追加の基本統計情報を提供します。以下は、あなたが得られる統計情報です。
この統計の意味がわからなくても、気にしないでください。
タイムライン範囲と値域は、データを入力する列です。Excelが不正なデータを受信した場合、これらを調整することができますが、調整する必要がない場合もあります。
欠損点の補填の使用について議論する前に、予測における欠損データについて議論する必要があります。予測機能は、タイムラインにすべてのデータポイントが含まれていない場合でも動作します。Excelは、いくつかの情報が欠けていても、予測を実行します。
欠損点を埋める標準的な方法は、欠損点に隣接する値の加重平均を用いる補間法である。特に、これしか選択肢がないことを考えると、良い選択だと思います。
Excelに補間をさせたくない場合は、ドロップダウンリストから「ゼロ」を選択すると、欠損データスペースに**ゼロを入れることができます。しかし、これらの欠損値が実際にゼロである可能性が低い場合は、予測を破棄することになります。
重複値の集計」ドロップダウンリストは、データの特定の状況に関連するものです。データのある時点で2つのエントリーがある場合、Excelは2つのエントリーを平均して最終的な値を決定します。カウント、中央値、合計など、さまざまな操作に変更できます。
すべてのオプションを希望通りに設定したら、「作成」をクリックすると、データが将来どのようになるかをExcelが最もよく推測し、グラフと予測値でいっぱいの表が表示されます。
過去のデータに基づいてエクセルで予測をする方法がわかったので、この古いスプレッドシートプログラムを使って、未来を予測することを始めましょう!。せめて、過去からイメージを膨らませてみてください。
Excelの予測は完璧ではありませんが、Excelのライブラリにあると便利なツールです。Excelで予測モデルを構築するのは簡単で、ビジネス統計を実行する際に大いに役立ちます。
Excelの予測を使っていますか?また、このイベントに初めて参加する人に何かアドバイスはありますか?あなたの考えを以下のコメントで共有してください。