機械学習・ディープラーニングがゼロから学べる大人気『脱ブラ』が無料に!

Excel でデータサイエンス!〜JAL と ANA 乗客者数が多いのはどっち?(後編)〜

はじめに

こんにちは、機械学習の講師やセールス&マーケティングを担当している並木です!
本記事では、前回記事の後編として、データの特徴の捉え方や解釈についてお伝えします。
前回記事は以下からご覧ください。
Excel でデータサイエンス!〜JAL と ANA 乗客者数が多いのはどっち?(前編)〜

前回はオープンデータを活用し、サンフランシスコ国際空港発着の日本航空株式会社(以下 JAL)と全日本空輸株式会社(以下 ANA)の乗客者数の推移をグラフ化しました。
今回は、時系列グラフからどのようなことが分かるか、特徴の捉え方とその読み解き方についてお伝えします。
あくまで一例なので、みなさんであればどんな解釈ができるかぜひ考えてみてください!

データの特徴をどう捉えるか?

改めて前回作成した時系列グラフを見てみましょう。
サンフランシスコ国際空港を発着する JAL と ANA の乗客者数の推移です。

トレンド

時系列データの特徴を把握する際に重要なポイントは、データを俯瞰することで全体的な傾向を捉えることです。
これを「トレンド」と呼びます。
今回のグラフ全体を見ると、大きく 3 つの特徴が確認できます。

  1. データ開始の起点となる 2005 年 7 月〜 2009 年末頃までの期間は、JAL の方が明らかに ANA よりも乗客者数が大きい
  2. 2010 年頃からは ANA が逆転し、2020 年までの 10 年間は JAL を上回っている
  3. 2020 年 2 月からは、両社とも激的に低下している
1, 2 の特徴については後述します。
では、3 の特徴は何を意味するでしょうか?もうお分かりの方も多いと思いますが、新型コロナウイルス感染症の拡大に伴う影響です。
グラフで可視化すると、航空業界にどれだけ大きな影響があったかが一目瞭然です。

周期性

また、全体の傾向を捉える「トレンド」だけではなく、一定のサイクルに起因する変化がないかを捉えることも重要です。
以下は、先程のグラフを横に引き伸ばして 2005 年 7 月〜2008年 7 月までの 3 年分だけを切り取ったグラフです。

どんな傾向が読み取れるでしょうか?
縦軸の乗客数の表示幅を絞り、 1 年ごとに赤枠で囲ってみたグラフがこちらです。

いかがでしょうか?
多少の変動はありますが、4 月から 8 月頃にかけて上昇し、8 月から 1 月頃にかけて下降する様子が見て取れます。
データの特徴を把握するうえでは、日 / 週 / 月 / 年など一定のサイクル単位で読み取れる傾向を捉えることも重要です。これを「周期性」と呼びます。

データの特徴をどう読み解くか?

最後に、データの解釈についてお伝えします。
データの特徴をある程度捉えることができたところで、その特徴をどう解釈するべきか考えてみましょう。
トレンドについては、大きく 3 点の特徴をとらえることができました。

  1. 2009 年頃までは JAL が ANA の乗客数を上回っている
  2. 2010 年頃からは ANA の乗客数が優勢に転じている
  3. 2020 年 2 月からは、両社とも激的に低下している
これらの特徴をどう解釈するか、ここまでが Excel を使ってできることであり、ここからは人間が仮説を立てて検証していく領域です。

3 点目は、新型コロナウイルス感染症拡大の影響が大きな要因であろうということは先ほどお伝えしました。
では残りの1,2 点目について考えてみましょう。

まず 1 点目の特徴について、当初は JAL が優勢であったことの要因はいくつも考えられますが、「先発優位性」という観点で考えてみたいと思います。
東京ーサンフランシスコ便就航開始時期を調査すると以下のような結果となりました。

ANA がサンフランシスコ便を就航開始したのが 1998 年であったのに対し、JAL のサンフランシスコ便就航開始は  1954 年にホノルルを経由する形で初めて就航しました。これは戦後、日本初の国際就航便だったそうです。
このように、JAL は ANA に先立つこと 40 年以上であり、「先発優位性」が大きく作用していることが要因の一つとして考えられます。

2010 年頃からは ANA の乗客数が優勢に転じている

では、2 点目の特徴はいかがでしょう。就航開始が JAL よりも 40 年以上後となった ANA が2010年頃を境に優勢に転じたのはなぜでしょうか?
こちらもいくつもの複合的な要因が考えられますが、一つの考え方をご紹介します。

時系列グラフの推移をよく観察してみてください。
まず、2008 年 9 月頃から JAL の乗客数が大きく下落しているのがわかります。ただしこの時は、ANA の乗客数も同様に大きく下落していますので、外的な要因の影響が大きいと考えられます。このときは、2008 年 9 月に発生したいわゆる「リーマンショック」と時期が重なるため、その煽りを両社とも受けたことによる下落と推察することができます。
したがって、ANA が優勢に転じた要因とは考えにくいです。

一方、2010 年の後半から再び JAL の乗客数が大きく下落しています。このときは ANA の乗客数には JAL ほど大きな下落幅は見られません。そのため、経済危機などの外的要因ではなく、JAL 特有の要因と考えることができそうです。
その観点で調査してみると、JAL が 2010 年 1 月に会社更生法の適用を申請し、経営破綻していたことが分かります。

出典:日航、会社更生法を申請 再生機構が支援を決定

経営再建のために事業規模を縮小したことが、2010 年以降の JAL の乗客数下落の一つの要因と考えることができるでしょう。

まとめ

今回は前編から後編に渡って、Excel を使った時系列グラフの作成からデータの解釈方法まで順を追ってお伝えしました。
データ分析においては、特徴を捉えるためのデータの加工も大切ですが、その結果をどう解釈するか、検証することが非常に重要なポイントです。
データについての専門的な知識データの特徴を読み取る観察力仮説検証する洞察力が問われる領域です。
みなさんご自身の仕事や得意分野など、強みが発揮できる領域でぜひ取り組んでみてください!

プログラミングを使わずとも、まずは Excel を使えば簡単にはじめることができます!

さいごに

今回も、Excel を使ったデータ分析の手法をご紹介しました。
みなさんも生のデータをどう整えて欲しい情報を抽出するか、今回の記事を参考にぜひ取り組んでみましょう!

そこから更に発展的な「データサイエンス」の領域に興味を持っていただいた方は、ぜひキカガクの動画コンテンツもぜひご活用ください!
プログラミングを使えば、驚くほど簡単に多角的なデータ分析を行うことができます。

無料で取り組んでいただけるコンテンツを多数ご用意しております!
「データサイエンス」をもっと身近なものとして活用していきましょう!

大人気コース「Python & 機械学習入門コース」が無料!

現在 e ラーニングプラットフォーム「キカガク」に無料登録すると、これまで多くの方にご受講頂いた、Python の基礎から機械学習の数学やプログラミングまでを学べる大人気コース「Python & 機械学習入門コース」が無料です。

好評である手書きの数学とハンズオン形式のプログラミングを通じて、初学者でも数学の理論から実装まで一から学習できます。また、動画で丁寧に解説しているため、迷うことなく最後まで継続して学習しやすいです。

データサイエンスのスキルを高めるために、Python の基礎から機械学習を学習したい方は、ぜひ教材の1つとしてご利用ください!