二重軸グラフにご用心

現代の日本
二重軸グラフにご用心
2つのy軸を持つ「二重軸グラフ(複合軸グラフ)」を使うと、異なるデータが一目でわかるようになるので便利に思えます。しかし、このグラフには問題点が多いとして、データ可視化ツールを手がけるDatawrapperが、なぜ二重軸グラフが読み手に誤解を与えやすいのかや、代わりにどんなグラフを使うべきなのかを解説しました。

二重軸グラフにご用心


2つのy軸を持つ「二重軸グラフ(複合軸グラフ)」を使うと、異なるデータが一目でわかるようになるので便利に思えます。しかし、このグラフには問題点が多いとして、データ可視化ツールを手がけるDatawrapperが、なぜ二重軸グラフが読み手に誤解を与えやすいのかや、代わりにどんなグラフを使うべきなのかを解説しました。

Why not to use two axes, and what to use instead
https://blog.datawrapper.de/dualaxis/

◆二重軸グラフとは

 二重軸グラフはよく、大きさが異なる2つのデータを扱う際に使われます。例えば、以下では世界のGDP(左のy軸)とドイツのGDP(右のy軸)の推移が二重軸グラフで表されています。なお、数字はダミーデータです。


また、ドイツの平均寿命とGDPのように、種類が異なるデータを図示する際に使われることもあります。

◆二重軸グラフの問題

 このように、二重軸グラフは種類や大きさが違うデータを示すために使われることがありますが、大きな問題があります。それは、「目盛りを任意に決めることができるため、意図的に読み手に誤解を与えることが可能」という点です。

例えば、以下は世界銀行が発表している、2004~2016年の世界のGDP(左のy軸)とドイツのGDP(右のy軸)を表したグラフです。一見すると特に問題のないグラフに見えます。


しかし、上のグラフには比率が異なるという落とし穴があります。両方のy軸を下まで伸ばすと、そのことがよくわかります。


この二重軸グラフでは、世界のGDPとドイツのGDPが2014年ごろまで同じペースで成長しているように見えます。しかし、この期間に世界のGDPは約80%成長した一方でドイツのGDPの伸びは約40%にとどまっており、実態とはかけ離れた印象を与えるグラフになってしまっています。

このように、2つのy軸の比率を変えることでさまざまなグラフを作れてしまうのが、二重軸グラフの問題点です。


では、ベースラインをそろえればいいのかというと、そうでもありません。この場合、今度は一見すると「2011年まではドイツのGDPが世界のGDPを上回っていたが、2011年には並んだ」という印象を与えてしまいますが、もちろんこれは間違いです。


Datawrapperは、「人間には近いもの同士を関連付けて考えてしまう傾向があります。これはデータも例外ではないため、人間は線と点を見比べる一方で、目盛りが異なることは忘れがちになってしまうのです」と述べました。

このことは実験でも裏付けられており、二重軸グラフを15人の被験者に見せた2011年の(PDFファイル)論文の中で研究者らは「重ね合わせチャート(二重軸グラフ)は、読み取る際の時間と正確性の両面で劣っており、アンケートでも1人を除く全員から最低評価を受けました。参加者からは、目盛りが2つあるようなグラフは非常に混乱し、集中力と熟慮が必要になるとの声が寄せられました」と結論づけています。

◆代替案

 こうした問題を避けてわかりやすいグラフにするために、Datawrapperは以下のような代案を出しています。

1つ目は、横並びチャート(Side-by-side charts)です。これは、単純に「2つの線がこんがらがるのが問題ならグラフを分けてしまおう」というもので、2つのグラフに2つのy軸を設定できるので数値の違いを気にする必要がないのがメリットです。一方で、場所を取るのが欠点です。


2つ目は、インデックス・チャート(Indexed charts)です。これは絶対数を廃して相対的な変化を示すグラフで、絶対数が必要な場合はラベルなどを使って示すこともできます。ただし、これは同じような割合で増減している場合にのみ有効で、例えば「一方の数値が5%増えている間にもう一方が10000%増加した」というような場合は意味をなさない点に注意が必要です。


3つ目は、グラフにするデータを取捨選択して、それほど重要でないものはラベルで示すものです。これは、主に同じデータの絶対数と割合を示す二重軸グラフの代わりとして有効です。例えば、以下はアメリカの失業率の推移を表したもので、グラフにするのはパーセンテージのみと割り切って、重要なポイントでの絶対数はラベルで注釈しています。


4つ目は、連結散布図です。これは、x軸に時間ではなくもう片方のデータをプロットする方法です。直感的でわかりやすいグラフではありませんが、取り上げたいテーマ次第ではデータを印象的なものにすることが可能です。


4つの代替案のうち、最初の2つを使えばたいていの場合は正確でわかりやすいグラフを作ることができるので、Datawrapperは「2つの異なるデータを扱う場合は2つのグラフを作るか、インデックス・チャートを使うことを強くお勧めします」と述べました。

スポンサーリンク

コメント

タイトルとURLをコピーしました