ラーメン店の待ち時間と評価は関係ある?順位相関で検証
この記事では、Excelを用いてデータ分析を行う「やさしいデータ分析」シリーズの第13回として、順位相関を使った検定方法について解説しています。
具体的には、スピアマンの順位相関とケンドールの順位相関の違いや使い分け、計算方法、検定方法などを説明しています。サンプルデータとして、ラーメン店の待ち時間と評価の関係を分析し、両者の間に相関があるかどうかを検証しています。
結果としては、スピアマンの順位相関では有意水準を超えることはなかったものの、ケンドールの順位相関では有意な関係が見られたという結果となっています。また、サンプルサイズが小さい場合や外れ値の影響を受けやすい点についても触れられています。
背景
この連載は、データ分析の基礎から応用までを段階的に学ぶことを目的としており、今回は順位相関を用いた検定方法に焦点を当てています。 以前の記事ではノンパラメトリック検定について解説しており、今回の記事はその流れを受けてスピアマンとケンドールの順位相関の違いや使い分けなどを説明しています。
重要用語解説
**スピアマンの順位相関**: データの順位に基づいて2つの変数の間に存在する線形関係を測る指標。
**ケンドールの順位相関**: データの順位に基づいて2つの変数の間に存在する順序関係を測る指標。スピアマンの順位相関よりも外れ値の影響を受けにくい。
**ノンパラメトリック検定**: 母集団の分布が正規分布であることを仮定しない統計的手法。
今後の影響
この記事は、データ分析を行う際に順位相関を用いた検定方法を理解する上で役立ちます。特に、スピアマンとケンドールの順位相関の違いや使い分けについて解説している点は、実践的な知見を得る上で重要です。 今後の展開としては、3群以上の平均値の差を検定する方法である分散分析が解説される予定です。