<YouTube>

専門科目動画25本で知識を定着させていきましょう!

カリスマチャンネル

【量的データの分析】統計的仮説検定

統計的仮説検定 【新カリ】ソーシャルワークの理論と方法
スポンサーリンク
スポンサーリンク

独立変数&従属変数

量的調査におけるデータ分析とは、ある変数(独立変数)を変化させてその結果(従属変数)がどうなったか、相関があるのかないのかを分析するものです。

独立変数は「説明変数」とも呼ばれます。

従属変数は「目的変数、基準変数」とも呼ばれます。

従属変数に影響を与えるのは調査者が操作する独立変数だけではなく、調査者が操作しない様々な要因があります。

このような様々な要因を「剰余変数」と呼びます。

独立変数と従属変数

分析手法

独立変数と従属変数の性質によって分析手法は以下のように異なります。

独立変数(説明変数)
量的質的
1変数複数変数2グループ多グループ
従属変数
(目的変数)
量的散布図
単回帰分析
重回帰分析平均値の差を
t検定
平均値の差を
分散分析
質的ロジスティック回帰分析カイ二乗検定

散布図&回帰分析

独立変数も従属変数も量的変数の場合には散布図を用い、その分析には回帰分析を行います。

例えば、夜間頻尿で眠れない利用者さんの悩みを解決するために、日中の水分摂取量と睡眠時間の相関を調べるときに、調査結果について左下のような散布図を作成します。散布図を見ると、日中の水分摂取量が多いほど睡眠時間が短くなるという相関がありそうです。そこで回帰分析をして具体的な相関(y=ax+b)を求めます。事例の場合では、x(独立変数:日中の水分摂取量)、y(従属変数:夜間の睡眠時間)ですね。

散布図と回帰分析

独立変数が1つの場合は単回帰分析(y=ax+b)になりますが、独立変数が複数ある場合は重回帰分析(y=a0+a1x1+a2x2+・・・)となります。例えば、夜間の睡眠時間は日中の水分摂取量だけでなく、日中の活動量にも依存するかもしれません。そのような複数の独立変数を想定する場合は重回帰分析になります。

t検定&分散分析

独立変数が2つの質的変数で従属変数が量的変数の場合にt検定を用います。t検定は2つのグループの、ある値の平均値の差を検定する方法です。

例えば、社会福祉士国家試験について、一般受験生とカリスマ生のどちらが点数が高いかを調べたいとします。その場合、平均点を比較すればいいのですが、単に平均点が高いだけでは本当に有意な差があるかわかりません。そこでt検定を用います。t検定では単に平均値を比較するだけでなく、その平均値が信用できるか(分散が小さいか)、サンプル数が多いかも加味して検定を行います。

カリスマくん
カリスマくん

例えば、データのばらつき(分散)が大きいと、そもそもその平均値は信用できないので分散の大きさも考慮するんだね。下のグラフでは縦に長くなってると分散が大きいね。

t検定

このような一般受験生とカリスマ生という2グループではなく、3グループ以上になると分散分析を用います。

カイ二乗検定

カイ二乗検定は、独立変数も従属変数も質的変数の場合に用います。

例えば、社会福祉士国家試験について、一般受験生とカリスマ生のどちらが合格者が多いかを調べたいとします。以下のクロス集計表のように、一般受験生とカリスマ生100人ずつのサンプルを抽出して、合格者と不合格者の人数を調べました。一見するとカリスマ生の方が合格者が多いように見えますが、これは100人ずつのサンプルなので本当にカリスマ生の方が合格しやすいと言えるかどうかははっきり分かりません。そこでカイ二乗検定を行います。

観測度数(相対度数)合格者数不合格者数合計
一般受験生15(30%)35(70%)50(100%)
カリスマ生45(90%)5(10%)50(100%)
合計60(60%)40(40%)100(100%)

一般受験生とカリスマ生で合格率に差があるのかどうかを調べたいわけですが、もし差がなかった場合の値(期待値)と比較して、「観測値」と「期待値」のずれは意味があるものなのか誤差範囲なのかを確かめるためにカイ二乗検定を行います。

各分析方法の詳しい内容はこちらから。

過去問

第27回 問題83

A介護老人福祉施設では、夜間の睡眠時間を十分に確保できていない利用者Bさんへの対応が課題となっていた。検討の結果、日中の水分摂取量が要因のひとつとして取り上げられ、1か月間データを取って調べることとなった。
Bさんの日中の水分摂取量(ml)と夜間の睡眠時間(分)の関係を見るときに用いる方法として、最も適切なものを1つ選びなさい。
1 t検定
2 カイ2乗検定
3 散布図
4 箱ひげ図
5 度数分布表

量的変数と量的変数の関係を見るためには、選択肢3の散布図が適しています。

第22回 問題18

成人の勤労者を対象に、職場でのストレスの大きさ、職場でのサポートの程度及び抑うつ症状の重症度について、一定の尺度を用いた質問紙調査を行った。調査で得られた量的データを基に抑うつ症状を従属変数として、職場でのストレス及び職場でのサポートの二つの独立変数との関連性について分析を行った。次のうち、上記のデータ分析方法の名称として、正しいものを1つ選びなさい。
1 カイ2乗検定
2 デルファイ法
3 重回帰分析
4 分散分析
5 因子分析

ストレス(x)とサポート(y)という2つの量的変数に対する抑うつの程度(z)という量的変数の相関を調べるわけですから、選択肢3の重回帰分析(z=ax+by)になります。

第26回 問題69

精神科病院に勤務するJ精神保健福祉士は、栄養士と共同の発案で、糖尿病を合併している統合失調症の患者に対する6か月間の運動・栄養指導の評価プログラムを、説明と同意の上で実施することとした。プログラムの開始前と終了時(6か月後)の2時点において、IDを付したプログラムへの参加者50名の空腹時の血糖値を測定した。参加者における2時点の血糖値の平均値に、統計的有意差があるかを検証するために、統計的手法を用いた。
次のうち、用いた統計的手法として、適切なものを1つ選びなさい。
1 相関係数の算出
2 因子分析
3 リッカート法
4 対応のあるt検定
5 カイ二乗検定

選択肢4が正解です。対応のあるt検定では、同じ調査対象者に対して異なる条件で測定された2つの数値の平均値の比較を行います。

次の記事

次は、社会調査の質的調査です。

コメント

タイトルとURLをコピーしました