XでYを説明する 回帰直線 「回帰直線」が意味するものとは?

散布図では、2つの変数の間での相関の有無をみることができる。相関のある散布図で、データに最もよく当てはまるよう引いた直線が回帰直線である。今回はこの回帰直線が示すものは何か、そこから何が読み取れるのか、身近なテーマを例に解説する。

直線でデータを
整理・要約するとは?

図1をご覧頂きたい。左側の図は散布図であり、それを見れば2つの変数の間に中程度の正の相関があることが分かる。また、右側の図はその散布図に直線を重ね書きしたものである。この直線はデータに最もよく当てはまっている直線であり、回帰直線と呼ばれる。直線を使ってデータを整理・要約するとどのような情報が得られるのか。それが今日のテーマである。

図1 散布図(X,Y)
倉田 博史

倉田 博史

東京大学大学院総合文化研究科・教養学部教授。
1996年一橋大学大学院経済学研究科理論経済学及び統計学専攻博士後期課程修了、博士(経済学)。山口大学経済学部助教授を経て現職。専門は統計学。著書に"GeneralizedLeastSquares"(JohnWileyandSons)、「大学4年間の統計学を10時間でざっと学べる」(KADOKAWA)など。

ご存じの通り、直線は一般にY=a+bXという形で表される。aを切片、bを傾きと言う。傾きbの性質として重要なものは、

(1)bの値が正ならば直線は右上がり、負ならば右下がりとなること、
(2)Xの値が1だけ増えるとYの値はbだけ変化すること、
の2つである。例えば、Y=2+3Xは切片が2、傾きが3の直線である。正の傾きを持っているから右上がりの直線であり、Xが1だけ増えるとYの値は3だけ増える(例えば、X=1のときはY=2+3×1=5、X=2のときはY=2+3×2=8であり、8-5=3だけ増えている)。

データを直線で整理・要約する際にまず決めなければならないのは、…

(※全文:2344文字 画像:あり)

全文を読むには有料プランへのご登録が必要です。