調査した各人の、例えば身長と体重のようなAとBという二つの変数について、Aの値が大きくなるときに、Bの値も大きくなる傾向を示すとき、AとBは「正の相関がある」という。逆に、Aの値が大きくなるときに、Bの値が小さくなる傾向を示すとき、AとBは「負の相関がある」という。また、その傾向がないときには、「相関がない」という。
あるサンプルで、各データのAとBの値を、横軸と縦軸にとって図示したものを散布図(scatter diagram)、あるいは相関図(correlation diagram)という(図「散布図」参照)。
二つの変数の間の相関性を示す統計の指標を相関係数(correlation function)という。データがn個で、各データが(Aの値,Bの値)として、(a1,b1),(a2,b2),(a3,b3),…,(an,bn)と与えられたとし、AとBの平均値をa,bとする。このとき、
(a1-a)(b1-b)+(a2-a)(b2-b)+…+(an-a)(bn-b)の値を、
(a1-a)2+(a2-a)2+…+(an-a)2の値の平方根と
(b1-b)2+(b2-b)2+…+(bn-b)2の平方根の積で割った値が、相関関数Cとなる。
ここで、(a1-a,a2-a,…an-a)と(b1-b,b2-b,…bn-b)は、それぞれ大きさ(長さ)と方向をもつベクトルとなるため、両者のなす角度をθとすると、
C=cosθとなり、|C|≦1となる。一般に、相関係数Cが|C|>0.3のときには相関があり、|C|<0.3のときには相関がないとみなされる。