データ(data)をもとに確率論の成果を用いて、さまざまな意味を読み取るための学問。誤差を許容することによって成り立つ。これは推測統計学、あるいは推計学(stochastics)とも呼ばれ、1662年のロンドン市の死亡者数の調査における統計的理論に由来する。
データを生み出す源泉である母集団(population)からその一部分を抽出したものを標本(sample)という。得られた標本で、各個体に(もともとついているか、あるいは計算のために)値をつけたものをデータという。たとえば、世論調査の母集団は国民、そこから無作為抽出したものが標本、そしてその標本の回答の結果がデータである。実験などでは、母集団が見えにくいが、個々の実験結果を生み出す構造が母集団と考えることもできる。
そのように考えると、近代実験科学は、母集団の構造が未知のとき、標本のデータから母集団の構造を見いだす作業と考えられる。この作業のためにも、データの状況把握が重要である。標本のデータから母集団の平均や散らばり具合を示す分散などを推定するのはその第一歩でもある。しかし、世論調査の例のように、母集団自体は既知で、標本のデータからその特性を調査する場合のほうが普通である。この方法は、この他に、視聴率、抜き取り検査などに用いられている。