Chapter 9: THE MATHEMATICAL WORLD:修正案[9-31][9-32][9-33]:「標本抽出」の項目


追記】訂正:当初は[9-31]を新規の訳として掲載する一方で[9-32][9-33]の修正案を出しておりましたが,[9-31]もすでにkahjinさんが訳しておられました.3つとも参考用の訳文とみなしてください.

 ダメだ自分><


2008-03-16追記】訳の表現を修正しました.


下記はKahjinさんの訳文(31, 32, 33)への部分的な見直し案です.英語表現の解釈や文意の取り方について少しちがう見解をもったので参考用につくりました.

■SFAA[9-31]

標本抽出

およそ我々が世界について知ることは,研究対象の標本──たとえば,岩石の組成,星からの光,TV視聴者,ガン患者,クジラ,数などの標本──にもとづく情報から得られる.なぜ標本を使うかと言えば,何事かについてそのすべての事例を検討するのは不可能であったり,実際的でなかったり,あるいはあまりに費用が高くつくためであり,また,大半の目的には標本だけで十分に足りるからである.

■SFAA[9-32]

何かについてその標本から結論を導くときには,つねに2つの問題を考慮にいれねばならない.第一に,その標本を抽出した方法により生じる可能性のあるバイアスに警戒しなければならない.標本作成時にバイアスを生じさせる要因としてよくあるものとしては,便宜性(たとえば自分の友人のみに聞き取りをしたり地表にある岩石のみを取り上げること),自己選択(たとえば有志の協力者や調査用紙の回答者のみを研究すること),調査中に協力をやめた人々を考慮からはずす失敗(たとえば中途退学者を考慮に入れなかったりセラピーに最後まで通い続けた患者のみを検証すること),さらに,自分の予想を支持するデータのみを使うように決めてしまうことがあげられる.

■SFAA[9-33]
標本が使い物になるかどうかを決める問題の第二点は,その大きさである.標本抽出がバイアスを生じない手法でなされているなら,あとは標本数が大きくなればなるほど全体を正確に代表する確率は高くなる.なぜかと言えば,標本が大きくなるほど,純粋にランダムなばらつきの効果が標本の特徴に反映される可能性は低くなるからだ.標本数が増えれば増えるだけ,間違った結論を導いてしまう確率は減少する.たとえば,無作為抽出した標本について,ある母集団の大多数に特定の性質があるという結論を導くとき,1000コのうち600にその性質が見つかる方が,10コのうち6コに見つかるのより(それどころか10のうち9であっても)はるかに強い証拠となる.他方で,標本を抽出する母集団の実際の大きさは,標本の結果の正確さにほとんど影響しない.似通った母集団なら,そのサイズが1万であっても1億であっても,そこから無作為抽出される標本が同じく1000コであれば,誤差の余地はほぼ同じとなる.


対応する箇所の原文は下記のとおり:

[9-31]

Sampling

Most of what we learn about the world is obtained from information based on samples of what we are studying—samples of, say, rock formations, light from stars, television viewers, cancer patients, whales, or numbers. Samples are used because it may be impossible, impractical, or too costly to examine all of something, and because a sample often is sufficient for most purposes.

[9-32]
In drawing conclusions about all of something from samples of it, two major concerns must be taken into account. First, we must be alert to possible bias created by how the sample was selected. Common sources of bias in drawing samples include convenience (for example, interviewing only one's friends or picking up only surface rocks), self-selection (for example, studying only people who volunteer or who return questionnaires), failure to include those who have dropped out along the way (for example, testing only students who stay in school or only patients who stick with a course of therapy), and deciding to use only the data that support our preconceptions.

[9-33]
A second major concern that determines the usefulness of a sample is its size. If sampling is done without bias in the method, then the larger the sample is, the more likely it is to represent the whole accurately. This is because the larger a sample is, the smaller the effects of purely random variations are likely to be on its summary characteristics. The chance of drawing a wrong conclusion shrinks as the sample size increases. For example, for samples chosen at random, finding that 600 out of a sample of 1,000 have a certain feature is much stronger evidence that a majority of the population from which it was drawn have that feature than finding that 6 out of a sample of 10 (or even 9 out of the 10) have it. On the other hand, the actual size of the total population from which a sample is drawn has little effect on the accuracy of sample results. A random sample of 1,000 would have about the same margin of error whether it were drawn from a population of 10,000 or from a similar population of 100 million.