抽樣

抽樣（粵音：cau1 joeng2；英文：sampling）係指由一個統計總體入面抽一個樣本出嚟嘅過程。例如而家有香港嘅動物學家想研究海豚，原則上統計總體係世上古往今來所有嘅海豚，但係由於人力物力限制佢哋冇可能睇晒咁多隻海豚，於是佢哋唯有喺香港附近水域捉 20 隻海豚嚟研究，呢 20 隻海豚就係佢哋嘅樣本，而搵呢個樣本返嚟嘅過程就係抽樣^[1]。

理論基礎

所有研究都係研究緊某啲總體。但研究嘅總體通常都太大，搞到研究佢哋嘅科學家好難由個總體入面嘅所有個體收集數據。

例如做醫學研究想睇啲人嘅血入面啲化合物嘅濃度。世界上有數以億計嘅人，要逐個逐個噉嚟研究太嘥時間，根本冇可能行得通，於是乎科學家喺做研究嗰陣往往要做抽樣－由研究緊個總體嗰度抽一小部份出嚟，而呢個部份就係所謂嘅樣本，希望透過研究呢一小部份嚟去了解嗮總體入面所有嘅個體。

例如係想研究黑洞嘅話，天體物理學家可以去搵 10 個特定嘅黑洞嚟研究，希望透過研究呢 10 個黑洞（呢 10 個黑洞只係全宇宙成千上萬個黑洞之中嘅一小部份）嚟了解埋其餘嘅黑洞^[2]。

做法步驟

抽樣呢個程序係做科研好關鍵嘅一環，因為做抽樣嗰個科學家一定要確保到佢抽出嚟個樣本真係代表得到成個總體，噉先至可以說服到啲人話佢個研究得出嘅結果可以普遍化到去成個總體嗰度。例如係動物學家想研究狼噉，佢有至少兩個抽樣方法可以揀：

喺華南嗰度隨機噉攞 200 隻狼嚟研究；
喺全世界各個洲嗰度隨機噉抽（隨機抽樣）200 隻狼嚟研究。

一般認為，後者更加代表得到嗮個總體－「全世界嘅狼」－而前者就比較有以偏概全之嫌。好多時啲科學家詏話一份研究冇辦法將得出嘅結果普遍化，都係指控緊佢個樣本唔夠代表性。

睇埋優惠抽樣。

樣本概念

樣本大細：指樣本嘅個體數量，通常以 $n$ 做符號代表；一般認為假設第啲因素不變，樣本最好就有咁大得咁大
樣本代表性：指個樣本有幾代表到想研究嗰個總體，數學化啲講，係指個樣本喺研究緊嘅變數上嘅概率分佈有幾接近總體；例如家陣想研究嘅總體係「人類」，但個研究者貪方便淨係由大學生嗰度抽樣，搞到成個樣本得 19 至 26 歲嘅人類，代表唔到呢個年齡層以外嘅人類－樣本代表性不足。

睇埋

引述

↑ Clarkson, K. L., & Shor, P. W. (1989). Applications of random sampling in computational geometry, II. Discrete & Computational Geometry, 4(5), 387-421.
↑ Stuart, A. (1962). Basic Ideas of Scientific Sampling. New York: Hafner Publishing Company.

[clarkson1989-1] Clarkson, K. L., & Shor, P. W. (1989). Applications of random sampling in computational geometry, II. Discrete & Computational Geometry, 4(5), 387-421.

[2] Stuart, A. (1962). Basic Ideas of Scientific Sampling. New York: Hafner Publishing Company.

[1]

[2]