Bước tới nội dung

Khác biệt giữa bản sửa đổi của “Phân phối xác suất”

Bách khoa toàn thư mở Wikipedia
Nội dung được xóa Nội dung được thêm vào
n Đã lùi lại sửa đổi của Thai tom 2004 (thảo luận) quay về phiên bản cuối của Camtrang2901
Thẻ: Lùi tất cả
 
(Không hiển thị 67 phiên bản của 46 người dùng ở giữa)
Dòng 1: Dòng 1:
Trong [[Toán học]] và [[Thống kê]], một '''phân bố xác suất''' hay thường gọi hơn là một ''hàm phân phối xác suất'' gán cho mỗi [[Khoảng (toán học)|khoảng giá trị]] của tập [[số thực]] một [[xác suất]], sao cho các [[tiên đề xác suất]] được thỏa mãn. Theo thuật ngữ kỹ thuật, một phân bố xác suất là một [[độ đo xác suất]] (''probability measure'') mà miền xác định là [[đại số Borel]] trên tập số thực.
Trong [[toán học]] và [[khoa học thống kê|thống kê]], một '''phân phối xác suất''' hay thường gọi hơn là một '''hàm phân phối xác suất''' là quy luật cho biết cách gán mỗi [[xác suất]] cho mỗi [[Khoảng (toán học)|khoảng giá trị]] của tập [[số thực]], sao cho các [[tiên đề xác suất]] được thỏa mãn. Theo thuật ngữ kỹ thuật, một phân phối xác suất là một [[độ đo xác suất]] (''probability measure'') mà miền xác định là [[đại số Borel]] trên tập số thực.


Một phân bố xác suất là một trường hợp đặc biệt của một khái niệm tổng quát hơn về [[độ đo xác suất]], đó là một hàm thỏa mãn các [[Hệ tiên đề xác suất của Kolmogorov|tiên đề xác suất của Kolmogorov]] cho các tập đo được của một [[không gian đo được]] (''measurable space'').
Một phân phối xác suất là một trường hợp đặc biệt của một khái niệm tổng quát hơn về [[độ đo xác suất]], đó là một hàm thỏa mãn các [[Hệ tiên đề xác suất của Kolmogorov|tiên đề xác suất của Kolmogorov]] cho các tập đo được của một [[không gian đo được]] (''measurable space'').


==Định nghĩa hình thức==
== Định nghĩa chính thức ==
Mỗi [[biến ngẫu nhiên]] tạo ra một phân bố xác suất, phân bố này chứa hầu hết các thông tin quan trọng về biến ngẫu nhiên đó. Nếu ''X'' là một biến ngẫu nhiên, phân bố xác suất tương ứng gán cho đoạn [''a'', ''b''] một xác suất P[''a'' ≤ ''X'' ≤ ''b''], nghĩa là, xác suất mà biến ''X'' sẽ lấy giá trị trong đoạn [''a'', ''b''].
Mỗi [[biến ngẫu nhiên]] tạo ra một phân phối xác suất, phân phối này chứa hầu hết các thông tin quan trọng về biến ngẫu nhiên đó. Nếu ''X'' là một biến ngẫu nhiên, phân phối xác suất tương ứng gán cho đoạn [''a'', ''b''] một xác suất P[''a'' ''X'' ''b''], nghĩa là, xác suất mà biến ''X'' sẽ lấy giá trị trong đoạn [''a'', ''b''].


Phân bố xác suất của biến ''X'' có thể được mô tả một cách duy nhất bởi [[hàm phân bố tích lũy]] (''cumulative distribution function'') ''F''(''x'') được định nghĩa như sau:
Phân phối xác suất của biến ''X'' có thể được mô tả một cách duy nhất bởi [[hàm phân phối tích lũy]] (''cumulative distribution function'') ''F''(''x'') được định nghĩa như sau:


:<math> F(x) = \Pr\left[ X \le x \right] </math>
:<math> F(x) = \Pr\left[ X \le x \right] </math>


với mọi ''x'' thuộc '''R'''.
với mọi ''x'' thuộc '''R'''.


Một phân bố được gọi là ''rời rạc'' nếu hàm phân bố tích lũy của nó bao gồm một dãy các bước nhảy hữu hạn, nghĩa là nó sinh ra từ một [[biến ngẫu nhiên rời rạc]] ''X'': một biến chỉ có thể nhận giá trị trong một tập hợp hữu hạn hoặc [[đếm được]] nhất định.
Một phân phối được gọi là ''rời rạc'' nếu hàm phân phối tích lũy của nó bao gồm một dãy các bước nhảy hữu hạn, nghĩa là nó sinh ra từ một [[biến ngẫu nhiên rời rạc]] ''X'': một biến chỉ có thể nhận giá trị trong một tập hợp hữu hạn hoặc [[tập hợp đếm được|đếm được]] nhất định.
Một phân bố được gọi là ''liên tục'' nếu hàm phân bố tích lũy của nó là [[hàm liên tục]], nghĩa nó sinh ra từ một biến ngẫu nhiên ''X'' mà P[ ''X'' = ''x'' ] = 0 với mọi ''x'' thuộc '''R'''.
Một phân phối được gọi là ''liên tục'' nếu hàm phân phối tích lũy của nó là [[hàm liên tục]], khi đó nó sinh ra từ một biến ngẫu nhiên ''X'' mà P[ ''X'' = ''x'' ] = 0 với mọi ''x'' thuộc '''R'''.
Phân bố liên tục còn có thể được biểu diễn bằng một [[hàm mật độ xác suất]]: một hàm ''f'' không âm [[Phép lấy tích phân Lebesgue|khả tích Lebesgue]] được định nghĩa trên tập số thực như sau"
Phân phối liên tục còn có thể được biểu diễn bằng [[hàm mật độ xác suất]]: một hàm ''f'' không âm [[Phép lấy tích phân Lebesgue|khả tích Lebesgue]] được định nghĩa trên tập số thực như sau:


:<math>
:<math>
Dòng 20: Dòng 20:
</math>
</math>


với mọi ''a'' và ''b''.
với mọi ''a'' và ''b''.


Không có gì đáng ngạc nhiên về việc các phân bố rời rạc không có một hàm mật độ như vậy, nhưng có các phân bố liên tục, như phân bố [[cầu thang của quỷ]] (''devil's staircase''), cũng không có mật độ.
Không có gì đáng ngạc nhiên về việc các phân phối rời rạc không có một hàm mật độ như vậy, nhưng có các phân phối liên tục, như phân phối [[cầu thang của quỷ]] (''devil's staircase''), cũng không có mật độ.


*[[Giá (toán học)|Giá]] của một phân bố là một tập đóng nhỏ nhất mà các phần tử của nó có xác suất bằng 0.
* [[Giá (toán học)|Giá]] của một phân phối là một tập đóng nhỏ nhất mà các phần tử của nó có xác suất bằng 0.
*Phân bố xác suất của tổng hai biến ngẫu nhiên độc lập là [[tích chập]] (''convolution'') của các phân bố của chúng.
* Phân phối xác suất của tổng hai biến ngẫu nhiên độc lập là [[tích chập]] (''convolution'') của các phân phối của chúng.
*Phân bố xác suất của hiệu hai biến ngẫu nhiên là [[tương quan chéo]] (''cross-correlation'') của các phân bố của chúng.
* Phân phối xác suất của hiệu hai biến ngẫu nhiên là [[tương quan chéo]] (''cross-correlation'') của các phân phối của chúng.


== Các phân bố xác suất quan trọng ==
== Các phân phối xác suất quan trọng ==


Một số phân bố xác suất có vai trò quan trọng trong lý thuyết và ứng dụng đến mức chúng đã được đặt tên:
Một số phân phối xác suất có vai trò quan trọng trong lý thuyết và ứng dụng đến mức chúng đã được đặt tên:


===Các phân bố rời rạc===
=== Các phân phối rời rạc ===


====Với biến ngẫu nhiên nhận hữu hạn giá trị====
==== Với biến ngẫu nhiên nhận hữu hạn giá trị ====


* [[Phân bố Bernoulli]] là phân bố của biên ngẫu nhiên X lấy giá trị 1 với xác suất ''p'' và giá trị 0 với xác suất ''q'' = 1 &minus; ''p''.
* [[Phân phối Bernoulli]] là phân phối của biên ngẫu nhiên X lấy giá trị 1 với xác suất ''p'' và giá trị 0 với xác suất ''q'' = 1 ''p''.
** Phân bố Rademacher là phân bố của biên ngẫu nhiên X lấy giá trị giá trị 1 với xác suất 1/2 và giá trị &minus;1 với xác suất 1/2.
** Phân phối Rademacher là phân phối của biên ngẫu nhiên X lấy giá trị giá trị 1 với xác suất 1/2 và giá trị −1 với xác suất 1/2.
* [[Phân bố nhị thức]] (''binomial distribution'') là phân bố của biên ngẫu nhiên X biểu diễn số lần thành công trong một dãy thí nghiệm độc lập, trong đó mỗi lần thử xác suất thành công là số ''p'' cố định.
* [[Phân phối nhị thức]] (''binomial distribution'') là phân phối của biên ngẫu nhiên X biểu diễn số lần thành công trong một dãy thí nghiệm độc lập, trong đó mỗi lần thử xác suất thành công là số ''p'' cố định.
* [[Phân bố suy biến]] (''degenerate distribution'') tại ''x''<sub>0</sub> là phân bố của biên ngẫu nhiên X, trong đó ''X'' chắc chắn lấy giá trị ''x<sub>0</sub>''. Phân bố này không có vẻ ngẫu nhiên, nhưng nó thỏa mãn định nghĩa về [[biến ngẫu nhiên]]. Nó có ích do nó đã đặt các biến tất định và các biến ngẫu nhiên trong cùng một dạng thức.
* [[Phân phối suy biến]] (''degenerate distribution'') tại ''x''<sub>0</sub> là phân phối của biên ngẫu nhiên X, trong đó ''X'' chắc chắn lấy giá trị ''x<sub>0</sub>''. Phân phối này không có vẻ ngẫu nhiên, nhưng nó thỏa mãn định nghĩa về [[biến ngẫu nhiên]]. Nó có ích do nó đã đặt các biến tất định và các biến ngẫu nhiên trong cùng một dạng thức.
* [[Phân bố đều (rời rạc)|Phân bố đều rời rạc]] (''uniform distribution'')là phân bố của biến ngẫu nhiên X trong đó X nhân giá trị trong một tập hữu hạn và X nhận giá trị bằng mỗi phần tử của tập đó với xác suất bằng nhau. Đây chính là phân bố xác suất của biên ngẫu nhiên X nhận được khi gieo một đồng xu cân bằng, một con súc sắc không lệch, một vòng roulette, hoặc khi tráo kỹ một bộ bài. Ngoài ra, người ta còn có thể sử dụng các đo đạc về các trạng thái lượng tử (''quantum state'') để sinh các biến ngẫu nhiên đều. Mọi thiết bị "vật lý" hay "cơ khí" đều có thể có lỗi thiết kế hoặc bị trục trặc, và phân phối đều là một mô tả gần đúng hành vi của chúng.
* [[Phân phối đều (rời rạc)|Phân phối đều rời rạc]] (''discrete uniform distribution'')là phân phối của biến ngẫu nhiên X trong đó X nhân giá trị trong một tập hữu hạn và X nhận giá trị bằng mỗi phần tử của tập đó với xác suất bằng nhau. Đây chính là phân phối xác suất của biên ngẫu nhiên X nhận được khi gieo một đồng xu cân bằng, một con súc sắc không lệch, một vòng roulette, hoặc khi tráo kỹ một bộ bài. Ngoài ra, người ta còn có thể sử dụng các đo đạc về các [[trạng thái lượng tử]] (''quantum state'') để sinh các biến ngẫu nhiên đều. Mọi thiết bị "vật lý" hay "cơ khí" đều có thể có lỗi thiết kế hoặc bị trục trặc, và phân phối đều là một mô tả gần đúng hành vi của chúng.
* [[Phân bố siêu bội]] (''hypergeometric distribution'') là phân bố của biên ngẫu nhiên X biểu diễn số lần thành công trong ''m'' lần đầu tiên của một chuỗi ''n'' thực nghiệm độc lập, nếu cho trước tổng số lần thành công.
* [[Phân phối siêu bội]] (''hypergeometric distribution'') là phân phối của biên ngẫu nhiên X biểu diễn số lần thành công trong ''m'' lần đầu tiên của một chuỗi ''n'' thực nghiệm độc lập, nếu cho trước tổng số lần thành công.
* [[Phân bố Zipf]]: một phân bố quy tắc lũy thừa (''power law'') rời, ví dụ nổi tiếng nhất của nó là mô tả về tần số của các từ trong tiếng Anh.
* [[Phân phối Zipf]]: một phân phối quy tắc [[lũy thừa]] (''power law'') rời, ví dụ nổi tiếng nhất của nó là mô tả về tần số của các từ trong [[tiếng Anh]].
* [[Phân bố Zipf-Mandelbrot]] là một phân bố quy tắc lũy thừa rời rạc và là suy rộng của [[phân bố Zipf]].
* [[Phân phối Zipf-Mandelbrot]] là một phân phối quy tắc lũy thừa rời rạc và là suy rộng của [[phân phối Zipf]].


====Với biến ngẫu nhiên nhận vô hạn giá trị====
==== Với biến ngẫu nhiên nhận vô hạn giá trị ====


* [[Phân bố Boltzmann]], một phân bố rời rạc quan trọng trong [[vật lý học thống kê]]. Nó mô tả xác suất của các mức năng lượng rời rạc của một hệ thống trong [[cân bằng nhiệt]]. Nó có một mô hình liên tục. Các trường hợp đặc biệt gồm có:
* [[Phân phối Boltzmann]], một phân phối rời rạc quan trọng trong [[vật lý học thống kê]]. Nó mô tả xác suất của các mức năng lượng rời rạc của một hệ thống trong [[cân bằng nhiệt]]. Nó có một mô hình liên tục. Các trường hợp đặc biệt gồm có:
** [[Phân bố Gibbs]]
** [[Phân phối Gibbs]]
** [[Phân bố Maxwell-Boltzmann]]
** [[Phân phối Maxwell-Boltzmann]]
** [[Phân bố Bose-Einstein]]
** [[Phân phối Bose-Einstein]]
** [[Phân bố Fermi-Dirac]]
** [[Phân phối Fermi-Dirac]]
* [[Phân bố hình học]], là phân bố của biến ngẫu nhiên X rời rạc mô tả số thực nghiệm cần thiết để đạt đến thành công đầu tiên trong một dãy các thực nghiệm Có/Không độc lập.
* [[Phân phối hình học]], là phân phối của biến ngẫu nhiên X rời rạc mô tả số thực nghiệm cần thiết để đạt đến thành công đầu tiên trong một dãy các thực nghiệm Có/Không độc lập.
[[Hình:Poisson distribution PMF.png|150px|nhỏ|[[Phân bố Poisson]]]]
[[Tập tin:Poisson distribution PMF.png|150px|nhỏ|[[Phân phối Poisson]]]]
* [[Phân bố lôga]]
* [[Phân phối lôga]]
* [[Phân bố nhị thức âm]], một suy rộng của phân bố hình học cho thành công thứ ''n''.
* [[Phân phối nhị thức âm]], một suy rộng của phân phối hình học cho thành công thứ ''n''.
* [[Phân phối bật hai phân dạng]]
* [[parabolic fractal distribution]]
* [[Phân bố Poisson]], là phân bố của biên ngẫu nhiên X biểu diên một số rất lớn các biến cố xảy ra trong một khoảng thời gian nhất định.
* [[Phân phối Poisson]], là phân phối của biên ngẫu nhiên X biểu diên một số rất lớn các biến cố xảy ra trong một khoảng thời gian nhất định.
[[Hình:SkellamDistribution.png|150px|nhỏ|[[Phân bố Skellam]]]]
[[Tập tin:SkellamDistribution.png|150px|nhỏ|[[Phân phối Skellam]]]]
* [[Phân bố Skellam]], phân bố của hiệu của hai biến ngẫu nhiên độc lập tuân theo phân bố Poisson.
* [[Phân phối Skellam]], phân phối của hiệu của hai biến ngẫu nhiên độc lập tuân theo phân phối Poisson.
* [[Phân bố Yule-Simon]]
* [[Phân phối Yule-Simon]]
* [[Phân bố zeta]] dùng trong thống kê ứng dụng và cơ học thống kê, và có lẽ được các nhà lý thuyết số quan tâm. Nó là [[phân bố Zipf]] cho tập vô hạn các phần tử.
* [[Phân phối zeta]] dùng trong thống kê ứng dụng và cơ học thống kê, và có lẽ được các nhà [[lý thuyết số]] quan tâm. Nó là [[phân phối Zipf]] cho tập vô hạn các phần tử.


===Các phân bố liên tục===
=== Các phân phối liên tục ===


====Phân bố của các biến ngẫu nhiên lấy giá trị trên một khoảng bị chặn====
==== Phân phối của các biến ngẫu nhiên lấy giá trị trên một khoảng bị chặn ====
[[Hình:Beta distribution pdf.png|nhỏ|150px|[[Phân bố Beta]]]]
[[Tập tin:Beta distribution pdf.png|nhỏ|150px|[[Phân phối Beta]]]]
* [[Phân bố Bêta]] trên đoạn [0,1], phân bố đều là trường hợp đặc biệt, hữu dụng cho việc ước lượng các xác suất thành công.
* [[Phân phối Beta]] trên đoạn [0,1], phân phối đều là trường hợp đặc biệt, hữu dụng cho việc ước lượng các xác suất thành công.
[[Hình:Uniform_distribution_PDF.png|nhỏ|150px|[[Phân bố đều (liên tục)|Phân bố đều liên tục]]]]
[[Tập tin:Uniform distribution PDF.png|nhỏ|150px|[[Phân phối đều (liên tục)|Phân phối đều liên tục]]]]
* [[Phân bố đều (liên tục)|Phân bố đều liên tục]] trên đoạn [''a'',''b'']là phân bố của biên ngẫu nhiên X , trong đó X nhận giá trị trong các khoảng con hữu hạn độ dài bằng nhau với xác suất bằng nhau.
* [[Phân phối đều (liên tục)|Phân phối đều liên tục]] trên đoạn [''a'',''b'']là phân phối của biên ngẫu nhiên X, trong đó X nhận giá trị trong các khoảng con hữu hạn độ dài bằng nhau với xác suất bằng nhau.
** [[Phân bố chữ nhật]] là một phân bố đều trên đoạn [-1/2,1/2].
** [[Phân phối chữ nhật]] là một phân phối đều trên đoạn [-1/2,1/2].
* [[Hàm delta Dirac]] tuy không hoàn toàn là một hàm, là một dạng giới hạn của nhiều hàm xác suất liên tục. Nó biễu diễn một phân bố xác suất ''rời rạc'' tập trung tại 0 &mdash; một [[phân bố suy biến]] &mdash; (''degenerate distribution'') nhưng hệ thống biểu diễn đối xử với nó như thể nó là một phân bố liên tục.
* [[Hàm delta Dirac]] tuy không hoàn toàn là một hàm, là một dạng giới hạn của nhiều hàm xác suất liên tục. Nó biểu diễn một phân phối xác suất ''rời rạc'' tập trung tại 0 một [[phân phối suy biến]] (''degenerate distribution'') nhưng hệ thống biểu diễn đối xử với nó như thể nó là một phân phối liên tục.
* [[Phân bố Kumaraswamy]] cũng hữu dụng như phân bố Beta nhưng có dạng đóng đơn giản cho cả hàm phân bố tích lũy và hàm phân bố xác suất.
* [[Phân phối Kumaraswamy]] cũng hữu dụng như phân phối Beta nhưng có dạng đóng đơn giản cho cả hàm phân phối tích lũy và hàm phân phối xác suất.
* [[Phân bố lôga (liên tục)]]
* [[Phân phối lôga (liên tục)]]
* [[Phân bố tam giác]] trên đoạn [''a'', ''b''], trường hợp đặc biệt là phân bố của tổng hai biến ngẫu nhiên có phân bố đều (''tính chập'' của hai phân bố đều).
* [[Phân phối tam giác]] trên đoạn [''a'', ''b''], trường hợp đặc biệt là phân phối của tổng hai biến ngẫu nhiên có phân phối đều (''tính chập'' của hai phân phối đều).
* [[Phân bố von Mises]]
* [[Phân phối von Mises]]
* [[Phân bố nửa hình tròn Wigner]] (''Wigner semicircle distribution'') quan trọng trong lý thuyết [[ma trận ngẫu nhiên]] (''random matrices'').
* [[Phân phối nửa hình tròn Wigner]] (''Wigner semicircle distribution'') quan trọng trong lý thuyết [[ma trận ngẫu nhiên]] (''random matrices'').


====Phân bố của các biến ngẫu nhiên lấy giá trị trên khoảng nửa hữu hạn, thường là <nowiki>[0,&infin;)</nowiki>====
==== Phân phối của các biến ngẫu nhiên lấy giá trị trên khoảng nửa hữu hạn, thường là <nowiki>[0,)</nowiki> ====


[[Hình:Chi-square distributionPDF.png|nhỏ|150px|[[Phân bố chi-square]]]]
[[Tập tin:Chi-square distributionPDF.png|nhỏ|150px|[[Phân phối chi-square]]]]
* [[Phân bố chi]]
* [[Phân phối chi]]
* [[Phân bố chi không trung tâm]] (''noncentral chi distribution'')
* [[Phân phối chi không trung tâm]] (''noncentral chi distribution'')
* [[Phân bố chi-bình phương]], là tổng của các bình phương của ''n'' biến ngẫu nhiên Gauss độc lập. Đây là trường hợp đặc biệt của phân bố the Gamma, nó được dùng cho các kiểm tra [[goodness-of-fit]] (mức độ khớp) trong [[Thống kê]].
* [[Phân phối chi-bình phương]], là tổng của các [[bình phương]] của ''n'' biến ngẫu nhiên Gauss độc lập. Đây là trường hợp đặc biệt của phân phối the Gamma, nó được dùng cho các kiểm tra [[goodness-of-fit]] (mức độ khớp) trong [[Khoa học Thống kê|Thống kê]].
** [[Phân bố chi-bình phương nghịch đảo]] (''inverse-chi-square distribution'')
** [[Phân phối chi-bình phương nghịch đảo]] (''inverse-chi-square distribution'')
** [[Phân bố chi-bình phương nghịch đảo không trung tâm]] (''noncentral chi-square distribution'')
** [[Phân phối chi-bình phương nghịch đảo không trung tâm]] (''noncentral chi-square distribution'')
** [[Phân bố chi-bình phương nghịch đảo tỉ lệ]] (''scale-inverse-chi-square distribution'')
** [[Phân phối chi-bình phương nghịch đảo tỉ lệ]] (''scale-inverse-chi-square distribution'')
[[Hình:Exponential distribution pdf.png|nhỏ|150px|[[Phân phối mũ]]]]
[[Tập tin:Exponential distribution pdf.png|nhỏ|150px|[[Phân phối mũ]]]]
* [[Phân phối mũ]], mô tả thời gian giữa các biến cố ngẫu nhiên hiếm gặp liên tiếp trong một quy trình không có bộ nhớ.
* [[Phân phối mũ]], mô tả thời gian giữa các biến cố ngẫu nhiên hiếm gặp liên tiếp trong một quy trình không có bộ nhớ.
* [[Phân bố F]], là phân bố của tỉ lệ giữa hai biến ngẫu nhiên có phân bố chi-bình phương (đã chuẩn hóa), dùng trong [[phân tích phương sai]] (''analysis of variance'').
* [[Phân phối F]], là phân phối của tỉ lệ giữa hai biến ngẫu nhiên có phân phối chi-bình phương (đã chuẩn hóa), dùng trong [[phân tích phương sai]] (''analysis of variance'').
** [[Phân bố F không trung tâm]] (''noncentral F-distribution'')
** [[Phân phối F không trung tâm]] (''noncentral F-distribution'')
[[Hình:Gamma distribution pdf.png|nhỏ|150px|[[Phân bố Gamma]]]]
[[Tập tin:Gamma distribution pdf.png|nhỏ|150px|[[Phân phối Gamma]]]]
* [[Phân bố Gamma]], mô tả thời gian cho đến khi ''n'' biến cố ngẫu nhiên hiếm gặp liên tiếp xảy ra trong một quá trình không có bộ nhớ.
* [[Phân phối Gamma]], mô tả thời gian cho đến khi ''n'' biến cố ngẫu nhiên hiếm gặp liên tiếp xảy ra trong một quá trình không có bộ nhớ.
** [[Phân bố Erlang]], là trường hợp đặc biệt của phân bố Gamma với tham số hình dạng là số nguyên, được phát triển để dự đoán các thời gian đợi trong các [[hệ thống hàng đợi]] (''queuing systems'').
** [[Phân phối Erlang]], là trường hợp đặc biệt của phân phối Gamma với tham số hình dạng là số nguyên, được phát triển để dự đoán các thời gian đợi trong các [[hệ thống hàng đợi]] (''queuing systems'').
** [[Phân bố gamma đảo]] (''inverse-gamma distribution'')
** [[Phân phối gamma đảo]] (''inverse-gamma distribution'')
* [[Phân bố z của Fisher]] (''Fisher's z-distribution'')
* [[Phân phối z của Fisher]] (''Fisher's z-distribution'')
* [[Phân bố nửa chuẩn]] (''half-normal distribution'')
* [[Phân phối nửa chuẩn]] (''half-normal distribution'')
* [[Phân bố Lévy]]
* [[Phân phối Lévy]]
* [[log-logistic distribution]]
* [[log-logistic distribution]]
* [[log-normal distribution]], mô tả các biến có thể được mô hình dưới dạng tích của nhiều biến ngẫu nhiên độc lập nhỏ.
* [[log-normal distribution]], mô tả các biến có thể được mô hình dưới dạng tích của nhiều biến ngẫu nhiên độc lập nhỏ.
[[Hình:Pareto distributionPDF.png|nhỏ|150px|[[Phân bố Pareto]]]]
[[Tập tin:Pareto distributionPDF.png|nhỏ|150px|[[Phân phối Pareto]]]]
* [[Phân bố Pareto]], hoặc phân bố "quy tắc lũy thừa", được dùng trong phân tích dữ liệu thương mại và hành vi tới hạn (''critical behavior'').
* [[Phân phối Pareto]], hoặc phân phối "quy tắc lũy thừa", được dùng trong phân tích dữ liệu thương mại và hành vi tới hạn (''critical behavior'').
* [[Phân bố Rayleigh]]
* [[Phân phối Rayleigh]]
* [[Rayleigh mixture distribution]]
* [[Rayleigh mixture distribution]]
* [[Phân bố Rice]]
* [[Phân phối Rice]]
* [[type-2 Gumbel distribution]]
* [[type-2 Gumbel distribution]]
* [[Phân bố Wald]]
* [[Phân phối Wald]]
* [[Phân bố Weibull]], trong đó [[phân phối mũ]] là trường hợp đặc biệt, dùng để mô hình tuổi thọ của các thiết bị kỹ thuật.
* [[Phân phối Weibull]], trong đó [[phân phối mũ]] là trường hợp đặc biệt, dùng để mô hình tuổi thọ của các thiết bị kỹ thuật.


====Phân phối của các biến ngẫu nhiên lấy giá trị trên toàn tập số thực====
==== Phân phối của các biến ngẫu nhiên lấy giá trị trên toàn tập số thực ====
[[Hình:Cauchy distribution pdf.png|150px|nhỏ|[[Phân bố Cauchy]]]]
[[Tập tin:Cauchy distribution pdf.png|150px|nhỏ|phải|[[Phân phối Cauchy]]]]
[[Hình:Laplace distribution pdf.png|150px|nhỏ|[[Phân bố Laplace]]]]
[[Tập tin:Laplace distribution pdf.png|150px|nhỏ|phải|[[Phân phối Laplace]]]]
[[Hình:LevyDistribution.png|150px|nhỏ|[[Phân bố Levy]]]][http://www.example.com/ Văn bản liên kết]
[[Tập tin:LevyDistribution.png|150px|nhỏ|phải|[[Phân phối Levy]]]][[Tập tin:Normal distribution pdf.png|nhỏ|phải|150px|[[Phân phối chuẩn]]]]
* [[Phân phối nguyên tố Beta]]
[[Hình:Normal distribution pdf.png|nhỏ|150px|[[Phân bố chuẩn]]]]
* [[Phân phối Cauchy]], một ví dụ về một phân phối không có [[kỳ vọng]] hay [[phương sai]]. Trong vật lý, phân phối này thường được gọi là một [[Hàm Lorentz|Lorentzian profile]], và có liên quan đến nhiều quá trình, trong đó có phân phối năng lượng [[cộng hưởng]], impact and natural [[spectral line]] broadening and quadratic [[stark effect|stark]] line broadening.
{{đang dịch}}
* [[Phân phối Fisher-Tippett]], extreme value, or log-Weibull distribution
* [[Phân bố nguyên tố Beta]]
** [[Phân phối Gumbel]], trường hợp đặc biệt của phân phối Fisher-Tippett
* [[Phân bố Cauchy]], một ví dụ về một phân bố không có [[kỳ vọng]] hay [[phương sai]]. Trong vật lý, phân bố này thường được gọi là một [[Hàm Lorentz|Lorentzian profile]], và có liên quan đến nhiều quá trình, trong đó có phân bố năng lượng [[cộng hưởng]], impact and natural [[spectral line]] broadening and quadratic [[stark effect|stark]] line broadening.
*[[Phân bố Fisher-Tippett]], extreme value, or log-Weibull distribution
** [[Phân bố Gumbel]], trường hợp đặc biệt của phân bố Fisher-Tippett
* The [[generalized extreme value distribution]]
* The [[generalized extreme value distribution]]
* The [[hyperbolic secant distribution]]
* The [[hyperbolic secant distribution]]
* [[Phân bố Landau]]
* [[Phân phối Landau]]
* [[Phân bố Laplace]]
* [[Phân phối Laplace]]
* The [[Lévy skew alpha-stable distribution]] is often used to characterize financial data and critical behavior.
* The [[Lévy skew alpha-stable distribution]] is often used to characterize financial data and critical behavior.
* The [[map-Airy distribution]]
* The [[map-Airy distribution]]
* [[Phân bố chuẩn]] (''normal distribution'') còn gọi là phân bố theo đường cong Gauss, là phân bố của biên ngẫu nhiên X có hàm mật đọ là đường cong Gauss. Nó rất phổ biến trong thiên nhiên và thống kê do [[định lý giới hạn trung tâm]] (''central limit theorem''): mọi biến mà có thể được mô hình bằng tổng của nhiều biến độc lập đều là xấp xỉ chuẩn.
* [[Phân phối chuẩn]] (''normal distribution'') còn gọi là phân phối theo đường cong Gauss, là phân phối của biên ngẫu nhiên X có hàm mật đọ là đường cong Gauss. Nó rất phổ biến trong thiên nhiên và thống kê do [[định lý giới hạn trung tâm]] (''central limit theorem''): mọi biến mà có thể được mô hình bằng tổng của nhiều biến độc lập đều là xấp xỉ chuẩn.
* [[Phân phối Student]], là phân bố của biên ngẫu nhiên biểu diễn giá trị trung bình chưa biết của phân bố Gauss.
* [[Phân phối Student]], là phân phối của biên ngẫu nhiên biểu diễn giá trị trung bình chưa biết của phân phối Gauss.
** [[t-phân phối không tâm]]
** [[t-phân phối không tâm]]
*[[Phân phối Gumbel dạng 1]]
* [[Phân phối Gumbel dạng 1]]


===Các phân bố điều kiện===
=== Các phân phối điều kiện ===


Với tập hợp bất kỳ gồm các biến ngẫu nhiên [[độc lập thống kê|độc lập]], [[hàm mật độ xác suất]] của [[phân bố có điều kiện]] (''joint distribution'') là tích của từng hàm riêng.
Với tập hợp bất kỳ gồm các biến ngẫu nhiên [[độc lập thống kê|độc lập]], [[hàm mật độ xác suất]] của [[phân phối có điều kiện]] (''joint distribution'') là tích của từng hàm riêng.


====Phân phối đông thời của các biến ngẫu nhiên trên cùng một không gian mẫu (vectơ ngẫu nhiên)====
==== Phân phối đông thời của các biến ngẫu nhiên trên cùng một không gian mẫu (vectơ ngẫu nhiên) ====


*[[Phân phối Dirichlet]],là tổng quát hóa của phân bố beta.
* [[Phân phối Dirichlet]],là tổng quát hóa của phân phối beta.
*The [[Ewens's sampling formula]] is a probability distribution on the set of all [[integer partition|partitions of an integer]] ''n'', arising in [[population genetics]].
* The [[Ewens's sampling formula]] is a probability distribution on the set of all [[integer partition|partitions of an integer]] ''n'', arising in [[population genetics]].
*[[phân phối bội]], là tổng quát hóa của phân phối nhị thức.
* [[phân phối bội]], là tổng quát hóa của phân phối nhị thức.
*[[phân phối chuẩn bội]], là tổng quát hóa của [[phân phối chuẩn]].
* [[phân phối chuẩn bội]], là tổng quát hóa của [[phân phối chuẩn]].


====Các phân bố của các ma trận ngẫu nhiên====
==== Các phân phối của các ma trận ngẫu nhiên ====
Đó là phân bố của các biến ngẫu nhiên nhận giá trị là các ma trận
Đó là phân phối của các biến ngẫu nhiên nhận giá trị là các ma trận
*[[Phân phối Wishart]]
* [[Phân phối Wishart]]
*[[Phân phối ma trận chuẩn]]
* [[Phân phối ma trận chuẩn]]
*[[t-phân phối ma trận]]
* [[t-phân phối ma trận]]
*[[Hotelling's T-square distribution]]
* [[Hotelling's T-square distribution]]


===Các phân bố khác===
=== Các phân phối khác ===


* [[Phân bố Cantor]]
* [[Phân phối Cantor]]


== Xem thêm ==
== Xem thêm ==
* [[Phân phối nhị thức]]
* [[Copula (thống kê)]]
* [[Hàm phân phối tích lũy]]
* [[Hàm khả năng]]
* [[Danh sách các chủ đề Thống kê]]
* [[Hàm mật độ xác suất]]
* [[Biến rời rạc]]
* [[Biến ngẫu nhiên]]
* [[Biểu đồ tần số]]
{{thể loại Commons|Probability distributions}}


==Tham khảo==
*[[copula (thống kê)]]
{{tham khảo}}
*[[hàm phân bố tích lũy]]
*[http://www.socr.ucla.edu/htmls/SOCR_Distributions.html Interactive Discrete and Continuous Probability Distributions]
*[[hàm khả năng]] (''likelihood function'')
*[[Danh sách các chủ đề Thống kê]]
*[[hàm mật độ xác suất]]
*[[biến ngẫu nhiên]]
*[[biểu đồ tần số]] (''histogram'')


[[Thể loại:Xác suất thống kê|Xác suất và thống ]]
[[Thể loại:Phân phối xác suất| ]]
[[Thể loại:Phân bố xác suất|*]]
[[Thể loại: thuyết xác suất]]
[[Thể loại:Xác suất và thống kê]]


[[it:Variabile casuale#Distribuzione di probabilità]]
[[ar:توزيع احتمالي]]
[[su:Sebaran probabilitas]]
[[de:Wahrscheinlichkeitsverteilung]]
[[en:Probability distribution]]
[[es:Distribución de probabilidad]]
[[fr:Loi de probabilité]]
[[gl:Distribución de probabilidade]]
[[it:Variabile casuale]]
[[he:התפלגות]]
[[lt:Skirstinys]]
[[nl:Kansverdeling]]
[[ja:確率分布]]
[[pl:Rozkład zmiennej losowej]]
[[ru:Распределение]]
[[sv:Sannolikhetsfördelning]]
[[zh:概率分布]]

Bản mới nhất lúc 08:07, ngày 3 tháng 5 năm 2024

Trong toán họcthống kê, một phân phối xác suất hay thường gọi hơn là một hàm phân phối xác suất là quy luật cho biết cách gán mỗi xác suất cho mỗi khoảng giá trị của tập số thực, sao cho các tiên đề xác suất được thỏa mãn. Theo thuật ngữ kỹ thuật, một phân phối xác suất là một độ đo xác suất (probability measure) mà miền xác định là đại số Borel trên tập số thực.

Một phân phối xác suất là một trường hợp đặc biệt của một khái niệm tổng quát hơn về độ đo xác suất, đó là một hàm thỏa mãn các tiên đề xác suất của Kolmogorov cho các tập đo được của một không gian đo được (measurable space).

Định nghĩa chính thức

[sửa | sửa mã nguồn]

Mỗi biến ngẫu nhiên tạo ra một phân phối xác suất, phân phối này chứa hầu hết các thông tin quan trọng về biến ngẫu nhiên đó. Nếu X là một biến ngẫu nhiên, phân phối xác suất tương ứng gán cho đoạn [a, b] một xác suất P[aXb], nghĩa là, xác suất mà biến X sẽ lấy giá trị trong đoạn [a, b].

Phân phối xác suất của biến X có thể được mô tả một cách duy nhất bởi hàm phân phối tích lũy (cumulative distribution function) F(x) được định nghĩa như sau:

với mọi x thuộc R.

Một phân phối được gọi là rời rạc nếu hàm phân phối tích lũy của nó bao gồm một dãy các bước nhảy hữu hạn, nghĩa là nó sinh ra từ một biến ngẫu nhiên rời rạc X: một biến chỉ có thể nhận giá trị trong một tập hợp hữu hạn hoặc đếm được nhất định. Một phân phối được gọi là liên tục nếu hàm phân phối tích lũy của nó là hàm liên tục, khi đó nó sinh ra từ một biến ngẫu nhiên X mà P[ X = x ] = 0 với mọi x thuộc R. Phân phối liên tục còn có thể được biểu diễn bằng hàm mật độ xác suất: một hàm f không âm khả tích Lebesgue được định nghĩa trên tập số thực như sau:

với mọi ab.

Không có gì đáng ngạc nhiên về việc các phân phối rời rạc không có một hàm mật độ như vậy, nhưng có các phân phối liên tục, như phân phối cầu thang của quỷ (devil's staircase), cũng không có mật độ.

  • Giá của một phân phối là một tập đóng nhỏ nhất mà các phần tử của nó có xác suất bằng 0.
  • Phân phối xác suất của tổng hai biến ngẫu nhiên độc lập là tích chập (convolution) của các phân phối của chúng.
  • Phân phối xác suất của hiệu hai biến ngẫu nhiên là tương quan chéo (cross-correlation) của các phân phối của chúng.

Các phân phối xác suất quan trọng

[sửa | sửa mã nguồn]

Một số phân phối xác suất có vai trò quan trọng trong lý thuyết và ứng dụng đến mức chúng đã được đặt tên:

Các phân phối rời rạc

[sửa | sửa mã nguồn]

Với biến ngẫu nhiên nhận hữu hạn giá trị

[sửa | sửa mã nguồn]
  • Phân phối Bernoulli là phân phối của biên ngẫu nhiên X lấy giá trị 1 với xác suất p và giá trị 0 với xác suất q = 1 − p.
    • Phân phối Rademacher là phân phối của biên ngẫu nhiên X lấy giá trị giá trị 1 với xác suất 1/2 và giá trị −1 với xác suất 1/2.
  • Phân phối nhị thức (binomial distribution) là phân phối của biên ngẫu nhiên X biểu diễn số lần thành công trong một dãy thí nghiệm độc lập, trong đó mỗi lần thử xác suất thành công là số p cố định.
  • Phân phối suy biến (degenerate distribution) tại x0 là phân phối của biên ngẫu nhiên X, trong đó X chắc chắn lấy giá trị x0. Phân phối này không có vẻ ngẫu nhiên, nhưng nó thỏa mãn định nghĩa về biến ngẫu nhiên. Nó có ích do nó đã đặt các biến tất định và các biến ngẫu nhiên trong cùng một dạng thức.
  • Phân phối đều rời rạc (discrete uniform distribution)là phân phối của biến ngẫu nhiên X trong đó X nhân giá trị trong một tập hữu hạn và X nhận giá trị bằng mỗi phần tử của tập đó với xác suất bằng nhau. Đây chính là phân phối xác suất của biên ngẫu nhiên X nhận được khi gieo một đồng xu cân bằng, một con súc sắc không lệch, một vòng roulette, hoặc khi tráo kỹ một bộ bài. Ngoài ra, người ta còn có thể sử dụng các đo đạc về các trạng thái lượng tử (quantum state) để sinh các biến ngẫu nhiên đều. Mọi thiết bị "vật lý" hay "cơ khí" đều có thể có lỗi thiết kế hoặc bị trục trặc, và phân phối đều là một mô tả gần đúng hành vi của chúng.
  • Phân phối siêu bội (hypergeometric distribution) là phân phối của biên ngẫu nhiên X biểu diễn số lần thành công trong m lần đầu tiên của một chuỗi n thực nghiệm độc lập, nếu cho trước tổng số lần thành công.
  • Phân phối Zipf: một phân phối quy tắc lũy thừa (power law) rời, ví dụ nổi tiếng nhất của nó là mô tả về tần số của các từ trong tiếng Anh.
  • Phân phối Zipf-Mandelbrot là một phân phối quy tắc lũy thừa rời rạc và là suy rộng của phân phối Zipf.

Với biến ngẫu nhiên nhận vô hạn giá trị

[sửa | sửa mã nguồn]
Phân phối Poisson
Phân phối Skellam

Các phân phối liên tục

[sửa | sửa mã nguồn]

Phân phối của các biến ngẫu nhiên lấy giá trị trên một khoảng bị chặn

[sửa | sửa mã nguồn]
Phân phối Beta
  • Phân phối Beta trên đoạn [0,1], phân phối đều là trường hợp đặc biệt, hữu dụng cho việc ước lượng các xác suất thành công.
Phân phối đều liên tục

Phân phối của các biến ngẫu nhiên lấy giá trị trên khoảng nửa hữu hạn, thường là [0,∞)

[sửa | sửa mã nguồn]
Phân phối chi-square
Phân phối mũ
Phân phối Gamma
Phân phối Pareto

Phân phối của các biến ngẫu nhiên lấy giá trị trên toàn tập số thực

[sửa | sửa mã nguồn]
Phân phối Cauchy
Phân phối Laplace
Phân phối Levy
Phân phối chuẩn

Các phân phối điều kiện

[sửa | sửa mã nguồn]

Với tập hợp bất kỳ gồm các biến ngẫu nhiên độc lập, hàm mật độ xác suất của phân phối có điều kiện (joint distribution) là tích của từng hàm riêng.

Phân phối đông thời của các biến ngẫu nhiên trên cùng một không gian mẫu (vectơ ngẫu nhiên)

[sửa | sửa mã nguồn]

Các phân phối của các ma trận ngẫu nhiên

[sửa | sửa mã nguồn]

Đó là phân phối của các biến ngẫu nhiên nhận giá trị là các ma trận

Các phân phối khác

[sửa | sửa mã nguồn]

Tham khảo

[sửa | sửa mã nguồn]