Bước tới nội dung

Khác biệt giữa bản sửa đổi của “Phân phối xác suất”

Bách khoa toàn thư mở Wikipedia
Nội dung được xóa Nội dung được thêm vào
Ctmt (thảo luận | đóng góp)
hỗ trợ -> giá
Dòng 166: Dòng 166:


[[Category:Xác suất và thống kê|Xác suất và thống kê]]
[[Category:Xác suất và thống kê|Xác suất và thống kê]]
[[Category:Phân bố xác suất]]
[[Category:Phân bố xác suất|*]]


[[ar:توزيع احتمالي]]
[[ar:توزيع احتمالي]]

Phiên bản lúc 13:35, ngày 24 tháng 3 năm 2006

Trong Toán họcThống kê, một phân bố xác suất hay phân phối xác suất, tên đúng hơn là mật độ xác suất, gán cho mỗi khoảng giá trị của số thực một xác suất, sao cho các tiên đề xác suất được thỏa mãn. Theo thuật ngữ kỹ thuật, một phân bố xác suất là một độ đo xác suất (probability measure) mà miền xác định là đại số Borel trên tập số thực.

Một trong nhiều ứng dụng của phân bố xác suất là công việc đánh giá rủi ro trong ngành bảo hiểm.

Một phân bố xác suất là một trường hợp đặc biệt của một khái niệm tổng quát hơn về độ đo xác suất, đó là một hàm xác suất thỏa mãn các tiên đề Kolmogorov cho các tập đo được của một không gian đo được (measurable space).

Mỗi biến ngẫu nhiên cho ra một phân bố xác suất, và phân bố này chứa hầu hết các thông tin quan trọng về biến đó. Nếu X là một biến ngẫu nhiên, phân bố xác suất tương ứng gán cho đoạn [a, b] xác suất Pr[aXb], nghĩa là, xác suất mà biến X sẽ lấy giá trị trong đoạn [a, b].

Phân bố xác suất của biến X có thể được mô tả một cách duy nhất bởi hàm phân bố tích lũy (cumulative distribution function) F(x) được định nghĩa như sau:

với mọi x thuộc R.

Một phân bố được gọi là rời rạc nếu hàm phân bố tích lũy của nó bao gồm một chuỗi các bước nhảy hữu hạn, nghĩa là nó thuộc về một biến ngẫu nhiên rời rạc X: một biến chỉ có thể nhận giá trị trong một tập hợp hữu hạn hoặc đếm được nhất định. Một phân bố được gọi là liên tục nếu hàm phân bố tích lũy của nó là hàm liên tục, nghĩa là nó thuộc về một biến ngẫu nhiên X mà Pr[ X = x ] = 0 với mọi x thuộc R. Phân bố liên tục có thể được biểu diễn bằng một hàm mật độ xác suất: một hàm f không âm khả tích Lebesgue được định nghĩa trên tập số thực như sau"

với mọi ab.

Không có gì đáng ngạc nhiên về chuyện các phân bố rời rạc không có một mật độ như vậy, nhưng có các phân bố liên tục, như phân bố cầu thang của quỷ (devil's staircase), cũng không có mật độ.

  • Giá (support) của một phân bố là một tập đóng nhỏ nhất mà các phần tử của nó có xác suất bằng 0.
  • Phân bố xác suất của tổng hai biến ngẫu nhiên độc lập là tích chập (convolution) của các phân bố của chúng.
  • Phân bố xác suất của hiệu hai biến ngẫu nhiên là tương quan chéo (cross-correlation) của các phân bố của chúng.

Các phân bố xác suất quan trọng

Một số phân bố xác suất có vai trò quan trọng trong lý thuyết và ứng dụng đến mức chúng đã được đặt tên:

Các phân bố rời rạc

Với giá hữu hạn

  • Phân bố Bernoulli lấy giá trị 1 với xác suất p và giá trị 0 với xác suất q = 1 − p.
    • Phân bố Rademacher lấy giá trị giá trị 1 với xác suất 1/2 và giá trị −1 với xác suất 1/2.
  • Phân bố nhị thức (binomial distribution) mô tả số lần thành công trong một chuỗi thực nghiệm Có/Không độc lập.
  • Phân bố suy biến (degenerate distribution) tại x0, trong đó X chắc chắn lấy giá trị x0. Phân bố này không có vẻ ngẫu nhiên, nhưng nó thỏa mãn định nghĩa về biến ngẫu nhiên. Nó có ích do nó đã đặt các biến tất định và các biến ngẫu nhiên trong cùng một dạng thức.
  • Phân bố đều rời rạc (uniform distribution), trong đó mọi phần tử của một tập hữu hạn đều có xác suất xảy ra bằng nhau. Đây được coi là phân bố của một đồng xu cân bằng, một con súc sắc không lệnh, một vòng roulette, hoặc một bộ bài tráo kĩ. Ngoài ra, người ta còn có thể sử dụng các đo đạc về các trạng thái lượng tử (quantum state) để sinh các biến ngẫu nhiên đều. Mọi thiết bị "vật lý" hay "cơ khí" đều có thể có lỗi thiết kế hoặc bị trục trặc, và phân phối đều là một mô tả gần đúng hành vi của chúng.
  • Phân bố siêu bội (hypergeometric distribution) mô tả số lần thành công trong m lần đầu tiên của một chuỗi n thực nghiệm Có/Không độc lập, nếu cho trước tổng số lần thành công.
  • Phân bố Zipf: một phân bố quy tắc lũy thừa (power law) rời, ví dụ nổi tiếng nhất của nó là mô tả về tần số của các từ trong tiếng Anh.
  • Phân bố Zipf-Mandelbrot là một phân bố quy tắc lũy thừa rời rạc và là suy rộng của phân bố Zipf.

Với giá vô hạn

Phân bố Poisson
Phân bố Skellam

Các phân bố liên tục

Được hỗ trợ trên một khoảng bị chặn

Phân bố Beta
  • Phân bố Bêta trên đoạn [0,1], phân bố đều là trường hợp đặc biệt, hữu dụng cho việc ước lượng các xác suất thành công.
Phân bố đều liên tục

Với giá là các khoảng nửa hữu hạn, thường là [0,∞)

chi-square distribution
Phân phối mũ
Phân bố Gamma
Phân bố Pareto

Giá là toàn tập số thực

Phân bố Cauchy
Phân bố Laplace
Phân bố Levy
Phân bố chuẩn

Joint distributions

For any set of independent random variables the probability density function of the joint distribution is the product of the individual ones.

Two or more random variables on the same sample space

Matrix-valued distributions

Miscellaneous distributions

Xem thêm