Khác biệt giữa bản sửa đổi của “Phân phối xác suất”
hỗ trợ -> giá |
|||
Dòng 166: | Dòng 166: | ||
[[Category:Xác suất và thống kê|Xác suất và thống kê]] |
[[Category:Xác suất và thống kê|Xác suất và thống kê]] |
||
[[Category:Phân bố xác suất]] |
[[Category:Phân bố xác suất|*]] |
||
[[ar:توزيع احتمالي]] |
[[ar:توزيع احتمالي]] |
Phiên bản lúc 13:35, ngày 24 tháng 3 năm 2006
Trong Toán học và Thống kê, một phân bố xác suất hay phân phối xác suất, tên đúng hơn là mật độ xác suất, gán cho mỗi khoảng giá trị của số thực một xác suất, sao cho các tiên đề xác suất được thỏa mãn. Theo thuật ngữ kỹ thuật, một phân bố xác suất là một độ đo xác suất (probability measure) mà miền xác định là đại số Borel trên tập số thực.
Bài viết này là công việc biên dịch đang được tiến hành từ bài viết ArticleName từ một ngôn ngữ khác sang tiếng Việt. Bạn có thể giúp Wikipedia bằng cách hỗ trợ dịch và trau chuốt lối hành văn tiếng Việt theo cẩm nang của Wikipedia. |
Một trong nhiều ứng dụng của phân bố xác suất là công việc đánh giá rủi ro trong ngành bảo hiểm.
Một phân bố xác suất là một trường hợp đặc biệt của một khái niệm tổng quát hơn về độ đo xác suất, đó là một hàm xác suất thỏa mãn các tiên đề Kolmogorov cho các tập đo được của một không gian đo được (measurable space).
Mỗi biến ngẫu nhiên cho ra một phân bố xác suất, và phân bố này chứa hầu hết các thông tin quan trọng về biến đó. Nếu X là một biến ngẫu nhiên, phân bố xác suất tương ứng gán cho đoạn [a, b] xác suất Pr[a ≤ X ≤ b], nghĩa là, xác suất mà biến X sẽ lấy giá trị trong đoạn [a, b].
Phân bố xác suất của biến X có thể được mô tả một cách duy nhất bởi hàm phân bố tích lũy (cumulative distribution function) F(x) được định nghĩa như sau:
với mọi x thuộc R.
Một phân bố được gọi là rời rạc nếu hàm phân bố tích lũy của nó bao gồm một chuỗi các bước nhảy hữu hạn, nghĩa là nó thuộc về một biến ngẫu nhiên rời rạc X: một biến chỉ có thể nhận giá trị trong một tập hợp hữu hạn hoặc đếm được nhất định. Một phân bố được gọi là liên tục nếu hàm phân bố tích lũy của nó là hàm liên tục, nghĩa là nó thuộc về một biến ngẫu nhiên X mà Pr[ X = x ] = 0 với mọi x thuộc R. Phân bố liên tục có thể được biểu diễn bằng một hàm mật độ xác suất: một hàm f không âm khả tích Lebesgue được định nghĩa trên tập số thực như sau"
với mọi a và b.
Không có gì đáng ngạc nhiên về chuyện các phân bố rời rạc không có một mật độ như vậy, nhưng có các phân bố liên tục, như phân bố cầu thang của quỷ (devil's staircase), cũng không có mật độ.
- Giá (support) của một phân bố là một tập đóng nhỏ nhất mà các phần tử của nó có xác suất bằng 0.
- Phân bố xác suất của tổng hai biến ngẫu nhiên độc lập là tích chập (convolution) của các phân bố của chúng.
- Phân bố xác suất của hiệu hai biến ngẫu nhiên là tương quan chéo (cross-correlation) của các phân bố của chúng.
Các phân bố xác suất quan trọng
Một số phân bố xác suất có vai trò quan trọng trong lý thuyết và ứng dụng đến mức chúng đã được đặt tên:
Các phân bố rời rạc
Với giá hữu hạn
- Phân bố Bernoulli lấy giá trị 1 với xác suất p và giá trị 0 với xác suất q = 1 − p.
- Phân bố Rademacher lấy giá trị giá trị 1 với xác suất 1/2 và giá trị −1 với xác suất 1/2.
- Phân bố nhị thức (binomial distribution) mô tả số lần thành công trong một chuỗi thực nghiệm Có/Không độc lập.
- Phân bố suy biến (degenerate distribution) tại x0, trong đó X chắc chắn lấy giá trị x0. Phân bố này không có vẻ ngẫu nhiên, nhưng nó thỏa mãn định nghĩa về biến ngẫu nhiên. Nó có ích do nó đã đặt các biến tất định và các biến ngẫu nhiên trong cùng một dạng thức.
- Phân bố đều rời rạc (uniform distribution), trong đó mọi phần tử của một tập hữu hạn đều có xác suất xảy ra bằng nhau. Đây được coi là phân bố của một đồng xu cân bằng, một con súc sắc không lệnh, một vòng roulette, hoặc một bộ bài tráo kĩ. Ngoài ra, người ta còn có thể sử dụng các đo đạc về các trạng thái lượng tử (quantum state) để sinh các biến ngẫu nhiên đều. Mọi thiết bị "vật lý" hay "cơ khí" đều có thể có lỗi thiết kế hoặc bị trục trặc, và phân phối đều là một mô tả gần đúng hành vi của chúng.
- Phân bố siêu bội (hypergeometric distribution) mô tả số lần thành công trong m lần đầu tiên của một chuỗi n thực nghiệm Có/Không độc lập, nếu cho trước tổng số lần thành công.
- Phân bố Zipf: một phân bố quy tắc lũy thừa (power law) rời, ví dụ nổi tiếng nhất của nó là mô tả về tần số của các từ trong tiếng Anh.
- Phân bố Zipf-Mandelbrot là một phân bố quy tắc lũy thừa rời rạc và là suy rộng của phân bố Zipf.
Với giá vô hạn
- Phân bố Boltzmann, một phân bố rời rạc quan trọng trong vật lý học thống kê. Nó mô tả xác suất của các mức năng lượng rời rạc của một hệ thống trong cân bằng nhiệt. Nó có một mô hình liên tục. Các trường hợp đặc biệt gồm có:
- Phân bố hình học, một phân bố rời rạc mô tả số thực nghiệm cần thiết để đạt đến thành công đầu tiên trong một chuỗi các thực nghiệm Có/Không độc lập.
- Phân bố lôga
- Phân bố nhị thức âm, một suy rộng của phân bố hình học cho thành công thứ n.
- parabolic fractal distribution
- Phân bố Poisson, mô tả một số rất lớn các biến cố xảy ra trong một khoảng thời gian nhất định.
- Phân bố Skellam, phân bố của hiệu của hai biến ngẫu nhiên độc lập tuân theo phân bố Poisson.
- Phân bố Yule-Simon
- Phân bố zeta dùng trong thống kê ứng dụng và cơ học thống kê, và có lẽ được các nhà lý thuyết số quan tâm. Nó là phân bố Zipf cho tập vô hạn các phần tử.
Các phân bố liên tục
Được hỗ trợ trên một khoảng bị chặn
- Phân bố Bêta trên đoạn [0,1], phân bố đều là trường hợp đặc biệt, hữu dụng cho việc ước lượng các xác suất thành công.
- Phân bố đều liên tục trên đoạn [a,b], trong đó mọi điểm trong một khoảng hữu hạn có xác suất bằng nhau.
- Phân bố chữ nhật là một phân bố đều trên đoạn [-1/2,1/2].
- Hàm delta Dirac tuy không hoàn toàn là một hàm, là một dạng giới hạn của nhiều hàm xác suất liên tục. Nó biễu diễn một phân bố xác suất rời rạc tập trung tại 0 — một phân bố suy biến — (degenerate distribution) nhưng hệ thống biểu diễn đối xử với nó như thể nó là một phân bố liên tục.
- Phân bố Kumaraswamy cũng hữu dụng như phân bố Beta nhưng có dạng đóng đơn giản cho cả hàm phân bố tích lũy và hàm phân bố xác suất.
- Phân bố lôga (liên tục)
- Phân bố tam giác trên đoạn [a, b], trường hợp đặc biệt là phân bố của tổng hai biến ngẫu nhiên có phân bố đều (tính chập của hai phân bố đều).
- Phân bố von Mises
- Phân bố nửa hình tròn Wigner (Wigner semicircle distribution) quan trọng trong lý thuyết ma trận ngẫu nhiên (random matrices).
Với giá là các khoảng nửa hữu hạn, thường là [0,∞)
- Phân bố chi
- Phân bố chi không trung tâm (noncentral chi distribution)
- Phân bố chi-square, là tổng của các bình phương của n biến ngẫu nhiên Gauss độc lập. Đây là trường hợp đặc biệt của phân bố the Gamma, nó được dùng cho các kiểm tra goodness-of-fit trong Thống kê.
- Phân bố chi-square nghịch đảo (inverse-chi-square distribution)
- Phân bố chi-square nghịch đảo (noncentral chi-square distribution)
- Phân bố chi-square nghịch đảo tỉ lệ (scale-inverse-chi-square distribution)
- Phân phối mũ, mô tả thời gian giữa các biến cố ngẫu nhiên hiếm gặp liên tiếp trong một quy trình không có bộ nhớ.
- The F-distribution, which is the distribution of the ratio of two (normalized) chi-square distributed random variables, used in the analysis of variance.
- Phân bố Gamma, mô tả thời gian cho đến khi n biến cố ngẫu nhiên hiếm gặp liên tiếp xảy ra trong một quá trình không có bộ nhớ.
- Phân bố Erlang, là trường hợp đặc biệt của phân bố Gamma với tham số hình dạng là số nguyên, được phát triển để dự đoán các thời gian đợi trong các hệ thống hàng đợi (queuing systems).
- The inverse-gamma distribution
- Fisher's z-distribution
- The half-normal distribution
- The Lévy distribution
- The log-logistic distribution
- The log-normal distribution, describing variables which can be modelled as the product of many small independent positive variables.
- Phân bố Pareto, hoặc phân bố "quy tắc lũy thừa", được dùng trong phân tích dữ liệu thương mại và hành vi tới hạn (critical behavior).
- The Rayleigh distribution
- The Rayleigh mixture distribution
- The Rice distribution
- The type-2 Gumbel distribution
- The Wald distribution
- The Weibull distribution, of which the exponential distribution is a special case, is used to model the lifetime of technical devices.
Giá là toàn tập số thực
- The Beta prime distribution
- The Cauchy distribution, an example of a distribution which does not have an expected value or a variance. In physics it is usually called a Lorentzian profile, and is associated with many processes, including resonance energy distribution, impact and natural spectral line broadening and quadratic stark line broadening.
- The Fisher-Tippett, extreme value, or log-Weibull distribution
- Phân bố Gumbel, trường hợp đặc biệt của phân bố Fisher-Tippett
- The generalized extreme value distribution
- The hyperbolic secant distribution
- Phân bố Landau
- Phân bố Laplace
- The Lévy skew alpha-stable distribution is often used to characterize financial data and critical behavior.
- The map-Airy distribution
- Phân bố chuẩn (normal distribution), còn gọi là đường cong Gauss. Nó rất phổ biến trong thiên nhiên và thống kê do định lý giới hạn trung tâm (central limit theorem): mọi biến mà có thể được mô hình bằng tổng của nhiều biến độc lập đều là xấp xỉ chuẩn.
- Student's t-distribution, useful for estimating unknown means of Gaussian populations.
- The type-1 Gumbel distribution
- The Voigt distribution, or Voigt profile, is the convolution of a normal distribution and a Cauchy distribution. It is found in spectroscopy when spectral line profiles are broadened by a mixture of Lorentzian and Doppler broadening mechanisms.
Joint distributions
For any set of independent random variables the probability density function of the joint distribution is the product of the individual ones.
Two or more random variables on the same sample space
- Dirichlet distribution, a generalization of the beta distribution.
- The Ewens's sampling formula is a probability distribution on the set of all partitions of an integer n, arising in population genetics.
- multinomial distribution, a generalization of the binomial distribution.
- multivariate normal distribution, a generalization of the normal distribution.
Matrix-valued distributions
- Wishart distribution
- matrix normal distribution
- matrix t-distribution
- Hotelling's T-square distribution