Phân phối Poisson là gì? Công thức, tính chất và bài tập chi tiết
Phân phối Poisson là một trong những phân phối xác suất rời rạc quan trọng nhất trong lý thuyết xác suất và thống kê. Phân phối này được sử dụng để mô tả số lần xảy ra của một sự kiện trong một khoảng thời gian hoặc không gian cố định. Bài viết dưới đây sẽ trình bày chi tiết định nghĩa, công thức, tính chất cùng các ví dụ minh họa giúp bạn nắm vững kiến thức về phân phối Poisson.
Phân phối Poisson là gì?
Phân phối Poisson là phân phối xác suất rời rạc mô tả xác suất của số lần xảy ra một sự kiện trong một khoảng thời gian hoặc không gian cố định, khi các sự kiện xảy ra độc lập với nhau và với tốc độ trung bình không đổi.
Phân phối này được đặt theo tên nhà toán học người Pháp Siméon Denis Poisson (1781-1840), người đã công bố nghiên cứu về phân phối này vào năm 1837.
Ký hiệu: Nếu biến ngẫu nhiên X tuân theo phân phối Poisson với tham số λ, ta viết:
\[ X \sim Poisson(\lambda) \quad \text{hoặc} \quad X \sim P(\lambda) \]
Đặc điểm của phân phối Poisson:
- Là phân phối xác suất rời rạc
- Biến ngẫu nhiên X nhận các giá trị nguyên không âm: 0, 1, 2, 3, …
- Chỉ có một tham số λ (lambda) – số trung bình sự kiện xảy ra
Để áp dụng phân phối này vào bài toán, chúng ta cần nắm vững các công thức cơ bản sau.
Công thức phân phối Poisson
Hàm xác suất (PMF – Probability Mass Function)
Công thức tính xác suất để biến ngẫu nhiên X nhận giá trị k:
\[ P(X = k) = \frac{\lambda^k \cdot e^{-\lambda}}{k!} \]
Trong đó:
- \( k \) = 0, 1, 2, 3, … (số lần sự kiện xảy ra)
- \( \lambda \) (lambda) > 0: tham số của phân phối, là số trung bình sự kiện xảy ra trong khoảng thời gian/không gian xác định
- \( e \approx 2.71828 \): cơ số của logarit tự nhiên
- \( k! \): giai thừa của k
Kỳ vọng và phương sai
Một tính chất đặc biệt của phân phối Poisson là kỳ vọng bằng phương sai:
| Đại lượng | Công thức | Giá trị |
|---|---|---|
| Kỳ vọng (Expected Value) | \( E(X) = \mu \) | \( \lambda \) |
| Phương sai (Variance) | \( Var(X) = \sigma^2 \) | \( \lambda \) |
| Độ lệch chuẩn (Standard Deviation) | \( \sigma = \sqrt{Var(X)} \) | \( \sqrt{\lambda} \) |
Hàm phân phối tích lũy (CDF)
Xác suất để X nhận giá trị nhỏ hơn hoặc bằng k:
\[ P(X \leq k) = \sum_{i=0}^{k} \frac{\lambda^i \cdot e^{-\lambda}}{i!} \]
Trước khi áp dụng các công thức trên, cần kiểm tra xem bài toán có thỏa mãn các điều kiện của phân phối Poisson hay không.
Điều kiện áp dụng phân phối Poisson
Một biến ngẫu nhiên tuân theo phân phối Poisson khi thỏa mãn các điều kiện sau:
- Sự kiện xảy ra độc lập: Việc xảy ra một sự kiện không ảnh hưởng đến xác suất xảy ra các sự kiện khác
- Tốc độ xảy ra không đổi: Số trung bình sự kiện xảy ra trong một đơn vị thời gian/không gian là hằng số
- Không có hai sự kiện xảy ra đồng thời: Trong một khoảng thời gian đủ nhỏ, xác suất có nhiều hơn một sự kiện xảy ra gần bằng 0
- Xác suất tỷ lệ với độ dài khoảng: Xác suất xảy ra sự kiện trong một khoảng tỷ lệ thuận với độ dài khoảng đó
Các tình huống thường gặp phân phối Poisson:
- Số cuộc gọi đến tổng đài trong một giờ
- Số khách hàng đến cửa hàng trong một ngày
- Số lỗi chính tả trong một trang sách
- Số tai nạn giao thông tại một ngã tư trong một tháng
- Số email nhận được trong một ngày
Để hiểu rõ hơn về đặc điểm của phân phối này, hãy xem xét đồ thị phân phối.
Đồ thị phân phối Poisson
Hình dạng đồ thị của phân phối Poisson phụ thuộc vào giá trị của tham số λ:
| Giá trị λ | Đặc điểm đồ thị |
|---|---|
| \( \lambda < 1 \) | Đồ thị lệch phải mạnh, đỉnh tại k = 0 |
| \( 1 \leq \lambda < 5 \) | Đồ thị lệch phải, đỉnh gần giá trị λ |
| \( \lambda \geq 10 \) | Đồ thị gần đối xứng, tiến gần phân phối chuẩn |
Quy tắc xác định mode (giá trị xuất hiện nhiều nhất):
- Nếu λ là số nguyên: có hai mode là λ và λ – 1
- Nếu λ không phải số nguyên: mode là phần nguyên của λ, tức \( \lfloor \lambda \rfloor \)
Phân phối Poisson có mối liên hệ chặt chẽ với phân phối nhị thức, được trình bày trong phần tiếp theo.
Mối quan hệ giữa phân phối Poisson và phân phối nhị thức
Phân phối Poisson có thể được xem là giới hạn của phân phối nhị thức khi:
- Số phép thử n rất lớn (\( n \to \infty \))
- Xác suất thành công p rất nhỏ (\( p \to 0 \))
- Tích \( np = \lambda \) không đổi
Công thức xấp xỉ:
Khi \( n \geq 20 \) và \( p \leq 0.05 \) (hoặc \( n \geq 100 \) và \( np \leq 10 \)):
\[ C_n^k \cdot p^k \cdot (1-p)^{n-k} \approx \frac{\lambda^k \cdot e^{-\lambda}}{k!} \quad \text{với } \lambda = np \]
Xấp xỉ với phân phối chuẩn:
Khi λ đủ lớn (thường λ ≥ 10), phân phối Poisson có thể xấp xỉ bằng phân phối chuẩn:
\[ X \sim P(\lambda) \approx N(\lambda, \lambda) \]
Nhờ các tính chất đặc biệt, phân phối Poisson được ứng dụng rộng rãi trong nhiều lĩnh vực.
Ứng dụng của phân phối Poisson trong thực tế
Phân phối Poisson được ứng dụng trong nhiều lĩnh vực:
| Lĩnh vực | Ứng dụng cụ thể |
|---|---|
| Viễn thông | Mô hình hóa số cuộc gọi, số gói tin đến server |
| Y tế | Số ca bệnh mới trong một khoảng thời gian, số đột biến gen |
| Bảo hiểm | Số yêu cầu bồi thường, số vụ tai nạn |
| Quản lý chất lượng | Số lỗi sản phẩm, số khuyết tật trên một đơn vị diện tích |
| Giao thông | Số xe qua trạm, số tai nạn tại một điểm |
| Sinh học | Số vi khuẩn trong một mẫu, số tế bào phân chia |
Để hiểu rõ cách áp dụng các công thức, hãy cùng xem các ví dụ minh họa chi tiết.
Ví dụ và bài tập minh họa
Ví dụ 1: Tính xác suất cơ bản
Đề bài: Trung bình mỗi ngày một cửa hàng có 4 khách hàng khiếu nại. Tính xác suất để trong một ngày:
a) Không có khách hàng nào khiếu nại
b) Có đúng 3 khách hàng khiếu nại
c) Có ít nhất 2 khách hàng khiếu nại
Lời giải:
Gọi X là số khách hàng khiếu nại trong một ngày. Ta có \( X \sim P(\lambda = 4) \)
a) Xác suất không có khách khiếu nại P(X = 0):
\[ P(X = 0) = \frac{4^0 \cdot e^{-4}}{0!} = \frac{1 \cdot e^{-4}}{1} = e^{-4} \approx 0.0183 \]
Kết quả: Xác suất khoảng 1.83%
b) Xác suất có đúng 3 khách khiếu nại P(X = 3):
\[ P(X = 3) = \frac{4^3 \cdot e^{-4}}{3!} = \frac{64 \cdot e^{-4}}{6} = \frac{64 \times 0.0183}{6} \approx 0.1954 \]
Kết quả: Xác suất khoảng 19.54%
c) Xác suất có ít nhất 2 khách khiếu nại P(X ≥ 2):
\[ P(X \geq 2) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] \]
Tính \( P(X = 1) \):
\[ P(X = 1) = \frac{4^1 \cdot e^{-4}}{1!} = 4 \cdot e^{-4} \approx 0.0733 \]
\[ P(X \geq 2) = 1 – (0.0183 + 0.0733) = 1 – 0.0916 \approx 0.9084 \]
Kết quả: Xác suất khoảng 90.84%
Ví dụ 2: Thay đổi khoảng thời gian
Đề bài: Một tổng đài nhận trung bình 12 cuộc gọi mỗi giờ. Tính xác suất trong 15 phút có đúng 2 cuộc gọi.
Lời giải:
Bước 1: Tính tham số λ cho khoảng thời gian 15 phút
15 phút = 1/4 giờ, nên:
\[ \lambda_{15\text{phút}} = 12 \times \frac{1}{4} = 3 \text{ cuộc gọi} \]
Bước 2: Áp dụng công thức Poisson
\[ P(X = 2) = \frac{3^2 \cdot e^{-3}}{2!} = \frac{9 \cdot e^{-3}}{2} = \frac{9 \times 0.0498}{2} \approx 0.2240 \]
Kết quả: Xác suất có đúng 2 cuộc gọi trong 15 phút là khoảng 22.40%
Ví dụ 3: Xấp xỉ nhị thức bằng Poisson
Đề bài: Tỷ lệ sản phẩm lỗi của một nhà máy là 2%. Lấy ngẫu nhiên 100 sản phẩm. Tính xác suất có nhiều nhất 3 sản phẩm lỗi.
Lời giải:
Bước 1: Kiểm tra điều kiện xấp xỉ
n = 100 ≥ 20, p = 0.02 ≤ 0.05 → Có thể dùng xấp xỉ Poisson
Bước 2: Tính tham số λ
\[ \lambda = np = 100 \times 0.02 = 2 \]
Bước 3: Tính xác suất P(X ≤ 3)
\[ P(X \leq 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) \]
Tính từng xác suất:
- \( P(X = 0) = \frac{2^0 \cdot e^{-2}}{0!} = e^{-2} \approx 0.1353 \)
- \( P(X = 1) = \frac{2^1 \cdot e^{-2}}{1!} = 2e^{-2} \approx 0.2707 \)
- \( P(X = 2) = \frac{2^2 \cdot e^{-2}}{2!} = 2e^{-2} \approx 0.2707 \)
- \( P(X = 3) = \frac{2^3 \cdot e^{-2}}{3!} = \frac{4e^{-2}}{3} \approx 0.1804 \)
\[ P(X \leq 3) = 0.1353 + 0.2707 + 0.2707 + 0.1804 \approx 0.8571 \]
Kết quả: Xác suất có nhiều nhất 3 sản phẩm lỗi là khoảng 85.71%
Bài tập tự luyện
Bài 1: Số lỗi đánh máy trên một trang sách trung bình là 1.5 lỗi. Tính xác suất:
- a) Một trang không có lỗi nào
- b) Một trang có ít nhất 1 lỗi
- c) Trong 3 trang liên tiếp có tổng cộng đúng 5 lỗi
Bài 2: Trung bình mỗi tuần có 2 vụ tai nạn tại một ngã tư. Tính xác suất trong 2 tuần liên tiếp có không quá 3 vụ tai nạn.
Bài 3: Một bệnh hiếm có tỷ lệ mắc là 0.001 trong dân số. Khảo sát 2000 người, tính xác suất có từ 1 đến 3 người mắc bệnh.
Kết luận
Phân phối Poisson là công cụ quan trọng trong xác suất thống kê, đặc biệt hữu ích khi mô tả số lần xảy ra sự kiện hiếm trong một khoảng thời gian hoặc không gian cố định. Qua bài viết này, chúng ta đã tìm hiểu:
- Định nghĩa và ý nghĩa của phân phối Poisson
- Công thức xác suất: \( P(X = k) = \frac{\lambda^k \cdot e^{-\lambda}}{k!} \)
- Tính chất đặc biệt: Kỳ vọng bằng phương sai bằng λ
- Điều kiện áp dụng và các ứng dụng thực tế
- Mối quan hệ với phân phối nhị thức và phân phối chuẩn
Việc nắm vững phân phối Poisson sẽ giúp bạn giải quyết hiệu quả các bài toán xác suất liên quan đến sự kiện hiếm và ứng dụng trong nhiều lĩnh vực như viễn thông, y tế, bảo hiểm và quản lý chất lượng.
Có thể bạn quan tâm
- Số nguyên tố là gì? Bảng các số nguyên tố, cách tìm chi tiết
- Tứ diện đều: Định nghĩa, tính chất và công thức tính đầy đủ nhất
- Công thức tính đường sinh: Độ dài đường sinh hình nón và bài tập
- Diện tích hình cầu: Công thức tính diện tích mặt cầu và bài tập
- Trọng tâm tứ diện: Công thức, tính chất và cách vẽ chi tiết
