Bài giảng Xác suất thống kê - Chương 3: Các phân phối xác suất thông dụng - Th.S Nguyễn Phương

pdf 38 trang phuongnguyen 6530
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Chương 3: Các phân phối xác suất thông dụng - Th.S Nguyễn Phương", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_chuong_3_cac_phan_phoi_xac_suat.pdf

Nội dung text: Bài giảng Xác suất thống kê - Chương 3: Các phân phối xác suất thông dụng - Th.S Nguyễn Phương

  1. Chương 3: CÁC PHÂN PHỐI XÁC SUẤT THÔNG DỤNG Th.S NGUYỄN PHƯƠNG Khoa Giáo dục cơ bản Trường Đại học Ngân hàng TPHCM Blog: Email: nguyenphuong0122@gmail.com Yahoo: nguyenphuong1504 Ngày 17 tháng 2 năm 2014 1
  2. 1 Phân phối nhị thức 2 Phân phối siêu bội 3 Phân phối Poisson 4 Phân phối chuẩn 5 Phân phối chi bình phương 6 Phân phối Student 7 Phân phối Fisher 2
  3. Phân phối nhị thức Dãy phép thử Bernoulli Dãy n phép thử được gọi là dãy phép thử Bernoulli nếu: - Các phép thử độc lập với nhau. - Xác suất biến cố A xảy ra trong mỗi phép thử là như nhau, P(A) = p. Công thức Bernoulli Xác suất để biến cố A xuất hiện k lần trong n phép thử, được ký hiệu Pn(k) và xác định bởi công thức k k n k Pn(k) = Cnp q − k = 0, , n 3
  4. Phân phối nhị thức Định nghĩa X có phân phối nhị thức với tham số n, p, kí hiệu làX B(n, p), nếu tập giá trị của X làX (Ω) = 0, 1, , n và ∼ { } k k n k P(X = k) = C p q − , k X(Ω) (1) n ∈ Ví dụ Một phân xưởng có 10 máy hoạt động độc lập. Xác suất để trong 1 ngày mỗi máy bị hỏng là 0,1. a) Tính xác suất trong 1 ngày có 2 máy bị hỏng. b) Tính xác suất trong 1 ngày có không quá 2 máy bị hỏng. 4
  5. Phân phối nhị thức Tính chất NếuX B(n, p) thì ∼ i)E (X) = np; Var(X) = np(1 p) = npq; − ii) np q Mod(X) np + p; − ≤ ≤ iii) với x, h là 2 số nguyên dương thì P(x X x + h) = P(X = x) + P(X = x + 1) + + P(X = x + h) ≤ ≤ Ví dụ Một phân xưởng có 100 máy hoạt động độc lập. Xác suất trong một ca sản xuất mỗi máy bị hỏng là như nhau và bằng 2%. Gọi X là số máy bị hư trong một ca sản xuất. a) Tính E(X), Var(X). b) Nếu mỗi kỹ sư có thể sửa chữa tối đa được 2 máy bị hỏng trong 1 ca sản xuất thì nhà máy cần bố trí trực sửa chữa mỗi ca bao nhiêu kỹ sư là hợp lý nhất. 5
  6. Phân phối siêu bội Ví dụ Trong bình có 10 viên bi trong đó có 6 viên bi trắng và 4 viên bi đen. Lấy ngẫu nhiên 3 viên bi, nếu gọi X là số viên bi trắng có trong 3 bi lấy ra thì giá trị có thể của biến ngẫu nhiên X là 0, 1, 2, 3. Xác suất để lấy được 1 bi trắng là 1 2 C6C4 P(X = 1) = 3 C10 Xác suất lấy được k viên bi trắng k 3 k C6C4− P(X = k) = 3 C10 trong đó k = 0, 1, 2, 3. 6
  7. Phân phối siêu bội Mô hình tổng quát Tổng quát, một tập T gồm có N phần tử, trong đó có NA phần tử có tính chất A và N NA phần tử không có tính chất A. Từ tập T ta lấy ngẫu nhiên n phần tử (lấy− một lần n phần tử hoặc lấy n lần không hoàn lại mỗi lần một phần tử). Gọi X là số phần tử có tính chất A có trong n phần tử chọn ra từ tập T . Khi đó X là biến ngẫu nhiên rời rạc nhận giá trị k sao cho   0 k n  ≤ ≤ n (N NA) k NA − − ≤ ≤ Nếu kí hiệu k1 = max 0, n (N NA) và k2 = min(n, NA) thì miền giá trị của X là { − − } S = k N : k1 k k2 { ∈ ≤ ≤ } và Ck Cn k NA N− NA − P(X = k) = n , k S CN ∈ 7
  8. Phân phối siêu bội Định nghĩa Biến ngẫu nhiên X nhận giá trị nguyên dương k S với xác suất tương ứng ∈ Ck Cn k NA N− NA − P(X = k) = n , k S (2) CN ∈ thì ta gọi X có phân phối siêu bội với tham số N, NA, n, kí hiệu X H(N, NA, n). ∼ Ví dụ Có một cái hộp chứa 8 quả cầu trắng và 3 quả cầu đen. Lấy ngẫu nhiên không hoàn lại 4 quả cầu. Gọi X là số quả cầu trắng lấy được. Tính xác suất a) Lấy được ít nhất 1 quả cầu trắng. b) Lấy được 2 quả cầu trắng. 8
  9. Phân phối siêu bội Tính chất Nếu biến ngẫu nhiênX H(N, NA, n)thì ∼ N i)E (X) = np với p = A ; N N n ii) Var(X) = npq − với q = 1 p. N 1 − − Ví dụ Có một cái hộp chứa 8 quả cầu trắng và 3 quả cầu đen. Lấy ngẫu nhiên không hoàn lại 4 quả cầu. Gọi X là số quả cầu trắng lấy được. Tính E(X), Var(X). Ví dụ Một trò chơi có 3 quân bài đỏ và 5 quân bài đen, bốc ngẫu nhiên ra 3 quân bài. Nếu bốc được quân bài đỏ thì được 7 USD, nếu bốc phải quân bài đen thì mất 5 USD. Tính số tiền trung bình người chơi có thể thu được trong một lần chơi. 9
  10. Phân phối siêu bội Xấp xỉ phân phối siêu bội bằng phân phối nhị thức NA Định lí: NếuX H(N, NA, n), n cố định, N và p (p , 0, p , 1) thì ∼ → ∞ N → F X B(n, p) → Ý nghĩa trong thực hành 1. Nếu X H(N, NA, n), nếu N khá lớn; n rất nhỏ so với N thì ∼ k k n k NA P(X = k) C p q − p = . ≈ n N Công thức xấp xỉ khá tốt khin < 0, 05N. 2. Khi N khá lớn so với n. Việc lấy ra n phần tử từ tổng thể N phân tử theo phương thức: có hoàn lại hay không hoàn lại, được coi là như nhau. Ví dụ Một lô hàng có 1000 sản phẩm, có tỷ lệ sản phẩm loại A là 80%. Lấy ngẫu nhiên 10 sản phẩm để kiểm tra. Tính xác suất có 7 sản phẩm loại A trong 10 sản phẩm lấy ra kiểm tra. 10
  11. Phân phối Poisson Định nghĩa Nếu biến ngẫu nhiên rời rạc X nhận giá trị nguyên dương k, (k = 0, 1, 2, ) với xác suất λke λ P(X = k) = − , k = 0, 1, 2, 3, k! Thì biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số λ , ký hiệuX P(λ). ∼ Ví dụ Cho X P(3). Tính ∼ a) P(X = 3) b) P(X = 6, 5) c) P(X > 2) 11
  12. Phân phối Poisson Tính chất NếuX P(λ) thì ∼ i)E (X) = Var(X) = λ; ii) λ 1 mod(X) λ. − ≤ ≤ Trong thực tế, phân phối Poisson dùng để chỉ số lần biến cố A xảy ra trong một khoảng thời gian, không gian nhất định, với tham sốλ là số lần biến cố A xảy ra trung bình trong khoảng thời gian đó. Ví dụ Ở một tổng đài điện thoại các cuộc gọi đến một cách ngẫu nhiên, độc lập và trung bình có 10 cuộc gọi trong 1 phút. Giả sử số cuộc gọi đến tổng đài trong 1 phút có phân phối Poisson tìm xác suất để: a) Có đúng 5 cuộc gọi đến trong 1 phút. b) Có ít nhất 2 cuộc gọi trong 1 phút. 12
  13. Phân phối Poisson Xấp xỉ phân phối nhị thức bằng phân phối Poisson Định lí: ChoX n B(n, p). Nếu số phép thử n và xác suất P(A) 0 sao cho np = λthì ∼ → ∞ → F Xn P(λ) → Ý nghĩa trong thực hành λke λ 1. Nếu X B(n, p), nếu n khá lớn, p khá bé thì P(X = k) = − với ∼ k! λ = np. Công thức xấp xỉ khá tốt khin > 50; p < 0, 1. 2. Do n lớn, p rất bé, từ định lí ngày người ta còn nói luật phân phối Poisson là luật phân phối của biến cố hiếm. Ví dụ Xác suất để một máy sản xuất ra một phế phẩm là 0,1%. Cho máy sản xuất 1000 sản phẩm. Tính xác suất có đúng 2 phế phẩm. 13
  14. Phân phối chuẩn Định nghĩa Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng ( , + ) được gọi là có phân phối chuẩn tham số µ, σ nếu hàm mật độ xác suất−∞ có dạng∞ 1  (x µ)2  f(x) = exp − 2 σ √2π − 2σ trong đó µ, σ là hằng số và σ > 0, µ ( , + ), ký hiệu X N(µ, σ2) ∈ −∞ ∞ ∼ Tính chất Biến ngẫu nhiên X N(µ, σ2), ta có ∼ i)E (X) = Mod(X) = Med(X) = µ. ii) Var(X) = σ2. 14
  15. Phân phối chuẩn Ví dụ Đồ thị của hàm mật độ của X N(4, 1) ∼ Trong trường hợp µ = 0, σ = 1, ta có 15
  16. Phân phối chuẩn Định nghĩa (Phân phối chuẩn tắc) Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng ( , + ) được gọi là có phân phối chuẩn tắc tham số µ = 0, σ = 1 nếu hàm mật−∞ độ xác∞ suất (hay còn được là hàm Gauss) có dạng 1  x2  f(x) = exp √2π − 2 ký hiệu X N(0, 1) ∼ Đồ thị của hàm Gauss 16
  17. Phân phối chuẩn Hàm Laplace Z z ϕ(z) = f(x)dx 0 Giá trị của hàm Laplace là diện tích của miền sau Giá trị của hàm Laplace có thể tra "Bảng 2" (Trang 231 - SGK) 17
  18. Phân phối chuẩn Đồ thị của hàm Laplace 18
  19. Phân phối chuẩn Tính chất (Hàm Gauss và hàm Laplace) i)f ( x) = f(x), − ii) ϕ( x) = ϕ(x), x, − − ∀ iii) ϕ( ) = 0, 5 và ϕ(+ ) = 0, 5 −∞ − ∞ Khi tính toán làm tròn đến số lẻ thứ 5, ta có i)f (x) 0, x 4, 76 ≈ ≥ ii) ϕ(x) 0, 5, x 4, 42 ≈ ≥ Định lý Nếu X N(0; 1) thì ∼ i) P(a X b) = ϕ(b) ϕ(a) ≤ ≤ − ii) P( X < ) = 2ϕ() | | Định lý X N(µ; σ2) aX + b N(aµ + b;(aσ)2)(a , 0). ∼ ⇔ ∼ 19
  20. Phân phối chuẩn Hệ quả Nếu X N(µ; σ2) thì ∼ X µ i) − N(0; 1) σ ∼ b µ a µ ii) P(a X b) = ϕ( − ) ϕ( − ) ≤ ≤ σ − σ    iii) P( X µ < ) = 2ϕ | − | σ 1 x µ iv) Hàm phân phối xác suất F(x) = + ϕ − 2 σ Ví dụ Cho X N(1; 0, 52). Tính các xác suất sau ∼ a) P( 5 X < 1, 23) − ≤ b) P( X 1 < 0, 64) | − | c) P(X < 2, 1) 20
  21. Phân phối chuẩn Giải. a) Ta có 1, 23 1  5 1 P( 5 X < 1, 23) = ϕ − ϕ − − − ≤ 0, 5 − 0, 5 = ϕ(0, 46) ϕ( 12) = 0, 1772 + 0, 5 − − = 0, 6772 b) Ta có, 0, 64 P( X 1 < 0, 64) = 2ϕ | − | 0, 5 = ϕ(1, 28) = 2.0, 3997 = 0, 7994 c) Ta có P(X < 2, 1) = P( < X < 2, 1) −∞ 2, 1 1  1 = ϕ − ϕ −∞ − 0, 5 − 0, 5 = ϕ(2, 2) ϕ( ) = 0, 4861 + 0, 5 − −∞ = 0, 9861 21
  22. Phân phối chuẩn Ví dụ Tốc độ chuyển dữ liệu từ máy chủ của ký túc xá đến máy tính của sinh viên vào buổi sáng chủ nhật có phân phối chuẩn với trung bình 60Kbits/s và độ lệch chuẩn 4Kbits/s. Xác suất để tốc độ chuyển dữ liệu lớn hơn 63Kbits/s Giải. Gọi X là biến ngẫu nhiên chỉ tốc độ chuyển dữ liệu, ký hiệu X N(60, 42). Ta có, ∼ P(X > 63) = P(63 < X < + ) ∞ + 60 63 60 = ϕ ∞ − ϕ − 4 − 4 = ϕ(+ ) ϕ(0, 75) = 0, 5 0, 2734 = 0, 2266 ∞ − − Ví dụ Một kỳ thi đầu vào ở trường chuyên A quy định điểm đỗ là tổng số điểm các môn thi không được thấp hơn 15 điểm. Giả sử tổng điểm các môn thi của học sinh là biến ngẫu nhiên có phân phối chuẩn với trung bình 12 điểm. Biết rằng tỉ lệ học sinh thi đỗ là 25,14%. Tìm độ lệch chuẩn. 22
  23. Phân phối chuẩn Giải. Gọi X là biến ngẫu nhiên tổng điểm các môn thi của học sinh có phân phối chuẩn hay X N(12, σ2). Ta có ∼  12 15 12 P(X 15) = P(15 X < + ) = ϕ ∞ − ϕ − ≥ ≤ ∞ σ − σ  3   3  = ϕ( ) ϕ = 0, 5 ϕ = 0, 2514 ∞ − σ − σ  3  = ϕ = 0, 2486 ⇒ σ 3 Tra bảng 2, ta có = 0, 67 = σ 4, 5 điểm. σ ⇒ ≈ Ví dụ Thời gian đi từ nhà tới trường của sinh viên An là biến ngẫu nhiên X (đơn vị là phút) có phân phối chuẩn. Biết rằng 65% số ngày An đến trường mất hơn 20 phút và 8% số ngày mất hơn 30 phút. a) Tính thời gian đến trường trung bình của An và độ lệch tiêu chuẩn b) Giả sử An xuất phát từ nhà trước giờ vào học 25 phút. Tính xác suất để An bị muộn học c) An cần phải xuất phát trước giờ học là bao nhiêu phút để xác suất bị muộn học của An bé hơn 0,02 23
  24. Phân phối chuẩn Giải. Với X là biến ngẫu nhiên chỉ thời gian đi từ nhà tới trường của sinh viên An có phân phối chuẩn hay X N(µ, σ2) ∼ a) Ta có P(X > 20) = P(20 X 20) = P(20 X < + ) = 0, 08 = − = 1, 405 (4) ≤ ∞ ⇒ σ Từ (3) và (4) = µ = 22, 12 phút và σ = 5, 59 phút. ⇒ 24
  25. Phân phối chuẩn b) Xác suất để An bị muộn học  22, 12 25 22, 12 P(X > 25) = P(25 X t) 0, 02 ≤ P(t X < + ) 0, 02 ≤ ∞ ≤ t 22, 12 0, 5 ϕ − 0, 02 − 5, 59 ≤ t 22, 12 ϕ − 0, 48 5, 59 ≥ t 22, 12 ϕ − ϕ(2, 06) 5, 59 ≥ t 22, 12 − 2, 06 5, 59 ≥ t 33, 6354 ≥ Vậy t = 33, 6354 phút 25
  26. Phân phối chuẩn Ví dụ Trọng lượng của gói mì ăn liền tuân theo quy luật phân phối chuẩn N(100, 4). Gói mì có trọng lượng 98,28g đến 102,28g là đạt tiêu chuẩn. Tìm tỉ lệ phế phẩm và trà lời các câu hỏi sau a) Chọn 200 gói mì. Tìm số gói phế phẩm trung bình. b) Chọn ngẫu nhiên 3 gói mì. Tìm xác suất có đúng 1 gói mì phế phẩm. Giải. Xác suất để 1 gói mì được chọn là chính phẩm 102, 28 100 98, 28 100 P(98, 28 < X < 102, 28) = ϕ − ϕ − = 0, 68 2 − 2 Vậy tỉ lệ gói mì được chọn là phế phẩm p = 1 0, 68 = 0, 32. Ta coi việc chọn gói mì là 1 phép thử Bernoulli − a) Trung bình 200 gói mì được chọn có E(X) = np = 200 0, 32 = 64 gói phế · phẩm. 1 1 2 b) Xác suất có đúng 1 gói mì phế phẩm P3(1) = C3(0, 32) (0, 68) = 0, 444 26
  27. Phân phối chuẩn Quy tắc 3σ 2 Bài toán : Cho X N(µ, σ ). Hãy tìm giá trị z α sao cho ∼ 2 P( X µ < σz α ) = 1 α | − | 2 − trong đó, xác suất α cho trước. Từ công thức tính xác suất, ta có  z α  σ 2 P( X µ < σz α ) = 2ϕ = 2ϕ(z α ) | − | 2 σ 2 1 α Suy ra ϕ(z α ) = − . Ta Bảng phân phối chuẩn tắc ta tìm được z α 2 2 2 Lưu ý : Cho X N(µ, σ2) ∼ P( X µ 2σ) = ϕ(2) 95, 45% | − | ≤ ≈ P( X µ 3σ) = 2ϕ(3) 99, 73% | − | ≤ ≈ P( X µ 6σ) = 2ϕ(6) 99, 999999803% | − | ≤ ≈ 27
  28. Phân phối chuẩn Định lý (Moivre - Laplace) X µ Cho biến ngẫu nhiên X B(n; p). Khi đó − N(0; 1), với µ = np, ∼ σ → σ = √npq Ý nghĩa: Xét X B(n; p) với n đủ lớn sao cho np 5, nq 5 thì ta có thể xấp ∼ ≥ ≥ xĩ X N(µ; σ2) ∼ 1 k µ i) P(X = k) f − ≈ σ σ k2 µ k1 µ ii) P(k1 X < k2) ϕ − ϕ − ≤ ≈ σ − σ Để giảm sai số, ta có thể sử dụng công thức hiệu chỉnh k2 µ 0, 5 k1 µ 0, 5 P(k1 X < k2) ϕ − − ϕ − − ≤ ≈ σ − σ Ví dụ Tỷ lệ nảy mầm của 1 loại hạt giống là 0,8. Gieo thử 100 hạt giống. Tính xác suất để có ít nhất 70 hạt nảy mầm 28
  29. Phân phối chuẩn Giải. Gọi X là biến ngẫu nhiên chỉ số hạt giống nẩy mầm. Khi đó, X B(100; 0, 8) Theo∼ định lý Moivre-Laplace thì ta có thể xấp xĩ X N(80; 42) do ∼ µ = np = 80 và σ = √npq = 4 Khi đó xác suất để có ít nhất 70 hạt giống nẩy mầm P(X 70) = P(70 X + ) ≥ ≤ ≤ ∞ + 80 70 80 = ϕ ∞ − ϕ − 4 − 4 = 0, 5 ϕ( 2, 5) − − = 0, 5 + 0, 49379 = 0, 99379 29
  30. Phân phối chi bình phương Định nghĩa Cho X là biến ngẫu nhiên có phân phối chi bình phương với bậc tự do k, ký hiệu X χ2(k). Hàm mật độ xác suất của X χ2(k) là ∼ ∼   1 k/2 1 x/2  x − e− khi x > 0 f (x) = 2k/2Γ(k/2) k  0 khi x 0 ≥ R + trong đó, Γ(x) = ∞ tx 1e tdt x 0, hay 0 − − , > Định nghĩa n 2 P 2 X χ (k) nếu X = Xi với Xi độc lập, Xi N(0, 1). ∼ i=1 ∼ 30
  31. Phân phối chi bình phương Đồ thị của hàm mật độ xác suất chi bình phương 31
  32. Phân phối chi bình phương Tính chất i) Nếu X N(0, 1) thì X2 χ2(1) ∼ ∼ ii) Nếu X χ2(k),Y χ2(m) thì X + Y χ2(k + m) ∼ ∼ ∼ Giá trị tới hạn mức α của phân phối chi bình phương χ2(k), kí hiệu χ2(k, α) Ví dụ χ2 = 11, 3423 = X χ2(5): P(X > 11, 3423) = 0, 045 (5;0,045) ⇒ ∼ Giá trị tới hạn của hàm chi bình phương32 có thể tra "Bảng 4" (Trang 233 - SGK)
  33. Phân phối Student Định nghĩa Biến ngẫu nhiên X được gọi là phân phối Student với k bậc tự do, kí hiệu X t(k). Hàm mật độ xác suất của X t(k) là ∼ ∼ k + 1 Γ k + 1 2  x2  f(x) = 1 + − 2 √kπΓ(k/2) k R + trong đó, Γ(x) = ∞ tx 1e tdt x 0 hay 0 − − , > Định nghĩa Z 2 X t(k) nếu X = r với Z N(0, 1),Y χ (k) và X, Y độc lập ∼ Y ∼ ∼ k 33
  34. Phân phối Student Đồ thị của hàm mật độ xác suất của phân phối Student t(k) 34
  35. Phân phối Student Giá trị tới hạn mức α của phân phối t(k), kí hiệu t(k,α). Ví dụ t(5;0 03) = 2, 42158 = X t(5): P(X > 2, 42158) = 0, 03 , ⇒ ∼ 35
  36. Phân phối Fisher Định nghĩa Biến ngẫu nhiên X được gọi là có phân phối Fisher với các bậc tự do là m, n; kí hiệu X F(m; n). Hàm mật độ xác suất của X F(m; n) ∼ ∼  m/2 1  x − k nếu x > 0 f(x) =  (mx + n)(m+n)/2  0 nếu x 0 ≤ m + n Γ( )mm/2nn/2 2 R + trong đó, k = , Γ(x) = ∞ tx 1e tdt, x > 0 Γ(m/2)Γ(n/2) 0 − − Tính chất X Cho 2 biến ngẫu nhiên độc lập X 2(m),Y 2(n). Đặt Z = m . Khi đó χ χ Y ∼ ∼ n Z F(m; n). ∼ 36
  37. Phân phối Fisher Đồ thị của hàm mật độ xác suất của phân phối Fisher 37
  38. Phân phối Fisher Giá trị tới hạn mức α của phân phối Fisher, ký hiệu f(m;n;α) Ví dụ f(4;4;0 09) = 4, 40578 X F(4; 4): P(X > 4, 40578) = 0, 09 , ⇔ ∼ Giá trị tới hạn của phân phối Fisher có thể tra "Bảng 5" (Trang 234 - SGK) 38