Bài giảng Xác suất và thống kê toán học - Ths Nguyễn Văn Du

ppt 311 trang phuongnguyen 8360
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất và thống kê toán học - Ths Nguyễn Văn Du", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbai_giang_xac_suat_va_thong_ke_toan_hoc_ths_nguyen_van_du.ppt

Nội dung text: Bài giảng Xác suất và thống kê toán học - Ths Nguyễn Văn Du

  1. BÀI GIẢNG XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC Ths Nguyễn Văn Du
  2. CHƯƠNG MỞ ĐẦU GIẢI TÍCH TỔ HỢP
  3. §1 – CÁC KHÁI NIỆM CƠ BẢN ⚫1.1 – BÀI TOÁN CỦA GIẢI TÍCH TỔ HỢP ⚫Từ tập hợp A = {a1, a2, ,an} ta lấy ngẫu nhiên k phần tử kèm theo một điều kiện ràng buộc nào đó. ⚫Vấn đề đặt ra là: Hãy tính số cách chọn ra k phần tử đó ⚫Đây là bài toán cơ bản của giải tích tổ hợp
  4. 1.2 - NGUYEÂN LYÙ CỘNG Neáu moät coâng vieäc ñöôïc chia thaønh k tröôøng hôïp thöïc hieän: ❖ Tröôøng hôïp 1: coù n1 caùch thöïc hieän ❖ Tröôøng hôïp 2: coù n2 caùch thöïc hieän ❖ ❖ Tröôøng hôïp k: coù nk caùch thöïc hieän Thì công vieäc đó có n1+ n2 + + nk cách thöïc hieän
  5. 1.3 – NGUYÊN LÝ NHÂN ▪ Neáu moät coâng vieäc ñöôïc chia laøm k giai ñoaïn ñeå thöïc hieän: ▪ Giai ñoaïn 1: coù n1 caùch thöïc hieän ▪ Giai ñoaïn 2: coù n2 caùch thöïc hieän ▪ ▪ Giai ñoaïn k: coù nk caùch thöïc hieän ▪ Thì công vieäc đó có n1 n2 nk cách thöïc hieän
  6. VÍ DỤ ÁP DỤNG ▪ Cho taäp hôïp: A = {0,1,2,3,4,5} ▪ Ngöôøi ta laäp moät soá töï nhieân coù 4 chöõ soá khaùc nhau ñoâi moät ▪ a) Hoûi coù bao nhieâu soá ñöôïc laäp ? ▪ b) Trong caùc soá ñöôïc laäp coù bao nhieâu soá chaün, bao nhieâu soá leû ?
  7. GIAÛI a) Giaû söû soá phaûi laäp coù daïng x = a1a2a3a4 ÔÛ vò trí a1 ta coù 5 caùch choïn, coøn 5 chöõ soá ÔÛ vò trí a2 ta coù 5 caùch choïn, coøn 4 chöõ soá ÔÛ vò trí a3 ta coù 4 caùch choïn, coøn 3 chöõ soá ÔÛ vò trí a4 ta coù 3 caùch choïn Theo nguyeân lyù nhaân ta coù 5.5.4.3 = 300 soá coù 4 chöõ soá khaùc nhau ñoâi moät
  8. b) Giaû söû soá chaün phaûi laäp coù daïng x = a1a2a3a4 Tröôøng hôïp 1: Soá chaün coù taän cuøng laø soá 0: x = a1a2a30 ⚫ÔÛ vò trí a1 ta coù 5 caùch choïn, coøn 4 chöõ soá ⚫ÔÛ vò trí a2 ta coù 4 caùch choïn, coøn 3 chöõ soá ⚫ÔÛ vò trí a3 ta coù 3 caùch choïn Theo nguyeân lyù nhaân ta coù 5.4.3 = 60 soá chaün coù taän cuøng laø 0
  9. Tröôøng hôïp 2: Soá chaün coù taän cuøng laø soá khaùc 0: x = a1a2a3a4 ⚫ÔÛ vò trí a4 ta coù 2 caùch choïn, coøn 5 chöõ soá ⚫ÔÛ vò trí a1 ta coù 4 caùch choïn, coøn 4 chöõ soá ⚫ÔÛ vò trí a2 ta coù 4 caùch choïn, coøn 3 chöõ soá ⚫ÔÛ vò trí a3 ta coù 3 caùch choïn Theo nguyeân lyù nhaân ta coù 2.4.4.3 = 96 soá chaün coù taän cuøng laø soá khaùc 0
  10. ⚫Theo nguyeân lyù coäng ta coù 60 + 96 = 156 soá chaün ñöôïc laäp thoûa maõn ñeà baøi ⚫Do ñoù coù: 300 – 156 = 144 soá leû thoûa maõn ñeà baøi
  11. §2 – CHỈNH HỢP VAØ HOAÙN VÒ 2.1 - ÑÒNH NGHÓA Cho A laø taäp hôïp coù n phaàn töû. 1) Moãi caùch sắp xếp k phaàn töû cuûa A theo một trình tự nhất định ñöôïc goïi laø moät chỉnh hôïp chaäp k cuûa n phaàn töû ñoù. 2) Moãi caùch sắp xếp n phaàn töû cuûa A theo một trình tự nhất định ñöôïc goïi laø moät hoaùn vò cuûa n phaàn töû ñoù.
  12. 2.2 - COÂNG THÖÙC k 1) Neáu ta goïi An laø soá caùc chỉnh hôïp chaäp k cuûa n phaàn töû thì ta coù coâng thöùc: n! Ak = n (nk− )! 2) Neáu ta goïi Pn laø soá caùc hoaùn vò cuûa n phaàn töû thì ta coù coâng thöùc: Pn = n!
  13. 3 - Ví duï Ví duï 1 Moät lôùp hoïc coù 30 sinh vieân. Ngöôøi ta thaønh laäp moät ban caùn söï coù 3 ngöôøi, trong ñoù moät ngöôøi laøm lôùp tröôûng, moät ngöôøi laø lôùp phoù, moät ngöôøi laøm thuû quyõ maø khoâng cho ai kieâm nhieäm. Hoûi coù bao nhieâu caùch thaønh laäp?
  14. Giaûi: Moãi caùch thaønh laäp Ban caùn söï thoûa maõn ñeà baøi laø moät chænh hôïp chaäp 3 cuûa 3 30, do ñoù ta coù A30 caùch thaønh laäp. Cuï theå laø: 30! 30.29.28.27! A3 == 30 (30− 3) ! 27! == 30.29.28 24360
  15. Ví duï 2 Trong moät buoåi daï hoäi, coù 5 chaøng trai vaø 5 coâ gaùi muoán gheùp ñoâi moät caùch ngaãu nhieân ñeå thaønh laäp nhöõng caëp khieâu vuõ. Hoûi coù bao nhieâu caùch thaønh laäp caùc caëp khieâu vuõ nhö vaäy? GIAÛI Moãi caùch thaønh laäp nhöõng caëp khieâu vuõ chính laø moät hoaùn vò cuûa 5 phaàn töû. Do ñoù ta coù: 5! = 5.4.3.2.1 = 120 caùch laäp
  16. §3 - TOÅ HÔÏP 3.1 - Ñònh nghóa Cho A laø taäp hôïp coù n phaàn töû. Moãi caùch thaønh laäp moät taäp hôïp coù k phaàn töû cuûa A ñöôïc goïi laø moät toå hôïp chaäp k cuûa n phaàn töû ñoù. 3.2 - Coâng thöùc k Neáu ta goïi Cn laø soá caùc toå hôïp chaäp k cuûa n phaàn töû thì ta coù coâng thöùc: n! Ck = n (n− k)!! k
  17. 3 – Tính chất cơ bản k n− k Cnn= C ( k = 0, n − 1) k k−−1 n k Cn= C n−−11 + C n ( k = 0, n − 1) 0 n CCnn==1 1 Cnn = ⚫Nhị thức Newton n n k n−− k k0 n 1 n 1 n n (ab+ ) = CabCaCabn = n + n + + Cb n k=0 ⚫ Suy ra 01 nn CCCn+ n + + n = 2
  18. 3.3 - Ví duï Moät lôùp hoïc coù 30 sinh vieân. Ngöôøi ta thaønh laäp moät ban caùn söï coù 3 ngöôøi Hoûi coù bao nhieâu caùch thaønh laäp? Giaûi Moãi caùch thaønh laäp ban caùn söï nhö vaäy laø moät toå hôïp chaäp 3 cuûa 30. Do ñoù ta coù: 30! 30.29.28.27! 30.29.28 C3 = = = = 4060 caùch 30 (30− 3) !3! 27!3.2.1 6
  19. Chương 1 CÁC KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XÁC SUẤT
  20. PHẦN A BIẾN CỐ NGẪU NHIÊN
  21. §1 - BIẾN CỐ NGẪU NHIÊN ⚫ 1.1 – Phép thử và biến cố ⚫ 1 – Định nghĩa ⚫ Một thí nghiệm dùng để nghiên cứu một đại lượng hay một hiện tượng nào đó được gọi là phép thử. Ký hiệu một phép thử là T ⚫ Mỗi phép thử đều cho ta một kết cục. Kết cục đó được gọi là một biến cố ngẫu nhiên. Ký hiệu biến cố ngẫu nhiên là A, B, C ⚫ 2 – Ví dụ ⚫ Tung một đồng tiền đồng chất cân đối là một phép thử. Kết cục xảy ra là: Đồng tiền xuất hiện
  22. ⚫Mặt sấp (S) hoặc xuất hiện mặt ngửa (N).Ta có: S và N là những biến cố ⚫Gieo một con xúc sắc đồng chất cân đối là một phép thử. Kết cục có thể xảy ra là: Con xúc sắc xuất hiện mặt một chấm A1, hai chấm A2, ba chấm A3, bốn chấm A4, năm chấm A5, sáu chấm A6. Ta có: A1, A2, A3, A4, A5, A6 là những biến cố
  23. 1.2 – Các loại biến cố ⚫ 1 – Biến cố sơ cấp: Là những biến cố loại trừ nhau trong cùng một phép thử ⚫ Tập hợp các biến cố sơ cấp của một phép thử còn gọi là không gian các biến cố sơ cấp và ký hiệu là Ω ⚫ Ví dụ: ⚫ Tung một đồng tiền đồng chất cân đối ta thấy không gian các BCSC của phép thử này là: ⚫ Ω = {N,S} ⚫ Tung một con xúc sắc đồng chất cân đối ta thấy không gian các BCSC của phép thử này là: ⚫ Ω = {A1, A2, A3, A4, A5, A6 }
  24. ⚫ 2 – Biến cố chắc chắn: Là biến cố nhất định phải xảy ra khi phép thử được thực hiện. Ký hiệu là Ω ⚫ 3 – Biến cố không thể có: Là biến cố không thể xảy ra khi phép thử được thực hiện. Ký hiệu là Ø ⚫ 4 – Biến cố đồng khả năng: Là những biến cố có khả năng xuất hiên ngang nhau khi thực hiện một phép thử
  25. §2 – CÁC PHÉP TOÁN VỀ BIẾN CỐ ⚫ 2.1 – Tổng của các biến cố ⚫ 1- Định nghĩa ⚫ Tổng của hai biến cố A và B trong cùng một phép thử là một biến cố C ký hiệu là C = A + B. Biến cố này xảy ra khi và chỉ khi có ít nhất một biến cố A hoặc B xảy ra khi phép thử đươc thực hiện ⚫ Tổng của n biến cố A1, A2, , An trong cùng một phép thử là một biến cố C ký hiệu là ⚫ C = A1 + A2 + + An . Biến cố này xảy ra khi và chỉ khi có ít nhất một biến cố Ai nào đó xảy ra khi phép thử được thực hiện
  26. 2 – Tính chất ⚫ Cho A, B, C là những biến cố trong cùng phép thử ta có: ⚫ A + B = B + A ⚫ (A + B) + C = A + (B + C) ⚫ A + A = A ⚫ A + Ø = A 3 – Ghi chú ⚫ Một biến cố sơ cấp không thể biểu diễn được dưới dạng tổng của các biến cố khác
  27. Ví dụ ⚫Tung một con xúc sắc đồng chất, cân đối ta thấy: ⚫A1, A2, A3 , A4, A5 , A6 là những biến cố sơ cấp. Ta thấy các biến cố này không biểu diễn được thành tổng của các biến cố khác ⚫Gọi C, L tương ứng là các biến cố con xúc sắc xuất hiện mặt chẵn hay lẻ chấm. Ta có: ⚫ C = A2 + A4 + A6 ; L = A1 + A3 + A5 ⚫Như vậy C và L không phải là các biến cố sơ cấp
  28. 2.2 – Tích của các biến cố ⚫ 1 – Định nghĩa ⚫ Tích của hai biến cố A và B trong cùng một phép thử là một biến cố C ký hiệu là C = A B. Biến cố này xảy ra khi và chỉ khi cả hai biến cố A và B xảy ra khi phép thử được thực hiện ⚫ Tích của n biến cố A1, A2, , An trong cùng một phép thử là một biến cố C ký hiệu là ⚫ C = A1A2 An ⚫ Biến cố này xảy ra khi và chỉ khi tất cả các biến cố Ai đều xảy ra khi phép thử được thực hiện
  29. 2 – Tính chất ⚫ Cho A, B, C là những biến cố trong cùng phép thử ta có: ⚫ A B = B A ⚫ (A B)C = A(B C) ⚫ A A = A; A Ø = Ø; A Ω = A ⚫ A(B+C) = AB + AC ⚫ A+BC = (A+B)(A+C)
  30. Ví dụ ⚫Lớp học có 30 sinh viên dự thi môn XSTK; Gọi Ai là biến cố sinh viên i thi đậu; A là biến cố có ít nhất một sinh viên đậu, B là biến cố tất cả sinh viên đều thi đậu. ⚫Ta có: ⚫A = A1 + A2 + + A30 ⚫B = A1A2 A30
  31. §3 – MỐI QUAN HỆ GIỮA CÁC BIẾN CỐ ⚫ 3.1 – Quan hệ kéo theo và quan hệ bằng nhau ⚫ Nếu biến cố A xảy ra luôn luôn làm cho biến cố B xảy ra thì ta nói biến cố A kéo theo biến cố B và ký hiệu là A0B ⚫ Nếu biến cố A kéo theo biến cố B và ngược lại biến cố B kéo theo biến cố A thì ta nói biến cố A bằng biến cố B và ký hiệu là A = B ⚫ 3.2 – Biến cố xung khắc ⚫ Hai biến cố A và B trong cùng phép thử được gọi là xung khắc với nhau nếu A và B không đồng thời xảy ra khi phép thử được thực hiện. Ký hiệu AB = Ø
  32. ⚫ Các biến cố A1, A2, , An trong cùng phép thử được gọi là xung khắc nhau từng đôi một nếu bất kỳ hai biến cố nào trong hệ cũng xung khắc với nhau ⚫ 3.3 – Quan hệ đối lập ⚫ Hai biến cố A và B trong cùng phép thử được gọi là đối lập với nhau nếu chúng là những biến cố xung khắc và khi thực hiện phép thử chỉ xuất hiện biến cố A hoặc biến cố B. Ký hiệu là A== B hay B A ⚫Vậy: AB = AB= AB+ = 
  33. ⚫ 3.4 – Hệ đầy đủ các biến cố ⚫ Hệ các biến cố A1, A2, , An trong cùng một phép thử được gọi là một hệ đầy đủ các biến cố nếu chúng là một hệ xung khắc với nhau từng đôi một và khi phép thử được thực hiện chỉ xuất hiện một trong các biến cố Ai ⚫ Vậy: AAA12, , ,n laø moät he äñaày ñuû i j: Aij A =  (  i , j = 1, n) AAA12+ + +n = 
  34. ⚫ 3.5 – Tính chất (Luật đối ngẫu Đơmoocgăng) ABAB+=. AAAAAA1+ 2 + +nn = 1 2 ABAB. =+ AAAAAA1. 2nn= 1 + 2 + +
  35. PHẦN B XÁC SUẤT
  36. §1 – CÁC ĐỊNH NGHĨA XÁC SUẤT ⚫1.1 – Định nghĩa xác suất theo lối cổ điển ⚫Giả sử một phép thử T có n biến cố sơ cấp đồng khả năng; A là biến cố trong cùng phép thử và có m biến cố sơ cấp có lợi cho A (nghĩa là số khả năng xảy ra biến cố A) ⚫Ta gọi tỉ số m/n là xác suất của biến cố A và ký hiệu là p(A) Soá BCSC co ùlôïi cho A pA( ) = Soá BCSC ñoàng khaû naêng
  37. 1.2 – Định nghĩa xác suất bằng thống kê ⚫Một phép thử T được lặp lại nhiều lần trong những điều kiên giống nhau. Nếu trong n lần thực hiện phép thử có k lần xuất hiện biến cố A thì tỉ số fn(A) = k/n được gọi là tần suất xuất hiện biến cố A trong n lần thử ⚫Khi số phép thử n tăng lên vô hạn thì fn(A) dao động xung quanh một giá trị ổn định. Ta gọi giá trị đó là xác suất của biến cố A và ký hiệu là p(A)
  38. ⚫1.3 – Định nghĩa xác suất bằng hình học ⚫ Ta coi một hình chữ nhật là biến cố chắc chắn Ω; mỗi điểm trong hình chữ nhật được coi là biến cố sơ cấp; mỗi miền con A của hình chữ nhật được coi là biên cố ngẫu nhiên; tập hợp Ø được coi là biến cố không thể có. ⚫Ta định nghĩa xác suất của biến cố A là tỉ số giữa diện tích của miền con A và diện tích của miền Ω
  39. 1.4 – Các tính chất cơ bản của xác suất ▪ Với mọi biến cố A ta có: 01 pA( ) p(=) 1 p() = 0 p( A) =−1 p( A)
  40. 1.5 – Ví dụ minh họa Ví dụ 1 ⚫ Một bình đựng 12 bi trong đó có 8 bi trắng và 4 bi đỏ. Lấy ngẫu nhiên từ trong bình ra 4 bi ⚫ a) Tính xác suất để 4 bi được chọn có đúng ba bi trắng ⚫ b) Tính xác suất để 4 bi được chọn có ít nhất ba bi trắng
  41. Giải ⚫ a) Gọi A là biến cố 4 bi được chọn có đúng 3 bi trắng ta có: p(A) = m/n ⚫ n là số BCSC đồng khả năng. Đó chính là số trường hợp chọn 4 bi từ 12 bi mà không phân biệt mầu. Ta 4 có: n = C12 = 495 ⚫ m là số BCSC có lợi cho A. Đó chính là số trường hợp chọn 4 bi từ 12 bi trong đó có đúng ba bi mầu 3 1 trắng. Ta có: m = C8 C4 = 224 ⚫ Suy ra: ⚫ p(A) = m/n = 224/495 = 0,453 (45,3%)
  42. b) Gọi B là biến cố có ít nhất ba bi trắng.Ta có: p(B) = m/n ⚫ n là số BCSC đồng khả năng. Đó chính là số trường hợp chọn 4 bi từ 12 bi mà không phân biệt mầu. Ta 4 có: n = C12 = 495 ⚫ m là số BCSC có lợi cho B. Đó chính là số trường hợp chọn 4 bi từ 12 bi trong đó có ít nhất ba bi mầu trắng. Có 2 trường hợp xảy ra: 3 1 ⚫ TH1: 3 trắng – 1 đỏ: Trường hợp này có C8 C4 cách chọn 4 0 ⚫ TH2: 4 trắng – 0 đỏ: Trường hợp này có C8 C4 cách chọn
  43. Suy ra: 3 1 4 0 • m = C8 C4 + C8 C4 = 224 + 70 = 294 • Vậy p(B) = m/n = 294/495 = 59,4% • Ví dụ 2: • Một tập hợp có N phần tử, trong đó có NA phần tử loại A. Người ta chọn ngẫu nhiên n phần tử. • Tính xác suất sao cho trong n phần tử chọn ra có đúng k phần tử loại A
  44. Giải ⚫Gọi F là biến cố: “Trong n phần tử chọn ra có đúng k phần tử loại A”. Ta có: M pF( ) = A k n− k k n− k M = CCNNN− CCNNN− AA =pF( ) AA n C n A = CN N ⚫Người ta thường gọi đây là công thức xác suất lựa chọn
  45. §2 – CÁC CÔNG THỨC XÁC SUẤT ⚫ 2.1 – Công thức cộng xác suất ⚫ 2.1.1 – Công thức ⚫ 1 – Các biến cố xung khắc ⚫ Nếu A và B là hai biến cố xung khắc với nhau ta có: ⚫ p(A+B) = p(A) + p(B) ⚫ Nếu A1, A2, , An là những biến cố xung khắc nhau từng đôi một ta có: ⚫ p (A1+ A2+ + An ) = p (A1) + p(A2) + +p(An)
  46. ⚫2 – Các biến cố bất kỳ ⚫Cho A và B là những biến cố bất kỳ ta có: ⚫ p(A+B) = p(A) + p(B) – p(AB) ⚫Cho A, B và C là những biến cố bất kỳ ta có: ⚫p(A+B+C) = p(A) + p(B) + p(C ) – p(AB) – p(AC) - p(BC) + p (ABC)
  47. 3 - Ví dụ ⚫ Ví duï 1 ⚫Moät loâ haøng coù 100 saûn phaåm trong ñoù coù 5 pheá phaåm. Loâ haøng ñöôïc chaáp nhaän neáu choïn ngaãu nhieân ra 50 saûn phaåm ñeå kieåm tra thì soá pheá phaåm khoâng quaù 1. ⚫ Tìm xaùc suaát ñeå loâ haøng ñöôïc chaáp nhaän. ⚫Giải ⚫Goïi: A laø bieán coá loâ haøng ñöôïc chaáp nhaän;
  48. ⚫A0 laø bieán coá trong 50 saûn phaåm khoâng coù pheá phaåm naøo; A1 laø bieán coá trong 50 saûn phaåm coù 1 pheá phaåm. ⚫Khi ñoù A0, A1 laø hai bieán coá xung khaéc vaø ta coù: A = A0 + A1. Suy ra: PAPAAPAPA( ) =( 0 + 1) =( 0) + ( 1 ) 0 50 1 49 CCCC5 95 5 95 =50 + 50 = 0,18( 18%) CC100 100
  49. Ví dụ 2 ⚫Thaêm doø 100 ngöôøi trong moät Caâu Laïc Boä thaáy coù 80 ngöôøi thích nhaïc Vaên Cao, 70 ngöôøi thích nhaïc Trònh Coâng Sôn, 60 ngöôøi thích nhaïc cuûa caû hai oâng. Choïn ngaãu nhieân 1 ngöôøi trong soá ñöôïc thaêm thaêm doø. ⚫Tính xaùc suaát ñeå ngöôøi naøy thích nhaïc cuûa ít nhaát 1 trong 2 nhaïc só.
  50. Giải ⚫Goïi: A1 laø Bieán coá ngöôøi ñöôïc choïn thích nhaïc Vaên Cao; A2 laø Bieán coá ngöôøi ñöôïc choïn thích nhaïc Trònh Coâng Sôn; F laø Bieán coá ngöôøi ñöôïc choïn thích nhaïc cuûa ít nhaát 1 trong 2 nhaïc só. ⚫Ta thaáy A1, A2 khoâng phaûi laø hai bieán coá xung khaéc vaø: F = A1 + A2 PFPAAPAPAPAA( ) =( 1 + 2) =( 1) +( 2) − ( 1 2 ) 80 70 60 90 = + − = = 0,9 100 100 100 100
  51. 2.2 – Công thức nhân xác suất ⚫2.2.1 – Xác suất có điều kiện ⚫1 – Định nghĩa ⚫Cho A và B là những biến cố trong cùng phép thử. Xác suất của biến cố A khi biến cố B xảy ra được gọi là xác suất có điều kiện của A theo B. Ký hiệu là p(A/B) ⚫2 - Ví dụ ⚫Năm người bắt thăm mua 3 món hàng cùng loại. Hỏi người bắt thăm trước hay sau có lợi thế hơn?
  52. Giải ⚫ Gọi Ai (i =1, ,5) là biến cố người thứ i bắt trúng. Ta thấy xác suất bắt trúng của từng người như sau: 3 2 3 p A/ A = pA( 1 ) = p( A21/ A ) = ( 21) 5 4 4 2 1 p A// A A== p A A A p( A3/ A 1 A 2 ) = ( 3 1 2) ( 3 1 2 ) 3 3 3 p A/ A A = ( 3 1 2 ) 3
  53. 2.2.2 – Công thức nhân xác suất thứ nhất ⚫ Cho A và B là hai biến cố bất kỳ trong cùng phép thử ta có: p(AB) = p(A)p(B/A) = p(B)p(A/B) ⚫ Cho A1, A2, , An là những biến cố bất kỳ trong cùng phép thử ta có: ⚫ p(A1 A2 An) = p(A1)p(A2/A1)p(A3/A1A2) ⚫ p(An / A1 A2 An -1)
  54. 2.2.3 – Công thức nhân xác suất thứ hai ⚫1 – Sự độc lập của các biến cố ⚫Biến cố A và B được gọi là độc lập với nhau nếu việc xảy ra hay không xảy ra của biến cố này không ảnh hưởng đến việc xảy ra hay không xảy ra của biến cố kia ⚫Các biến cố A1, A2, , An được gọi là độc lập từng đôi nếu một cặp hai biến cố bất kỳ trong hệ đều độc lập với nhau
  55. ⚫ Các biến cố A1, A2, , An được gọi là độc lập toàn thể nếu việc xảy ra hay không xảy ra của một nhóm k biến cố bất kỳ trong hệ không ảnh hưởng đến việc xảy ra hay không của các biến cố khác trong hệ đó ⚫ 2 – Công thức nhân xác suất thứ hai ⚫ Cho A và B là hai biến cố độc lập. Ta có: ⚫ p(AB) = p(A)p(B) ⚫ Cho A1, A2, , An là hệ độc lập toàn thể ta có: ⚫ p(A1A2 An ) = p(A1)p(A2) p(An )
  56. VÍ DỤ ÁP DỤNG Ví dụ 1 Moät chaøng trai vieát thö cho 3 coâ baïn gaùi, do ñaõng trí neân anh ta boû thư vaøo phong bì moät caùch ngaãu nhieân. Tính xaùc suaát ñeå khoâng coâ naøo nhaän ñöôïc ñuùng thö cuûa mình.
  57. Giải ⚫Goïi Ai laø bieán coá coâ thöù i nhaän ñuùng thö cuûa ⚫mình (i = 1, 2, 3) ⚫ Goïi F laø bieán coá khoâng coâ naøo nhaän ñöôïc ñuùng thö cuûa mình. Ta coù: FAAA= 1 2 3 =p( F) p( A1 A 2 A 3 ) 2 1 1 1 =p A1././ p A 2 A 1 p A 3 A 1 A 2 = = ( ) ( ) ( ) 3 2 1 3
  58. Ví dụ 2 ⚫Một thủ kho có một chùm chìa khóa gồm 9 chiếc bề ngoài giống hệt nhau, trong đó chỉ có 2 chiếc mở được. Anh ta thử ngẫu nhiên từng chìa, chiếc nào thử không trúng thì bỏ ra. ⚫Tính xác suất để người thủ kho mở được ở lần mở thứ 3
  59. Giải ⚫Gọi Ai là biến cố người thủ kho mở được ở lần mở thứ i (i = 1 9); F là biến cố người thủ kho mở được cửa ở lần thứ 3. ⚫Khi đó ta có biểu diễn: FAAA= 1 2 3 =p( F) p( A1 A 2 A 3 ) = p( A1) p( A 2//. A 1) p( A 3 A 1 A 2 ) 7 6 2 1 = = 9 8 7 6
  60. ⚫Ví dụ 3 ⚫Lô hàng chứa 20 sản phẩm trong đó có 2 sản phẩm xấu. Chọn lần lượt không hòan lại mỗi lần một sản phẩm cho đến khi thấy đủ 2 sản phẩm xấu thì dừng. ⚫Tính các suất để việc chọn dừng lại ở bước chọn thứ 4
  61. Giải ⚫ Gọi F là biến cố việc chọn dừng lại ở bước thứ 4 ⚫ Gọi Xi là biến cố sản phẩm xấu chọn ở bước thứ i (i = 1 20) ta có: FXXXXXXXXXXXX=12 3 4 + 1 2 3 4 + 1 2 3 4 PFPXXXXPXXXXPXXXX( ) =( 12 3 4) +( 1 2 3 4) + ( 1 2 3 4 ) ⚫ Tính các xác suất: PXXXX23 ( 14)= PXPXXPXXXPXXXX( 1) ( 2/// 1) ( 3 1 2) ( 4 1 2 3 ) 2 18 17 1 1 = = 20 19 18 17 190
  62. PXXXX( 1324) = PXPXXPXXXPXXXX( 1) ( 2/// 1) ( 3 1 2) ( 4 1 2 3 ) 18 2 17 1 1 = = 20 19 18 17 190 = PXPXXPXXXPXXXX1 2/// 1 1 2 1 2 PXXXX( 1234) ( ) ( ) ( 3) ( 4 3 ) 18 17 2 1 1 = = 20 19 18 17 190 1 1 1 3 PF( ) = + + = = 0,016 ( 1,6%) 190 190 190 190
  63. Ví dụ 4 ⚫ Một xưởng có ba máy làm việc. Trong một ca máy thứ nhất cần sửa chữa với xác suất là 0,15; máy thứ hai là 0,1; máy thứ ba là 0,12. ⚫ Tính xác suất sao cho trong một ca làm việc có ít nhất một máy cần sửa chữa ⚫ Giải ⚫ Gọi Ai là biến cố máy thứ i cần phải sửa chữa ⚫ (i = 1,2,3). Ta thấy A1, A2, A3 độc lập ⚫ Gọi F là biến cố có ít nhất một máy cần sửa chữa ⚫ Khi đó ta có:
  64. FAAA= + + 1 2 3 FAAAAAA =1 + 2 + 3 = 1 2 3 =PFPAPAPA( ) ( 1) ( 2) ( 3 ) = 1 −PAPAPA( 1) 1 −( 2) 1 − ( 3 ) =(1– 0,15) ( 1– 0,1) ( 1– 0,12) =0,85 0,9 0,88 = 0,6732 PFPF( ) =1 −( ) = 1 − 0,6732 = 0,3268 ( 32,68%)
  65. Ví dụ 5 ⚫ Một người có ba viên đạn bắn độc lập vào một mục tiêu. Xác suất bắn trúng mục tiêu của mỗi viên đều bằng nhau và bằng 0,7. ⚫ Tính xác suất để ba viên đạn bắn ra: ⚫ A) Không có viên nào trúng mục tiêu ⚫ B) Có một viên trúng mục tiêu ⚫ C) Có hai viên trúng mục tiêu ⚫ D) Có ba viên trúng mục tiêu
  66. Giải ⚫Gọi Ai là biến cố viên thứ I trúng mục tiêu (i=1,2,3). Ta thấy A1, A2, A3 độc lập ⚫Gọi A, B, C, D lần lượt là biến cố có 0, 1, 2, 3 viên trúng mục tiêu. Ta có: AAAA= 1 2 3 =PAPAPAPA( ) ( 1) ( 2) ( 3 ) =0,3 0,3 0,3 = 0,027
  67. BAAAAAAAAA=12 3 + 1 2 3 + 1 2 3 =PBPAPAPA( ) ( 13) ( 2 ) ( ) ++PAPAPAPAPAPA( 13) ( 2) ( 3) ( 1) ( 2 ) ( ) = 0,3 0,7 0,3 + 0,7 0,3 0,3 + 0,3 0,3 0,7 = 0,189
  68. CAAAAAAAAA=1 23 + 1 2 3 + 1 2 3 =p( C) p( A12) p( A) p( A3 ) ++pApApA( 1) ( 21) ( 3) pApApA( ) ( 2) ( 3 ) = 0,7 0,7 0,3 + 0,7 0,3 0,7 + 0,3 0,7 0,7 = 0,441
  69. Tương tự DAAA= 1 2 3 =p( D) p( A1) p( A 2) p( A 3 ) = 0,7 0,7 0,7 = 0,343
  70. Ví dụ 6 ⚫Một người có 3 viên đạn bắn độc lập vào một mục tiêu; xác suất bắn trúng mục tiêu đều bằng nhau và bằng 0,6. Người đó bắn theo nguyên tắc: Nếu bắn trúng mục tiêu hay bắn hết đạn thì dừng lại. Tính xác suất để người đó bắn ra: ⚫1 viên ⚫2 viên ⚫3 viên
  71. Giải ⚫Gọi Ai là biến cố viên thứ I trúng mục tiêu (i=1,2,3). Ta thấy A1, A2, A3 độc lập ⚫Gọi A, B, C lần lượt là biến cố xạ thủ bắn ra 1, 2, 3. Ta có: AAPAPA=11 ( ) =( ) = 0,6 BAAPBPAPA=1 2 ( ) =( 1) ( 2 ) =0,4 0,6 = 0,24 CAAAAAAAAAAAA=123 + 123 = 123( + 3) = 12 PCPAAPAPA( ) =( 1 2) =( 1) ( 2 ) =0,4 0,4 = 0,16
  72. ⚫ 2.3 – Công thức xác suất Becnuli ⚫ 2.3.1 – Dãy phép thử Becnuli ⚫ Một dãy n phép thử được gọi là dãy phép thử Becnuli nếu thỏa mãn các điều kiện sau: ⚫ Dãy các phép thử được tiến hành độc lập với nhau ⚫ Trong qúa trình thực hiện phép thử chỉ xuất hiện biến cố A hoặc biến cố đối lập với biến cố A ⚫ Xác suất xuất hiện biến cố A (xác suất thành công) trong mỗi lần thử đều bằng một hằng số p không đổi
  73. 2.3.2 – Công thức xác suất Becnuli ⚫ Cho một dãy n phép thử Becnuli với xác suất thành công là p. ⚫ Khi đó xác suất để biến cố A trong phép thử đó xuất hiện đúng k lần được tính theo công thức: kk nk− Pnn( k) = C p(1 − p) ( 0 k n)
  74. Bài toán về công thức xác suất Becnuli ⚫Ví dụ ⚫Một cuộc thăm dò cho thấy tỉ lệ những hộ dân có sử dụng loại sản phẩm X trong thành phố là 65%. Chọn ngẫu nhiên 12 hộ dân trong thành phố. Tính xác suất để 12 hộ dân này: ⚫A) Có 5 hộ sử dụng loại sản phẩm X ⚫B) Có ít nhất hai gia đình sử dụng loại sản phẩm X
  75. Giải ⚫ Mỗi lần kiểm tra một hộ dân ta coi đó là một phép thử, ta có số phép thử là n =12. Xác suất để một hộ có sử dụng loại sản phẩm X trong mỗi lần thử là p = 0,65. Vậy việc chọn kiểm tra hộ dân như trên là dãy phép thử Becnuli với số lần thử là n = 12 và xác suất thành công là 0,65 ⚫ A)Gọi A là biến cố có đúng 5 hộ dân sử dụng sản phẩm X. Theo công thức xác suất Becnuli ta có 5 5 12− 5 p( A) = p12(5) = C 12 ( 0,65) ( 1 − 0,65) = 0,059( 5,9%)
  76. ⚫ B) Gọi B là biến cố có ít nhất hai hộ sử dụng sản phẩm X. Khi đó biến cố đối lập của B là biến cố có không quá 1 hộ sử dụng và ta có: p( B) =+ p12(01) p 12 ( ) 010 12−− 0 1 12 1 =CC12(0,65) ( 1 − 0,65) + 12 ( 0,65) ( 1 − 0,65) = 0,001 p( B) =1 − p( B) = 1 − 0,001 = 0,999( 99,9%)
  77. Ví dụ 2 ⚫Một xạ thủ bắn độc lập 100 phát đạn vào một mục tiêu; xác suất bắn trúng mục tiêu của mỗi viên đều bằng nhau và bằng 0,8. ⚫Tính xác suất để 100 viên đạn mà người đó bắn ra có 80 viên trúng mục tiêu. ⚫Giải ⚫Mỗi lần bắn ra một viên đạn ta coi như là một phép thử, ta có số phép thử là n = 100
  78. ⚫Xác suất để một viên trúng mục tiêu trong mỗi lần thử là p = 0,8. Vậy việc bắn súng như trên là dãy phép thử Becnuli với số lần thử là n = 100 và xác suất thành công là p = 0,8. ⚫Gọi A là biến cố “có 80 viên trúng mục tiêu”. ⚫Theo công thức Becnuli ta có: p( A) = p100 (80) 80 80 100− 80 =C100 ( 0,8) ( 1 − 0,8) = 0,099( 9,9%)
  79. 2.4 – Công thức xác suất đầy đủ - Công thức Bayes ⚫ 1- Công thức xác suất đầy đủ ⚫ Cho A1, A2, , An là một hệ đầy đủ các biến cố; F là một biến cố bất kỳ trong cùng phép thử. Khi đó ta có công thức: PFPAPFAPAPFA( ) =( 1) ( / 1) +( 2) ( / 2 ) + + PAPFA( nn) ( / ) n =  PAPFA( ii) ( / ) i=1
  80. ⚫ 2 – Công thức Bayes ⚫ Cho A1, A2, , An là một hệ đầy đủ các biến cố; F là một biến cố bất kỳ trong cùng phép thử. Khi đó ta có công thức: PAPFA()(/) P( A / F )=kk ( 1 k n) k PF()
  81. Chứng minh ⚫1) Vì A1, A2, , An là một hệ đầy đủ nên: AAA12+++=  n FFAAA =+++ ( 12 n ) =+++FFAFAFA12 n =+++P( FP) FAP( FAP12) FA( ) ( n ) //=+P( AP1122) FAP( AP) FA( ) ( ) /++P( APnn) FA( )
  82. ⚫2) Ta có: p( FAkk) = p( F) p( A/ F ) p( FA) p( A) p( F/ A ) p( A/ F ) =k = k k k p( F) p( F )
  83. Các bài toán về công thức xác suất đầy đủ ⚫ Ví dụ 1 ⚫ Sản phẩm X trên thị trường là do ba cơ sở sản xuất cung cấp. Cơ sở I chiếm 30% lượng hàng với tỉ lệ phế phẩm là 1%; Cơ sở II chiếm 50% lượng hàng với tỉ lệ phế phẩm là 3%; Cơ sở III chiếm 20% lượng hàng với tỉ lệ phế phẩm là 5% ⚫ A) Một người mua một sản phẩm X trên thị trường. Tính xác suất để người đó mua phải sản phẩm phế phẩm ⚫ B) Một người mua một sản phẩm X trên thị trường và mua phải sản phẩm phế phẩm. Theo anh chị thì sản phẩm phế phẩm này có khả năng là của cơ sở nào nhiều nhất?
  84. Giải ⚫ A) Gọi F là biến cố khách hàng mua phải sản phẩm phế phẩm ⚫ Gọi Ai là biến cố sản phẩm X là của cơ sở i sản xuất (i=1,2,3). Ta thấy A1, A2, A3 lập thành một hệ đầy đủ các biến cố ⚫ Suy ra: PFPAPFAPAPFAPAPFA( ) =( 1) ( /// 1) +( 2) ( 2) + ( 3) ( 3 ) = 0,3 0,01 + 0,5 0,03 + 0,20 0,05 =0,003 + 0,015 + 0,010 = 0,028( 2,8%) ⚫ Vậy xác suất để khách hàng mua phải sản phẩm phế phẩm là 2,8%
  85. B) Theo công thức Bayes ta có: PAPFA()(/) 0,3 0,01 3 PAF(/) =11 = = 1 PF( ) 0,028 28 PAPFA()(/) 0,5 0,03 15 PAF(/) =22 = = 2 PF( ) 0,028 28 PAPFA()(/) 0,2 0,05 10 PAF(/) =33 = = 3 PF( ) 0,028 28 ⚫Ta thấy xác suất 15/28 lớn nhất. Do đó sản phẩm phế phẩm có khả năng là của cơ sở II là nhiều nhất
  86. Ví dụ 2 ⚫ Có hai bình đựng bi: Bình thứ nhất chứa 12 bi trong đó có 8 bi mầu trắng và 4 bi mầu đỏ; Bình thứ hai chứa 12 bi trong đó có 9 bi mầu trắng và 3 bi mầu đỏ. Người ta lấy ngẫu nhiên một bi từ bình I bỏ vào bình II, sau đó lấy ngẫu nhiên bốn bi từ bình II ra ngoài. ⚫ Tính xác suất để 4 bi lấy ra từ bình II có đúng 2 bi mầu trắng
  87. Giải ⚫ Gọi A1 là biến cố bi lấy ra từ bình I có mầu trắng; ⚫ Gọi A2 là biến cố bi lấy ra từ bình I có mầu đỏ. ⚫ Ta thấy {A1, A2} lập thành một hệ đầy đủ ⚫ Gọi F là biến cố có đúng 2 bi mầu trắng. Theo công thức xác suất đầy đủ ta có: PFPAPFAPAPFA( ) =+( 1) ( // 1) ( 2) ( 2 ) 2 2 2 2 8CCCC10 3 4 9 4 8 45 3 4 36 6 1944 =44 + = + = 12CC13 12 13 12 715 12 715 8580 = 0,2265( 22,65%)
  88. Ví dụ 3 ⚫Trong một thúng cam có 42% cam Trung Quốc, 24% cam Thái Lan, 26% cam Campuchia và 8% cam Việt Nam.Trong số đó có một số cam bị hư gồm 20% cam TQ, 10% cam TL, 12% cam CPC và 2% cam VN. ⚫1) Tính xác suất để một người mua phải một trái cam TQ bị hư ⚫2) Tính xác suất để một người mua phải một trái cam bị hư
  89. ⚫3) Biết một người mua phải một trái cam hư. Tính xác suất để trái cam ấy là cam của CPC ⚫4) Biết một người mua phải một trái cam hư. Tính xác suất để trái cam ấy không phải là cam của VN ⚫Giải ⚫Gọi A1, A2, A3, A4 lần lượt là biến cố cam của TQ, TL, CPC, VN .Ta thấy A1, A2, A3, A4 lập thành một hệ đầy đủ các biến cố
  90. ⚫1) Gọi A là biến cố trái cam hư là của TQ. F là biến cố trái cam bị hư. Ta có: ⚫A = A1F p(A) = p(A1F) = p(A1)p(F/A1) ⚫ = 0,42x0,2 = 0,084 (8,4%) ⚫2) p(F) = p(A1)p(F/A1) + p(A2)p(F/A2) ⚫ + p(A3)p(F/A3) + p(A4)p(F/A4) ⚫= 0,42x0,2 + 0,24x0,1 + 0,26x0,12 ⚫ + 0,08x0,02 ⚫= 0,1408 (14,08%)
  91. p( A) p( F/ A ) 0,26 0,12 3) p( A / F ) =33 = = 0,222( 22,2%) 3 pF( ) 0,1408 p( A4 F ) 4) p( A4 / F ) = pF( ) AFAAAFAFAFAF4=( 1 + 2 + 3) = 1 + 2 + 3 pAF( 4) = pAF( 1 + AF 2 + AF 3) = pAF( 1) + pAF( 2) + pAF( 3 ) =pApFA( 1) ( /// 1) + pApFA( 2) ( 2) + pApFA( 3) ( 3 ) =0,42 0,2 + 0,24 0,1 + 0,26 0,12 = 0,1392 0,1392 p A/ F = = 0,9886( 98,86%) ( 4 ) 0,1408
  92. Cách khác p( A44/ F) =− 1 p( A / F ) p( A) p( F/ A ) 0,08 0,02 p( A/ F ) = 44==0,0114 4 pF( ) 0,1408 p( A4 / F ) = 1 − 0,0114 = 0,9886( 98,86%)
  93. Chương 2 ĐẠI LƯỢNG NGẪU NHIÊN
  94. §1 – ĐẠI LƯỢNG NGẪU NHIÊN ⚫ 1.1 – Khái niệm ĐLNN ⚫ 1 – Định nghĩa ⚫ ĐLNN là một đại lượng biến thiên, phụ thuộc vào nhiều yếu tố ngẫu nhiên mà trong kết quả của phép thử nó chỉ mang một giá trị có thể được ⚫ Như vậy ĐLNN là một quy tắc cho tương ứng mỗi biến cố sơ cấp trong không gian các biến cố sơ cấp của một phép thử với một số thực duy nhất ⚫ Ký hiệu ĐLNN: X, Y, Z, ⚫ Giá trị của ĐLNN: x, y, z,
  95. 2 – Phân loại ⚫Khi tập các giá trị của ĐLNN X là hữu hạn hoặc vô hạn đếm được thì X được gọi là ĐLNN rời rạc và ký hiệu: (X = a), (X = b), ⚫Khi ĐLNN X lấy một giá trị tùy ý trong đoạn [a,b] thì ta nói X là ĐLNN liên tục và ký hiệu: (a#X#b); (a <X<b); (X#b),
  96. 3 – Ghi chú ⚫Khi có ĐLNN (X = a) thì ta có thể coi đó là một biến cố xác suất ghi nhận hiện tượng: “Đại lượng ngẫu nhiên X nhận giá trị a” ⚫Nếu X và Y là hai ĐLNN ứng với hai phép thử khác nhau thì ta nói X và Y là hai ĐLNN độc lập và ta có: ⚫ pXaYb( =)( =) = pXapYb( =) ( = )
  97. §2 – QUY LUẬT PHÂN PHỐI XÁC SUẤT ⚫ 2.1 – Quy luật PPXS của ĐLNN rời rạc ⚫ 2.1.1 – Bảng PPXS ⚫ Cho X là một ĐLNN rời rạc với các giá trị có thể được là x1, x2, , xn. Đặt pi = p(X=xi) (i=1 n) ⚫ Ta lập một bảng liệt kê tất cả các giá trị của X cùng với các xác suất của nó và gọi bảng này là bảng PPXS của ĐLNN X: X x1 x2 xn pX p1 p2 pn
  98. Ghi chú ⚫ Vì x1, x2, , xn là các giá trị có thể của X nên chúng là những số thực khác nhau đôi một do đó (X = x1); (X = x2); ; (X = xn) lập thành một hệ đầy đủ các biến cố. Suy ra: ⚫ (X = x1) + (X = x2) + + (X = xn) = Ω ⚫ 0p(X = x1)+p(X = x2) + + p(X = xn) =p(Ω) ⚫ 0p1 + p2 + + pn = 1 ⚫ Điều này thể hiện một quy luật cho tất cả ĐLNN. ⚫ Người ta gọi đó là Quy luật phân phối xác suất
  99. 2.1.2 – Hàm PPXS ⚫ 1 – Định nghĩa ⚫ Hàm số F(x) xác định trên R cho bởi công thức: ⚫ F(x) = p(X<x) được gọi là hàm PPXS của đại lượng ngẫu nhiên X ⚫ 2 – Định lý ⚫ Cho X là một ĐLNN rời rạc có các giá trị: ⚫ x1< x2< < xn với bảng PPXS là: X x1 x2 xn pX p1 p2 pn
  100. ⚫ Khi đó hàm PPXS của X có dạng: 0 khi x x1 p khi x x x 1 1 2 p1+ p 2 khi x 2 x x 3 Fx( ) = p+ p + + p khi x x x 1 2 n - 1 n - 1 n 1 khi x > x n
  101. Bài tập lập bảng phân phối xác suất ⚫ Bài 1 ⚫ Một bình chứa 10 viên bi trong đó có 6 bi trắng và 4 bi đỏ. Người ta lấy ngẫu nhiên từ trong bình ra 3 bi. Gọi X là số bi trắng có trong ba bi được chọn. ⚫ Hãy tìm quy luật PPXS của X ⚫ Tìm hàm PPXS của X ⚫ Giải ⚫ Gọi X là số bi trắng có trong ba bi được chọn thì X là ĐLNN có các giá trị là 0, 1, 2, 3
  102. Ta tính các xác suất 03 CC64 4 p0 = p( X =0) =3 = C10 120 12 CC64 36 p1 = p( X =1) =3 = C10 120 21 CC64 60 p2 = p( X =2) =3 = C10 120 30 CC64 20 p3 = p( X =3) =3 = C10 120
  103. Kiểm tra ta được: • p0 + p1 + p2 + p3 = 1 • Suy ra bảng PPXS của X là: X 0 1 2 3 pX 4/120 36/120 60/120 20/120
  104. Hàm PPXS của X là 0 khi x 0 0 khi0 x 4 4 khi 0 x 1 khi 01 x 120 120 40 36+4 = Fxx( ) khi 12 F( x) = khi 1 x 2 120 120 100 36+4+60 khi 23 x khi 2 x 3 120 120 1 khi x > 3 1 khi x > 3
  105. Baøi 2 ▪ Moät xaï thuû baén ñoäc laäp 3 vieân ñaïn vaøo moät bia, xaùc suaát truùng cuûa moãi vieân ñaïn baèng nhau vaø baèng 0,7. Goïi X laø soá vieân ñaïn truùng bia (trong 3 vieân ñaïn baén). ▪ Haõy laäp baûng PPXS cuûa X. ▪ Giaûi ▪ Goïi X laø ñaïi löôïng ghi nhaän soá vieân ñaïn baén truùng muïc tieâu. Khi ñoù X laø ÑLNN nhaän caùc giaù trò 0, 1, 2, 3
  106. Ta tính caùc xaùc suaát ▪ Goïi Ai laø vieân ñaïn thöù i baén truùng bia (i = 1,2,3). ▪ Khi ñoù {A1, A2, A3} ñoäc laäp vaø ta coù: (XAAA== 0) 1 2 3 PXPAPAPA( = 0) = (1 ) ( 2 ) ( 3 ) = (1 − 0,7)(1 − 0,7)(1 − 0,7) = 0,027 (XAAAAAAAAA= 1) =12 3 + 1 2 3 + 1 2 3 PXPAPAPA( =1) = (13 ) (2 ) ( ) + ++PAPAPAPAPAPA (13 ) (2 ) ( 3 ) ( 1 ) ( 2 ) ( ) =3 0,3 0,7 0,3 = 0,189
  107. ( XAAAAAAAAA=2) =1 23 + 1 2 3 + 1 2 3 PXPAPAPA( =2) = (12 ) ( ) (3 ) + ++PAPAPAPAPAPA (1 ) (21 ) ( 3 ) ( ) ( 2 ) ( 3 ) = 3 0,7 0,7 0,3 = 0,441 ( XAAAPXPAPAPA=3) =1 2 3 ( = 3) = ( 1 ) ( 2 ) ( 3 ) = 0,7 0,7 0,7 = 0,343 Kieåm tra p0 + p1 + p2 + p3 = 1 Suy ra baûng PPXS cuûa X laø X 0 1 2 3 pX 0,027 0,189 0,441 0,343
  108. 2.2 – Quy luật PPXS của ĐLNN liên tục ▪ 2.2.1 – Hàm mật độ xác suất ▪ 1 – Định nghĩa ▪ Cho X là một ĐLNN liên tục. Hàm f(x) xác định trên R được gọi là hàm mật độ xác suất của X nếu thỏa mãn các điều kiện như sau: (1) f( x) 0(  x R) + (2) f ( x ) dx = 1 − b (3) p( a X b) = f ( x ) dx a
  109. 2 – Ghi chú: • Cho X là một ĐLNN liên tục có hàm mật độ xác suất là f(x). Khi đó xác suất p(a<X<b) chính là diện tích hình thang cong được giới hạn bởi các đường: • x = a, x = b, y = f(x) và y = 0 • 2.2.2 – Hàm PPXS của ĐLNN liên tục • 1 – Định nghĩa • Hàm số F(x) xác định trên R cho bởi công thức: F(x) = p(X<x) được gọi là hàm PPXS của ĐLNN X
  110. 2 – Ghi chú • Khi X là một ĐLNN liên tục có hàm mật độ xác suất là f(x) thì hàm PPXS của X có dạng là: x F( x) = f() t dt −
  111. 3 – Các tính chất cơ bản của hàm PPXS ⚫(1) x R: 0 ≤ F(x) ≤ 1 ⚫(2) F(x) là hàm không giảm. Nghĩa là nếu x1 < x2 thì F(x1) ≤ F(x2) ⚫(3) Khi x → + thì F(x) → 1 ⚫ Khi x → - thì F(x) → 0 ⚫ (4) [F(x)]’ = f(x)
  112. Bài tập về ĐLNN liên tục • Ví dụ 1 • Cho X là một ĐLNN liên tục có hàm mật độ xác suất là acos xkhi− x 22 fx( ) = 0khi x 2 A) Tính hệ số a B) Tìm hàm mật độ F(x) C) Tính pX − 44
  113. Giải A) Theo tính chất của hàm mật độ xác suất ta có − + 22 + f( x) dx=11 f( x) dx + f( x) dx + f( x) dx = − − − 22 0 0 2 2 1 acos xdx = 1 a sin x = 1 2 a = 1 a = − 2 2 − 2
  114. b) Theo tính chất của hàm PPXS ta có x F( x) = f() t dt − − x 2 Khi x − : F( x) = f( t) dt = 0 dx = 0 2 − − − 2 x Khi − x : F( x) = f( t) dt + f( t) dt 22 − − 2 − 2 x 1 1x 1 =0dt + cos tdt = sin t =( sin x + 1) − 2 2− 2 − 2 2
  115. − 22x Khi x : F( x) = f( t) dt + f( t) dt + f( t) dt 2 − − 22 − x 221 12 1 =0dt + cos tdt + 0 dt = sin t =( 1 −( − 1)) = 1 − 2 2− 2 − 2 0 22 0 Suy ra hàm PPXS của X là: 0 khi x − 2 1 F( x) = (sin x + 1) khi − x 2 2 2 1 khi x 2
  116. ⚫C) Theo tính chất của hàm phân phối xác suất ta có: PXFF − = − − 4 4 4 4 11 = sin + 1 − sin − + 1 2 4 2 4 1 2 1 2 2 = − − = = 0,7 ( 70%) 2 2 2 2 2
  117. Ví dụ 2 Cho X là ĐLNN liên tục có hàm PPXS: 0 khi x 1 2 F( x) = a( x −1) khi 1 x 4 1 khi x 4 • A) Tìm hệ số a • B) Tính p(2# X # 3) • Giải
  118. A) Vì F(x) là hàm liên tục nên nó liên tục tại x = 4. Khi đó: 2 1 limF( x) = lim F( x) = F( 4) a( 4 − 1) = 1 a = xx→→44−+ 9 B) Theo tính chất của hàm PPXS ta có: 122 1 1 p(2 X 3) = F( 3) − F ( 2) =( 31 −) −( 21 −) = = 0,3333%( ) 9 9 3
  119. §3 – CÁC ĐẶC TRƯNG CỦA MỘT ĐLNN ⚫ 3.1 – Kỳ vọng toán học ⚫ 1 – Định nghĩa ⚫ (1) Cho X là ĐLNN rời rạc có bảng PPXS là: X x1 x2 xn pX p1 p2 pn Kỳ vọng toán học của ĐLNN X là một số thực được cho bởi công thức: E(X) = p1x1 + p2x2 + + pn xn
  120. ⚫(2) Cho X là một ĐLNN liên tục có hàm mật độ xác suất là f(x). Kỳ vọng toán học của ĐLNN X là một số thực được cho bởi công thức: + E( X) = xf() x dx −
  121. Ví dụ ⚫Theo dõi thu nhập của nhân viên trong một công ty có 100 người người ta thu được một bảng số liệu như sau: Mức thu nhập 3 4 5 6 7 (triệu đồng/tháng) Số người 15 35 10 30 10 ⚫Nếu gọi X là mức thu nhập trung bình của một ⚫người trong công ty thì X là một ĐLNN có các giá trị 2,4,5,6,7 và bảng PPXS của X là:
  122. xi 3 4 5 6 7 pi 0,15 0,35 0,10 0,30 0,10 EX =0,15 + 3 0,35 + + + 4 0,1 5 0,3 6 0,1 7 15 3 + 35 4 + 10 5 + 30 6 + 10 7 == 4,85 100 ⚫Như vậy: ⚫Kỳ vọng của một ĐLNN chính là giá trị trung bình theo xác suất của các giá trị của ĐLNN đó
  123. 2 – Tính chất cơ bản của kỳ vọng ⚫(1) E(C) = C (C là hằng số) ⚫(2) E(CX) = CE(X) (C là hằng số) ⚫(3) E(X+Y) = E(X) + E(Y) ⚫(4) Nếu X và Y độc lập thì ⚫ E(XY) = E(X)E(Y)
  124. 3.2 – Phương sai và độ lệch tiêu chuẩn • 1 – Định nghĩa • (1) Phương sai của ĐLNN X là một số thực được định nghĩa bằng công thức: • D(X) = E[X - E(X)]2 • (2) Độ lệch tiêu chuẩn của ĐLNN X là một số thực được định nghĩa theo công thức: = D(X)
  125. 2 – Ghi chú ⚫(1) Nếu X là ĐLNN rời rạc với bảng PPXS là: X x1 x2 xn pX p1 p2 pn ⚫Thì phương sai của X được tính theo công thức: n 2 D( X) =− xii E( X) p i=1
  126. • (2) Nếu X là một ĐLNN liên tục có hàm mật độ xác suất là f(x) thì phương sai của X được tính theo công thức: + 2 D( X) =− ( x E( X)) f( x) dx −
  127. 3 – Tính chất cơ bản của phương sai ⚫(1) Biểu thức khác của phương sai: ⚫ D(X) = E(X2 ) – [E(X)]2 ⚫(2) D(C) = 0 ( là hằng số ) ⚫(3) D(CX) = C2 D(X) ( là hằng số ) ⚫(4) Nếu X và Y độc lập thì ⚫ D(X+Y) = D(X) + D(Y)
  128. Ví dụ ⚫Cho X là một ĐLNN có bảng PPXS như sau: xi 3 4 5 6 7 pi 0,15 0,35 0,10 0,30 0,10 ⚫Ta có: 2 2 DXEXEX( ) =−( ) ( ) EX( 2) =0,15 3 2 + 0,35 4 2 + 0,1 5 2 + 0,3 6 2 + 0,1 7 2 = 26,75
  129. Suy ra: ⚫Phương sai của X là: DX( ) =26,75 −( 4,85)2 = 3,2275 ⚫Độ lệch tiêu chuẩn của X là:  =DX( ) =3,2275 = 1,7965
  130. 3.3 – Mốt (1) Cho X là ĐLNN rời rạc có bảng PPXS là: X x1 x2 xn pX p1 p2 pn Nếu xác suất p(X = x0 ) lớn nhất thì ta nói x0 là mốt của X và ký hiệu là mod(X) = x0 (2) Cho X là ĐLNN liên tục với hàm mật độ xác suất là f(x). Nếu f(x) đạt cực đại tại x0 thì ta nói x0 là mốt của X và cũng ký hiệu là mod(X) = x0
  131. §4 – MỘT SỐ QUY LUẬT PHÂN PHỐI THÔNG DỤNG • 4.1 – Quy luật phân phối siêu bội • 1 – Định nghĩa • Cho X là một ĐLNN rời rạc với các giá trị nguyên 0, 1, , n. Ta nói X là ĐLNN có quy luật phân phối siêu bội với các tham số N, NA, n nếu công thức xác suất của nó được thực hiện theo công thức xác suất lựa chọn: k n− k CCNNNAA− P( X= k ) =n ( 0 k n) C N •Ký hiệu X H(N, NA, n)
  132. 2 – Các đặc trưng của phân phối siêu bội • Cho X là ĐLNN có quy luật phân phối siêu bội • X H(N, NA, n). Khi đó X có các đặc trưng như sau: • (1) Kỳ vọng: • E(X) = np với p = NA/N • (2) Phương sai: Nn− N A D( X) = npq p = ; q = 1 − p NN−1
  133. 4.2 – Quy luật phân phối nhị thức • 1 – Định nghĩa • Cho X là một ĐLNN rời rạc với các giá trị nguyên 0, 1, , n. Ta nói X là ĐLNN có quy luật phân phối nhị thức với các tham số là n và p nếu công thức xác suất của nó được thực hiện theo công thức xác suất Becnuli: • kk nk− p( X= k) = Cn p(10 − p) ( k n) • Ký hiệu X B(n,p) • 2 - Ghi chú • Quy luật phân phối nhị thức gắn liền với một dãy phép thử Becnuli với số lần thử là n và xác suất thành công là p
  134. 3 – Các đặc trưng của phân phối nhị thức • Cho X là một ĐLNN có quy luật phân phối nhị thức X B(n,p). Khi đó ta có: • (1) modX = k trong đó k là một số nguyên sao cho • np – q # k # np – q + 1 với q = 1 – p • (2) Kỳ vọng E(X) = np • (3) Phương sai D(X) = npq với q = 1 – p
  135. 4 – Ví dụ ⚫Xác suất để một máy sản xuất ra phế phẩm là 0,02. ⚫A) Tính xác suất để trong 10 sản phẩm do máy sản xuất có không quá một phế phẩm ⚫B) Một ngày máy sản suất được 250 sản phẩm. Tìm số sản phẩm trung bình và số phế phẩm tin chắc nhất của máy đó trong một ngày
  136. Giải ⚫A) Mỗi lần máy sản suất ra một phế phẩm ta coi là một phép thử, do đó số phép thử là n =10. Xác suất để máy sản xuất ra phế phẩm trong mỗi lần thử là p = 0,02, do đó nếu gọi X là số phế phẩm trong 10 sản phẩm sản xuất ra thì X có phân phối nhị thức X B(10; 0,02) ⚫Gọi A là biến cố có không quá 1 phế phẩm. ⚫Ta có: A = (0 X 1) = (X = 0) + (X = 1)
  137. Suy ra: ⚫p(A) = p(X=0) + p(X=1) 0 0 10-0 ⚫ = C 10(0,02) (1 - 0,02) 1 1 10-1 ⚫ + C 10(0,02) (1 - 0,02) = 0,983 ⚫B) Gọi X là số sản phẩm tin chắc trong ngày ta có X B(250; 0,02). Khi đó: ⚫E(X) = np = 250 x 0,02 = 5 ⚫Số sản phẩm tin chắc trong ngày chính là modX:
  138. ⚫modX = k sao cho np – q k np – q + 1 ⚫np – q = 250 x 0,02 – 0,98 = 4,02 ⚫np – q + 1 = 5,02 ⚫ 4,02 k 5,02 k = 5 ⚫Vậy số phế phẩm tin chắc nhất trong ngày là 5
  139. 4.3 – Quy luật phân phối Poisson ⚫1 – Định lý k k n-k ⚫Cho biểu thức f(k) = C n p (1 - p) ta có: ⚫Nếu np = a với a cố định và với mọi k cố định ta có: −ak kk nk− ea limf( k) = lim Cn p( 1 − p) = nn→ → k!
  140. • 2 – Định nghĩa • Cho X là một ĐLNN rời rạc có vô số giá trị nguyên 0, 1, 2, Ta nói rằng X là ĐLNN có quy luật phân phối Poisson với tham số a > 0 nếu các công thức tính xác suất của nó có dạng: ea−ak P( X= k ) = ( k = 0,1, ) k! Ký hiệu X P(a)
  141. 3 – Các đặc trưng của phân phối Poisson ⚫Cho X là ĐLNN có quy luât phân phối Poisson X P(a). Ta có: ⚫(1) Kỳ vọng E(X) = a ⚫(2) Phương sai D(X) = a
  142. 4 - Ứng dụng ⚫Do định lý trên , phân phối Poisson được áp dụng trong các trường hợp sau: ⚫(1) Khi p khá nhỏ và n khá lớn thì xấp xỉ với phân phối nhị thức B(n,p) ⚫(2) Tính xác suất p (X = k) với X là ĐLNN biểu thị số lần xuất hiện biến cố A nào đó trong một khoảng thời gian nhất định
  143. Ví dụ: ⚫Một cửa hàng trung bình trong một giờ bán được 4 sản phẩm. Tính xác suất để trong một giờ của hàng bán được nhiều hơn 5 sản phẩm. ⚫Giải ⚫Gọi X là số sản phẩm mà cửa hàng bán được trong một giờ, ta có: X P(4) ⚫Gọi A là biến cố trong một giờ của hàng bán được nhiều hơn 5 sản phẩm. Ta có:
  144. AXAXX=( 5) =( 5) =( 5) =( XXX = 1) +( = 2) + +( = 5) p( A) = p( X =1) + p( X = 2) + + p( X = 5) e−44 0 e − 4 4 1 e − 4 4 5 = + + + = 0,7851 0! 1! 5! pA( ) =1 − 0,7851 = 0,2149( 21,49%)
  145. 4.4 – Quy luật phân phối chuẩn • 1 – Định nghĩa • Cho X là một ĐLNN liên tục có hàm mật độ xác suất là f(x). Ta nói rằng X là ĐLNN có quy luật phân phối chuẩn với các tham số là μ và σ2 nếu hàm mật độ xác suất của nó có dạng: ()x− 2 − 1 2 f() x= e 2  2 • Ký hiệu: X N(μ; σ2)
  146. ⚫Khi μ = 0 và σ2 = 1 ta có phân phối chuẩn tắc ⚫X N(0; 1) với hàm mật độ xác suất: x2 1 − ()xe= 2 2
  147. 2 – Các đặc trưng của phân phối chuẩn ⚫ Cho X là ĐLNN có phân phối chuẩn X N(μ; σ2) ⚫ Ta có: ⚫ (1) Kỳ vọng E(X) = μ ⚫ (2) Phương sai D(X) = σ2 ⚫ (3) mod(X) = μ
  148. 3 – Công thức tính xác suất của ĐLNN có quy luật phân phối chuẩn ⚫Định lý ⚫Cho X là ĐLNN có phân phối chuẩn ⚫ X N(μ; σ2) ⚫Ta có công thức: ba−− p( a X b) = −  x t2 1 − Trong ñoù: ()x= e2 dt 0 2
  149. Chứng minh ()x− 2 − 1 2 X N(, 2 ) f( x) = e 2  2 b ()x− 2 − 1 2 p( a X b) = e2 dx a  2 x −  t= x = t +  dx =  dt  ab−− Khi:;: x= a t = Khi x = b t = 
  150. p( a X b) = bb−− tt22 11−− == e22 dt e dt aa−−22  b− 0 tt22 11−− =+ e22 dt e dt a− 22 0 
  151. ba−− tt22 11−− =− e22 dt e dt 0022 x t2 ba−− 1 − = −  vôùi ()x = e2 dt  0 2 ba−− p(a X b) = −  b −  1 Khi a = - thì : ( Xb ) = +  2
  152. Ghi chú ⚫Hàm (x) trên đây được gọi là hàm tích phân Laplace. ⚫Hàm này là một hàm lẻ và được tính sẵn trong bảng F từ x = 0 đến x = 4,09. x tt22 ⚫Ta có: 1−− 1 1 lim e22 dt== e dt x→+ 0022 2 ⚫Mà (4,09) = 0,4999. Vì thế khi x > 5 thì ta xấp xỉ (x) ≈ 0,5
  153. ⚫Ví dụ: (1,96) = 0,475; (2,34) = 0,490 ⚫ (5,96) = 0,5 ⚫5 – Phân vị chuẩn ⚫Cho X là ĐLNN có quy luật phân phối chuẩn 2 ⚫X N(μ; σ ). Số thực xp là phân vị bậc p của X nếu thỏa mãn 2 điều kiện: x= − x ( 0 p 1) 1− pp 1 p( X xpp) = ( x ) + 2 ⚫Các giá trị xp được trình bày trong bảng G
  154. Ví dụ ⚫ Cho X có phân phối chuẩn N(2100; 2002) ⚫ Tính p(1700 < X < 2200) ⚫ Giải: ba−− pX(1700 2200) = −  2200−− 2100 1700 2100 =− 200 200 =(0,5) − ( − 2) = ( 0,5) +  ( 2) =0,1915 + 0,4772 = 0,6687( 66,87%)
  155. 4.5 – Quy luật phân phối chi bình phương ⚫1 – Định lý ⚫ Cho X1 , X2 , , Xn là những ĐLNN độc lập có phân phối chuẩn với cùng trung bình μ và cùng phương sai σ2. ⚫Đặt: 22 2 1 XX12−− X n −  X = + + + n    ⚫Khi đó X là một ĐLNN có hàm PPXS là:
  156. nx −− 1 1 22 n x e khi x 0 n fx( ) = 22  2 0 khi x 0 + Trong ñoù: =(t) xtx −− 1 e dx (Haøm Gamma) 0
  157. 2 – Định nghĩa ⚫Cho X là một ĐLNN liên tục. Ta nói rằng X là ĐLNN có phân phối chi bình phương với n bậc tự do ( n nguyên dương) và ký hiệu là X 2 χ n nếu hàm mật độ xác suất của nó là: nx −−1 1 22 n x e khi x 0 n fx( ) = 22  2 0 khi x 0
  158. 3 – Phân vị chi bình phương ⚫Cho X là ĐLNN liên tục có phân phối chi bình 2 phương X χ n . ⚫Số thực xp là phân vị bậc p của X nếu thỏa mãn 2 điều kiện: x 0 p p X = x p ( p ) ⚫Các giá trị của xp được trình bày ở bảng I
  159. 4.5 – Quy luật phân phối student ⚫1 – Định lý ⚫Cho X và Y là các ĐLNN liên tục, độc lập với nhau, trong đó X có phân phối chuẩn tắc X N(0,1); Y có phân phối chi bình phương Y 2 χ n . Đặt: Xn T = Y ⚫Khi đó T là một ĐLNN liên tục có hàm mật độ xác suất là
  160. n +1 n+1  2 − 2 x n f( x) = 1 + ( x R) n n n  2
  161. 2 – Định nghĩa ⚫Cho T là một ĐLNN liên tục. Ta nói rằng T có phân phối student nếu T có hàm mật độ xác suất là: n +1 n+1  2 − 2 x n f( x) = 1 + ( x R) n n n  2 ⚫và ký hiệu T Tn
  162. 3 – Phân vị Student ⚫Cho T là một ĐLNN có phân phối Student T Tn . Ta gọi số thực tp là phân vị bậc p của T nếu thỏa mãn hai điều kiện: t1− pp = − t ( 0 p 1) p T = t p ( p ) ⚫Các giá trị tp trình bày trong bảng H
  163. 4.5 – MỘT SỐ ĐỊNH LÝ QUAN TRỌNG Định lý 1 ⚫Cho X là một ĐLNN có quy luật phân phối nhị thức B(n;p). Nếu n P 30 , p quá bé gần 0 hoặc không quá lớn gần 1 thì ta có thể coi X có phân phối Poisson với tham số a = np và ta có công thức xấp xỉ: −ak nk− ea p( X= k) = Ckk p(1 − p) ( a = np) n k!
  164. Định lý 2 (định lý giới hạn địa phương) • Cho X là một ĐLNN có quy luật phân phối nhị thức B(n;p). Nếu n P 30 , p không quá gần 0 và không quá gần 1,thì X được xấp xỉ phân phối chuẩn với trung bình μ = np và phương sai σ2 = npq . Và ta có công thức: kk nk− 1 k −  p( X= k) = Cn p(1 − p)  x2 1 − Vôùi ().xe= 2 2
  165. Ghi chú x2 ⚫Hàm 1 − ()xe= 2 2 ⚫Được gọi là hàm Gauss. Hàm này được tính sẵn trong bảng E từ x = 0 đến x = 4,09 ⚫Khi x > 4,09 thì ta xấp xỉ (x ) 0 ⚫Ví dụ: (0,15) 0,3945; (2,5) 0,0175; (5,5) 0
  166. Định lý 3 (định lý giới hạn tích phân) • Cho X là một ĐLNN có quy luật phân phối nhị thức B(n;p). Nếu n P 30 , p không quá gần 0 và không quá gần 1, thì X được xấp xỉ phân phối chuẩn với trung bình μ = np và phương sai • δ2 = npq . Nghĩa là ta có công thức xấp xỉ: ba−− p( a X b)  −  ==np; npq ( ) x t2 1 − Vôùi ().x= e2 dt 0 2
  167. Ví duï ▪ Nhaø maùy X saûn xuaát moät loaïi saûn phaåm coù soá saûn phaåm loaïi A chieám tæ leä 66,87% ▪ Choïn ngaãu nhieân 100 saûn phaåm (trong raát nhieàu saûn phaåm). Tính xaùc suaát ñeå: ▪ a) Trong 100 saûn phaåm coù ñuùng 70 saûn phaåm loaïi A. ▪ b) Trong 100 saûn phaåm coù khoâng quaù 60 saûn phaåm loaïi A.
  168. Giaûi ▪ Moãi laàn kieåm tra moät saûn phaåm ta coi laø moät pheùp thöû. Ta coù soá pheùp thöû laø n = 100. Xaùc suaát ñeå moät saûn phaåm thuoäc loaïi A trong moãi laàn thöû laø p = 0,6687. ▪ Do ñoù neáu goïi X laø soá saûn phaåm loaïi A trong 100 saûn phaåm thì X laø ÑLNN coù phaân phoái nhò thöùc: X B(100; 0,6687)
  169. ⚫a) Goïi A laø bieán coá coù ñuùng 70 saûn phaåm loaïi A. ⚫Ta coù bieåu dieãn A = (X = 70) PAPX( ) =( = 70) 70 70 100− 70 =−C100 (0,6687) ( 1 0,6687) = 0,0681( 6,81%)
  170. ⚫B) Goïi B laø bieán coá coù khoâng quaù 60 saûn phaåm loaïi A . ⚫Ta coù bieåu dieãn: B = (0 ≤ X ≤ 60) ⚫Vì n = 100 > 30, xaùc suaát p = 0,6687 khoâng quaù gaàn 0 vaø khoâng quaù gaàn 1 neân: ba−  −  P( B) = P( 0 X 60)  −    =np = 100.0,6687 = 66,87  =npq = 100.0,6687.( 1 − 0,6687) = 4,7068
  171. 60−− 66,87 0 66,87 PB( ) =  −  4,7068 4,7068 = ( −1,46) − ( − 14,21) = (14,21) − ( 1,46) =−0,5 0,4279 = 0,0721( 7,21%)
  172. Bài tập áp dụng ▪ Ví duï 1 ▪ Troïng löôïng cuûa moät loaïi saûn phaåm ñöôïc quan saùt laø moät ñaïi löôïng ngaãu nhieân coù phaân phoái chuaån vôùi trung bình 50kg vaø phöông sai 100kg2 ▪ Nhöõng saûn phaåm coù troïng löôïng töø 45kg ñeán 70kg ñöôïc xeáp vaøo loaïi A. Choïn ngaãu nhieân 100 saûn phaåm (trong raát nhieàu saûn phaåm). Tính xaùc suaát ñeå: ▪ a) Trong 100 saûn phaåm coù ñuùng 70 saûn phaåm loaïi A. ▪ b) Trong 100 saûn phaåm coù khoâng quaù 60 saûn phaåm loaïi A.
  173. Giaûi ▪ Tröôùc heát ta tính tæ leä saûn phaåm loaïi A: ▪ Goïi W laø troïng löôïng cuûa loaïi saûn phaåm ñaõ cho, ta thaáy W laø ÑLNN coù phaân phoái chuaån: ▪ W N(50; 100) ▪ Goïi F laø bieán coá saûn phaåm ñöôïc xeáp vaøo loaïi A ta coù: F = (45 #W # 70). Suy ra: ba−  −  P( F) = P(45 W 70) =  −  
  174. 70 - 50 45 - 50 P( F) =  -  =  (2) -  (-0,5) 10 10 =  (2) +  (0,5) = 0, 4772 + 0,1915 = 0, 6687 ⚫Suy ra xaùc suaát ñeå moät saûn phaåm thuoäc loaïi ⚫A laø p = 0,6687
  175. Ta tính xaùc suaát theo yeâu caàu cuûa baøi toaùn: ⚫Moãi laàn kieåm tra moät saûn phaåm ta coi laø moät pheùp thöû, ta coù n = 100. Xaùc suaát ñeå moät saûn phaåm thuoäc loaïi A trong moãi laàn thöû laø p = 0,6687. ⚫Do ñoù neáu goïi X laø soá saûn phaåm loaïi A trong 100 saûn phaåm ñaõ choïn ra thì X laø ÑLNN coù phaân phoái nhò thöùc: X B(100; 0,6687)
  176. ▪ a) Goïi A laø bieán coá coù ñuùng 70 saûn phaåm loaïi A. Ta coù: A = (X = 70) PAPX( ) =( = 70) 70 70 100− 70 =−C100 ( 0,6687) ( 1 0,6687) 1 k −    = np = 100 0,6687 = 66,87  =npq =100 0,6687 (1 − 0,6687) = 4,7068
  177. 1 k −  PA( )  1 70− 66,87 = 4,7068 4,7068 1 = ( 0,66) 4,7068 0,3209 == 0,0681( 6,81%) 4,7068
  178. ⚫b) Goïi B laø bieán coá coù khoâng quaù 60 saûn phaåm loaïi A ta coù: B = (0# X #60) ba− −  = P( BP) − 0X60  ( )  6066,87066,87−− = −  4,70684,7068 = ( −−1,4614,2114,211,46  −=) −(  ) ( ) ( ) =−=0,50,42970,0721 7,21%( )
  179. Ví duï 2 ▪ Saûn phaåm trong moät nhaø maùy ñöôïc ñoùng thaønh töøng kieän, moãi kieän goàm 14 saûn phaåm trong ñoù coù 8 saûn phaåm loaïi A vaø 6 saûn phaåm loaïi B. Khaùch haøng choïn caùch kieåm tra nhö sau: töø moãi kieän laáy ra 4 saûn phaåm; neáu thaáy soá saûn phaåm thuoäc loaïi A nhieàu hôn soá saûn phaåm thuoäc loaïi B thì môùi nhaän kieän ñoù; ngöôïc laïi thì loaïi boû. Kieåm tra 100 kieän (trong raát nhieàu kieän). Tính xaùc suaát ñeå ▪ coù 42 kieän ñöôïc nhaän. ▪ coù töø 40 ñeán 45 kieän ñöôïc nhaän. ▪ coù ít nhaát 42 kieän ñöôïc nhaän
  180. Giaûi ▪ Tröôùc heát ta tính tæ leä nhöõng kieän ñöôïc nhaän nghóa laø tìm xaùc suaát ñeå moät kieän haøng ñöôïc nhaän ▪ Goïi X laø soá saûn phaåm loaïi A trong kieän haøng ▪ Goïi F laø bieán coá kieän haøng ñöôïc nhaän ta coù: ▪ F = (X = 3) + (X = 4) ▪ Suy ra: P( F) = P(X = 3) + P(X = 4) CCCC3 1 4 0 =8 6 + 8 6 = 44 0, 4056( 40,56%) CC14 14
  181. Tính caùc xaùc suaát theo yeâu caàu ▪ Moãi laàn kieåm tra moät kieän haøng ta coi ñoù laø moät pheùp thöû khi ñoù soá pheùp thöû laø n = 100. Xaùc suaát ñeå moät kieän haøng ñöôïc nhaän trong moãi laàn thöû laø p = 0,4056. ▪ Do ñoù neáu goïi X laø soá kieän haøng ñöôïc nhaän trong 100 kieän haøng ñöôïc kieåm tra thì X laø ÑLNN coù phaân phoái nhò thöùc X B(n, p) vôùi n = 100, p = 0,4056
  182. ⚫a) Goïi A laø bieán coá coù ñuùng 42 kieän ñöôïc nhaän. Ta coù: AX==( 42) PAPX( ) =( = 42) 42 42 100− 42 =−C100 ( 0,4056) ( 1 0,4056) = 0,0779 ( 7,79%) ⚫Vaäy xaùc suaát ñeå trong 100 kieän choïn ra coù ñuùng 42 kieän ñöôïc mua laø 7,79%
  183. ⚫b) Goïi B laø bieán coá coù töø 40 ñeán 45 kieän ñöôïc nhaän , ta coù: B=( 40 X 45) P( B) = P( 40 X 45) 45−  40 −   −    =np =100 0,4056 = 40,56  =npq =100 0,4056 (1 − 0,4056) = 4,9101
  184. ⚫Suy ra: 45−− 40,56 40 40,56 PB( ) =  −  4,9101 4,9101 = (0,90) −  ( − 0,11) = (0,90) +  (0,11) =0,3159 + 0,0438 = 0,3597 = 35,97% ⚫ Vaäy xaùc suaát ñeå 100 kieän choïn ra coù töø 40 ñeán 45 kieän ñöôïc nhaän laø 35,97%
  185. c) Goïi C laø bieán coá coù ít nhaát 42 kieän ñöôïc nhaän, ta coù: C=( 42 X 100) 100−  42 −  P( C) = P( 42 X 100) =  −   100−− 40,56 42 40,56 =  −  = (12) −  (0,29) 4,9101 4,9101 =0,50 − 0,1141 = 0,3859 = 38,59%. ⚫Vaäy xaùc suaát ñeå 100 kieän choïn ra coù ít nhaát 42 kieän ñöôïc nhaän laø 38,59%
  186. Chương 3 ĐẠI CƯƠNG VỀ THỐNG KÊ TOÁN HỌC
  187. §1 – LÝ THUYẾT MẪU ⚫1.1 – ĐÁM ĐÔNG ⚫1- Khái niệm đám đông ⚫Đám đông là một tập hợp các phần tử chứa đựng những thông tin hay dấu hiệu mà ta cần nghiên cứu. ⚫Ký hiệu một đám đông là Ω ⚫Dấu hiệu của một đám đông ký hiệu là X*
  188. 2 – Ghi chú ⚫Khi nghiên cứu một đám đông ta quan tâm đến dấu hiệu X* của đám đông đó. Dấu hiệu X* có thể thay đổi từ cá thể này sang cá thể khác . ⚫Vì vậy: ⚫Ta có thể coi việc nghiên cứu một đám ⚫đông là nghiên cứu một đại lượng ngẫu ⚫nhiên X*
  189. 3- Các khái niệm liên quan ⚫Kích thước của đám đông: là số phần tử N của đám đông * ⚫Giá trị của dấu hiệu X : x1, x2, ,xk ⚫Tần số N1, N2, ,Nk : số phần tử mang dấu hiệu tương ứng x1, x2, ,xk ⚫Tần suất của các phần tử mang dấu hiệu ⚫xi là tỉ số pi = Ni/N
  190. Ghi chú: ⚫Ta luôn có: ∑Ni = N và ∑pi = 1 ⚫Bảng cơ cấu đám đông: Do ta coi X* như là một ĐLNN nên ta gọi bảng PPXS của nó là bảng cơ cấu đám đông: * X x1 x2 xn pi p1 p2 pn
  191. 4- Các đặc trưng của đám đông 1) Trung bình đám đông: 11N k k =xi hay =  x i p i =  x i N i NNi=1 i = 1 i = 1 2) Phương sai đám đông: N 221 =−()xi N i=1 kk 2 21 2 hay:()()= xi −  p i = x i −  N i ii==11N
  192. 3) Độ lệch chuẩn: = 2 4) Tỉ lệ đám đông: p = M/N (M là số phần tử có tính chất mà ta quan tâm) 5 – Ghi chú Việc nghiên cứu một đám đông thường gặp một số khó khăn như sau: - Do kích thước của đám đông quá lớn nên tốn kém vật chất và thời gian - Khi làm việc với quy mô lớn người ta khó kiểm soát được quá trình nghiên cứu
  193. - Nếu đám đông biến động, các phần tử thay đổi thường xuyên thì việc nghiên cứu trên cả đám đông khó thực hiện được - Để khắc phục được tình trạng này người ta tìm cách chọn mẫu và nghiên cứu trên mẫu và từ kết quả thu được trên mẫu ta có kết luận cho cả đám đông 1.2 – CÁC VẤN ĐỀ VỀ MẪU 1- Mẫu - Từ đám đông ta chọn ra một tập hợp có n phần tử và nghiên cứu dấu hiệu X* trên chúng. Tập hợp này được gọi là một mẫu
  194. Ghi chú: Khi nghiên cứu một mẫu ta quan tâm đến dấu hiệu X* của đám đông trên mẫu nên ta coi một mẫu như là một ĐLNN 2 – Các khái niệm liên quan đến mẫu - Kích thước mẫu: là số phần tử của tập hợp mẫu * - Giá trị của dấu hiệu X : x1, x2, ,xk - Tần số ni của xi: số phần tử mang giá trị xi (i=1 k) - Tần suất của xi là tỉ số: ni/n (i=1 k)
  195. 3 – Các đặc trưng của mẫu Trung bình mẫu: 11nk x== xi hay x x i n i nnii==11 Trung bình bình phương: nk 211 2 2 2 x== xi hay x x i n i nnii==11 Phương sai mẫu: n 22 221 S=( xi − x) = x − ( x) n i=1
  196. ⚫ Phương sai mẫu hiệu chỉnh: n 2 2 1 S=−( xi x) n −1 i=1 Ta có: nn22 2211nn S=( xii − x) = ( x − x) = S n−1ii==11 n − 1 n n − 1 ● Tỉ lệ mẫu: m f== f( A) nn n
  197. 4 – Các phương pháp chọn mẫu ⚫ 1) Mẫu cơ học: Chia đám đông thành n tập nhỏ sau đó chọn từ mỗi tập một phần tử làm đại diện ⚫ 2) Mẫu điển hình: Chia đám đông thành n tập nhỏ có tính điển hình. Sau đó chọn từ mỗi tập một phần tử làm đại diện ⚫ 3) Mẫu dãy: Chia đám đông thành n dãy sau đó chọn từ mỗi dãy một phần tử làm đại diện
  198. 5 – Các phương pháp sắp xếp số liệu ⚫ 1) Sắp xếp theo giá trị quan sát: * X x1 x2 xk ni n1 n2 nk Ta gọi bảng này là bảng tần số của mẫu ● 2) Sắp xếp số liệu dạng khoảng: * ’ ” ’ ” ’ ” X x1 – x1 x2 – x2 xk – xk ni n1 n2 nk Khi đó để lập bảng tần số ta chọn: xi = (xi’ + xi”)/2
  199. 6 - Phương pháp tính các đặc trưng mẫu ⚫ Ví dụ: ⚫ Cho bảng số liệu: xi 4 5 7 9 ni 10 15 13 12 Tính trung bình mẫu và phương sai mẫu hiệu chỉnh
  200. Giải ⚫ Lập bảng tính: 2 xi ni nixi nixi 4 10 40 160 5 15 75 375 7 13 91 637 9 12 108 972 Tổng 50 314 2144
  201. Suy ra: 11 k x=  nii x = 314 = 6,28 n i=1 50 k 2211 x=  nii x = 2144 = 42,88 n i=1 50 2 S2= x 2 −( x) =42,88 − (6,28) 2 = 3,4416 S =3,4416 = 1,8552 n 50 SS22= = 3,4416 = 3,5118 n −1 49 S =3,5118 = 1,8740
  202. Phương pháp sử dụng máy tính bỏ túi Fx570 MS ⚫ Bước 1: Vào chương trình thống kê (SD) ⚫ Mod – SD – xóa dữ liệu có trong máy – vào lại SD ⚫ Bước 2: Nhập số liệu + ⚫ xi ; ni – M (i = 1 n) ⚫ Bước 3: Đọc kết quả 2 ⚫ Gọi n; ∑xi; ∑xi : Bấm shift – sum ⚫ Gọi x; S ( x n) ; S ( x n − 1) Bấm shift - var
  203. Phương pháp sử dụng máy tính bỏ túi Fx570ES ⚫ Bước 1: ⚫ Vào chương trình ⚫ Bấm sift – mod – (mũi tên xuống) – chọn 4 – chọn 1 – mod – chọn 3 – chọn 1 ⚫ Máy xuất hiện 2 cột để nhập số liệu: X Freq 1 2 3
  204. ⚫ Bước 2: ⚫ Nhập số liệu theo cột – nhập xong bấm AC ⚫ Bước 3: ⚫ Đọc kết quả 2 ⚫ Gọi ∑xi; ∑xi : Bấm Sift – 1 – chọn 4 ⚫ Gọi n; xσn; xσn-1: Bấm Sift – 1 – chọn 5
  205. §2 – LÝ THUYẾT ƯỚC LƯỢNG ⚫ 2.1 – Bài toán ước lượng ⚫ 1 - Định nghĩa ⚫ Cho một đám đông có tham số θ chưa biết ( θ có thể là μ; σ hay p). ⚫ Người ta chọn ra một mẫu có n quan sát cho dấu hiệu * ⚫ X là x1, x2, ,xn ⚫ Vấn đề đặt ra là: Căn cứ vào mẫu quan sát hãy tìm ⚫ một giá trị gần đúng θ’ cho θ ⚫ Bài toán này được gọi là Bài toán ước lượng tham số ⚫ đám đông
  206. 2 - Phân loại bài toán ước lượng 1) Ước lượng điểm: là loại ước lượng chỉ phụ thuộc vào mẫu quan sát 2) Ước lượng khoảng: là loại ước lượng phụ thuộc vào mẫu quan sát và một xác suất cho trước (còn gọi là độ tin cậy) 2.2 – Phương pháp ước lượng điểm 1) Để ước lượng điểm trung bình đám đông ta dùng trung bình mẫu để ước lượng:  x 2) Để ước lượng điểm phương sai đám đông ta dùng phương sai mẫu hiệu chỉnh để ước lượng: σ2 ≈ S2
  207. 3) Để ước lượng điểm tỉ lệ đám đông ta dùng tỉ lệ mẫu để ước lượng: p ≈ fn 2.3 – Ước lượng khoảng cho trung bình 2.3.1 - Bài toán: - Cho một đám đông có trung bình μ chưa biết. Người ta lấy ra một mẫu có kích thước là n, tính được trung bình mẫu và phương sai mẫu hiệu chỉnh. - Vấn đề đặt ra là: Căn cứ vào kết quả tính được trên mẫu, với độ tin cậy là 1 - α cho trước hãy tìm khoảng ước lượng cho trung bình của đám đông
  208. 2.3.2 – Phương pháp giải quyết Người ta chọn một khoảng (μ1, μ2 ) sao cho: p (μ1 #μ# μ2 ) = 1 – α 2.3.3 – Công thức ước lượng Trường hợp 1: Phương sai của đám đông σ2 đã biết. Ta có công thức:  , = xt 12 n Trong đó tα được tính như sau: Từ hệ thức (tα) = (1 – α )/2 tra bảng F ta tính được tα
  209. Trường hợp 2: ⚫ Phương sai của đám đông chưa biết và kích thước mẫu lớn (n P 30) ta có công thức ước lượng: S 12, = xt ⚫ Trường hợp 3: n ⚫ Phương sai của đám đông chưa biết và kích thước mẫu nhỏ (n < 30) ta có công thức ước lượng: n−1 S 12,= xt n-1 n ⚫ Trong đó tα được tra ở bảng H
  210. Ghi chú:  SS Ñaët =t;  = t hay  = t n−1 n n n Ta coù: 12, = x  ⚫ Và gọi ε là độ chính xác của ước lượng.
  211. CÁC VÍ DỤ ⚫Ví dụ 1 ⚫Khảo sát chiều cao của 36 sinh viên người ⚫ta tính được: x==66 inches( 1 inches 2,54 cm) ⚫Biết độ lệch tiêu chuẩn của một người ⚫trưởng thành là σ = 3inches, hãy ước ⚫lượng chiều cao trung bình của một sinh ⚫viên với độ tin cậy là 95%
  212. Giải ⚫Gọi μ là ước lượng chiều cao trung bình của một sinh viên với độ tin cậy 95% ⚫Ta có công thức ước lượng:  , = xt 12 n ⚫Nhưng 1− 0,95  (tt) = = =0,475 = 1,96 22
  213. Suy ra:  3 ,==xt 66 1,96 12 n 36 3  ==1,96 0,98 36 1 =66 − 0,98 = 65,02 65,02  66,98( 95%) 2 =66 + 0,98 = 66,98 Vậy chiều cao trung bình của một sinh viên nằm trong khoảng 65,02 inches đến 66,98 inches với độ tin cậy 95%
  214. Ví dụ 2 ⚫Lấy ngẫu nhiên 100 hộp sữa trong một kho sữa, cân trọng lượng và tính được: x==396 g ; S22 25 g ⚫Hãy ước lượng trọng lượng trung bình của một hộp sữa trong kho với độ tin cậy là 96%
  215. Giải ⚫ Gọi μ là ước lượng trọng lượng trung bình của một hộp sữa trong kho với độ tin cậy là 96%. Do n =100 > 30 nên ta có công thức ước lượng: S ,.= xt 12 n ⚫Nhưng: 1− 0,96  (tt) = = =0,480 = 2,05 22
  216. 5 Suy ra: ,= 396 2,05 12 100 5  =2,05 = 1,025 100 1 =396 − 1,025 = 394,975 2 =396 + 1,025 = 397,025 394,975  397,025( 96%) ⚫Vậy trọng luợng trung bình của một hộp sữa trong kho vào khoảng từ 394,975g đến 397,025g với độ tin cậy 96%
  217. Ví dụ 3 ⚫Lấy ngẫu nhiên 25 hộp sữa trong một kho sữa, cân trọng lượng và tính được: x==395 g ; S22 24 g ⚫Ước lượng trọng lượng trung bình của một hộp sữa trong kho với độ tin cậy là 95%
  218. Giải ⚫Gọi μ là ước lượng trọng lượng trung bình của một hộp sữa trong kho với độ tin cậy là 95%. Do n = 25 < 30 nên ta có công thức ước lượng: n−1 S 12,= xt ⚫Nhưng n n−1 24 tt ==0,05 2,0639
  219. 4,9 Suy ra: ,= 395 2,0639 12 25 4,9  =2,0639 = 2,02 25 1 =395 − 2,02 = 392,98 2 =395 + 2,02 = 397,02 392,98  397,02( 95%) Vậy trong lượng trung bình của một hộp sữa trong kho vào khoảng từ 392,98g đến 397,02g với độ tin cậy 95%
  220. Ví dụ 4 ⚫ Lấy ngẫu nhiên 100 hộp sữa trong một kho sữa, cân trọng lượng và tính được: x==396 g ; S22 25 g a) Muốn ước lượng trong lượng trung bình của một hộp sữa trong kho đạt được độ chính xác là 1gam và độ tin cậy 99% thì cần điều tra trên bao nhiêu hộp? b) Muốn ước lượng trong lượng trung bình của một hộp sữa trong kho đạt được độ chính xác là 1gam thì độ tin cậy của ước lượng sẽ là bao nhiêu?
  221. Giải a) Theo công thức ước lượng trung bình đám đông ta có: 2 SS2 =tt. 2 =( ) n n (tS)222 (2,58) 25 nn = 166,41 = 166  221 Vậy ta phải điều tra ít nhất là 166 hộp
  222. b) Theo công thức ước lượng trung bình đám đông ta có: 2 2 2 S22 S n 100 1 =t.4 2 =( t) ( t ) = = = n nS 2 25 tt =2 ( ) =( 2) = 0,4772 1 − = 2(t ) = 0,9544( 95,44%) Vậy độ tin cậy của ước lượng là 95,44% Ghi chú: Bài toán trong ví dụ 4 còn gọi là bài toán xác định các chỉ tiêu của bài tóan ước lượng trung bình đám đông
  223. 2.4 – Ước lượng khoảng cho tỉ lệ 1 - Bài toán: Cho một đám đông có tỉ lệ p chưa biết. Người ta chọn ra một mẫu có kích thước là n, tính được tỉ lệ mẫu là fn. ⚫ Vấn đề đặt ra là: Căn cứ vào kết quả trên mẫu, hãy tìm khoảng ước lượng cho tỉ lệ đám đông với độ tin cậy 1 – α cho trước 2 – Phương pháp giải quyết: Người ta tìm một khoảng (p1, p2) sao cho: p (p1# p #p2) = 1 – α
  224. 3 – Công thức ước lượng ff(1− ) p, p= f t nn 12 n n Ghi chú: Nếu ta đặt ff(1− )  = t nn n Thì công thức ước lượng có dạng: p12, p= fn  Ta gọi ε là độ chính xác của ước lượng
  225. Ví dụ 1 ⚫ Lô trái cây của một chủ hàng được đóng thành từng sọt mỗi sọt chứa 100 trái. Kiểm tra 50 sọt thấy có 450 trái không đạt tiêu chuẩn ⚫ a) Ước lượng tỉ lệ trái cây không đạt tiêu chuẩn của lô hàng với độ tin cậy 95%. ⚫ b) Muốn lượng tỉ lệ trái cây không đạt tiêu chuẩn với độ chính xác là 0,005 thì độ tin cậy là bao nhiêu ⚫ c) Muốn lượng tỉ lệ trái cây không đạt tiêu chuẩn với độ chính xác là 0,01 và độ tin cậy là 99% thì cần kiểm tra bao nhiêu sọt
  226. Giải ⚫ a) Gọi p là ước lượng tỉ lệ trái cây không đạt tiêu chuẩn của lô hàng với độ tin cậy 95% ta có công thức ước lượng: ff(1− ) p, p= f t nn 12 n n 450 Do: f= = 0,09;1 − = 95% t = 1,96 n 50 100 0,09( 1− 0,09) =pp, 0,09 1,96 12 5000
  227. Khi đó 0,09( 1− 0,09)  ==1,96 0,008 5000 p1 =0,09 − 0,008 = 0,082 p2 =0,09 + 0,008 = 0,098 0,082 p 0,098( 95%) Vậy tỉ lệ trái cây không đạt chuẩn nằm trong khoảng từ 8,2% đến 9,8% với độ tin cậy là 95%
  228. b) Theo công thức ước lượng tỉ lệ đám đông ta có: f(11−− f) 2 f( f ) =ttn n 2 = ( ) n n nn 2 2 2 n 5000 ( 0,005) (tt ) = = =1,5376 = 1,24 ffnn(1−−) 0,09( 1 0,09) 1 − = 2 (t ) = 2 ( 1,24) = 2 0,3925 = 0,785 (78,5%) ⚫Vậy độ tin cậy đạt được là 78,5%
  229. c) Theo công thức ước lượng tỉ lệ đám đông ta có: f(11−− f) 2 f( f ) =ttn n 2 = ( ) n n nn f(1−− f)( t )22 0,09( 1 0,09)( 2,58) n =nn = 5451,59  2 (0,01)2 =n 5452 traùi hay 55 soït ⚫Vậy ta phải kiểm tra ít nhất là 55 sọt
  230. Ví dụ 2 (Bài toán đếm cá) ⚫Muoán bieát ñöôïc soá caù trong moät hoà lôùn ngöôøi ta baét leân 2000 con, ñaùnh daáu xong laïi thaû xuoáng hoà. Sau ñoù ngöôøi ta baét leân 400 con vaø thaáy coù 80 con ñöôïc ñaùnh daáu. ⚫Vôùi ñoä tin caäy 95% haõy öôùc löôïng soá caù trong hoà. ⚫Giaûi ⚫Ta goïi N laø soá caù trong hoà, p laø tæ leä caù coù ñaùnh daáu trong hoà ta coù: 2000 p = N
  231. ⚫ Tröôùc heát ta öôùc löôïng tæ leä p soá con caù ñaõ ñaùnh daáu trong hoà: ⚫ Theo coâng thöùc öôùc löôïng tæ leä ñaùm ñoâng ta coù: ff(1)− ppft, = nn 12 n n 80 ft=== = 0,2; 1- 95%1,96 n 400 0,210,2 −( ) pp,0,21,96= 12 400 0,210,2 −( )  = =1,960,0392 400
  232. Suy ra: p1 =0,2 − 0,0392 = 0,1608 0,1608 p 0,2392(95%) p2 =0,2 + 0,0392 = 0,2392 2000 2000 Do: p= N = Np 1 1 1 0,1608 p 0,2392 0,2392p 0,1608 2000 2000 2000 8361(con) N 12438( con) 0,2392p 0,1608 Vaäy öôùc löôïng soá caù trong hoà coù khoaûng töø 8361 con ñeán 12438 con vôùi ñoä tin caäy laø 98%
  233. §3 – LÝ THUYẾT KIỂM ĐỊNH ⚫3.1 – KIỂM ĐỊNH GIẢ THIẾT THAM SỐ ⚫3.1.1 – Kiểm định 2 phía ⚫A – Bài toán kiểm định trung bình Cho một đám đông có trung bình μ chưa biết. Đặt một giả thiết H0 về μ : “μ = μ0” Vấn đề đặt ra là với mức ý nghĩa α cho trước hãy kiểm tra giả thiết H0 là đúng hay sai Bài toán này được gọi là bài toán kiểm định giả thiết trung bình đám đông
  234. Giải quyết ⚫Trường hợp 1: Biết phương sai σ2 ⚫Bước 1: ⚫Đặt giả thiết không H0 : “μ = μ0 “ ⚫Đặt đối thiết H1 : “μ s μ0 “ ⚫Bước 2: (xn− 0 ) ⚫Tính thống kê: t =  ⚫Tính tα
  235. Bước 3: Kết luận 1) Nếu | t |# tα thì ta chấp nhận giả thiết H0 Và bác bỏ H1 2) Nếu | t | > tα thì ta bác bỏ giả thiết H0 và Chấp nhận H1 Ghi chú: Khi giả thiết H0 bị bác bỏ ta có kết luận: Khi: x 00   Khi: x 00  
  236. ⚫Trường hợp 2: Biết phương sai σ2 và n 30 ⚫Bước 1: ⚫Đặt giả thiết không H0 : “μ = μ0 “ ⚫Đặt đối thiết H1 : “μ s μ0 “ ⚫Bước 2: ⚫Tính thống kê: (xn− 0 ) ⚫ t = Tính tα S
  237. Bước 3: Kết luận 1) Nếu | t |# tα thì ta chấp nhận giả thiết H0 Và bác bỏ H1 2) Nếu | t | > tα thì ta bác bỏ giả thiết H0 và Chấp nhận H1 Ghi chú: Khi giả thiết H0 bị bác bỏ ta có kết luận: Khi: x 00   Khi: x 00  
  238. ⚫Trường hợp 3: Chưa biết phương sai σ2 ⚫n < 30 ⚫Bước 1: ⚫Đặt giả thiết không H0 : “μ = μ0 “ ⚫Đặt đối thiết H1 : “μ s μ0 “ ⚫Bước 2: (xn− 0 ) ⚫Tính thống kê: t = S n-1 ⚫Tính t α
  239. Bước 3: Kết luận n-1 1) Nếu | t |# t α thì ta chấp nhận giả thiết H0 và bác bỏ H1 n-1 2) Nếu | t | > t α thì ta bác bỏ giả thiết H0 và Chấp nhận H1 Ghi chú: Khi giả thiết H0 bị bác bỏ ta có kết luận: Khi: x 00   Khi: x 00  
  240. Ví dụ áp dụng ⚫ Ví dụ 1 ⚫ Giám đốc một xí nghiệp cho biết lương trung bình của một công nhân là 2,5 triệu đồng / tháng ⚫ Chọn ngẫu nhiên 36 công nhân thì thấy lương trung bình là 2,3 triệu đồng / tháng. Biết độ lệch tiêu chuẩn là 0,5 triệu hãy kiểm định tuyên bố của ông giám đốc với mức ý nghĩa 5%. ⚫ Giải ⚫ Gọi μ là mức lương trung bình của một công nhân. Đặt giả thiết H0:”μ = 2,5”. Ta kiểm định H0 ở mức ý nghĩa 5%
  241. Giải ⚫Gọi μ là mức lương trung bình của một công nhân. ⚫Đặt giả thiết không H0:”μ = 2,5”. ⚫Với đối thiết H0:”μ s 2,5”. ⚫Ta kiểm định H0 ở mức ý nghĩa 5% ⚫Tính: (xn− 0 ) (2,3− 2,5) 36 t = = = 2,4  0,5 =0,05 t = 1,96 t t
  242. ⚫Suy ra bác bỏ H0, chấp nhận H1 ⚫Lời của giám đốc không tin cậy được. ⚫Thực tế mức lương trung bình của một ⚫công nhân thấp hơn 2,5 triệu đồng/tháng
  243. Ví dụ 2 ⚫ Trước đây trọng lượng thanh niên độ tuổi 20 của vùng A là 45kg. Năm nay người ta chọn ngẫu nhiên 100 thanh niên và xác định được trọng lượng trung bình là 48kg; phương sai mẫu hiệu chỉnh là 100kg2 ⚫ Với mức ý nghĩa 5% hãy kiểm tra xem trọng lượng của thanh niên trong vùng có thay đổi hay không?
  244. Giải ⚫Gọi μ là trọng lượng trung bình của thanh niên trong vùng hiện nay ⚫Đặt giả thiết không H0:”μ = 45” ⚫Đối thiết H1:”μ s 45” và kiểm định H0 ở mức ý nghĩa 5%. ⚫Ta có (xn− 0 ) (48− 45) 100 t = = = 3 S 10 =0,05 t = 1,96 | t | t
  245. ⚫Suy ra bác bỏ H0, chấp nhận H1 ⚫Kết luận trọng lượng của thanh niên trong vùng có tăng lên.
  246. Ví dụ 3 ⚫ Một công ty sản xuất pin tuyên bố rằng pin của họ có tuổi thọ trung bình là 21,5 giờ. Một cơ quan kiểm tra chất lượng kiểm tra ngẫu nhiên 6 chiếc pin và thu được kết quả về tuổi thọ của 6 chiếc pin này là: 19, 18, 22, 20, 16, 25. ⚫ Kiểm tra lại thông tin trên với mức ý nghĩa là 5% ⚫ Giải ⚫ Gọi μ là tuổi thọ trung bình của loại pin do công ty sản xuất. Đặt giả thiết H0:”μ = 21,5” và kiểm định H0 ở mức ý nghĩa 5%.
  247. Tính toán ta được 19+ 18 + 22 + 20 + 16 + 25 x ==20 6 192+ 18 2 + 22 2 + 20 2 + 16 2 + 25 2 x2 ==408,3 6 222 n S= x22 − x =8,3 S = S = 10 S = 3,16 ( ) n −1 ( xn− 0 ) (20− 21,5) 6 t = = =1,16 S 3,16 nn−−1 5 1 t = t0,05 =2,571 t t Ta chấp nhận H0 ở mức ý nghĩa α = 5% Vậy tuyên bố của công ty là đúng
  248. B – Bài toán kiểm định về tỉ lệ Cho một đám đông có tỉ lệ p chưa biết. Đặt một giả thiết H0 về p : “p = p0” Vấn đề đặt ra là với mức ý nghĩa α cho trước hãy kiểm tra giả thiết H0 là đúng hay sai Bài toán này được gọi là bài toán kiểm định giả thiết tỉ lệ đám đông
  249. Giải quyết ⚫Bước 1: ⚫Đặt giả thiết không H0 : “p = p0 “ ⚫Đặt đối thiết H1 : “p s p0 “ ⚫Bước 2: ( p− p) n ⚫Tính thống kê: t = 0 pp00(1− ) ⚫Tính tα (tra bảng G)
  250. Bước 3: Kết luận 1) Nếu | t |# tα thì ta chấp nhận giả thiết H0 và bác bỏ H1 2) Nếu | t | > tα thì ta bác bỏ giả thiết H0 và Chấp nhận H1 Ghi chú: Khi giả thiết H0 bị bác bỏ ta có kết luận: Khi: fn p00 p p Khi: fn 00 p p
  251. Ví dụ áp dụng ⚫ Ví dụ 1 ⚫ Một tài liệu cũ cho biết tỉ lệ hộ dân thích xem chương trình “Phim Việt” là 80%. Kiểm tra ngẫu nhiên 36 hộ dân thì thấy có 25 hộ thích xem chương trình này. Với mức ý nghĩa 5% có chấp nhận tài liệu này hay không? ⚫ Giải ⚫ Gọi p là tỉ lệ hộ dân thích xem chương trình “Phim Việt”. ⚫ Đặt giả thiết H0: ”p = 0,8”, Đối thiết H1: ”p s 0,8” ⚫ Ta kiểm định H0 ở mức ý nghĩa 5%
  252. Ta có: ( f− p) n t = n 0 pp0 (1− o ) 25 (0,7− 0,8) 36 ft= =0,7 = = − 1,5 n 36 0,8(1− 0,8) t =1,96 t t Vậy ta chấp nhận giả thiết H0; Bác bỏ H1 Nghĩa là thông tin cho rằng tỉ lệ 80% người thích chương trình “Phim Việt” có thể tin cậy được
  253. Ví dụ 2 ⚫ Một bản báo cáo nói rằng 80% gia đình trong thành phố có máy vi tính ở nhà. Để kiểm tra người ta chọn ngẫu nhiên 80 gia đình trong thành phố và thấy có 68 hộ có máy tính cá nhân. ⚫ Kiểm định thông tin trên với mức ý nghĩa α = 2% ⚫ Giải ⚫ Gọi p là tỉ lệ hộ dân có máy vi tính ở nhà. ⚫ Đặt giả thiết H0: ”p = 0,8”, Đối thiết H1: ”p s 0,8” ⚫ Ta kiểm định H0 ở mức ý nghĩa 2%
  254. Ta có ( f− p) n t = n 0 pp0 (1− o ) 68 (0,85− 0,8) 80 ft= =0,85 = = 2,5 n 80 0,8(1− 0,8) =2% t = 2,34 t t Ta bác bỏ giả thiết H0 ; chấp nhận H1 Thực tế số gia đình có máy tính cá nhân ở nhà trong thành phố cao hơn
  255. Ví dụ 3 ⚫Tỉ lệ phế phẩm của một nhà máy trước đây là 5%. Năm nay nhà máy áp dụng một biện pháp cải tiến kỹ thuật mới. Để nghiên cứu tác dụng của biện pháp kỹ thuật mới, người ta lấy ngẫu nhiên một mẫu gồm 800 sản phẩm kiếm tra thấy có 24 phế phẩm. ⚫A) Cho biết kết luận về biện pháp cải tiến kỹ thuật với mức ý nghĩa 1% ⚫
  256. ⚫B) Với mức ý nghĩa 5%, nếu nhà máy báo cáo tỉ lệ phế phẩm sau khi áp dụng biện pháp mới là 2% thì có tin được không ⚫Giải ⚫Gọi p là tỉ lệ phế phẩm sau khi áp dụng biện pháp cải tiến kỹ thuật mới. ⚫Đặt giả thiết H0: ”p = 0,05” ⚫Đối thiết H1:”p s 0,05” ⚫Ta kiểm định H0 ở mức ý nghĩa 1%
  257. ⚫Ta có ( f− p) n t = n 0 pp0 (1− o ) 24 (0,03− 0,05) 800 ft= =0,03 = = − 2,59 n 800 0,05(1− 0,05) =1% t = 2,58 t t ⚫Vậy bác bỏ H0, chấp nhận H1 ⚫Suy ra biện pháp kỹ thuật mới có tác dụng tốt do làm giảm tỉ lệ phế phẩm
  258. ⚫B) Gọi p là tỉ lệ phế phẩm sau khi áp dụng biện pháp cải tiến kỹ thuật mới. ⚫Đặt giả thiết H0: ”p = 0,02” ⚫Đối thiết H1:”p s 0,02” ⚫Ta kiểm định H0 ở mức ý nghĩa 5% ⚫ Ta có ( f− p) n (0,03− 0,02) 800 t = n 0 ==2,02 pp0 (1− o ) 0,02(1− 0,02) =5% t = 1,96 t t
  259. ⚫Suy ra bác bỏ H0, chấp nhận H1 ⚫Vậy báo cáo của nhà máy tỉ lệ phế phẩm là 2% không đúng theo thực tế.
  260. B – Bài toán kiểm định về phương sai Cho một đám đông có phương sai σ chưa biết. Đặt một giả thiết H0 về σ : “σ = σ0” Vấn đề đặt ra là với mức ý nghĩa α cho trước hãy kiểm tra giả thiết H0 là đúng hay sai Bài toán này được gọi là bài toán kiểm định giả thiết phương sai đám đông
  261. Giải quyết ⚫Bước 1: 2 2 ⚫Đặt giả thiết không H0 : “σ = σ 0 “ 2 2 ⚫Đặt đối thiết H1 : “σ s σ 0 “ ⚫Bước 2: 2 2 (nS−1) ⚫Tính thống kê:  = 2  0 ⚫Tính 22  (nn−−1) ;( 1) 1− 22
  262. Bước 3: Kết luận 1) Nếu 2 2 2  (nn−11)   ( − ) 1− 22 thì ta chấp nhận giả thiết H0và bác bỏ H1 2) Nếu 2 2 2 2  (nn−11)   ( −)  1− 22 thì ta bác bỏ giả thiết H0 và chấp nhận H1
  263. Ghi chú: Khi giả thiết H0 bị bác bỏ ta có kết luận: 2 2 2 2 Khi: S 00   2 2 2 2 Khi: S 00  
  264. Ví dụ áp dụng ⚫Nếu máy móc hoạt động bình thường thì kích thước của một loại sản phẩm là một ĐLNN có quy luật phân phối chuẩn với phương sai σ2 = 25cm2 . ⚫Nghi ngờ máy hoạt động không bình thường, người ta đó thử 20 sản phẩm và tính được S2 = 27,5 cm2 ⚫Với mức ý nghĩa 2%, hãy kết luận về điều nghi ngờ này
  265. Giải ⚫Gọi σ2 là phương sai của kích thước sản phẩm hiện nay. 2 ⚫Đặt giả thiết không H0 : “σ = 25 “ 2 ⚫Đặt đối thiết H1 : “σ s 25 “ ⚫Tính: 2 2 (nS−1) 19 27,5  =2 = = 20,9  0 25
  266. ⚫Tra bảng I ta được: 2 2 2  (n −1) = 0,02( 20 − 1) =  0,01 ( 19) = 7,6327 22 2 2 2  (n −1) = 0,02( 20 − 1) =  0,99 ( 19) = 36,1908 11−− 22 2 2 2  (nn −11)   ( − ) 1− 22 ⚫Vậy chấp nhận H0 bác bỏ H1 ⚫Suy ra máy hoạt động bình thường
  267. 3.1.2 – Kiểm định một phía ⚫1 – Kiểm định trung bình ⚫A) Phía phải ⚫Giả thiết không: H0: “μ = μ0” ⚫Giả thiết đối: H1: “μ > μ0” ⚫(1) Nếu n 30, biết σ: ⚫- Tính (x − 0 ) n t =  ⚫- Tính t2α
  268. ⚫- Nếu |t| t2α : Chấp nhận H0 bác bỏ H1 ⚫- Nếu |t| > t2α : Bác bỏ H0 chấp nhận H1 ⚫Nếu n 30, chưa biết σ: Ta thay σ bằng S và lập luận như trên ⚫(2) Nếu n t2α : Bác bỏ H0 chấp nhận H1
  269. ⚫(2) Nếu n t 2α : Bác bỏ H0 chấp nhận H1
  270. A) Phía trái ⚫Giả thiết không: H0: “μ = μ0” ⚫Giả thiết đối: H1: “μ < μ0” ⚫Tiến hành kiểm định như đối với phía phải chỉ lưu ý tính t theo công thức (0 − x) n (0 − x) n t = hay t =  S
  271. Ví dụ áp dụng ⚫Một công ty có một hệ thống máy vi tính có thể xử lý 1200 hóa đơn trong một giờ. Công ty vừa cho nhập về một hệ thống máy mới. Cho chạy thử 40 giờ thì thấy số hóa đơn xử lý một giờ trung bình là 1260 với độ lệch tiêu chuẩn là 215 ⚫Với mức ý nghĩa 5% hãy nhận xét hệ thống mới có tốt hơn hệ thống cũ hay không
  272. Giải ⚫Gọi μ là số thời gian xử lý trung bình trong một giờ của hệ thống máy vi tính mới ⚫Đặt giả thiết không: H0: “μ = 1200” (nghĩa là HT mới tốt bằng HT cũ) ⚫Giả thiết đối: H1: “μ > μ0” (nghĩa là HT mới tốt hơn HT cũ) ⚫Ta tính:
  273. (x − 0 ) n (1260− 1200) 40 t = = =1,76 S 215 ⚫Tra bảng F ta tính: t2α = t2x0,05 = t0,1 1−− 2 1 0,1  (tt) = = =0,45 = 1,64 22 22 ⚫Suy ra t > t2α : Bác bỏ H0 chấp nhận H1 ⚫Vậy hệ thống máy mới tốt hơn hệ thống máy cũ
  274. 2 – Kiểm định tỉ lệ ⚫A) Phía phải ⚫Giả thiết không: H0: “p = p0” ⚫Giả thiết đối: H1: “p > p0” ⚫Tính ( fn − pn0 ) tt= ; 2 pp0 (1− o ) ⚫Nếu t t2α : Chấp nhận H0 bác bỏ H1 ⚫Nếu t > t2α : Bác bỏ H0 chấp nhận H1
  275. B) Phía trái ⚫Giả thiết không: H0: “p = p0” ⚫Giả thiết đối: H1: “p > p0” ⚫Tính ( pn0 − fn ) tt= ; 2 pp0 (1− o ) ⚫Nếu t t2α : Chấp nhận H0 bác bỏ H1 ⚫Nếu t > t2α : Bác bỏ H0 chấp nhận H1
  276. C) Ví dụ ⚫Một báo cáo nói rằng tỷ lệ gia đình ở TP Hồ Chí Minh có máy tính cá nhân là 85%. Một mẫu kiểm tra gồm 80 hộ dân cho thấy có 72 hộ có máy tính ở nhà. ⚫Với mức ý nghĩa 2% hãy xét xem tỉ lệ hộ dân trong TP có máy tính cá nhân có cao hơn tỷ lệ chung hay không?
  277. Giải ⚫Gọi p là tỷ lện hộ dân hiện có máy tính cá nhân ở nhà. ⚫ Đặt giả thiết không: H0:“p = 0,85” ⚫Giả thiết đối: H0: “p > 0,85” ⚫Tính ( fn − pn0 ) 72 tf=;n = = 0,9 pp0 (1− o ) 80 (0,9− 0,80) 80 t = = 2,236 0,80( 1− 0,80)
  278. =0,02 tt2 = 0,04 1− 0,04 (t2 ) =( t 0,04) = =0,48 t 2 = 2,06 2 ⚫Suy ra t > t2α : Bác bỏ H0 chấp nhận H1 ⚫Vậy tỷ lệ hộ dân có máy tính cá nhân ở nhà cao hơn so với báo cáo
  279. 3 – Kiểm đinh phương sai ⚫A) Phía phải 2 2 ⚫ Đặt giả thiết không H0 : “σ = σ 0 “ 2 2 ⚫ Đặt đối thiết H1 : “σ > σ 0 “ 2 ⚫Tính: (nS−1) 2 2  n −1  = 2 1− ( )  0 22 ⚫ Nếu  −1− (n 1) ⚫Thì bác bỏ H0 chấp nhận H1
  280. B) Phía trái 2 2 ⚫ Đặt giả thiết không H0 : “σ = σ 0 “ 2 2 ⚫ Đặt đối thiết H1 : “σ < σ 0 “ ⚫Tính: 2 (nS−1) 2  2 =  (n −1)  2 ⚫ 0 22 ⚫Nếu  − (n 1) ⚫Thì bác bỏ H0 chấp nhận H1
  281. C) Ví dụ ⚫Đo đường kính 12 sản phẩm của một dây chuyền sản xuất người ta tính được S = 0,3. Biết rằng nếu độ biến động của các sản phẩm lớn hơn 0,2 thì dây chuyền sản xuất phải dừng lại để điều chỉnh. ⚫Với mức ý nghĩa 5%, người kiểm tra có kết luận như thế nào?
  282. Giải ⚫Gọi là độ biến động của đường kính sản phẩm. 2 2 ⚫Đặt giả thiết không H0 : “σ = (0,2) = 0,04” 2 ⚫Đặt đối thiết H1 : “σ > 0,04” ⚫Tính: 2 2 2 (nS−−1) ( 12 1)( 0,3)  =2 = = 24,75  0 0,04 2 2 2 1−− (n −1) =  1 0,05( 12 − 1) =  0,95 ( 11) = 19,6752
  283. ⚫Suy ra 22  − (n 1) ⚫Vậy bác bỏ giả thiết H0 chấp nhận H1 ⚫Do đó dây chuyền cần phải điều chỉnh vì độ biến động lớn hơn mức cho phép
  284. §4 – LÝ THUYẾT SO SÁNH 4.1 – So sánh hai trung bình 4.1.1 – Bài toán Cho hai đám đông có trung bình μ1, μ2 chưa biết. Đặt một giả thiết H0 : “μ1 = μ2” Vấn đề đặt ra là với mức ý nghĩa α cho trước hãy kiểm tra giả thiết H0 là đúng hay sai 4.1.2 – Phương pháp Từ đám đông thứ nhất chọn ra một mẫu có kích thước là n1; tính trung bình mẫu và phương sai mẫu hiệu chỉnh xSnn11;
  285. Từ đám đông thứ nhất chọn ra một mẫu có kích thước là n2; tính trung bình mẫu và phương sai mẫu hiệu chỉnh xSnn22; 2 2 Trường hợp 1: Biết các phương sai σ1 và σ2 Bước 1: xxnn12− Tính t theo công thức: t = 22 12+ nn12 Tính tα Bước 2 : Kết luận 1) Nếu t # tα thì ta chấp nhận giả thiết H0 2) Nếu t > tα thì ta bác bỏ giả thiết H0
  286. 2 Trường hợp 2: Không biết các phương sai σ1 2 và σ2 1) Nếu n1, n2 P 30 ta tiến hành kiểm định: - Tính t theo công thức: xxnn12− t = SS22 12+ nn12 - Tính tα - So sánh t với tα và kết luận Nếu t # tα thì ta chấp nhận giả thiết H0 Nếu t > tα thì ta bác bỏ giả thiết H0
  287. 2) Nếu n1 hoặc n2 tα thì ta bác bỏ giả thiết H0
  288. Ghi chú: Khi giả thiết H0 bị bác bỏ thì ta kết luận μ1 ≠ μ2 ở mức ý nghĩa α. Tuy nhiên: Nếu xn1 > xn2 thì ta kết luận μ1 > μ2 Nếu xn1 < xn2 thì ta kết luận μ1 < μ2
  289. Ví dụ áp dụng ⚫ Ví dụ 1 ⚫ Từ đám đông thứ nhất người ta lấy một mẫu kích thước là 40; tính được trung bình mẫu là 130. Từ đám đông thứ hai người ta lấy một mẫu kích thước là 50; tính được trung bình mẫu là 140. Biết phương sai của đám đông thứ nhất là 80, của đám đông thứ hai là 100. ⚫ So sánh trung bình của hai đám đông với mức ý nghĩa α = 1%
  290. Giải ⚫ Theo giả thiết của bài toán ta có 2 nx1=40;n 1 = 130; 1 = 80 2 nx2=50;n 2 = 140; 2 = 100  xxnn12− 130− 140 t = = = 5 22 80 100 12 + +  tt 40 50 nn12 =1% t = 2,58  ⚫ Vậy giả thiết H0 bị bác bỏ ở mức ý nghĩa α = 1%
  291. Nhưng xxnn1 2  1 2 ⚫Vậy trung bình của đám đông thứ nhất nhỏ hơn trung bình của đám đông thứ hai
  292. Ví dụ 2 ⚫ Kiểm tra chất lượng của một loại sản phẩm do hai nhà máy sản xuất người ta chọn ngẫu nhiên từ mỗi nhà máy một mẫu gồm 225 sản phẩm và xác định các khuyết tật của mỗi sản phẩm. Ở nhà máy thứ nhất người ta tính số khuyết tật trung bình là 2,3 với phương sai mẫu hiệu chỉnh là 3,24. Ở nhà máy thứ hai người ta tính số khuyết tật trung bình là 2,5 với phương sai mẫu hiệu chỉnh là 4,06. ⚫ So sánh số khuyết tật trung bình của loại sản phẩm do hai nhà máy sản xuất với mức ý nghĩa là α = 5%
  293. Giải ⚫ Gọi μ1, μ2 lần lượt là số khuyết tật trung bình của loại sản phẩm do hai nhà máy 1 và 2 sản xuất. Đặt giả thiết H0:” μ1 = μ2” và kiểm định H0 ở mức ý nghĩa α = 5% ⚫ Từ giả thiết ta có: 2 n1=225; xnn 1 = 2,3; S 1 = 3,24 2 n2=225; xnn 2 = 2,5; S 2 = 4,06
  294. Do n1 và n2 > 30 nên ta tính xxnn12− 2,3− 2,5 0,2 15 3 t = = = = =1,1 SS22 3,24 4,06 7,3 2,7 12+ + 225 225 nn12 =5% t = 1,96 t t Vậy ta chấp nhận giả thiết H0 ở mức ý nghĩa α = 5% Suy ra số khuyết tật trung bình của loại sản phẩm do hai nhà máy là như nhau
  295. Ví dụ 3 ⚫ Hai công ty cùng sản xuất một loại pin viễn thông. Kiểm ta công ty A 10 chiếc thì thấy tuổi thọ trung bình là 4,8 năm, với độ lệch tiêu chuẩn là 1,1 năm; Kiểm ta công ty B 12 chiếc thì thấy tuổi thọ trung bình là 4,3 năm, với độ lệch tiêu chuẩn là 0,9 năm. ⚫ So sánh tuổi thọ trung bình của loại pin viễn thông do hai công ty sản xuất với mức ý nghĩa là α = 5%
  296. Giải ⚫ Gọi μ1, μ2 lần lượt là tuổi thọ trung bình của loại pin do hai công ty A và B sản xuất. Đặt giả thiết H0:” μ1 = μ2” và kiểm định H0 ở mức ý nghĩa α = 1% ⚫ Từ giả thiết ta có: n1=10; xn 1 = 4,8; S 1 = 1,1 n2=12; xn 2 = 4,3; S 2 = 0,9 (n−1) S22 +( n − 1) S 91,1 ( )22 + 110,9 ( ) S 2 =1 1 2 2 = = 0,99 nn12+ −2 10 + 12 − 2
  297. Do n1 và n2 < 30 nên ta tính:  xxnn12− 4,8− 4,3 t = = =1,174 SS 0,99 0,99 nn12+−2 ++  tt nn12 10 12 nn12+−2 20 =5% tt =0,05 = 2,845  Vậy ta chấp nhận giả thiết H0 ở mức ý nghĩa α = 5% Suy ra số tuổi thọ trung bình của loại và B sản xuất là như nhau
  298. 4.2 – So sánh hai tỉ lệ 4.2.1 – Bài toán Cho hai đám đông có các tỉ lệ p1, p2 chưa biết. Đặt một giả thiết H0 : “p1 = p2” Vấn đề đặt ra là: Với mức ý nghĩa α cho trước hãy kiểm tra giả thiết H0 là đúng hay sai Bài toán này được gọi là bài toán so sánh hai tỉ lệ của hai đám đông
  299. 4.2.2 – Phương pháp kiểm định Từ đám đông thứ nhất chọn ra một mẫu có kích thước là n1; tính tỉ lệ mẫu fn1 Từ đám đông thứ hai chọn ra một mẫu có kích thước là n2; tính tỉ lệ mẫu fn2 Tiến hành kiểm định: ffnn12− - Tính t theo công thức: t = 11 ffnn(1−+) nn12 n f+ n f -Với tỉ lệ mẫu chung: 1nn 1 2 2 fn = nn12+
  300. - Tính tα - So sánh t với tα và kết luận: Nếu t # tα thì ta chấp nhận giả thiết H0 Nếu t > tα thì ta bác bỏ giả thiết H0 Ghi chú: Khi giả thiết H0 bị bác bỏ thì ta kết luận p1 ≠ p2 ở mức ý nghĩa α. Tuy nhiên: Nếu fn1 > fn2 thì ta kết luận p1 > p2 Nếu fn1 < fn2 thì ta kết luận p1 < p2
  301. Ví dụ áp dụng ⚫ Công ty nước giải khát Côca – Côla tiến hành cải tiến công thức cho sản phẩm của mình. Với công thức cũ, khi cho 500 người dùng thử thì thấy có 120 người ưa thích nó. Với công thức mới, khi cho 1000 người dùng thử thì thấy có 300 người ưa thích nó. ⚫ So sánh tỷ lệ những người ưa thích Côca – Côla theo hai công thức cũ và mới và đưa ra kết luận về công thức mới ở mức ý nghĩa α = 2%
  302. Giải ⚫ Gọi p1, p2 lần lượt là tỉ lệ những người ưa thích Côca – Côla theo công thức mới và cũ. Đặt giả thiết H0:” p1 = p2” và kiểm định H0 ở mức ý nghĩa α = 2% ⚫ Từ giả thiết ta có: 300 n=1000; m = 300 f = = 0,3 1 1n 1 1000 120 n=500; m = 120 f = = 0,24 2 2n 2 500 n1 fnn 1+ n 2 f 2 1000 0,3 + 500 0,24 f n = = = 0,28 nn12++1000 500
  303. Tính các test thống kê ff−−0,3 0,24 t =nn12 = = 2,4 11 11 ff1−+ 0,28( 1−+ 0,28) nn( ) 1000 500 nn12 =2% t = 2,34 t t Ta bác bỏ H0 ở mức ý nghĩa α = 2% Do fn1 > fn2 nên p1 > p2 do đó tỉ lệ những người ưa thích Côca – Côla theo công thức mới cao hơn. Vậy công thức mới có hiệu quả tốt
  304. §5 – Ví dụ tổng hợp ⚫ Theo dõi chất lượng của một loại sản phẩm do một nhà máy sản suất người ta tiến hành đo tạp chất có trong sản phẩm đó. Kiểm tra trên một số sản phẩm ta thu được kết quả như sau: Löôïng taïp 0,5 1 1,5 2 2,5 3 3,5 chaát(%) soá saûn 100 80 135 40 10 15 20 phaåm
  305. 1) Ước lượng số lượng tạp chất trung bình có trong loại sản phẩm trên với độ tin cậy là 98% 2) Những sản phẩm có lượng tạp chất dưới 1% là những sản phẩm loại A. Biết rằng số sản phẩm do nhà máy sản suất ra là 20000 sản phẩm, hãy ước lượng số sản phẩm loại A do nhà máy sản suất với độ tin cậy 96%. 3) Khi ước lượng trọng lượng trung bình của loại sản phẩm do nhà máy sản suất có độ chính xác là 0,06 thì độ tin cậy của ước lượng là bao nhiêu? 4) Tiến hành khảo sát 600 sản phẩm cùng loại do nhà máy thứ hai sản suất người ta thấy có 240 sản phẩm loại A. Với mức ý nghĩa 2% có kết luận được tỉ lệ sản phẩm loại A của hai nhà máy bằng nhau được hay không?
  306. Giaûi ⚫ 1) Tính toaùn treân maãu ta thu ñöôïc keát quaû nhö sau 2 n=400;  ni x i = 552,25; n i x i = 1011,25; 11 x= n x =1,38; x22 = n x = 2,53 nni i i i 2 S22= x −( x) = 0,620 S = 0,788 n SS22==0,623 n −1 S = 0,789 180 f ==0,45 n 400
  307. 2) Giaûi quyeát caùc yeâu caàu cuûa baøi toaùn ⚫ a) Gọi μ là ước lượng số lượng tạp chất trung bình có trong loại sản phẩm trên với độ tin cậy là 98% ta thấy: n = 400 > 30 nên ta có công thức ước lượng: S 0,789 , =xt  ,  = 1,38 2,34 1 2 n 1 2 400 0,789  ==2,34 0,092 400 1 =1,38 − 0,092 = 1,288 1,288  1,472( 98%) 2 =1,38 + 0,092 = 1,472
  308. b) Gọi p là ước lượng tỉ lệ những sản phẩm loại A ta có công thức ước lượng: ff(1− ) 0,45(1− 0,45) p, p== f t nn 0,45 2,06 12 n n 400 0,45(1− 0,45)  ==2,06 0,05 400 p1 =0,45 − 0,05 = 0,4 0,4 p 0,5(96%) p2 =+=0,45 0,05 0,5 ⚫ Gọi P là số sản phẩm loại A ta có ước lượng: 0,4 20000 P 0,5 20000 8000 sp P 10000 sp (96%)
  309. ⚫ c) Theo công thức ước lượng trung bình đám đông ta có: 2 SS2 =tt 2 = ( ) n n 22 2 n 400 (0,06) (t ) = = = 2,311 S 2 0,623 tt =1,52 ( ) =( 1,52) = 0,4357 1 − = 2(t ) = 2 0,4357 = 0,8714(87,14%)
  310. d) Theo đề ra ta có: 180 240 n=400, f = = 0,45 vaø n = 600, f = = 0,4 1nn 1400 2 2 600 Gọi p1 và p2 lần lượt là tỷ lệ sản phẩm loại A của hai nhà máy. Đặt giả thiết H0: “p1 = p2” ta kiểm định giả thiết trên với mức ý nghĩa 1%
  311. Ta có n1 fnn 1+ n 2 f 2 400 0,45 + 600 0,4 fn = = = 0,42 nn12++400 600 ff−−0,45 0,40 t =nn12 = =1,569 11 11 ff1−+ 0,42(1−+ 0,42) nn( ) 400 600 nn12 =1% t = 2,58 t t ⚫Vậy ta chấp nhận giả thiết H0 với mức ý nghĩa 1%, nghĩa là tỷ lệ sản phẩm loại A của hai nhà máy là như nhau