Bài giảng Xác xuất thống kê và ứng dụng - Chương XI: Kiểm định Chi-bình phương - Nguyễn Phi Nhung

pdf 49 trang phuongnguyen 3520
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác xuất thống kê và ứng dụng - Chương XI: Kiểm định Chi-bình phương - Nguyễn Phi Nhung", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_xac_xuat_thong_ke_va_ung_dung_chuong_xi_kiem_dinh.pdf

Nội dung text: Bài giảng Xác xuất thống kê và ứng dụng - Chương XI: Kiểm định Chi-bình phương - Nguyễn Phi Nhung

  1. B i giÊng XĂc suĐt Thống kả v ựng dửng Nguyạn Thà Nhung Bở mổn ToĂn - Ôi hồc TH‹NG LONG Ng y 29 thĂng 8 nôm 2011 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 1 / 42
  2. Chữỡng XI Kiºm ành Chi-bẳnh phữỡng Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 2 / 42
  3. Chữỡng XI 1 Kiºm ành chi-bẳnh phữỡng Kiºm chựng tẵnh ởc lêp Kiºm chựng mực phũ hủp cừa mởt phƠn phối Kiºm chựng phƠn phối chuân Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 3 / 42
  4. Kiºm chựng tẵnh ởc lêp Trong thỹc tá nhiãu khi ta g°p mởt số tẳnh huống ỏi họi phÊi tẳm hiºu mối liản hằ giỳa cĂc bián ành tẵnh, ch¯ng hÔn Cõ hay khổng cõ mối liản hằ giỳa thới gian nghe nhÔc v kát quÊ hồc têp? Cõ ngữới yảu cõ Ênh hữðng án kát quÊ hồc têp hay khổng? Cõ mối liản hằ giỳa ở bãn cừa mởt cuởc hổn nhƠn vợi thới gian yảu nhau trữợc khi kát hổn hay khổng? Giợi tẵnh cõ Ênh hữðng án viằc thuên tay trĂi n o hay khổng? Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 4 / 42
  5. Nởi dung trẳnh b y 1 Kiºm ành chi-bẳnh phữỡng Kiºm chựng tẵnh ởc lêp Kiºm chựng mực phũ hủp cừa mởt phƠn phối Kiºm chựng phƠn phối chuân Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 5 / 42
  6. Kiºm chựng tẵnh ởc lêp B i toĂn Ta x²t hai bián ành tẵnh v muốn kiºm tra xem mối quan hằ giỳa chúng l ởc lêp hay phử thuởc. º thỹc hiằn viằc n y ta kiºm ành c°p giÊ thuyát sau: H0 : Hai bián ành tẵnh ởc lêp (hay khổng cõ mối liản hằ giỳa hai bián n y); H1 : Hai bián ành tẵnh khổng ởc lêp (cõ mối liản hằ giỳa hai bián n y). Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 6 / 42
  7. Qui trẳnh thỹc hiằn GiÊ sỷ bián ành tẵnh thự nhĐt gỗm r loÔi, bián ành tẵnh thự hai gỗm c loÔi. Chồn tứ tờng thº ra mău gỗm n phƯn tỷ xáp ch²o th nh r  c giĂ trà Oij, i  1, , r; j  1, , c, trong õ Oij l số quan sĂt cõ thuởc tẵnh thự i cừa bián thự nhĐt v thuởc tẵnh thự j cừa bián thự hai. Khi õ ta cõ bÊng sau: Bián Bián thự hai thự nhĐt 1 2 3 . . . c Tờng 1 O11 O12 O13 O1c R1 2 O21 O22 O23 O2c R2 . . . . . . . . . . . . . . r Or1 Or2 Or3 Orc Rr Tờng C1 C2 C3 Cc n Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 7 / 42
  8. Qui trẳnh thỹc hiằn GiÊ sỷ H0 úng, khi õ tƯn số lẵ thuyát Eij cừa ổ ð àa ch¿ ij ữủc tẵnh theo cổng thực: R  C E  i j ij n . Ta cõ giĂ trà kiºm ành: ár ác pO Ă E q2 2  ij ij χ E . i1 j1 ij 2 Náu giÊ thuyát H0 úng v Eij Ơ 5, @i, j thẳ χ tuƠn theo phƠn phối chi- bẳnh phữỡng vợi pr Ă 1qpc Ă 1q bêc tỹ do. So sĂnh giĂ trà kiºm ành vợi 2 , tÔi mực ỵ nghắa ta ữa χprĂ1qpcĂ1q,α α ra quyát ành bĂc bọ H0 náu 2 Ă 2 χ χprĂ1qpcĂ1q,α. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 8 / 42
  9. Vẵ dử B i toĂn Mởt nh nghiản cựu cho rơng iºm cừa cĂc hồc sinh phử thuởc v o số lữủng thới gian chúng nghe nhÔc. Mởt mău ngău nhiản gỗm 400 hồc sinh ữủc chồn v ữủc xáp lợp ch²o giỳa iºm trung bẳnh cuối nôm vợi thới gian nghe nhÔc h ng tuƯn nhữ sau: Thới gian iºm trung bẳnh nghe nhÔc XuĐt sưc Giọi KhĂ Trung bẳnh K²m Tờng 20h 8 11 41 24 11 95 Tờng 50 75 150 75 50 400 é mực ỵ nghắa α  5% hÂy kiºm tra xem iºm trung bẳnh cõ phử thuởc v o thới gian nghe nhÔc hay khổng. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 9 / 42
  10. Vẵ dử °t c°p giÊ thuyát cho b i toĂn: CĂc giĂ trà tƯn số lẵ thuyát Eij ữủc cho tữỡng ựng trong bÊng sau: Thới gian iºm trung bẳnh nghe nhÔc XuĐt sưc Giọi KhĂ Trung bẳnh K²m 20h 11.875 17.8125 35.625 17.8125 11.875 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 10 / 42
  11. Vẵ dử °t c°p giÊ thuyát cho b i toĂn: CĂc giĂ trà tƯn số lẵ thuyát Eij ữủc cho tữỡng ựng trong bÊng sau: Thới gian iºm trung bẳnh nghe nhÔc XuĐt sưc Giọi KhĂ Trung bẳnh K²m 20h 11.875 17.8125 35.625 17.8125 11.875 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 10 / 42
  12. Vẵ dử Tẵnh toĂn giĂ trà kiºm ành ár ác pO Ă E q2 2  ij ij  63 8296 χ E . . i1 j1 ij GiĂ trà tợi hÔn 2  2  21 02607. χprĂ1qpcĂ1q,α χ12,0.05 . Kát luên: Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 11 / 42
  13. Vẵ dử Tẵnh toĂn giĂ trà kiºm ành ár ác pO Ă E q2 2  ij ij  63 8296 χ E . . i1 j1 ij GiĂ trà tợi hÔn 2  2  21 02607. χprĂ1qpcĂ1q,α χ12,0.05 . Kát luên: Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 11 / 42
  14. Thỹc hiằn kiºm ành tẵnh ởc lêp trong R º kiºm chựng tẵnh ởc lêp trong R, ta dũng h m chisq.test(A), trong õ A l ma trên ch¿ bÊng gỗm cĂc quan sĂt cừa hai thuởc tẵnh cƯn kiºm ành tẵnh ởc lêp. º lêp ữủc mởt ma trên cĐp m  n ta dũng h m matrix(x, nrow = m, ncol = n, byrow = FALSE, dimnames = NULL), trong õ x l v²c tỡ ch¿ cĂc phƯn tỷ cừa ma trên; nrow = m l tham số ch¿ số h ng bơng m cừa ma trên; ncol = n l tham số ch¿ số cởt bơng n cừa ma trên; byrow = FALSE (TRUE) l tham số ch¿ viằc sưp xáp cĂc phƯn tỷ trong v²c tỡ x theo cởt (h ng) trữợc, m°c ành l FALSE tực l theo cởt trữợc; dimnames l tham số ghi tản cởt v h ng cừa ma trên, m°c ành l NULL. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 12 / 42
  15. Thỹc hiằn kiºm ành tẵnh ởc lêp trong R Trong vẵ dử vã kiºm chựng xem iºm trung bẳnh v thới gian nghe nhÔc cõ phử thuởc v o nhau hay khổng, ta thỹc hiằn trong R nhữ sau: Thiát lêp ma trên: > SoHocSinhTheoCot = c(13, 20, 9, 8, 10, 27, 27, 11, 11, 27, 71, 41, 16, 19, 16, 24, 5, 2, 32, 11) > A = matrix(SoHocSinhTheoCot, nrow = 4) Ho°c > SoHocSinhTheoDong = c(13, 10, 11, 16, 5, 20, 27, 27, 19, 2, 9, 27, 71, 16, 32, 8, 11, 41, 24, 11) > A = matrix(SoHocSinhTheoDong, nrow = 4, byrow = T) Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 13 / 42
  16. Thỹc hiằn kiºm ành tẵnh ởc lêp trong R Kát quÊ trong R cho ta: > A r, 1s r, 2s r, 3s r, 4s r, 5s r1, s 13 10 11 16 5 r2, s 20 27 27 19 2 r3, s 9 27 71 16 32 r4, s 8 11 41 24 11 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 14 / 42
  17. Thỹc hiằn kiºm ành tẵnh ởc lêp trong R º thảm tản cừa cĂc cởt v dỏng cừa ma trên trản, ta thỹc hiằn lằnh: > A = matrix(SoHocSinhTheoDong, nrow = 4, byrow = T, dimnames = list(c(" 20h"), c("XuatSac", "Gioi", "Kha", "TrungBinh", "Kem"))) Kát quÊ trong R cho ta: > A XuatSac Gioi Kha TrungBinh Kem 20h 8 11 41 24 11 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 15 / 42
  18. Thỹc hiằn kiºm ành tẵnh ởc lêp trong R Thỹc hiằn kiºm ành: > chisq.test(A) > Pearson's Chi-squared test > data: A > X-squared = 63.8296, df = 12, p-value = 4.483e-09 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 16 / 42
  19. Nởi dung trẳnh b y 1 Kiºm ành chi-bẳnh phữỡng Kiºm chựng tẵnh ởc lêp Kiºm chựng mực phũ hủp cừa mởt phƠn phối Kiºm chựng phƠn phối chuân Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 17 / 42
  20. Kiºm chựng mực phũ hủp cừa mởt phƠn phối Khi tián h nh thỹc hiằn cĂc b i toĂn xĂc suĐt ho°c thống kả, ta thữớng giÊ sỷ rĐt nhiãu giÊ thiát, ch¯ng hÔn: GiÊ sỷ quƠn xúc xưc l cƠn ối v ỗng chĐt; GiÊ sỷ ch¿ số IQ cừa dƠn chúng tuƠn theo phƠn phối chuân vợi trung bẳnh à  100 v phữỡng sai σ  15; GiÊ sỷ số ngữới án trung tƠm bữu iằn th nh phố trong khoÊng thới gian tứ 12h án 13h tuƠn theo phƠn phối Poisson vợi λ  10; GiÊ sỷ số d°m m mởt chiác ổ tổ i ữủc cho án khi khổng sỷ dửng 1 ữủc nỳa tuƠn theo phƠn phối mụ vợi  . λ 20 L m thá n o º ta cõ thº ữa ra ữủc nhỳng giÊ sỷ nhữ trản º thỹc hiằn cĂc b i toĂn? Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 18 / 42
  21. Kiºm chựng mực phũ hủp cừa mởt phƠn phối CƠu họi tẳnh huống (London nguy hiºm hay an to n?) Ng y 10/07/1008, cõ bốn vử Ăn mÔng bơng dao xÊy ra ð bốn nỡi khĂc nhau ð London. Sỹ kiằn n y l m nĂo loÔn dữ luên án mực thừ tữợng Anh l Gordon Brown phÊi tuyản bố hựa s³ tẳm cĂch l m giÊm cĂc vử Ơm dao. London cõ trð nản nguy hiºm cho tẵnh mÔng hỡn nhỳng nôm trữợc khổng? º trÊ lới cƠu họi n y, cĂc nh iãu tra x hởi hồc thống kả ữủc nhỳng dỳ liằu sau: Trong 5 nôm trữợc õ, mội nôm London cõ khoÊng 170 ngữới bà giát, v con số n y khĂ ờn ành h ng nôm; KhoÊng 41% cĂc vử giát ngữới dũng dao, 17% dũng súng, 9% l Ănh êp khổng vụ khẵ, 5% l Ănh bơng vêt khổng phÊi l dao, 3% l bõp cờ, 3% l dũng thuốc ởc, v 17% l khổng xĂc ành ữủc phữỡng phĂp; Trong thới gian ba nôm 04{2004 Ă 03{2007, cõ 713 ng y khổng cõ Ăn mÔng n o, 299 ng y cõ 1 vử, 66 ng y cõ 2 vử, 16 ng y cõ 3 vử v khổng ng y n o cõ tứ 5 vử trð lản. Tứ nhỳng số liằu thống kả trản cõ thº tẳm ữủc qui luêt vã số vử Ăn mÔng ð London khổng? V sỹ kiằn xÊy ra ng y 10/07/2008 cõ cho thĐy xu hữợng gẳ mợi khổng, hay ch¯ng qua l ch¿ l mởt hiằn tữủng ngău nhiản khổng nơm ngo i qui luêt chung? Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 19 / 42
  22. Kiºm ành vã qui luêt phƠn phối xĂc suĐt cừa tờng thº B i toĂn GiÊ sỷ ta chữa biát qui luêt phƠn phối xĂc suĐt cừa tờng thº, ta cƯn kiºm ành xem phƠn phối cừa tờng thº cõ tuƠn theo mởt qui luêt xĂc suĐt A n o õ khổng bơng cĂch kiºm ành c°p giÊ thuyát sau: H0 : Tờng thº tuƠn theo qui luêt xĂc suĐt A; H1 : Tờng thº khổng tuƠn theo qui luêt xĂc suĐt A. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 20 / 42
  23. Qui trẳnh thỹc hiằn Chồn mởt mău ngău nhiản gỗm n phƯn tỷ m mội phƯn tỷ ữủc xáp v o úng mởt trong k lợp. Gồi O1, O2, , Ok lƯn lữủt l số phƯn tỷ rỡi v o k lợp trản. Náu H0 úng, tực l tờng thº tuƠn theo qui luêt xĂc suĐt A, thẳ xĂc suĐt º mởt phƯn tỷ rỡi v o lợp 1, 2, , k lƯn lữủt l p1, p2, , pk vợi p1 p2 pk  1. Khi õ số phƯn tỷ kẳ vồng theo k lợp õ s³ l Ei  npi , i  1, 2, , k. Lợp 1 2 . . . k Tờng Số phƯn tỷ quan sĂt O1 O2 Ok n XĂc suĐt theo H0 p1 p2 pk 1 Số phƯn tỷ theo H0 E1  np1 E2  np2 Ek  npk n Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 21 / 42
  24. Qui trẳnh thỹc hiằn Chồn mởt mău ngău nhiản gỗm n phƯn tỷ m mội phƯn tỷ ữủc xáp v o úng mởt trong k lợp. Gồi O1, O2, , Ok lƯn lữủt l số phƯn tỷ rỡi v o k lợp trản. Náu H0 úng, tực l tờng thº tuƠn theo qui luêt xĂc suĐt A, thẳ xĂc suĐt º mởt phƯn tỷ rỡi v o lợp 1, 2, , k lƯn lữủt l p1, p2, , pk vợi p1 p2 pk  1. Khi õ số phƯn tỷ kẳ vồng theo k lợp õ s³ l Ei  npi , i  1, 2, , k. Lợp 1 2 . . . k Tờng Số phƯn tỷ quan sĂt O1 O2 Ok n XĂc suĐt theo H0 p1 p2 pk 1 Số phƯn tỷ theo H0 E1  np1 E2  np2 Ek  npk n Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 21 / 42
  25. Qui trẳnh thỹc hiằn Náu H0 úng v cù mău lợn sao cho Ei  npi Ơ 5, @i  1, k thẳ bián ngău nhiản ák pO Ă E q2 2  i i χ E i1 i tuƠn theo phƠn phối xĐp x¿ phƠn phối chi- bẳnh phữỡng vợi k Ă m Ă 1 bêc tỹ do, trong õ m l số tham số tờng thº ữợc lữủng tứ dỳ liằu mău. TÔi mực ỵ nghắa α, giÊ thuyát H0 bà bĂc bọ náu ák pO Ă E q2 2  i i Ă 2 χ E χkĂmĂ1,α. i1 i Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 22 / 42
  26. Qui trẳnh thỹc hiằn Náu H0 úng v cù mău lợn sao cho Ei  npi Ơ 5, @i  1, k thẳ bián ngău nhiản ák pO Ă E q2 2  i i χ E i1 i tuƠn theo phƠn phối xĐp x¿ phƠn phối chi- bẳnh phữỡng vợi k Ă m Ă 1 bêc tỹ do, trong õ m l số tham số tờng thº ữợc lữủng tứ dỳ liằu mău. TÔi mực ỵ nghắa α, giÊ thuyát H0 bà bĂc bọ náu ák pO Ă E q2 2  i i Ă 2 χ E χkĂmĂ1,α. i1 i Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 22 / 42
  27. Vẵ dử B i toĂn º kiºm ành xem quƠn xúc xưc cõ cƠn ối v ỗng chĐt hay khổng, ngữới ta tián h nh tung con xúc xưc 120 lƯn v nhên ữủc kát quÊ nhữ sau: Số chĐm 1 2 3 4 5 6 Tờng Số lƯn tung 28 14 26 18 15 19 120 TÔi mực ỵ nghắa α  5% cõ thº kát luên con xúc xưc l cƠn ối v ỗng chĐt hay khổng? Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 23 / 42
  28. Vẵ dử Lới giÊi: °t c°p giÊ thuyát: GiÊ sỷ con xúc xưc l cƠn ối, ỗng chĐt tực l H0 úng thẳ trong 120 lƯn tung số lƯn xuĐt hiằn m°t i chĐm s³ l : 1 E  120   20 i  1 6. i 6 , , , BÊng mổ tÊ mối quan hằ giỳa số lƯn tung quan sĂt v số lƯn tung kẳ vồng: Số chĐm 1 2 3 4 5 6 Số lƯn tung quan sĂt pOi q 28 14 26 18 15 19 XĂc suĐt kẳ vồng ppi q 1/6 1/6 1/6 1/6 1/6 1/6 Số lƯn tung kẳ vồng Ei 20 20 20 20 20 20 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 24 / 42
  29. Vẵ dử Lới giÊi: °t c°p giÊ thuyát: GiÊ sỷ con xúc xưc l cƠn ối, ỗng chĐt tực l H0 úng thẳ trong 120 lƯn tung số lƯn xuĐt hiằn m°t i chĐm s³ l : 1 E  120   20 i  1 6. i 6 , , , BÊng mổ tÊ mối quan hằ giỳa số lƯn tung quan sĂt v số lƯn tung kẳ vồng: Số chĐm 1 2 3 4 5 6 Số lƯn tung quan sĂt pOi q 28 14 26 18 15 19 XĂc suĐt kẳ vồng ppi q 1/6 1/6 1/6 1/6 1/6 1/6 Số lƯn tung kẳ vồng Ei 20 20 20 20 20 20 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 24 / 42
  30. Vẵ dử Lới giÊi: GiĂ trà thống kả ữủc cho bði: ák pO Ă E q2 p28 Ă 20q2 p14 Ă 20q2 2  i i  χ E 20 20 i1 i p26 Ă 20q2 p18 Ă 20q2 p15 Ă 20q2 p19 Ă 20q2  8 3 20 20 20 20 . . Bêc tỹ do cừa kiºm ành chi- bẳnh phữỡng l k-1 = 6-1 = 5. Vợi  5 ta cõ 2  11 07. Do 8 3 Ă 11 07 nản chĐp nhên giÊ α % χ5,0.05 . . . thuyát H0. Nhữ vêy ta cõ ừ bơng chựng thống kả º cho rơng con xúc xưc l cƠn ối v ỗng chĐt. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 25 / 42
  31. Vẵ dử B i toĂn Mởt cổng ty thữỡng mÔi dỹa v o kinh nghiằm quĂ khự  xĂc ành rơng v o cuối nôm thẳ 80% số hõa ỡn  ữủc thanh toĂn Ưy ừ, 10% khĐt lÔi mởt thĂng, 6% khĐt lÔi hai thĂng v 4% khĐt lÔi trản hai thĂng. V o cuối nôm nay cổng ty kiºm tra mởt mău ngău nhiản gỗm 400 hõa ỡn, ta thĐy 287 ữủc thanh toĂn Ưy ừ, 49 khĐt lÔi mởt thĂng, 30 khĐt lÔi hai thĂng v 34 khĐt lÔi trản hai thĂng. TÔi mực ỵ nghắa α  5%, nhỳng dỳ liằu n y gủi ỵ rơng mổ thực cừa nôm nay cõ cỏn giống nhỳng nôm trữợc nỳa khổng? Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 26 / 42
  32. Vẵ dử Lới giÊi: °t c°p giÊ thuyát: GiÊ sỷ H0 úng thẳ số hõa ỡn kẳ vồng rỡi v o cĂc loÔi tứ mău gỗm 400 hõa ỡn s³ l : E1  400  0.8  320, E2  400  0.1  40, E3  400  0.06  24, E4  400  0.04  16. BÊng mổ tÊ mối quan hằ giỳa số hõa ỡn quan sĂt v số hõa ỡn kẳ vồng: Số thĂng khĐt lÔi 0 1 2 >2 Tờng Số hõa ỡn quan sĂt pOi q 287 49 30 34 400 XĂc suĐt kẳ vồng ppi q 0.8 0.1 0.06 0.04 1 Số hõa ỡn kẳ vồng pEi q 320 40 24 16 400 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 27 / 42
  33. Vẵ dử Lới giÊi: °t c°p giÊ thuyát: GiÊ sỷ H0 úng thẳ số hõa ỡn kẳ vồng rỡi v o cĂc loÔi tứ mău gỗm 400 hõa ỡn s³ l : E1  400  0.8  320, E2  400  0.1  40, E3  400  0.06  24, E4  400  0.04  16. BÊng mổ tÊ mối quan hằ giỳa số hõa ỡn quan sĂt v số hõa ỡn kẳ vồng: Số thĂng khĐt lÔi 0 1 2 >2 Tờng Số hõa ỡn quan sĂt pOi q 287 49 30 34 400 XĂc suĐt kẳ vồng ppi q 0.8 0.1 0.06 0.04 1 Số hõa ỡn kẳ vồng pEi q 320 40 24 16 400 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 27 / 42
  34. Vẵ dử Lới giÊi: GiĂ trà thống kả ữủc cho bði: ák pO Ă E q2 p287 Ă 320q2 p49 Ă 40q2 2  i i  χ E 320 40 i1 i p30 Ă 24q2 p34 Ă 16q2  27 178 24 16 . . Bêc tỹ do cừa kiºm ành chi- bẳnh phữỡng l k-1 = 4-1 = 3. Vợi  5 ta cõ 2  7 81. Do 27 178 Ă 7 81 nản giÊ thuyát H bà α % χ3,0.05 . . . 0 bĂc bọ. Nhữ vêy ta cõ bơng chựng thống kả º cho rơng mổ thực cừa nhỳng nôm nay khổng cỏn tuƠn theo nhỳng nôm trữợc. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 28 / 42
  35. Vẵ dử B i toĂn º iãu tra xem số vử Ăn mÔng trong ng y ð London cõ tuƠn theo phƠn phối Poisson hay khổng, ngữới ta iãu tra số vử Ăn mÔng xÊy ra tứ 04/2004 án 03/2007 v thu ữủc bÊng số liằu sau: Số vử Ăn mÔng 0 1 2 Ơ 3 Tờng Số ng y 713 299 66 17 1095 TÔi mực ỵ nghắa α  5%, hÂy kiºm ành xem số vử Ăn mÔng h ng ng y ð London cõ tuƠn theo phƠn phối Poisson hay khổng? Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 29 / 42
  36. Vẵ dử Lới giÊi: Gồi X l bián ngău nhiản ch¿ số vử Ăn mÔng trong ng y ð London. C°p giÊ thuyát H0, H1 ữủc ữa ra l : Tứ bÊng dỳ liằu ta cõ trung bẳnh mău l 0  713 1  299 2  66 3  17 x   0 44 1095 . . Ta s³ kiºm tra X cõ tuƠn theo phƠn phối Poisson vợi tham số λ ữợc lữủng bơng x  0.44. Náu X tuƠn theo phƠn phối Poisson vợi λ  0.44 thẳ ta cõ p1  PpX  0q  0.6440, p2  PpX  1q  0.2834, p3  PpX  2q  0.0623, p4  1 Ă p0 Ă p1 Ă p2  0.0103; E1  np1  705.1800, E2  np2  310.3230, E3  np3  68.2185, E4  np4  11.2785. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 30 / 42
  37. Vẵ dử Lới giÊi: Gồi X l bián ngău nhiản ch¿ số vử Ăn mÔng trong ng y ð London. C°p giÊ thuyát H0, H1 ữủc ữa ra l : Tứ bÊng dỳ liằu ta cõ trung bẳnh mău l 0  713 1  299 2  66 3  17 x   0 44 1095 . . Ta s³ kiºm tra X cõ tuƠn theo phƠn phối Poisson vợi tham số λ ữợc lữủng bơng x  0.44. Náu X tuƠn theo phƠn phối Poisson vợi λ  0.44 thẳ ta cõ p1  PpX  0q  0.6440, p2  PpX  1q  0.2834, p3  PpX  2q  0.0623, p4  1 Ă p0 Ă p1 Ă p2  0.0103; E1  np1  705.1800, E2  np2  310.3230, E3  np3  68.2185, E4  np4  11.2785. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 30 / 42
  38. Vẵ dử Lới giÊi: BÊng mổ tÊ mối quan hằ giỳa số tƯn số quan sĂt v kẳ vồng: ố vử Ăn mÔng 0 1 2 Ơ 3 Tờng Số ng y 713 299 66 17 1095 XĂc suĐt kẳ vồng ppi q 0.6440 0.2834 0.0623 0.0103 1 Số tứ kẳ vồng pEi q 705.1800 310.3230 68.2185 11.2785 1095 GiĂ trà thống kả ữủc cho bði: ák pO Ă E q2 2  i i  3 475 χ E . . i1 i Do cõ m = 1 tham số λ ữủc ữợc lữủng nản bêc tỹ do cừa kiºm ành chi- bẳnh phữỡng l k- m - 1 = 4 - 1 - 1 = 2. Vợi α  5% ta cõ 2  5 99. Do 3 475 5 99 nản chĐp nhên giÊ thuyát H . Nhữ χ2,0.05 . . . 0 vêy ta cõ bơng chựng thống kả º cho rơng số vử Ăn mÔng h ng ng y London tuƠn theo phƠn phối Poisson. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 31 / 42
  39. Thỹc hiằn kiºm chựng mực phũ hủp trong R Thỹc hiằn kiºm chựng mực phũ hủp trong R, ta dũng h m chisq.test(x, p = p0), trong õ x l v²c tỡ ch¿ cĂc quan sĂt, p0 l v²c tỡ xĂc suĐt ch¿ qui luêt phƠn phối cừa tờng thº. Trong vẵ dử B i toĂn Mởt cổng ty thữỡng mÔi dỹa v o kinh nghiằm quĂ khự  xĂc ành rơng v o cuối nôm thẳ 80% số hõa ỡn  ữủc thanh toĂn Ưy ừ, 10% khĐt lÔi mởt thĂng, 6% khĐt lÔi hai thĂng v 4% khĐt lÔi trản hai thĂng. V o cuối nôm nay cổng ty kiºm tra mởt mău ngău nhiản gỗm 400 hõa ỡn, ta thĐy 287 ữủc thanh toĂn Ưy ừ, 49 khĐt lÔi mởt thĂng, 30 khĐt lÔi hai thĂng v 34 khĐt lÔi trản hai thĂng. TÔi mực ỵ nghắa α  5%, nhỳng dỳ liằu n y gủi ỵ rơng mổ thực cừa nôm nay cõ cỏn giống nhỳng nôm trữợc nỳa khổng? Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 32 / 42
  40. Thỹc hiằn kiºm chựng mực phũ hủp trong R ta thỹc hiằn trong R nhữ sau > chisq.test(c(287, 49, 30, 34), p = c(0.8, 0.1, 0.06, 0.04)) Kát quÊ trong R cho ta Chi-squared test for given probabilities data: c(287, 49, 30, 34) X-squared = 27.1781, df = 3, p-value = 5.402e-06 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 33 / 42
  41. Thỹc hiằn kiºm chựng mực phũ hủp trong R Trong vẵ dử B i toĂn º iãu tra xem số vử Ăn mÔng trong ng y ð London cõ tuƠn theo phƠn phối Poisson hay khổng, ngữới ta iãu tra số vử Ăn mÔng xÊy ra tứ 04/2004 án 03/2007 v thu ữủc bÊng số liằu sau: Số vử Ăn mÔng 0 1 2 Ơ 3 Tờng Số ng y 713 299 66 17 1095 TÔi mực ỵ nghắa α  5%, hÂy kiºm ành xem số vử Ăn mÔng h ng ng y ð London: a. cõ tuƠn theo phƠn phối Poisson vợi λ  0.44 khổng? b. cõ tuƠn theo phƠn phối Poisson khổng? Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 34 / 42
  42. Thỹc hiằn kiºm chựng mực phũ hủp trong R ta thỹc hiằn cƠu paq trong R nhữ sau > p0 = c(dpois(0:2, lambda = 0.44), 1-sum(dpois(0:2, lambda = 0.44))) > chisq.test(c(713, 299, 66, 17), p = p0) Kát quÊ trong R cho ta Chi-squared test for given probabilities data: c(713, 299, 66, 17) X-squared = 3.5523, df = 3, p-value = 0.3140 Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 35 / 42
  43. Thỹc hiằn kiºm chựng mực phũ hủp trong R ta thỹc hiằn cƠu pbq trong R nhữ sau > m = mean(rep(c(0,1,2,3), c(713, 299, 66, 17))) > p0 = c(dpois(0:2, lambda = m), 1-sum(dpois(0:2, lambda = m))) > E  sumpOq Ư p0 > sumppO Ă Eq2{Eq > r1s 3.474492 > qchisq(0.95, 2) > r1s 5.991465 Kát quÊ trong R cho ta Do 3.474492 < 5.991456 nản ta chĐp nhên H0, tực l ta cõ ừ bơng chựng thống kả º cho rơng số vử Ăn mÔng hơng ng y ð London tuƠn theo phƠn phối Poisson. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 36 / 42
  44. Nởi dung trẳnh b y 1 Kiºm ành chi-bẳnh phữỡng Kiºm chựng tẵnh ởc lêp Kiºm chựng mực phũ hủp cừa mởt phƠn phối Kiºm chựng phƠn phối chuân Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 37 / 42
  45. Kiºm chựng phƠn phối chuân GiÊ sỷ ta cõ mởt mău ngău nhiản gỗm n phƯn tỷ, ta cƯn kiºm tra xem têp dỳ liằu n y cõ phÊi chồn tứ mởt tờng thº tuƠn theo phƠn phối chuân hay khổng. º thỹc hiằn viằc n y ta kiºm ành c°p giÊ thuyát: H0 : Tờng thº tuƠn theo phƠn phối chuân; H1 : Tờng thº khổng tuƠn theo phƠn phối chuân. Ta cõ thº kiºm ành theo mởt trong hai cĂch sau: Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 38 / 42
  46. Kiºm chựng phƠn phối chuân CĂch 1: Dỹa trản qui luêt phƠn phối xĂc suĐt Xáp cĂc phƯn tỷ cừa mău v o cĂc khoÊng phũ hủp, giÊ sỷ khoÊng thự i cõ Oi phƯn tỷ cừa mău; ìợc tẵnh cĂc tham số à v σ theo mău (náu chữa biát); Tẵnh cĂc giĂ trà xĂc suĐt pi theo H0 v tƯn số Ei theo H0; Tẵnh giĂ trà thống kả: ák pO Ă E q2 2  i i χ E . i1 i TÔi mực ỵ nghắa ta quyát ành bĂc bọ H náu 2 Ă 2 (ữợc α 0 χ χkĂ2Ă1,α lữủng ) ho°c 2 Ă 2 (khổng cƯn ữợc lữủng ). à, σ χ χkĂ1,α à, σ Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 39 / 42
  47. Kiºm chựng phƠn phối chuân (Bowman-Shelton) CĂch 2: Kiºm chựng Bowman-Shelton Kiºm chựng n y dỹa trản hai °c trững cừa phƠn phối chuân thổng qua hai hằ số ở nghiảng (Skewness) v hằ số o ở nhồn (Kurtosis). °c trững thự nhĐt cừa phƠn phối chuân l tẵnh ối xựng qua trung bẳnh. °c trững n y thº hiằn qua hằ số o ở nghiảng bơng 0: ° n px Ă xq3{n Skewness  i1 i s3 , trong õ x, s l trung bẳnh v ở lằch chuân cừa mău. °c trững thự hai cừa phƠn phối chuân l hằ thực giỳa ở ph¯ng cừa cĂc phƯn uổi cừa phƠn phối so vợi phƯn trung tƠm thº hiằn qua hằ số Kurtosis bơng 3: ° n px Ă xq4{n Kurtosis  i1 i s4 , trong õ x, s l trung bẳnh v ở lằch chuân cừa mău. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 40 / 42
  48. Kiºm chựng phƠn phối chuân (Bowman-Shelton) GiĂ trà thống kả cừa ph²p kiºm ành l Skewness2 pKurtosis Ă 3q2 ă B  n 6 24 . Náu H0 úng v cù mău lợn thẳ B s³ cõ phƠn phối chi-bẳnh phữỡng vợi 2 bêc tỹ do. Náu cù mău nhọ thẳ ta s³ so sĂnh B vợi giĂ trà tữỡng ựng trong bÊng giĂ trà Bowman-Shelton. Trong trữớng hủp cù mău rĐt lợn, ta s³ bĂc bọ H náu B Ă 2 , náu 0 χ2,α cù mău nhọ ta s³ bĂc bọ H0 náu B lợn hỡn giĂ trà tữỡng ựng trong bÊng giĂ trà Bowman-Shelton. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 41 / 42
  49. Thỹc hiằn kiºm ành phƠn phối chuân trong R º kiºm chựng phƠn phối chuân trong R ta dũng h m shapiro.test(x), trong õ x l v²c tỡ dỳ liằu. Ch¯ng hÔn vợi dỳ liằu vã iºm thi ToĂn khối A nôm 2008, ta cõ thº thỹc hiằn > shapiro.test(ToanAmoi) Kát quÊ trong R cho ta > Shapiro-Wilk normality test > data: ToanAmoi > W = 0.953, p-value < 2.2e-16 Tứ p-giĂ trà cừa ph²p kiºm ành rĐt nhọ ta cõ bơng chựng thống kả º kát luên rơng tờng thº iºm thi khổng tuƠn theo phƠn phối chuân. Nguyạn Thà Nhung (HDL TH‹NG LONG) B i giÊng XĂc suĐt Thống kả v ựng dửng Ng y 29 thĂng 8 nôm 2011 42 / 42