Bài giảng Tin học ứng dụng - Bài 6: Phân tích dữ liệu

pdf 38 trang phuongnguyen 2770
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng - Bài 6: Phân tích dữ liệu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_tin_hoc_ung_dung_bai_6_phan_tich_du_lieu.pdf

Nội dung text: Bài giảng Tin học ứng dụng - Bài 6: Phân tích dữ liệu

  1. TIN H ỌC ỨNG D ỤNG PHÂN TÍCH D Ữ LI ỆU NGHIÊN CỨU V ỚI SPSS BÀI 6: PHÂN TÍCH DỮ LI ỆU MỤC TIÊU u ứ • Hi ểu và áp dụng đượ c các ph ươ ng pháp phân tích dữ li ệu phù hợp với yêu cầu nghiên cứu. u nghiên c ệ l i • Tổ ch ức và làm vi ệc nhóm phân tích dữ li ệu ữ nghiên cứu; làm báo cáo và trình bày kết qu ả nghiên cứu. ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 1
  2. NỘI DUNG u ứ • Ki ểm đị nh mối liên hệ gi ữa hai bi ến đị nh tính • Ki ểm đị nh trung bình tổng th ể u nghiên c ệ l i ữ • Phân tích ph ươ ng sai • Tươ ng quan tuy ến tính • Hồi quy tuy ến tính ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH TÍNH u ứ • Ki ểm đị nh mối liên hệ gi ữa hai bi ến đị nh danh ho ặc đị nh danh – th ứ bậc u nghiên c ệ l i • Ki ểm đị nh mối liên hệ gi ữa hai bi ến th ứ bậc ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 2
  3. MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH TÍNH u ứ • Ki ểm đị nh mối liên hệ gi ữa hai bi ến đị nh danh ho ặc đị nh danh – th ứ bậc u nghiên c ệ – Gi ả thuy ết l i ữ •Ho: Không tồn tại mối liên hệ gi ữa hai bi ến •H1: Hai bi ến có liên hệ với nhau – Ph ươ ng pháp ng: Phân tích d ụ •Sử dụng ki ểm đị nh Chi – bình ph ươ ng (χ2 với mức ý ngh ĩa α = n g d 0.05 ứ c ọ – Ví dụ T i n h • Ki ểm đị nh mối liên hệ gi ữa trình độ học vấn và gi ới tính nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH DANH u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 3
  4. MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH DANH u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH DANH u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 4
  5. MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH DANH u ứ u nghiên c ệ l i ữ Các đạ i l ượ ng ki ểm Các đạ i l ượ ng ki ểm ng: Phân tích địd nh dành cho hai đị nh dành cho hai ụ bi ến đị nh danh bi ến th ứ b ậc n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH DANH u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 5
  6. MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH DANH u ứ u nghiên c ệ l i ữ ng: Phân tích d Do Sig. > α nên ch ấp ụ nh ận gi ả thuy ết H 0 n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn MỐI LIÊN H Ệ GI ỮA HAI BI ẾN ĐỊ NH TÍNH u ứ • Ki ểm đị nh mối liên hệ gi ữa hai bi ến th ứ bậc – Gi ả thuy ết u nghiên c ệ l i •Ho: Không tồn tại mối liên hệ gi ữa hai bi ến ữ •H1: Hai bi ến có liên hệ với nhau – Ph ươ ng pháp •Sử dụng ki ểm đị nh tau-b của Kendall, ki ểm đị nh d của Some, ng: Phân tích d α ụ ki ểm đị nh gamma của Goodman và Kruskal với mức ý ngh ĩa = 0.05 n g d ứ c – Ví dụ ọ • Ki ểm đị nh mối liên hệ gi ữa độ tu ổi và mức độ thanh toán th ẻ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 6
  7. MỐI LIÊN H Ệ GI ỮA HAI BI ẾN TH Ứ B ẬC u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn MỐI LIÊN H Ệ GI ỮA HAI BI ẾN TH Ứ B ẬC u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 7
  8. MỐI LIÊN H Ệ GI ỮA HAI BI ẾN TH Ứ B ẬC u ứ u nghiên c ệ l i ữ ≠ ng: Phân tích d ụ n g d ứ c ọ Do Sig. > α nên ch ấp nh ận gi ả thuy ết H 0 T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH TRUNG BÌNH T ỔNG TH Ể u ứ • So sánh tr ị trung bình của một tổng th ể với một giá tr ị cụ th ể u nghiên c ệ l i • So sánh tr ị trung bình của hai nhóm tổng th ể riêng ữ • So sánh tr ị trung bình của hai nhóm tổng th ể riêng bi ệt có đặ c điểm các ph ần tử của hai nhóm có sự tươ ng đồ ng từng đôi một ng: Phân tích d ụ • So sánh tr ị trung bình của nhi ều nhóm tổng th ể độ c n g d ứ c lập ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 8
  9. KI ỂM ĐỊ NH TRUNG BÌNH T ỔNG TH Ể u ứ • So sánh tr ị trung bình của một tổng th ể với một giá tr ị cụ th ể u nghiên c ệ – Ví dụ: Ki ểm đị nh gi ả thuy ết “Độ tu ổi trung bình của l i ữ khách hàng tr ả lươ ng qua th ẻ VCB là 35 ”. – Quy trình th ực hi ện • Dùng lệnh Select Case lọc ra các tr ườ ng hợp khách hàng tr ả lươ ng qua th ẻ VCB ng: Phân tích d ụ •Gọi ch ức năng Analyze > Compare Means > One-Sample T- n g d ứ Test c ọ • Cung cấp bi ến ki ểm đị nh, giá tr ị trung bình kỳ vọng T i n h • Ch ọn độ tin cậy nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH GI Ả THUY ẾT TR Ị TRUNG BÌNH C ỦA M ỘT TỔNG TH Ể u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 9
  10. KI ỂM ĐỊ NH GI Ả THUY ẾT TR Ị TRUNG BÌNH C ỦA M ỘT TỔNG TH Ể u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH GI Ả THUY ẾT TR Ị TRUNG BÌNH C ỦA M ỘT TỔNG TH Ể u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 10
  11. KI ỂM ĐỊ NH GI Ả THUY ẾT TR Ị TRUNG BÌNH C ỦA M ỘT TỔNG TH Ể u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH GI Ả THUY ẾT TR Ị TRUNG BÌNH C ỦA M ỘT TỔNG TH Ể u ứ GI Ả THUY ẾT H 0 Tu ổi trung bình c ủa ch ủ th ẻ l ươ ng VCB là 35 u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 11
  12. KI ỂM ĐỊ NH GI Ả THUY ẾT TR Ị TRUNG BÌNH C ỦA M ỘT TỔNG TH Ể u ứ GI Ả THUY ẾT H 0 Tu ổi trung bình c ủa ch ủ th ẻ l ươ ng VCB là 35 u nghiên c ệ l i Số l ượ ng quan sát Giá tr ị trung bình ữ ng: Phân tích d Mức ý ngh ĩa 0.00 < 0.01 ụ Giá tr ị ki ểm đị nh t n g d ứ c Bác b ỏ gi ả thuy ết H 0 ọ T i n h KẾT LU ẬN: Tu ổi trung bình c ủa ch ủ th ẻ l ươ ng VCB trên 35 nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể u ứ • Ki ểm đị nh tr ị trung bình của hai tổng th ể - tr ườ ng hợp mẫu độ c lập u nghiên c ệ l i ữ • Ki ểm đị nh tr ị trung bình của hai mẫu ph ụ thu ộc ho ặc ph ối hợp từng cặp ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 12
  13. KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể - TR ƯỜ NG H ỢP M ẪU ĐỘ C L ẬP u ứ • Ví dụ – Gi ả thuy ết H0: Tu ổi trung bình của khách hàng nam và u nghiên c ệ nữ là ngang nhau l i ữ • Quy trình th ực hi ện –Gọi ch ức năng Analye > Compare Means > Independent-samples T Test ng: Phân tích d ụ – Cung cấp các bi ến đị nh lượ ng (tính trung bình), bi ến n g d ứ đị nh tính (phân thành hai nhóm độ c lập) c ọ – Ch ỉ đị nh hai nhóm cần so sánh T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể - TR ƯỜ NG H ỢP M ẪU ĐỘ C L ẬP u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 13
  14. KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể - TR ƯỜ NG H ỢP M ẪU ĐỘ C L ẬP u ứ GI Ả THUY ẾT H 0: Tu ổi trung bình gi ữa nam và n ữ là b ằng nhau u nghiên c Ki ểm đị nh s ự b ằng nhau v ề Sig ph ươ ng sai hai m ẫu ệ ph ươ ng sai c ủa hai m ẫu khác nhau => s ử d ụng “ Equal l i ữ (Levenve’s Test) variances not assumed ” ng: Phân tích d ụ n g d Sig > 5% => ph ươ ng sai hai m ẫu ứ c bằng nhau => s ử d ụng “ Equal ọ variances assumed ” T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể - TR ƯỜ NG H ỢP M ẪU ĐỘ C L ẬP u ứ GI Ả THUY ẾT H 0: Tu ổi trung bình gi ữa nam và n ữ là b ằng nhau u nghiên c Sig > 5% => ph ươ ng sai hai m ẫu ệ Kết qu ả ki ểm đị nh s ự b ằng nhau bằng nhau => s ử d ụng “ Equal l i về tr ị trung bình c ủa hai m ẫu ữ variances assumed ” Sig Bác b ỏ gi ả thuy ết H 0 ng: Phân tích d ụ n g d ứ c ọ T i n h KẾT LU ẬN: Tu ổi trung bình gi ữa nam và n ữ là khác nhau nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 14
  15. KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể - TR ƯỜ NG H ỢP M ẪU PH ỐI H ỢP T ỪNG C ẶP u ứ • Nguyên lý –Dữ li ệu ở dạng thang đo kho ảng cách ho ặc tỷ lệ u nghiên c ệ l i – Tính toán chênh lệch trên từng cặp quan sát ữ – Ki ểm đị nh gi ả thuy ết H0 “chênh lệch trung bình của tổng th ể bằng 0” • Ví dụ ng: Phân tích d ụ n g d –Cảm nh ận của khách hàng tr ướ c và sau khi Ngân hàng ứ c tri ển khai Cam kết ch ất lượ ng dịch vụ (SLAs) ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể - TR ƯỜ NG H ỢP M ẪU PH ỐI H ỢP T ỪNG C ẶP u ứ • Quy trình th ực hi ện –Gọi ch ức năng Analye > Compare Means > Paired- u nghiên c ệ Samples T Test l i ữ – Cung cấp cặp bi ến ph ối hợp – Điều ch ỉnh độ tin cậy (n ếu cần) ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 15
  16. KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể - TR ƯỜ NG H ỢP M ẪU PH ỐI H ỢP T ỪNG C ẶP u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH TR Ị TRUNG BÌNH C ỦA HAI T ỔNG TH Ể - TR ƯỜ NG H ỢP M ẪU PH ỐI H ỢP T ỪNG C ẶP u ứ GI Ả THUY ẾT H 0: C ảm nh ận c ủa khách hàng là không đổ i u nghiên c ệ l i ữ Sig Bác b ỏ gi ả thuy ết H 0 ng: Phân tích d ụ n g d ứ c ọ T i n h KẾT LU ẬN: C ảm nh ận c ủa khách hàng có thay đổ i nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 16
  17. PHÂN TÍCH PH ƯƠ NG SAI u ứ • Nguyên lý –Mở rộng ki ểm đị nh t – ki ểm đị nh nhi ều nhóm mẫu cùng một lúc u nghiên c – Các nhóm mẫu ph ải có cùng ph ươ ng sai ệ l i ữ • Phân lo ại – ANOVA một yếu tố (m ột bi ến phân lo ại) – ANOVA nhi ều yếu tố (nhi ều bi ến phân lo ại) • Ví dụ ng: Phân tích d ụ – Gi ả thuy ết H0: Không có sự khác bi ệt về mức độ thanh toán bằng n g d ứ th ẻ gi ữa các nhóm tu ổi khác nhau c ọ – Gi ả thuy ết H0: Không có ảnh hưở ng của nhóm tu ổi và trình độ học vấn đố i với mức độ thanh toán bằng th ẻ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn PHÂN TÍCH PH ƯƠ NG SAI M ỘT Y ẾU T Ố u ứ • Quy trình th ực hi ện –Gọi th ực hi ện Analyze > Compare Means > One-Way u nghiên c ệ ANOVA l i ữ – Cung cấp bi ến ph ụ thu ộc, bi ến phân lo ại – Thi ết lập các tính toán th ống kê mô tả, ki ểm đị nh sự bằng nhau của các nhóm ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 17
  18. PHÂN TÍCH PH ƯƠ NG SAI M ỘT Y ẾU T Ố u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn PHÂN TÍCH PH ƯƠ NG SAI M ỘT Y ẾU T Ố u ứ GI Ả THUY ẾT H 0: Không có s ự khác nhau v ề thanh toán b ằng th ẻ u nghiên c Ki ểm tra điều ki ện áp d ụng ệ ANOVA: ph ươ ng sai b ằng nhau l i ữ gi ữa các nhóm m ẫu Sig > 0.05 => ph ủ đị nh H 0 => ph ươ ng sai b ằng nhau ng: Phân tích d Sig > 5% => Ch ấp nh ận gi ả ụ thuy ết H 0 n g d ứ c ọ T i n h KẾT LU ẬN: Không có s ự khác nhau v ề thanh toán b ằng th ẻ nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 18
  19. PHÂN TÍCH PH ƯƠ NG SAI M ỘT Y ẾU T Ố u ứ • Phân tích sâu ANOVA – Ki ểm đị nh tr ướ c (Contrasts) u nghiên c ệ l i • Ki ểm đị nh các gi ả đị nh về trung bình nhóm tr ướ c khi phân tích ữ ANOVA – Ki ểm đị nh sau (Post Hoc) • Ki ểm đị nh các gi ả đị nh về trung bình nhóm sau khi phân tích ANOVA ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn PHÂN TÍCH PH ƯƠ NG SAI M ỘT Y ẾU T Ố u ứ Th ực hi ện ki ểm đị nh t cho t ừng Gi ống LSD, ti ến hành so sánh b ội cặp trung bình nhóm trên s ố l ần ti ến hành so sánh Sử d ụng b ảng phân ph ối u nghiên c Studentizze range distribution ệ l i ữ ng: PhânKi tíchểm d đị nh l ại toàn b ộ các tr ị trung bình ụ nhóm. N ếu không b ằng nhau thì ki ểm n g d tra các nhóm nào có s ự khác bi ệt So sánh tr ị trung bình c ủa các nhóm ứ c với tr ị trung bình c ủa m ột nhóm c ụ th ể ọ đượ c ch ọn T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 19
  20. PHÂN TÍCH PH ƯƠ NG SAI MỘT Y ẾU TỐ u ứ u nghiên c ệ l i ữ Tr ị trung bình c ủa 4 nhóm đầ u bằng v ới nhóm cu ối cùng ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn PHÂN TÍCH PH ƯƠ NG SAI HAI Y ẾU TỐ u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 20
  21. PHÂN TÍCH PH ƯƠ NG SAI HAI Y ẾU T Ố u ứ GI Ả THUY ẾT H 0: Không có s ự khác nhau v ề thanh toán b ằng th ẻ Gi ả đị nh ph ươ ng sai các nhóm u nghiên c bằng nhau không b ị vi ph ạm => ệ ki ểm đị nh ANOVA có ý ngh ĩa l i ữ Ch ấp nh ận gi ả thuy ết H 0 ng: Phân tích d ụ n g d ứ c ọ T i n h KẾT LU ẬN: Không có s ự khác nhau v ề thanh toán b ằng th ẻ nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn TƯƠ NG QUAN TUY ẾN TÍNH u ứ • Nguyên lý – Ki ểm đị nh mối liên hệ gi ữa nhi ều bi ến đị nh lượ ng u nghiên c ệ l i ữ • Phân lo ại –Hệ số tươ ng quan đơ n –Hệ số tươ ng quan hạng ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 21
  22. TƯƠ NG QUAN TUY ẾN TÍNH u ứ • Hệ số tươ ng quan đơ n (r) – Tên đầ y đủ Pearson Correlation Coefficient u nghiên c – Áp dụng trong tr ườ ng hợp tổng th ể có phân ph ối chu ẩn ệ l i ữ –Lượ ng hóa mức độ ch ặt ch ẽ của mối liên hệ tuy ến tính gi ữa hai bi ến đị nh lượ ng –Mối liên hệ gi ữa hai bi ến có th ể • Không cóliên hệ (r = 0) ng: Phân tích d • Liên hệ tuy ến tính thu ận (r > 0) ụ • Liên hệ tuy ến tính ngh ịch (r Correlate > Bivariate u nghiên c ệ l i –Lựa ch ọn hai hay nhi ều bi ến đị nh lượ ng để phân tích ữ –Lựa ch ọn một (s ố) hệ số tính toán –Lựa ch ọn lo ại ki ểm đị nh mức ý ngh ĩa ng: Phân tích d ụ • Ví dụ n g d ứ – Đo lườ ng mối liên hệ gi ữa kết qu ả tuy ển sinh đầ u vào c ọ và điểm trung bình học tập toàn khóa của sinh viên T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 22
  23. TƯƠ NG QUAN TUY ẾN TÍNH u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn TƯƠ NG QUAN TUY ẾN TÍNH u ứ Hệ s ố t ươ ng quan gi ữa hai bi ến là u nghiên c 0.67 ở m ức ý ngh ĩa nh ỏ h ơn 1% ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 23
  24. TƯƠ NG QUAN TUY ẾN TÍNH u ứ • Hệ số tươ ng quan hạng Spearman – Tên đầ y đủ Rank Correlation Coefficient u nghiên c ệ l i – Áp dụng trong tr ườ ng hợp tổng th ể không có phân ph ối ữ chu ẩn ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn HỒI QUY TUY ẾN TÍNH u ứ • Nguyên lý – Mô hình hóa mối quan hệ tuy ến tính (b ậc nh ất) gi ữa một bi ến u nghiên c ph ụ thu ộc với nhi ều bi ến độ c lập (bi ến gi ải thích) ệ l i ữ – Không có tính ch ất đố i xứng nh ư tươ ng quan tuy ến tính • Phân lo ại –Hồi quy tuy ến tính đơ n ng: Phân tích d –Hồi quy tuy ến tính bội ụ n g d • Ví dụ ứ c ọ – Tác độ ng của kết qu ả tuy ển sinh đầ u vào đố i với điểm trung bình học tập toàn khóa của sinh viên T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 24
  25. HỒI QUY TUY ẾN TÍNH ĐƠ N u ứ • Mô hình tổng quát = ∗ u nghiên c ệ l i ữ Trong đó – Xi là giá tr ị quan sát th ứ i của bi ến độ c lập – là giá tr ị dự đoán th ứ i của bi ến ph ụ thu ộc ng: Phân tích d ụ –Bo và B1 là hệ số hồi quy; ph ươ ng pháp bình ph ươ ng n g d nh ỏ nh ất (OLS) xác đị nh hai hệ số này ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn HỒI QUY TUY ẾN TÍNH ĐƠ N u ứ • Một số gi ả đị nh – Phân ph ối chu ẩn của bi ến ph ụ thu ộc Y với ph ươ ng sai không u nghiên c đổ i ệ l i ữ – Các giá tr ị của Y độ c lập với nhau – Các giá tr ị trung bình nằm trên một đườ ng th ẳng – Ph ần dư = ∗ ng: Phân• tíchQuy d trình th ực hi ện ụ –Gọi th ực hi ện Analyze > Regression > Linear n g d ứ c ọ – Cung cấp bi ến ph ụ thu ộc, bi ến độ c lập – Ki ểm đị nh các gi ả đị nh của mô hình T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 25
  26. HỒI QUY TUY ẾN TÍNH ĐƠ N u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn HỒI QUY TUY ẾN TÍNH ĐƠ N u ứ Đo l ườ ng m ức độ phù h ợp c ủa mô hình đố i v ới m ẫu u nghiên c ệ Ki ểm đị nh m ức độ phù h ợp c ủa l i mô hình đố i v ới t ổng th ể (F l ớn, ữ Sig < 0.05) Hệ s ố h ồi quy ng: Phân tích d ụ Ki ểm đị nh ý ngh ĩa c ủa các h ệ s ố hồi quy (Sig < 0.05) n g d ứ c ọ T i n h KẾT LU ẬN: = . . ∗ nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 26
  27. HỒI QUY TUY ẾN TÍNH ĐƠ N u ứ • Ki ểm tra các gi ả đị nh – Gi ả đị nh liên hệ tuy ến tính u nghiên c ệ l i – Gi ả đị nh ph ươ ng sai của sai số không đổ i ữ – Gi ả đị nh về phân ph ối chu ẩn của ph ần dư – Gi ả đị nh về tính độ c lập của sai số ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn GI Ả ĐỊ NH LIÊN H Ệ TUY ẾN TÍNH u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c Các điểm ảnh phân b ố ng ẫu nhiên => gi ả đị nh ọ liên h ệ tuy ến tính không b ị vi ph ạm T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 27
  28. PH ƯƠ NG SAI C ỦA SAI S Ố KHÔNG ĐỔ I u ứ GI Ả THUY ẾT H 0: Ph ươ ng sai c ủa sai s ố không đổ i u nghiên c ệ Sig Bác b ỏ gi ả thuy ết H l i GI Ả THUY ẾT H 0: H ệ s ố t ươ ng quan h ạng Spearman cho hai bi ến 0 ữ Input_Score và ABSres=> b ằ Phngươ 0 ng sai c ủa sai s ố thay đổ i ng: Phân tích d ụ n g d ứ c ọ T i n h KẾT LU ẬN: Mô hình h ồi quy tuy ến tính không có giá tr ị nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn PHÂN PH ỐI CHU ẨN C ỦA PH ẦN D Ư (HISTOGRAM) u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 28
  29. TÍNH ĐỘ C L ẬP C ỦA SAI S Ố u ứ Gi ả thuy ết: H ệ s ố t ươ ng quan t ổng th ể c ủa sai s ố b ằng 0 u nghiên c ệ Dò tìm nh ững ph ần d ư b ất th ườ ng l i (quá nh ỏ ho ặc quá l ớn) ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn TÍNH ĐỘ C L ẬP C ỦA SAI S Ố u ứ • Quy tắc Durbin-Watson Có t ự u nghiên c tươ ng Ch ấp nh ận gi ả thuy ết Có t ự t ươ ng ệ Không có Không có l i quan không có t ự t ươ ng quan ngh ịch ữ kết lu ận kết lu ận thu ận quan chu ỗi b ậc nh ất (âm) (d ươ ng) 0 dL dU 2 4-dU 4-dL 4 ng: Phân• tíchTra d bảng Durbin-Watson với 01 bi ến và 300 quan sát ụ (d L=1.75; dU=1.779) n g d ứ c • Đạ i lượ ng th ống kê d=2.31 ∈(d ,4-d ) => ch ấp nh ận gi ả ọ U U thuy ết không có tự tươ ng quan chu ỗi bậc nh ất T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 29
  30. HỒI QUY TUY ẾN TÍNH B ỘI u ứ • Mô hình tổng quát = ∗ ∗ ⋯ ∗ u nghiên c ệ l i ữ Trong đó – Xki là giá tr ị quan sát th ứ i của bi ến độ c lập th ứ k – là giá tr ị dự đoán th ứ i của bi ến ph ụ thu ộc ng: Phân tích d ụ β – i là các hệ số hồi quy riêng ph ần n g d ứ σ2 – Ph ần dư ei là bi ến độ c lập ng ẫu nhiên N(0, ) c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn HỒI QUY TUY ẾN TÍNH B ỘI u ứ • Một số gi ả đị nh – Bi ến ph ụ thu ộc có phân ph ối chu ẩn đố i với các bi ến độ c u nghiên c ệ lập (bi ến gi ải thích) l i ữ – Không có bi ến gi ải thích nào là tổ hợp tuy ến tính của các bi ến gi ải thích còn lại • Ví dụ ng: Phân tích d ụ –Sự tác độ ng của độ tu ổi, trình độ học vấn, số th ẻ ngân n g d ứ hàng đố i với mức độ thanh toán bằng th ẻ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 30
  31. HỒI QUY TUY ẾN TÍNH B ỘI u ứ • Quy trình th ực hi ện – Xem xét ma tr ận hệ số tươ ng quan u nghiên c ệ – Xây dựng mô hình l i ữ – Đánh giá độ phù hợp của mô hình – Ki ểm đị nh độ phù hợp của mô hình – Gi ải thích các hệ số hồi quy riêng trong mô hình ng: Phân tích d ụ – Xác đị nh tầm quan tr ọng của các bi ến trong mô hình n g d ứ c –Lựa ch ọn bi ến cho mô hình ọ – Dò tìm các vi ph ạm gi ả đị nh cần thi ết T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn XEM XÉT MA TR ẬN H Ệ S Ố T ƯƠ NG QUAN u ứ u nghiên c ệ l i Hệ s ố t ươ ng quan gi ữa ữ hai bi ến độ c l ập th ấp Hệ s ố t ươ ng quan gi ữa bi ến ph ụ thu ộc v ới các bi ến độ c l ập t ươ ng đố i cao ng: Phân tích d ụ n g d ứ c ọ T i n h KẾT LU ẬN: Có th ể s ử d ụng các bi ến độ c l ập trong mô hình nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 31
  32. XÂY D ỰNG MÔ HÌNH H ỒI QUY u ứ Giúp xác đị nh t ầm quan tr ọng của m ỗi bi ến trong mô hình u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn KI ỂM ĐỊ NH CÁC GI Ả THUY ẾT u ứ Mô hình gi ải thích đượ c 71% các tr ườ ng h ợp đượ c ghi nh ận => độ phù h ợp CAO u nghiên c ệ l i ữ Sig < 0.01 ch ứng t ỏ các h ệ s ố h ồi quy không đồ ng nh ất 0, mô hình có th ể s ử d ụng đượ c ng: Phân tích d ụ n g d ứ c ọ Các bi ến độ c l ập đề u có T i n h ý ngh ĩa trong mô hình nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 32
  33. TẦM QUAN TR ỌNG C ỦA CÁC BI ẾN u ứ Hai bi ến này có ảnh h ưở ng đố i v ới mô hình l ớn h ơn các u nghiên c ệ bi ến còn l ại l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn LỰA CH ỌN CÁC BI ẾN ĐỘ C L ẬP u ứ • Mục đích –Lựa ch ọn hi ệu qu ả các bi ến đư a vào mô hình u nghiên c ệ l i ữ • Th ực hi ện –Tăng dần số lượ ng các bi ến và ki ểm giá mức độ phù hợp của mô hình ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 33
  34. LỰA CH ỌN CÁC BI ẾN ĐỘ C L ẬP u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn LỰA CH ỌN CÁC BI ẾN ĐỘ C L ẬP u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h KẾT LU ẬN: Mô hình hai bi ến t ốt h ơn h ẳn so v ới mô hình m ột bi ến nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 34
  35. DÒ TÌM CÁC VI PH ẠM GI Ả ĐỊ NH u ứ • Mục đích – Ki ểm tra tính hợp lệ của mô hình u nghiên c ệ l i ữ • Nội dung – Gi ả đị nh liên hệ tuy ến tính – Gi ả đị nh ph ươ ng sai của sai số không đổ i ng: Phân tích d ụ – Gi ả đị nh về phân ph ối chu ẩn của ph ần dư n g d ứ – Gi ả đị nh về tính độ c lập của sai số c ọ – Gi ả đị nh về hi ện tượ ng đa cộng tuy ến T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn GI Ả ĐỊ NH LIÊN H Ệ TUY ẾN TÍNH u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ Các điểm ảnh phân b ố ng ẫu nhiên => gi ả đị nh liên h ệ tuy ến tính không b ị vi ph ạm T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 35
  36. PH ƯƠ NG SAI C ỦA SAI S Ố KHÔNG ĐỔ I u ứ GI Ả THUY ẾT H 0: Ph ươ ng sai c ủa sai s ố không đổ i u nghiên c ệ l i ữ Ch ấp nh ận gi ả thuy ết H 0 ng: Phân tích d ụ n g d ứ c ọ T i n h KẾT LU ẬN: Ph ươ ng sai c ủa sai s ố không đổ i nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn PHÂN PH ỐI CHU ẨN C ỦA PH ẦN D Ư (HISTOGRAM) u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 36
  37. TÍNH ĐỘ C L ẬP C ỦA SAI S Ố u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn TÍNH ĐỘ C L ẬP C ỦA SAI S Ố u ứ • Quy tắc Durbin-Watson Có t ự u nghiên c tươ ng Ch ấp nh ận gi ả thuy ết Có t ự t ươ ng ệ Không có Không có l i quan không có t ự t ươ ng quan ngh ịch ữ kết lu ận kết lu ận thu ận quan chu ỗi b ậc nh ất (âm) (d ươ ng) 0 dL dU 2 4-dU 4-dL 4 ng: Phân• tíchTra d bảng Durbin-Watson với 01 bi ến và 300 quan sát ụ (d L=1.75; dU=1.779) n g d ứ c • Đạ i lượ ng th ống kê d=2.21 ∈(d ,4-d ) => ch ấp nh ận gi ả ọ U U thuy ết không có tự tươ ng quan chu ỗi bậc nh ất T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 37
  38. HI ỆN T ƯỢ NG ĐA C ỘNG TUY ẾN u ứ u nghiên c ệ l i ữ ng: Phân tích d ụ n g d ứ c ọ T i n h KẾT LU ẬN: Không x ảy ra hi ện t ượ ng đa c ộng tuy ến nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn ÔN T ẬP u ứ • Ki ểm đị nh mối liên hệ gi ữa hai bi ến đị nh tính • Ki ểm đị nh trung bình tổng th ể u nghiên c ệ l i ữ • Phân tích ph ươ ng sai • Tươ ng quan tuy ến tính • Hồi quy tuy ến tính ng: Phân tích d ụ n g d ứ c ọ T i n h nh ững b ướ c ch ập ch ững vào th ế gi ới s ố namth@buh.edu.vn 38