Bài giảng Thống kê trong kinh doanh: Thực hành Excel - Nguyễn Duy Tâm

pdf 58 trang phuongnguyen 3750
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê trong kinh doanh: Thực hành Excel - Nguyễn Duy Tâm", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_thong_ke_trong_kinh_doanh_thuc_hanh_excel_nguyen_d.pdf

Nội dung text: Bài giảng Thống kê trong kinh doanh: Thực hành Excel - Nguyễn Duy Tâm

  1. NGUYỄN DUY TÂM 1 Nguyễn Duy Tâm _ IDR Con người –Tầm nhìn mới NỘI DUNG 1. Nhập dữ liệu vào excel 2. Thống kê dữ liệu dạng bảng 3. Thống kê dữ liệu dạng đồ thị 4. Thống kê dữ liệu bằng các đại lượng thống kê mô tả 5. Ước lượng và kiểm định giả thiết 6. Phân tích phương sai ANOVA 7. Hồi quy tương quan 8. Kiểm định phi tham số 9. Lý thuyết quyết định Nguyễn Duy Tâm _ IDR 2 1
  2. Nhập số liệu vào Excel Con người –Tầm nhìn mới OBS Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION 1 0 0 22 4 1 4 2 1 1 22 0.125 0 5 3 0 0 18 10 0 5 4 0 1 22 0.75 0 3 5 12 0 42 15 1 2 6 0 0 37 15 1 4 7 0 1 52 15 1 4 8 7 0 27 1.5 0 5 9 0 1 27 4 0 4 10 0 0 27 1.5 1 2 Sử dụng file Excel: Business Statistics/ Resources/Learning-by-Doing/ Affair.xls OBS = Số thứ tự của người được phỏng vấn Y-PT = Số lần quan hệ tình dục ngoài hôn nhân trong năm Z1_MALE = 1 nếu là nam, 0 nếu là nữ Z2_AGE = Tuổi Z3_NOYM = Số năm kết hôn Z4_CHILD = 1 nếu có con, 0 nếu chưa có con Z8_SATISFACTION = Mức độ thỏa mãn về hôn nhân, thang Likert 1-5 Ghi chú : Biến số theo cột, quan sát ghi theo hàng 5/12/2009 Nguyễn Duy Tâm _ IDR 3 Con người –Tầm nhìn mới Tạo biểu nhập liệu (Form) Trên một trang bảng tính mới (New worksheet) Tạo dòng tiêu đề (biến số) ở dòng 1. Quét khối dòng tiêu đề, rồi vào Data/ Form Nguyễn Duy Tâm _ IDR 4 2
  3. Con người –Tầm nhìn mới Tạo biểu nhập liệu (Form) Vì chúng ta không định nghĩa chính xác số dòng của bảng tính, nên Excel có hỏi như bảng giao diện ở trên. Đơn giản là chọn OK. Nguyễn Duy Tâm _ IDR 5 Con người –Tầm nhìn mới Bản ghi cho ngƣời thứ nhất Nhập cho người thứ nhất Bảng số liệu điều tra của người này như sau OBS = 1 Người thứ nhất Y-PT = 0 Chưa ngoại tình Z1_MALE = 0 Nữ Z2_AGE = 22 22 tuổi Z3_NOYM = 4 Kết hôn được 4 năm Z4_CHILD = 1 Đã có con Z8_SATISFACTION = 4 Hài lòng về cuộc hôn nhân của mình Nguyễn Duy Tâm _ IDR 6 3
  4. Bản ghi cho ngƣời thứ nhất Con người –Tầm nhìn mới Nguyễn Duy Tâm _ IDR 7 Con người –Tầm nhìn mới Bản ghi cho ngƣời thứ hai Từ Form nhập liệu, click New để nhập một bản ghi (record) hay quan sát (observation) mới. Bảng số liệu điều tra của người thứ hai như sau OBS = 2 Người thứ hai Y-PT = 1 Đã ngoại tình Z1_MALE = 1 Nam Z2_AGE = 22 22 tuổi Z3_NOYM = 0.125 Kết hôn được 1.5 tháng (1.5/12) Z4_CHILD = 0 Chưa có con Z8_SATISFACTION = 5 Rất hài lòng về cuộc hôn nhân của mình Nguyễn Duy Tâm _ IDR 8 4
  5. Con người –Tầm nhìn mới Bản ghi cho ngƣời thứ hai Làm tương tự cho đến người thứ 10 ở slide 3. Nguyễn Duy Tâm _ IDR 9 Con người –Tầm nhìn mới Mảng thứ tự Chọn biến Z2_AGE Sắp xếp thành mảng thứ tự từ nhỏ đến lớn Quét khối toàn bộ số liệu, kể cả dòng tên biến. Data/ Sort Nguyễn Duy Tâm _ IDR 10 5
  6. Giao diện Sort Con người –Tầm nhìn mới OBS Z2_AGE 3 18 1 22 2 22 4 22 8 27 9 27 10 27 6 Kết quả37 5 42 7 52 Chọn Sort by: Z2_AGE Chọn Asending: Sắp xếp theo thứ tự tăng dần 5/12/2009 Nguyễn Duy Tâm _ IDR 11 Con người –Tầm nhìn mới 1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG Yêu cầu của nội dung: Lập bảng thống kê cho các biến thuộc tính và thuộc lượng.  Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ  Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin) Công cụ trên excel: Dùng lệnh =FREQUENCY[ (data_array, bins_array)] Nguyễn Duy Tâm _ IDR 12 6
  7. Con người –Tầm nhìn mới 1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG Quy trình dùng lệnh FREQUENCY Đối với biến có ít biểu hiện  B1: Lập cột các biểu hiện (cột BIN): là giá trị các biểu hiện  B2: Chọn vùng dữ liệu bảng thống kê, lập lệnh Frequency Cú pháp: = FREQUENCY(data_array, bins_array)  Data_array: Dữ liệu cần lập bảng  Bins_array: các biểu hiện  Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím [ctrl+shift+enter]  Ví dụ: lập bảng thống kê cho tình trạng hôn nhân [Marital] Nguyễn Duy Tâm _ IDR 13 Con người –Tầm nhìn mới 1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG Quy trình dùng lệnh FREQUENCY Đối với biến có nhiều biểu hiện: B1: Cần lập các [giới hạn dưới] và [giới hạn trên] của mỗi phân tổ. B2: Lập cột Bin chỉ gồm các số giới hạn trên của mỗi phân tổ. Ví dụ biến [trình độ học vấn]_edu B3: dùng lệnh FREQUENCY để lập bảng. . Bài tập: lập bảng tần số theo trình độ học vấn, độ tuổi và trình độ kết hôn. . Chú ý: phân tổ do sinh viên tự phân, có thể phân tổ đều hoặc không đều Nguyễn Duy Tâm _ IDR 14 7
  8. Con người –Tầm nhìn mới Biểu đồ tần số-Thủ tục Data Analysis Dùng thủ tục Data Analysis trong thư viện hàm Add-Ins của Excel Kiểm tra xem có thủ tục Data Analysis trong Tools hay chưa? Tools/ Add-Ins/ Check vào Analysis ToolPak/ OK Nguyễn Duy Tâm _ IDR 15 Con người –Tầm nhìn mới Biểu đồ tần số-Thủ tục Data Analysis Tools/ Data Analysis/ Histogram Nguyễn Duy Tâm _ IDR 16 8
  9. Biểu đồ tần số-Thủ tục DataCon ngAnalysisười –Tầm nhìn mới Input Range: Quét khối số liệu, nhớ có cả tên biến Bin Range: Quét biên khối biên trên của biểu đồ tần số, nhớ có cả tên Labels: Khai báo có dòng đầu tiên là tên biến Chọn Output range: ô đầu tiên chứa kết quả Khai báo các kết quả cần nhận: Pareto, Cumulative Percentage, Chart Output Nguyễn Duy Tâm _ IDR 17 Biểu đồ tần số-Thủ tục DataCon ngAnalysisười –Tầm nhìn mới Cumulative Cumulative BIN Frequency % BIN Frequency % 20 1 10.00% 30 6 60.00% 30 6 70.00% 20 1 70.00% 40 1 80.00% 40 1 80.00% 50 1 90.00% 50 1 90.00% 60 1 100.00% 60 1 100.00% More 0 100.00% More 0 100.00% Bảng tần số, tần suất tích lũy và phân phối Pareto Nguyễn Duy Tâm _ IDR 18 9
  10. Biểu đồ tần số-Thủ tục DataCon ngAnalysisười –Tầm nhìn mới Histogram 7 120.00% 6 100.00% 5 80.00% 4 Frequency 60.00% Cumulative % Frequency 3 40.00% 2 20.00% 1 0 0.00% 30 20 40 50 60 More BIN Biểu đồ Pareto Nguyễn Duy Tâm _ IDR 19 Con người –Tầm nhìn mới 2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ Các dạng đồ thị: 1. Hình thanh : Column, Bar, 2. Hình tròn, (bánh) : Pie 3. Đường gấp khúc : Line 4. Phân tán : Scatter Nguyễn Duy Tâm _ IDR 20 10
  11. Con người –Tầm nhìn mới 2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ QUY TRÌNH VẼ ĐỒ THỊ ĐỒ THỊ HÌNH TRÕN  B1: chọn vùng dữ liệu Tần số  B2: chọn biểu tượng đồ thị Rất không hài [chart wizart] hoặc lòng 1% 5% Không hài 12% insert/chart lòng 49% Bình thường  B3: Chọn các hiệu chỉnh 33% tương ứng Hài lòng Rất hài lòng Đồ thị hình tròn thường dùng tần suất (%) để hiển thị Nguyễn Duy Tâm _ IDR 21 Con người –Tầm nhìn mới 2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ ĐỒ THỊ HÌNH THANH ĐỒ THỊ HÌNH THANH [COLUMN] [BAR] Tên thuộc tính dài Tên thuộc tính ngắn Nguyễn Duy Tâm _ IDR 22 11
  12. ĐỒ THỊ ĐƯỜNG GẤP KHÚC _ LINE 5/12/2009 Nguyễn Duy Tâm _ IDR 23 Đồ thị Line: thường chỉ số CPI dùng cho trường hợp dữ liệu theo dõi qua thời gian 180 160 140 120 100 80 60 40 20 0 95 96 02 03 04 05 97 98 99 00 01 - - - - - - - - - - - Jan Jan Jan Jan Jan Jan Jan Jan Jan Jan Jan Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Data/ Pivot Table Nguyễn Duy Tâm _ IDR 24 12
  13. Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Quét khối dữ liệu cần tính toán, kể cả tên biến, sẽ được xem là tên trường(Field) Nguyễn Duy Tâm _ IDR 25 Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Nên chọn trang bảng tính mới Nguyễn Duy Tâm _ IDR 26 13
  14. Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Kéo và nhả (Drag and Drop) Z8_SATISFACTION vào Row Fields và Data Items Nguyễn Duy Tâm _ IDR 27 Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Nhấp đúp vào A3 (ô giao giữa Row Fields và Column Fields) và chọn Count of Z8_SATISFACTION. Ưu điểm: có thể tính Tổng, tần số và nhiều lệnh khác Nguyễn Duy Tâm _ IDR 28 14
  15. Pivot Table với 2 biến phân loại Con người –Tầm nhìn mới Count of Z8_SATISFACTION Z1_MALE Grand Z8_SATISFACTION 0 1 Total 1 11 5 16 2 35 31 66 3 46 47 93 4 93 101 194 5 130 102 232 Grand Total 315 286 601 Nguyễn Duy Tâm _ IDR 29 Pivot Table với 2 biến phân loại Con người –Tầm nhìn mới Click vào A3, kéo và thả trường Z1_MALE vào Column Fields. Ưu điểm: lập bảng tần số chéo cho nhiều biến. Nguyễn Duy Tâm _ IDR 30 15
  16. Pivot Table với 3 biến phân loại Con người –Tầm nhìn mới Kéo và thả Z4_Child vào Page Fields Nguyễn Duy Tâm _ IDR 31 Con người –Tầm nhìn mới Một số yêu cầu Dùng công cụ Pivot table: 1. Lập bảng tổng số con của các hộ gia đình có 1,2, ,n con cụ thể. 2. Lập bảng tổng số anh,chị em trong nhà ứng với từng loại gia đình cụ thể. 3. Lập bảng tần số cho biến Marital, vẽ biểu đồ và cho biết loại tình trạng hôn nhân nào chiếm đa số 4. Lập bảng tần số cho biến marita (column) và biến sex (row). Vẽ biểu đồ và cho biết giới tính nào ứng với tình trạng hôn nhân nào chiếm đa số. Vẽ biểu đồ tương ứng. 5. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row). 6. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row) và . Nguyễn Duy Tâm _ IDR 32 16
  17. Con người –Tầm nhìn mới Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả CHỈ TIÊU TẬP TRUNG CHỈ TIÊU PHÂN TÁN Trung bình : average Phương sai : var =average(data) =var(data) Trung vị : Median Độ lệch chuẩn : stdev =median(data) =stdev(data) Mode : Mode =mode(data) Tứ phân vị : quartile =quartile(data,số phân vị) (1: Q1; 2:Q2; 3:Q3) Nguyễn Duy Tâm _ IDR 33 Con người –Tầm nhìn mới Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả MỘT SỐ LỆNH CÓ TRONG MỘT SỐ LỆNH KHÁC EXCEL 2007 Tính tổng thoả điều kiện Tính tổng thỏa điều kiện =sumif(vùng ĐK, ĐK, nâng cao. Vùng tính tổng) =sumifs(vùng tính tổng, Đếm thỏa điều kiện vùng ĐK1, ĐK1, vùng =countif(vùng ĐK,ĐK) ĐK2, ĐK2) Đếm thỏa điều kiện nâng cao. =countifs(vùng ĐK1, ĐK1,vùng ĐK2, ĐK2, ) Nguyễn Duy Tâm _ IDR 34 17
  18. Con người –Tầm nhìn mới Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả MỘT SỐ LỆNH CÓ TRONG BÀI TẬP (AFFAIR) EXCEL 2007 Trung bình thỏa điều kiện 1. Tính giá trị trung bình, trung vị, =averageif(vùng ĐK, ĐK, mode, tứ phân vị, phương sai, độ lệch chuẩn cho các biến: Vùng tính mean) Z2_age, Z4_child, Z6_edu. Nêu =averageifs(vùng tính ý nghĩa của các số trên. mean,vùng ĐK1, ĐK1, 2. Tính tổng số con của những Vùng ĐK2, ĐK2) người có độ tuổi dưới 30. hoặc của những người hài lòng về tình trạng hôn nhân. 3. Đếm những người có 1 con Nguyễn Duy Tâm _ IDR 35 Con người –Tầm nhìn mới Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả BÀI TẬP (THUC HANH BÀI TẬP (THUC HANH EXCEL) EXCEL) 1. Đếm những người làm 1. Tính tổng số anh/chị/em việc toàn thời gian trong của những người lý dị, ly mẫu khảo sát thân. 2. Đếm những người đã lập 2. Tính tổng số con của gia đình, chưa lập gia đình những người là nữ giới. Nguyễn Duy Tâm _ IDR 36 18
  19. ườ ầ ớ Tính trị thống kê bằng thủ tục DataCon Analysisng i –T m nhìn m i Tools/ Data Analysis/ Descriptive Statistics Nhập số liệu và các tùy chọn vào giao diện Nguyễn Duy Tâm _ IDR 37 ườ ầ ớ Tính trị thống kê bằng thủ tục DataCon Analysisng i –T m nhìn m i Tools/ Data Analysis/ Descriptive Statistics Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTIONZ5_RELIGIOUS Z6_EDU Z7_OCCUPATION Mean 1.46 0.48 32.49 8.18 0.72 3.93 3.12 16.17 4.19 Standard Error 0.13 0.02 0.38 0.23 0.02 0.04 0.05 0.10 0.07 Median 0.00 0.00 32.00 7.00 1.00 4.00 3.00 16.00 5.00 Mode 0.00 0.00 27.00 15.00 1.00 5.00 4.00 14.00 5.00 Standard Deviation 3.30 0.50 9.29 5.57 0.45 1.10 1.17 2.40 1.82 Sample Variance 10.88 0.25 86.28 31.04 0.20 1.22 1.36 5.77 3.31 Kurtosis 4.26 -2.00 0.23 -1.57 -1.09 -0.20 -1.01 -0.30 -0.78 Skewness 2.35 0.10 0.89 0.08 -0.96 -0.84 -0.09 -0.25 -0.74 Range 12 1 39.5 14.875 1 4 4 11 6 Minimum 0 0 17.5 0.125 0 1 1 9 1 Maximum 12 1 57 15 1 5 5 20 7 Sum 875 286 19525 4914.795 430 2363 1873 9716 2521 Count 601 601 601 601 601 601 601 601 601 Kết quả sau khi đã hiệu chỉnh. Bài tập: Tính các chỉ tiêu thống kê mô tả bằng công cụ DATA ANALYSIS cho các biến: agewed sibs childs age educ trong bài tập thực hành excel Nguyễn Duy Tâm _ IDR 38 19
  20. Con người –Tầm nhìn mới HỆ SỐ TƢƠNG QUAN Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng (interval). Chú ý: Đối với thang đo định danh (norminal): những chỉ số tính toán không có ý nghĩa thống kê. Công thức lệnh: tính rxy =correl(data_X, data_Y) Ý nghĩa: Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y -1 < = rxy < 0 : X và Y nghịch biến 0< rxy <=1 : X và Y đồng biến Nguyễn Duy Tâm _ IDR 39 Dùng thủ tục Data Analysis đểCon tính ngườ i ma–Tầm nhìntrận mới tƣơng quan Tools/ Data Analysis/ Correlation Nguyễn Duy Tâm _ IDR 40 20
  21. Dùng thủ tục Data Analysis đểCon tính ngườ i ma–Tầm nhìntrận mới tƣơng quan Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILDZ8_SATISFACTIONZ5_RELIGIOUSZ6_EDUZ7_OCCUPATION Y_PT 1 Z1_MALE 0.011736 1 Z2_AGE 0.095237 0.190641 1 Z3_NOYM 0.186842 0.030283 0.777546 1 Z4_CHILD 0.10401 0.069222 0.421931 0.572857 1 Z8_SATISFACTION-0.27951 -0.00752 -0.199 -0.24312 -0.19628 1 Z5_RELIGIOUS-0.1445 0.007679 0.193777 0.218261 0.129351 0.024296 1 Z6_EDU -0.00244 0.397505 0.134596 0.040003 -0.00699 0.109303 -0.04257 1 Z7_OCCUPATION0.049612 0.467923 0.166413 0.044592 -0.09273 0.017422 -0.03972 0.533605 1 Kết quả. BT thực hành excel: Tính matrận hệ số tương quan cho các biến agewed sibs childs age educ và nhận xét về mối quan hệ giữa các biến 5/12/2009 Nguyễn Duy Tâm _ IDR 41 Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn Chọn loại đồ thị là Scatter Nguyễn Duy Tâm _ IDR 42 21
  22. Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn Nhập số liệu Nguyễn Duy Tâm _ IDR 43 Con người –Tầm nhìn mới Đồ thị phân tán:Hài lòng phụ thuộc vào học vấn Các tùy chọn Nguyễn Duy Tâm _ IDR 44 22
  23. Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn Xuất ra trang riêng Nguyễn Duy Tâm _ IDR 45 Đồ thị phân tán: Con người –Tầm nhìn mới Hài lòng phụ thuộc vào học vấn Chọn loại đồ thị là Scatter Nguyễn Duy Tâm _ IDR 46 23
  24. Đồ thị phân tán: Con người –Tầm nhìn mới Hài lòng phụ thuộc vào học vấn Nhập số liệu Nguyễn Duy Tâm _ IDR 47 Đồ thị phân tán: Con người –Tầm nhìn mới Hài lòng phụ thuộc vào học vấn Các tùy chọn Nguyễn Duy Tâm _ IDR 48 24
  25. Đồ thị phân tán: Con người –Tầm nhìn mới Hài lòng phụ thuộc vào học vấn Xuất ra trang riêng Nguyễn Duy Tâm _ IDR 49 MÔ PHỎNG LẤY MẪU LẶP LConẠ ngIười –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE Số thứ tự trong tổng thể: Hàm Randbetween Nguyễn Duy Tâm _ IDR 50 25
  26. MÔ PHỎNG LẤY MẪU LẶP LConẠ ngIười –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE Điền kết quả lấy mẫu: Hàm Vlookup Nguyễn Duy Tâm _ IDR 51 MÔ PHỎNG LẤY MẪU LẶP LẠConI người –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE MÔ PHỎNG BẰNG THỦ TỤC SAMPLING Tools/ Data Analysis/ Sampling Nguyễn Duy Tâm _ IDR 52 26
  27. MÔ PHỎNG LẤY MẪU LẶP LẠICon người –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE STT MẪU MẪU 1 MẪU 2 MẪU 3 MẪU 4 MẪU 5 MẪU 6 MẪU 7 MẪU 8 MẪU 9 MẪU 10 1 27 37 42 32 52 27 42 22 32 32 2 22 32 27 57 32 27 32 47 42 27 3 22 22 52 32 22 42 42 27 37 37 4 42 27 22 22 37 52 27 32 22 22 5 42 47 32 27 32 27 37 27 27 27 6 32 37 22 37 27 37 27 22 42 52 7 27 37 32 42 22 37 32 27 32 32 8 27 57 27 27 37 27 27 22 22 22 9 27 42 52 22 47 32 32 27 27 27 TRUNG BÌNH 29.78 37.56 34.22 33.11 34.22 34.22 33.11 28.11 31.44 30.89 KẾT QUẢ MÔ PHỎNG BẰNG THỦ TỤC SAMPLING 10 MẪU LƢU Ý: KẾT QUẢ NHẬN ĐƢỢC LÀ NGẪU NHIÊN Tạo 10 mẫu theo bảng trên (dùng công cụ Sample, số quan sát mỗi mẫu là 9) Nguyễn Duy Tâm _ IDR 53 MÔ PHỎNG LẤY MẪU LẶPCon ng LẠIười –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE TRUNG BÌNH CỦA TRUNG BÌNH MẪU 32.46 TRUNG BÌNH CỦA TỔNG THỂ 32.488 ĐỘ LỆCH CHUẨN CỦA TRUNG BÌNH MẪU 2.4237 ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ 9.2888 ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ/3 3.0963 TRUNG BÌNH: HÀM AVERAGE  ĐỘ LỆCH CHUẨN: HÀM STDEV   X LƢU Ý: THEO LÝ THUYẾT THÌ X VÀ n CÓ THỂ ĐẠT ĐƢỢC ĐiỀU NÀY VỚI VÔ SỐ LẦN LẤY MẪU Nguyễn Duy Tâm _ IDR 54 27
  28. ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHOCon GIÁ ngườ TRỊi –T ầTRUNGm nhìn mớ i BÌNH (BiẾT )  XZXZ  aa/ 2nn / 2 Chọn a = 0.05 =>P(1-a/2)= 0.975 Tra Za/2 = 1.96 Tính trung bình = 32.49 Ƣớc lƣợng khỏang tin cậy 95%: (31.77; 33.21) Nguyễn Duy Tâm _ IDR 55 ƢỚC LƢỢNG KHOẢNG TÌN ConCẬY ngườ CHOi –Tầm nhìn mới GIÁ TRỊ TRUNG BÌNH (CHƢA BiẾT ) SS X t  X t aa/ 2,nn 1nn / 2, 1 Chọn a = 0.05 =>P(1-a/2)= 0.975 Tra ta/2 = 1.964 Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29 Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23) Nguyễn Duy Tâm _ IDR 56 28
  29. ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHOCon GIÁ ngườ TRỊi –T ầTRUNGm nhìn mớ i BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS Tools/ Data Analysis/ Descriptive Statistics Chọn Summary Statistics và Confidence Level for Mean Nguyễn Duy Tâm _ IDR 57 ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG Con người –Tầm nhìn mới BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS SS X t  X t aa/ 2,nn 1nn / 2, 1 Cận dƣới = Mean – Confidence Level (95%) Cận trên = Mean + Confidence Level (95%) Nguyễn Duy Tâm _ IDR 58 29
  30. Con người –Tầm nhìn mới Bài tập ƣớc lƣợng BÀI TẬP “THUC HANH BÀI TẬP AFFAIR EXCEL 1. Ước lượng độ tuổi bình 1. Ước lượng độ tuổi bình quân (age) của những quân (age) của những người được khảo sát. người được khảo sát 2. Ước lượng độ tuổi bình quân kết hôn (agewed). 3. Ước lượng trình độ học vấn (educ) bình quân của những người được khảo sát. Nguyễn Duy Tâm _ IDR 59 Kiểm định 1 đuôi (Biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average Nguyễn Duy Tâm _ IDR 60 30
  31. Kiểm định 1 đuôi (Biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm Giá trị Z = 11.44 nằm ở miền bác bỏ =>Có bằng chứng thống kê cho thấy số năm học trung bình của người Mỹ lớn hơn 15 năm. Nguyễn Duy Tâm _ IDR 61 Kiểm định 1 đuôi (Không biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra ứng với 2a. Nguyễn Duy Tâm _ IDR 62 31
  32. Kiểm định 1 đuôi (Không biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho. Vậy số năm học trung bình của người Mỹ cao hơn 16. Nguyễn Duy Tâm _ IDR 63 Kiểm định 2 đuôi (Biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải nhập tham số là (1-a/2) Nguyễn Duy Tâm _ IDR 64 32
  33. Kiểm định 2 đuôi (Biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải nhập tham số là (1-a/2) Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể bác bỏ Ho. Nguyễn Duy Tâm _ IDR 65 Kiểm định 2 đuôi (Chƣa biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm Hàm TINV(a, n-1) Nguyễn Duy Tâm _ IDR 66 33
  34. Con người –Tầm nhìn mới Kiểm định 2 đuôi (Chƣa biết s) Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm Z6_EDU Trung bình 16.17 9 Độ lệch chuẩn = 2.40 16 Cỡ mẫu n= 601 14 Sai số chuẩn = 0.10 17 a = 0.05 14 t a/2 = 1.964 14 18 Ho:  = 16 17 H1  <> 16 20 17 Trị thống kê t= 1.70 Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể bác bỏ Ho. Nguyễn Duy Tâm _ IDR 67 Con người –Tầm nhìn mới Bài tập kiểm định BÀI TẬP AFFAIR BTẬP THỰC HÀNH EXCEL 1. Có giả thiết cho rằng, 1. Có giả thiết cho rằng, độ tuổi (age) bình độ tuổi (age) bình quân quân của những người được khảo sát là của những người được dưới 40. Bạn hãy kiểm định giả thiết khảo sát là dưới 30. nàyα=5%. Bạn hãy kiểm định giả 2. Có giả thiết cho rằng, độ tuổi (age) bình thiết này với mức ý quân của những người được khảo sát là nghĩa α=5%. 46. Theo bạn, đúng hay sai α=3%? 2. Có giả thiết cho rằng, 3. Có giả thiết cho rằng, độ tuổi (agewed) độ tuổi (age) bình quân bình quân của những người được khảo của những người được sát là dưới 40. Bạn hãy kiểm định giả khảo sát là 33. Theo thiết này α=4%. bạn, giả thiết này đúng hay sai? (α=10%) Nguyễn Duy Tâm _ IDR 68 34
  35. Kiểm định 2 đuôi (Biết và Chƣa biếtCon ngườ)-iGiá –Tầm nhìntrị m pới Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm ZTEST(Array, x, sigma) với Array: Số liệu cần kiểm định x: Giá trị của phát biểu Ho, Sigma: Nhập  nếu biết hoặc để trống nếu không biết. Nguyễn Duy Tâm _ IDR 69 Con người –Tầm nhìn mới Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá trị p Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm P_Value = 2*Min(ZTEST, 1-ZTEST) P_Value = 0.09> a = 0.05 => Không thể bác bỏ Ho. Nguyễn Duy Tâm _ IDR 70 35
  36. Kiểm định sự khác biệt về trung bìnhCon ng củaười – haiTầm nhìntổng mớ i thể-Biết độ lệch chuẩn Affair.xls trang Edu OBS MALE EDU(FEMALE) OBS MALE EDU(MALE) EDU(FEMALE) EDU(MALE) 1 0 9 1 1 9 Trung bình 15.26 17.17 2 0 9 2 1 9 Độ lệch chuẩn 2.02 2.39 3 0 9 3 1 9 Số quan sát 315 286 4 0 9 4 1 12 5 0 12 5 1 12 Ho: Không có sự khác biệt về học vấn trung bình của hai giới Kết quả khảo sát cho thấy học vấn trung bình của nam nhỉnh hơn của nữ nhưng độ lệch chuẩn cao hơn. Kiểm định Ho bằng thủ tục . Tools | Data Analysis | z-test: Two Sample for Means Nguyễn Duy Tâm _ IDR 71 Kiểm định sự khác biệt về trungCon bình người –củaTầm nhìn hai mớ i tổng thể-Biết độ lệch chuẩn Tools | Data Analysis | z-test: Two Sample for Means Nguyễn Duy Tâm _ IDR 72 36
  37. Kiểm định sự khác biệt về trung bìnhCon ng ườcủai –T ầhaim nhìn tổng mới thể-Biết độ lệch chuẩn Kết quả kiểm định: Bác bỏ Ho Nguyễn Duy Tâm _ IDR 73 Kiểm định sự khác biệt về trung bìnhCon ng ườcủai –T ầhaim nhìn tổng mới thể-Chƣa biết độ lệch chuẩn Ho: Không có sự khác biệt về học vấn trung bình của hai giới Tools | Data Analysis | t-Test: Two Sample Assuming Equal Variances Nguyễn Duy Tâm _ IDR 74 37
  38. Kiểm định sự khác biệt về trung bìnhCon ng ườcủai –T ầhaim nhìn tổng mới thể-Chƣa biết độ lệch chuẩn Ho: Không có sự khác biệt về học vấn trung bình của hai giới Tools | Data Analysis | t-Test: Two Sample Assuming Equal Variances Kết quả: Bác bỏ Ho Nguyễn Duy Tâm _ IDR 75 Con người –Tầm nhìn mới Bài tập kiểm định mức lƣơng trung bình theo giới tính 1. Có ý kiến cho rằng mức lương trung bình theo giới tính giữa nam và nữ là như nhau. Với số liệu của bài tập Tien luong khoi diem theo gioi tinh nam - nu.xls, bạn hãy kiểm định giả thiết trên. 2. Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện tại không có hiệu quả. Bằng dữ liệu bài tập hieu qua software.xls, bạn hãy kiểm định hiệu quả của phần mềm mới và cũ. Nguyễn Duy Tâm _ IDR 76 38
  39. Kiểm định F cho sự khác biệt về phƣơngCon người –T ầsaim nhìn của mới hai tổng thể Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới Tools | Data Analysis | F-Test: Two-Sample for Variances Nguyễn Duy Tâm _ IDR 77 Kiểm định F cho sự khác biệt về phƣơngCon người –T ầsaim nhìn của mới hai tổng thể Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới Kết quả: Bác bỏ Ho Nguyễn Duy Tâm _ IDR 78 39
  40. Kiểm định mẫu cặp: Vợ và chồng có cảmCon ng ườnhậni –Tầ mkhác nhìn m ớbiệti về hạnh phúc không? Affair.xls/ Satisfaction Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Tools | Data Analysis | t-test: Paired Two Sample for Means Nguyễn Duy Tâm _ IDR 79 Kiểm định mẫu cặp: Vợ và chồng Concó ng cảmười –T nhậnầm nhìn m ới khác biệt về hạnh phúc không? Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Kết quả: Chấp nhận Ho. Nguyễn Duy Tâm _ IDR 80 40
  41. Con người –Tầm nhìn mới Bài tập kiểm định cặp Có giả định cho rằng, hiệu quả của một phương pháp quảng cáo được tiến hành cho nhiều công ty khác nhau hiện tại không có hiệu quả. Bằng số liệu của bài tập truoc - sau quang cao ve doanh thu.xls, anh chị hãy kiểm định giả thiết trên Nguyễn Duy Tâm _ IDR 81 HÀM TTEST-Kiểm định sựCon khác người –T ầbiệtm nhìn mới fx/ Statistical/ TTEST Type: 1 cho mẫu cặp, 2 cho phƣơng sai bằng nhau, 3 cho phƣơng sai khác nhau Nguyễn Duy Tâm _ IDR 82 41
  42. ANOVA: Vợ và chồng có có mức độCon hài ngườ lòngi –Tầm nhìn về m hônới nhân trung bình khác nhau không? Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Tools/ Data Analysis/ ANOVA-Single Factor Nguyễn Duy Tâm _ IDR 83 ANOVA: Nam và nữ có có mứcCon ngườ đội –T ầhàim nhìn mới lòng về hôn nhân khác nhau không? Anova: Single Factor SUMMARY Groups Count Sum Average Variance WIFE 250 999 4.00 1.30 HUSBAND 250 984 3.94 1.06 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 0.45 1.00 0.45 0.38 0.54 3.86 Within Groups 586 498 1.18 Total 586 499 Ho: Hai giới thỏa mãn về hôn nhân trung bình như nhau. Kết quả: Chấp nhận Ho Nguyễn Duy Tâm _ IDR 84 42
  43. ANOVA một nhân tố-Ví dụ chƣơng 8 WorksheetCon người –Tầ min nhìn mới Chapter8(V) So sánh năng suất của 3 máy Ho: Năng suất của 3 máy là như nhau Nguyễn Duy Tâm _ IDR 85 ANOVA một nhân tố-Ví dụCon chƣơng người –Tầm nhìn 8 mới Anova: Single Factor SUMMARY Groups Count Sum Average Variance Machine 1 5 124.65 24.93 1.06 Machine 2 5 113.05 22.61 0.78 Machine 3 5 102.95 20.59 0.92 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 47.16 2 23.58 25.60 0.00 3.89 Within Groups 11.05 12 0.92 Total 58.22 14 Ho: Năng suất của 3 máy là như nhau Kết quả kiểm định: Bác bỏ Ho Nguyễn Duy Tâm _ IDR 86 43
  44. Con người –Tầm nhìn mới Thủ tục Tukey-Kramer Tools/ Lumenaut Statistics/ Tukey-Kramer Test Lumenaut là một phần mềm Add-Ins miễn phí, chạy trên nền Excel. Nguyễn Duy Tâm _ IDR 87 Con người –Tầm nhìn mới Thủ tục Tukey-Kramer Tools/ Lumenaut Statistics/ Tukey-Kramer Test Nguyễn Duy Tâm _ IDR 88 44
  45. Thủ tục Tukey-Kramer Con người –Tầm nhìn mới Tukey-Kramer Test Critical v k Value Q MS within 9 3 3.948 0.921 MSD Values Stack Machine 1 Machine 2 Machine 3 Mean Machine 1 1.695 1.695 i Machine 2 2.320 1.695 -Mean Machine 3 4.340 2.020 j If Meani-Meanj > MSD value then pair is significantly different at the 5% level (1 Tailed) Significant pair values are in bold and underlined in above Table Tools/ Lumenaut Statistics/ Tukey-Kramer Test Nguyễn Duy Tâm _ IDR 89 Tìm hệ số chặn và độ dốc Con người –Tầm nhìn mới Hệ số chặn: fx/ Statistical/ INTERCEPT Độ dốc: fx/ Statistical/ SLOPE Nguyễn Duy Tâm _ IDR 90 45
  46. Tìm hệ số chặn và độ dốc Con người –Tầm nhìn mới Hệ số chặn: fx/ Statistical/ INTERCEPT Độ dốc: fx/ Statistical/ SLOPE Nguyễn Duy Tâm _ IDR 91 Vẽ đƣờng xu hƣớng trong Chart Con người –Tầm nhìn mới Click phải/ Add Trendline/ Nguyễn Duy Tâm _ IDR 92 46
  47. Vẽ đƣờng xu hƣớng trong Chart Con người –Tầm nhìn mới Type: Linear Options: Display Equation on chart Nguyễn Duy Tâm _ IDR 93 Con người –Tầm nhìn mới Vẽ đƣờng xu hƣớng trong Chart 12,000 y = 1.5x + 1636.4 10,000 R2 = 0.9 8,000 Sales 6,000 Sales Linear (Sales) 4,000 2,000 0 0 1,000 2,000 3,000 4,000 5,000 6,000 Footage Kết quả Nguyễn Duy Tâm _ IDR 94 47
  48. Thủ tục REGRESSION Con người –Tầm nhìn mới Tools/ Data Analysis/ REGRESSION Nguyễn Duy Tâm _ IDR 95 Con người –Tầm nhìn mới KẾT QUẢ SUMMARY OUTPUT Regression Statistics Multiple R 0.97 R Square 0.94 Adjusted R Square 0.93 Standard Error 611.75 Observations 7 ANOVA df SS MS F Significance F Regression 1 30,380,456 30380456 81.18 0.00 Residual 5 1,871,200 374240 Total 6 32,251,656 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 1,636.41 451.50 3.62 0.02 475.81 2,797.02 Footage 1.49 0.16 9.01 0.00 1.06 1.91 Nguyễn Duy Tâm _ IDR 96 48
  49. Từ bảng kết xuất của Excel Con người –Tầm nhìn mới Residuals 12000 10000 8000 6000 Predicted Sales 4000 Residuals 2000 0 Predicted Sales and Residuals and Sales Predicted 0 2 4 6 8 -2000 Observations Nguyễn Duy Tâm _ IDR 97 Phần dƣ theo biến độc lập Con người –Tầm nhìn mới Footage Residual Plot 1000 800 600 400 200 0 Residuals -200 0 1,000 2,000 3,000 4,000 5,000 6,000 -400 -600 -800 Footage Nguyễn Duy Tâm _ IDR 98 49
  50. Con người –Tầm nhìn mới Real and Fitted Values Footage Line Fit Plot 12,000 y = 1.4866x + 1636.4 10,000 R2 = 1 8,000 6,000 Sales Sales 4,000 Predicted Sales 2,000 Linear (Predicted 0 Sales) 0 1,000 2,000 3,000 4,000 5,000 6,000 Footage Nguyễn Duy Tâm _ IDR 99 Tools/ Data Analysis/ RegressionCon người –Tầm nhìn mới Hồi quy đơn: Oil theo Temp Lê Tấn Luật 100 50
  51. Con người –Tầm nhìn mới Hồi quy đơn: Oil theo Temp SUMMARY OUTPUT Regression Statistics Multiple R 0.87 R Square 0.76 Adjusted R Square 0.74 Standard Error 66.51 Observations 15 ANOVA df SS MS F Significance F Regression 1 178624 178624 40 0.00 Residual 13 57511 4424 Total 14 236135 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 436.43823 38.63970893 11.29507 4.3E-08 352.962214 519.914246 Temp -5.4622077 0.859608768 -6.3543 2.52E-05 -7.3192795 -3.6051359 Lê Tấn Luật 101 Hồi quy đơn: Oil theo Insulation Con người –Tầm nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.47 R Square 0.22 Adjusted R Square 0.16 Standard Error 119 Observations 15 ANOVA df SS MS F Significance F Regression 1 51,076 51,076 3.59 0.08 Residual 13 185,059 14,235 Total 14 236,135 Coefficients Standard Error t Stat P-value Lower 95%Upper 95% Intercept 345.38 74.69 4.62 0.00 184.02 506.74 Insulation -20.35 10.74 -1.89 0.08 -43.56 2.86 Lê Tấn Luật 102 51
  52. ườ ầ ớ Hồi quy bội: Oil theo Temp và InsulationCon ng i –T m nhìn m i Quét Known’s X: cả Temp và Insulation SUMMARY OUTPUT Regression Statistics Multiple R 0.98 R Square 0.97 Adjusted R Square 0.96 Standard Error 26.01 Observations 15 ANOVA df SS MS F Significance F Regression 2 228015 114007 168 0.00 Residual 12 8121 677 Total 14 236135 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 562.15 21.09 26.65 0.00 516.19 608.11 Temp -5.44 0.34 -16.17 0.00 -6.17 -4.70 Insulation -20.01 2.34 -8.54 0.00 -25.12 -14.91 Lê Tấn Luật 103 Biến Insulation có cải thiện môCon hình người – Ttừầm nhìn Oil mớ i = f(Temp) không? Kết quả tính toán cho Fc = 73 Lê Tấn Luật 104 52
  53. Tra giá trị tới hạn của F: FINV Con người –Tầm nhìn mới Kết quả tính toán F* = 4.75 F =73 > F*: 4.75 Kết luận: Insulation làm tăng mức độ giải thích của mô hình. Lê Tấn Luật 105 Hồi quy bậc hai: Chuẩn bị sốCon liệungười – Tầm nhìn mới Temp2=Tem^2 Oil (Gal) Temp Temp2 275.30 40 1600 363.80 27 729 164.30 40 1600 40.80 73 5329 94.30 64 4096 230.90 34 1156 366.70 9 81 300.60 8 64 237.80 23 529 121.40 63 3969 31.40 65 4225 203.50 41 1681 441.10 21 441 323.00 38 1444 52.50 58 3364 Lê Tấn Luật 106 53
  54. Kết quả hồi quy Con người –Tầm nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.88 R Square 0.78 Adjusted R Square 0.74 Standard Error 65.71 Observations 15 ANOVA df SS MS F Significance F Regression 2 184,324 92,162 21 0.00 Residual 12 51,811 4,318 Total 14 236,135 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 372.33 67.60 5.51 0.00 225.04 519.62 Temp -1.26 3.75 -0.34 0.74 -9.44 6.91 Temp2 -0.05 0.05 -1.15 0.27 -0.15 0.05 Lê Tấn Luật 107 Hồi quy với biến giả Con người –Tầm nhìn mới TC = Tổng chi phí sản xuất Q = Tổng sản lượng CN = 1 cho các quý đã thay đổi công nghệ, 0 cho các quý trước khi thay đổi công nghệ. TCN = 0 cho các quý đã thay đổi công nghệ, 1 cho các quý trước khi thay đổi công nghệ. Lê Tấn Luật 108 54
  55. Sai lầm -> Đa cộng tuyếnCon hoàn người –T ầhảom nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.94 R Square 0.87 Adjusted R Square 0.78 Standard Error 56.65 Observations 16 ANOVA df SS MS F Significance F Regression 3 291,681 97,227 45 0.00 Residual 13 41,727 3,210 Total 16 333,408 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 521.80 122.46 4.26 0.00 257.24 786.35 Q 0.81 0.10 8.04 0.00 0.59 1.03 CN 0.00 0.00 65,535.00 #NUM! 0.00 0.00 TCN 210.63 52.80 3.99 0.00 96.55 324.70 Lê Tấn Luật 109 Hồi quy với biến giả Con người –Tầm nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.94 R Square 0.87 Adjusted R Square 0.86 Standard Error 56.65 Observations 16 ANOVA df SS MS F Significance F Regression 2 291,681 145,841 45.44 1.36E-06 Residual 13 41,727 3,210 Total 15 333,408 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 732.42 79.51 9.21 0.00 560.65 904.20 Q 0.81 0.10 8.04 0.00 0.59 1.03 CN -210.63 52.80 -3.99 0.00 -324.70 -96.55 Lê Tấn Luật 110 55
  56. Hồi quy với biến tƣơng tác Con người –Tầm nhìn mới SUMMARYCNQ OUTPUT = CN*Q Regression Statistics Multiple R 0.98 R Square 0.96 Adjusted R Square0.95 Standard Error 33.19 Observations 16 ANOVA df SS MS F Significance F Regression 3 320190 106730 96.90 1.11913E-08 Residual 12 13218 1102 Total 15 333408 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 401.52 80.00 5.02 0.00 227.21 575.83 Q 1.24 0.10 11.98 0.00 1.02 1.47 CN 368.96 118.05 3.13 0.01 111.75 626.17 CNQ -0.64 0.13 -5.09 0.00 -0.92 -0.37 Lê Tấn Luật 111 Ý nghĩa của biến giả và biếnCon tƣơngngười –Tầm nhìntác mới TC = 401 + 1.24*Q + 368*CN – 0.64CNQ P (0.00) (0.00) (0.01) (0.00) R2 = 0.96 Adjusted R2= 0.95 n= 16 Trước thay đổi công nghệ: CN=CNQ=0 TC = 401 + 1.24*Q Sau thay đổi công nghệ: CN=1, CNQ=Q TC = (401+368) + (1.24-0.68)*Q TC = 769 + 0.56*Q Vậy thay đổi công nghệ làm định phí tăng nhưng biến phí đơn vị giảm. Lê Tấn Luật 112 56
  57. Hồi quy với biến chuyển dạngCon ng ườlogi –Tầ-mlog nhìn mới Mô hình tuyến tính: Q=b1+b2*L+b3*K SUMMARY OUTPUT Regression Statistics Multiple R 0.99 R Square 0.99 Adjusted R Square 0.99 Standard Error 1,570.36 Observations 15 ANOVA df SS MS F Significance F Regression 2 2686989117 1.34E+09 545 1.67092E-12 Residual 12 29592539.09 2466045 Total 14 2716581656 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept -32,375.93 3,140.85 -10.31 0.00 -39,219.24 -25,532.61 L 2.62 6.43 0.41 0.69 -11.39 16.62 K 344.47 40.87 8.43 0.00 255.43 433.51 Lê Tấn Luật 113 Con người –Tầm nhìn mới Chuyển dạng log-log Hàm sản xuất Cobb-Douglas a b (1) Q = A*L *K Không thể ước lượng trực tiếp hàm (1) ln(Q) = ln(A) + a*ln(L) + b*ln(K) Y = b0 + b1*X1 + b2*X2 Với b0 = ln(A); b1= a; b2=b; X1= ln(L); X2=ln(K) Chúng ta đã chuyển về dạng mô hình hồi quy tuyến tính thông thường Lê Tấn Luật 114 57
  58. Chuẩn bị số liệu log-log: Hàm Conln(Number) người –Tầm nhìn mới lnQ lnL lnK 9.10 5.64 4.79 9.29 5.65 4.81 9.32 5.67 4.83 9.31 5.93 4.86 9.45 5.93 4.88 9.70 6.00 4.90 9.88 6.17 4.93 9.96 6.32 4.99 10.05 6.42 5.04 10.17 6.54 5.10 10.29 6.67 5.18 10.42 6.70 5.24 10.55 6.74 5.33 10.76 6.77 5.40 10.90 6.91 5.48 Lê Tấn Luật 115 Kết quả hồi quy Con người –Tầm nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.99 R Square 0.98 Adjusted R Square 0.97 Standard Error 0.09 Observations 15 ANOVA df SS MS F Significance F Regression 2 4 2 267 1.13248E-10 Residual 12 0 0 Total 14 5 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept -0.38 0.78 -0.49 0.63 -2.07 1.31 lnL 0.67 0.17 3.85 0.00 0.29 1.04 lnK 1.22 0.34 3.56 0.00 0.47 1.96 Lê Tấn Luật 116 58