Phân tích dữ liệu nghiên cứu với phần mềm EViews 5.1

pdf 71 trang phuongnguyen 2810
Bạn đang xem 20 trang mẫu của tài liệu "Phân tích dữ liệu nghiên cứu với phần mềm EViews 5.1", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfphan_tich_du_lieu_nghien_cuu_voi_phan_mem_eviews_5_1.pdf

Nội dung text: Phân tích dữ liệu nghiên cứu với phần mềm EViews 5.1

  1. TRƯỜNG ĐẠI HỌC NHA TRANG KHOA KINH TẾ BỘ MÔN KINH TẾ CƠ SỞ PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI PHẦN MỀM EVIEWS 5.1 Nha Trang, tháng 03 năm 2009
  2. TRƯỜNG ĐẠI HỌC NHA TRANG KHOA KINH TẾ BỘ MÔN KINH TẾ CƠ SỞ Th.S. PHẠM THÀNH THÁI PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI PHẦN MỀM EVIEWS 5.1 Nha Trang, tháng 03 năm 2009
  3. 1 Giới thiệu Có rất nhiều phần mềm xử lý dữ liệu cho môn học Kinh tế lượng. Các phần mềm thường được sử dụng có các tên gọi như là STATA, SPSS, EXCEL, MINITAB, và Eviews. . . Các phần mềm này đều có điểm chung là giúp chúng ta xử lý dữ liệu một cách nhanh chóng. Tuy nhiên, mỗi phần mềm lại có những đặc điểm riêng. STATA có thể tốt cho các dữ liệu từ các cuộc điều tra lớn, SPSS có ưu điểm xử lý dữ liệu mô tả tốt dưới dạng bảng biểu, EXCEL thì có ở khắp mọi máy tính PC thông thường mà không cần phải cài đặt gì thêm Riêng môn học kinh tế lượng, chúng ta sẽ chủ yếu sử dụng phần mềm Evews với phiên bản 5.1. Ưu điểm chính của EViews là có thể cho chúng ta kết quả nhanh chóng về hàm kinh tế lượng cho các dữ liệu chéo (Cross-Section data), dữ liệu chuỗi thời gian (Time series data) và dữ liệu bảng (Panel data). Ngoài ra, phần mềm này lại được chạy trong môi trường Window nên rất ít khi cần nhớ các lệnh cụ thể.
  4. 2 Chương 1: LÀM VIỆC VỚI EVIEWS 5.1 1.1. Khởi động Eviews. Biểu tượng của EViews trên màn hình Windows trông như thế này: Nhấn đúp vào biểu tượng EViews và EViews bắt đầu hoạt động. Hãy ghi nhận menu chính, cửa sổ lệnh, cửa sổ chính, và dòng tình trạng (status line). Menu chính bao gồm những lựa chọn sau: File Edit Objects View Procs Quick Options Window Help Hãy nhấp vào mỗi một trong những lựa chọn này và kiểm tra các menu phụ xuất hiện ở phía dưới. Các bạn có thể muốn tìm hiểu một số chi tiết về các chủ đề trong Help. Phương tiện Help của Eviews rất tuyệt vời. Dưới menu chính này là một cửa sổ, người ta gọi là cửa sổ lệnh. Cửa sổ này dùng để viết các câu lệnh và thực hiện một số công việc khác. Khi các bạn mở EViews lần đầu tiên, cửa sổ chính còn trống vì các bạn còn chưa xác định tập tin làm việc nào (workfile) để sử dụng. 1.2. Mở tập tin làm việc (Workfile) đã lưu giữ từ trước.
  5. 3 Nhấp File/Open/Workfile; một màn hình mở ra, trên đó liệt kê các tập tin trong thư mục mặc định (default folder). Nếu thư mục mặc định không phải là thư mục mà anh chị mong muốn, thì các bạn có thể tìm trong các thư mục cho tới khi tìm ra thư mục mà các bạn muốn dùng. Để chỉ ra các workfile trên EViews, dòng "Files of type" cần xác định Workfile (*.wf1). Vì các bạn dự định sử dụng thư mục này thường xuyên, nên các bạn nên nhấp chuột để đánh dấu vào ô vuông (Update default directory) giúp cập nhật thư mục mặc định ở góc trái-phía dưới cửa sổ Open như trên đây. Lần sau, khi các bạn khởi động EViews, chuỗi File/Open/Workfile sẽ tự động chỉ tới thư mục này. Mở workfile có tên bai15.wf1 bằng cách nhấp đúp vào nó. Cách khác, các bạn có thể bôi đen nó bằng cách nhấp đơn, sau đó nhấp Open. Với workfile đang mở , màn hình của các bạn có dạng:
  6. 4 Thanh trên cùng trên menu của Workfile chỉ toàn bộ đường dẫn đối với Workfile này; thanh tình trạng ở dưới đáy của màn hình cũng chỉ đường dẫn này, và nó chỉ workfile đang sử dụng : WF = bai15. Menu của workfile chứa các nút bấm, bao gồm: View Procs Objects Label +/- Show Fetch Store Delete Genr Sample Các phím bấm với +/- là các phím chuyển đổi thực hiện các chức năng bật và tắt. Thông tin về workfile này xuất hiện dưới thanh menu: Range Display Filter: * Sample Cuối cùng, phía trong cửa sổ của workfile, chúng ta thấy tất cả các đối tượng đang có mặt trong workfile này: các chuỗi (các biến), các nhóm chuỗi, vector hệ số, vector phần dư, và bất cứ phương trình, đồ thị hay bảng nào đã được đặt tên. Muốn đóng file bai15.wf1 hãy nhấp vào dấu X ở góc phải phía trên của workfile này. Bây giờ hãy nhấp File. Ghi nhớ rằng các workfile mới mở gần nhất sẽ hiện ra ở phía dưới cùng của menu trải ra phía dưới. Nếu các bạn muốn mở lại một trong số đó, chỉ việc nhấp vào tên của nó.
  7. 5 1.3. Tạo một file làm việc mới (Workfile) và nhập dữ liệu nghiên cứu. 1.3.1. Tạo file làm việc mới (New Workfile). Sau khi đã khởi động Eviews các bạn có thể tạo ra một file làm việc mới bằng cách nhấp chuột vào nút File trên menu chính, chọn New/Workfile, khi đó màn hình sẽ như sau:
  8. 6 Nhấp chuột vào Workfile, màn hình sẽ xuất hiện cửa sổ Workfile Create như sau: Nhấp chuột vào mũi tên ở khung Workfile structure type ta thấy có 3 loại cấu trúc file làm việc, đó là: - Date - regular frequency: Cấu trúc file làm việc với dữ liệu theo thời gian. - Unstructure / Undated: Cấu trúc file làm việc với dữ liệu chéo. - Balanced Panel: Cấu trúc file làm việc với dữ liệu dạng bảng. ( Nếu dữ liệu của mẫu nghiên cứu là dữ liệu theo thời gian thì chọn Date – regular frequency. Tiếp theo, bạn nhấp chuột vào mũi tên ở khung Date specification, khi đó màn hình sẽ như sau: Nhìn vào frequency ta chọn loại dữ liệu. Nếu là dữ liệu từng năm ta chọn Annual; nếu là dữ liệu nửa năm, chọn Semi-annual; nếu là dữ liệu từng quý, chọn Quarterly; nếu là dữ liệu từng tháng, chọn Monthly, nếu là dữ liệu tuần,
  9. 7 chọn Weekly, Khi đã chọn loại dữ liệu thích hợp, trong khung start date ta gõ mốc thời gian đầu tiên (1995) - ví dụ: năm bắt đầu của mẫu dữ liệu nghiên cứu là 1995 và năm cuối cùng là 2005, và trong khung End date ta gõ mốc thời gian cuối cùng (2005) của mẫu dữ liệu. Sau khi hoàn tất các thủ tục trên ta bấm OK, một file làm việc mới sẽ được tạo ra như sau: ( Nếu dữ liệu của mẫu nghiên cứu là dữ liệu chéo thì ta chọn Unstructure / Undated. Trong khung Data range ta gõ số quan sát của mẫu dữ liệu vào chỗ Obserations và bấm OK. Ví dụ, cỡ mẫu là 55 (n=55) thì ta gõ số 55 vào. Khi đó, màn hình sẽ như sau: ( Nếu dữ liệu của mẫu nghiên cứu là dữ liệu dạng bảng thì ta chọn Balanced Panel. (Trong tài liệu này chủ yếu trình bày cách sử dụng Eviews với dữ liệu nghiên cứu theo thời gian và dữ liệu chéo, còn dữ liệu dạng bảng không được đề cập. Bạn đọc muốn biết cách sử dụng Eviews với dữ liệu dạng bảng có thể tìm đọc ở một số sách hướng dẫn khác hoặc xem phần Help trong Eviews).
  10. 8 1.3.2. Nhập dữ liệu nghiên cứu. Sau khi đã tạo ra file làm việc mới, các bạn có thể nhập dữ liệu vào Eviews bằng nhiều cách khác nhau, sau đây là một số cách thức để nhập dữ liệu thường được sử dụng. 1.3.2.1. Nhập dữ liệu bằng cách copy và dán (Copy và Paste). Sau khi các biến đã được xác định, các giá trị của chúng có thể được nhập vào bằng cách sử dụng lệnh copy, sau đó dán (Paste) vào màn hình của bảng tính EViews. Các bạn có thể copy và dán từ nhiều nguồn, bao gồm cả thư điện tử. Đôi khi các bạn phải lưu giữ dữ liệu này trước hết như là một tập tin ngôn ngữ (text file), sau đó copy và dán nó. Trước khi bắt đầu thao tác copy/paste này, các bạn phải tạo ra các biến trong workfile mục tiêu. Hãy tưởng tượng rằng các bạn muốn copy và dán một biến có tên Y vào workfile của mình. Đầu tiên, hãy mở workfile này, sau đó nhấp Genr và đánh máy Y = NA, sau đó bấm OK, động tác này tạo ra một biến có tên Y nhưng tất cả các giá trị của nó đều không có. Các bạn có thể quan sát ở các hình sau đây.
  11. 9 Mở chuỗi Y. Bây giờ nhấp Edit+/-. Lúc này, các bạn hãy bôi đen và copy dữ liệu cho Y từ nguồn của nó (chẳng hạn copy dữ liệu Y từ Excel), sau đó nhấp vào ô đầu tiên của chuỗi Y trên EViews và nhấp Edit/Paste ở phần menu chính (hoặc các bạn cũng có thể bấm chuột phải, sau đó Paste). Dữ liệu này rơi vào vị trí mà các bạn đã chọn. Hoàn tất thao tác này bằng cách tắt edit (nhấp Edit+/-).
  12. 10 1.3.2.2. Nhập dữ liệu từ bàn phím. Giả sử ta đã tạo ra một file làm việc mới có dạng như sau: Từ cửa sổ Eviews ta chọn Quick/Empty Group(Edit series), một cửa sổ sẽ xuất hiện như sau: Cửa sổ này có cấu tạo giống như một bảng tính Excel, do đó chúng ta có thể nhập dữ liệu vào bảng tính này một cách dễ dàng như chúng ta nhập dữ liệu vào Excel vậy. Nhìn vào cửa sổ trên ta thấy cột thứ nhất ghi thứ tự các quan sát. Từ cột thứ hai bạn có thể nhập dữ liệu của các biến, mỗi cột nhập vào một biến. Ví dụ, để nhập dữ liệu của một mẫu quan sát (n=12) gồm các biến Y, X2, X3 ta tiến hành như sau:
  13. 11 Đầu tiên ta nhập dữ liệu của biến Y trước (dĩ nhiên các bạn có thể nhập dữ liệu của biến X2 hoặc X3 trước đều được) vào cột thứ hai, ta nhấp chuột vào ô đầu tiên của cột này và gõ tên biến Y vào, sau đó bấm Enter. Màn hình sẽ có dạng như sau: Lúc này các bạn gõ lần lượt giá trị quan sát của biến Y vào ô đóng khung (bên trong có chữ NA – Not Available). Sau khi nhập xong dữ liệu của biến Y, các bạn có thể tiến hành nhập dữ liệu của các biến X2, X3 một cách tương tự. Kết quả nhập liệu của các biến sau khi hoàn thành sẽ được thể hiện như màn hình sau: Sau khi nhập liệu xong, đóng cửa sổ dữ liệu bằng cách nhấp chuột vào ô có dấu X ở góc trên bên phải cửa sổ này.
  14. 12 1.3.2.3. Nhập dữ liệu từ các phần mềm khác. Dữ liệu có thể được nhập vào từ các tập tin Lotus, Excel, SPSS, MINITAB hoặc ASCII. Để nhập được một file số liệu từ Excel vào Eviews bạn cần phải ghi nhớ: - Tần suất (loại) của số liệu trong file này là gì? (Số liệu chéo hay số liệu theo thời gian. Nếu là số liệu theo thời gian thì tần suất thời gian là tháng, quý, năm, tuần hay ngày, ). - Thời điểm bắt đầu và thời điểm kết thúc đối với chuỗi thời gian, nếu là dữ liệu chéo thì có bao nhiêu quan sát tất cả (cỡ mẫu là bao nhiêu). - Có bao nhiêu biến số và tên của các biến số đó. Bạn cũng cần ghi nhớ là các biến trong file Excel là ghi theo cột hay theo hàng. - Số liệu bắt đầu được ghi ở ô nào, có tên biến số ở ô đầu tiên hay không? - Số liệu ghi trong file Excel được ghi ở sheet nào? (Tên sheet?). Chúng ta biểu diễn với một tập tin Excel có tên Bai18.xls chứa dữ liệu của ba biến gồm: Y (Doanh số), X2 (Chi phí quảng cáo), X3 (Tiền lương của nhân viên tiếp thị) của 12 công ty. Dữ liệu trong file Excel khi mở ra màn hình của nó có dạng như sau:
  15. 13 Quan sát file dữ liệu này ta thấy dữ liệu nghiên cứu là dữ liệu chéo; có tổng cộng là 12 quan sát; có ba biến số là Y, X2, X3; cả ba biến số này đều được ghi theo cột; số liệu bắt đầu được ghi ở ô B2, với tên biến số là Y ở ô đầu tiên (B1); và tập dữ liệu này được ghi ở Sheet3. Các bước tiến hành như sau: Đầu tiên các bạn phải tạo ra một file làm việc (Workfile) mới. Cách tạo ra một file làm việc đã được trình bày ở phần trên. File làm việc sau khi được tạo ra sẽ có màn hình như sau: Trong cửa sổ này ta thấy có vector hệ số “C” và vector phần dư “Resid” được Eviews tự động tạo ra. Vector hệ số “C” chứa các hệ số hồi quy được ước lượng. Vector phần dư “Resid” chứa phần dư. Do vây, không được dùng “C” và “Resid” để đặt tên cho các biến khác. Từ cửa sổ Workfile này bạn nhấp chuột vào nút Proc/Import/Read Text- Lotus-Excel Bạn sẽ được nhìn thấy như ở màn hình sau:
  16. 14 Sau khi chọn Proc/Import/Read Text-Lotus-Excel như chỉ dẫn ở hình trên, và bạn phải chỉ ra đường dẫn và tên file. Trong ví dụ này file Bai18.xls có đường dẫn là: D:\MYDOCUMENT\BAI TAP KINH TE LUONG\ Bai18.xls. Khi đó màn hình được mở ra như sau: Sau khi bạn nhấp chuột vào nút “Open”, cửa số dưới đây sẽ xuất hiện.
  17. 15 Trong khung “Data order” máy tính đã mặc định dữ liệu được ghi theo cột. Vì vậy, ta không cần phải chọn nữa vì dữ liệu của file Bai18.xls được ghi theo cột. Nếu dữ liệu ghi theo hàng ta chọn “By Series – series in rows”. Trong khung “Upper - left data cell” máy tính đã mặc định dữ liệu được ghi bắt đầu ở vị trí ô B2. Do đó, ta không cần thay đổi gì cả vì dữ liệu của file Bai18.xls được ghi bắt đầu ở ô B2. Giả sử dữ liệu bắt đầu ở ô C2 hay A2 thì ta phải thay B2 bằng C2 hay A2 cho phù hợp. Trong khung “Excel 5 + sheet name” chúng ta phải gõ vào chữ “sheet3” vì dữ liệu của file Bai18.xls được ghi ở sheet3. Nếu bạn không gõ vào tên sheet (sheet name) là gì, khi đó máy tính sẽ mặc nhiên lấy từ sheet1. Trong khung “Names for series or ” ta nhập vào tên của các biến số, mỗi biến số cách nhau ít nhất một khoảng trắng. Trong trường hợp file có nhiều biến số thì ta chỉ cần nhập số biến số. Trong ví dụ này ta nhập số biến số là 3. Sau khi làm xong các bước ở trên, bạn chọn “OK” để hoàn tất việc nhập liệu. Khi đó, một cửa sổ sẽ xuất hiện như sau:
  18. 16 Workfile này chưa có tên. Bạn có thể lưu workfile này bằng cách nhấp vào “Save”, đặt một tên mà bạn muốn, lưu ở thư mục nào, ổ đĩa nào là tùy bạn. Ở đây tôi lưu với tên là Bai18.wf1. Lưu ý, phần mở rộng của file Eviews là wf1 máy sẽ tự gán. Một khi bạn đã lưu lại rồi, sau này bạn muốn sử dụng workfile này bạn không cần phải nhập dữ liệu lại từ đầu. Bằng cách nhấp đúp chuột vào từng biến, các bạn có thể kiểm tra xem dữ liệu đã được nhập vào như mong muốn hay chưa. Các bạn cũng có thể mở nhiều biến cùng lúc trên một nhóm (Group) theo thứ tự mà mình muốn bằng cách bạn nhấn phím Ctrl và nhấp chuột vào biến số mong muốn. Sau khi đã chọn xong các biến số, bạn chỉ cần đưa chuột vào bất kỳ vị trí nào trong phần đã được đánh dấu rồi bấm chuột phải, chọn Open/as Group. Các bạn có thể nhìn thấy ở các hình sau.
  19. 17 Như vậy, ta đã nhập xong dữ liệu từ một file Excel vào Eviews theo mong muốn. Trong nghiên cứu người ta thường thích nhập liệu bằng cách này hơn.
  20. 18 Chương 2: LÀM VIỆC VỚI MỘT WORKFILE Sau khi đã tạo ra một workfile mới và nhập dữ liệu xong, chúng ta có thể tiến hành các phân tích như: Tính các trị thống kê mô tả, vẽ đồ thị, ước lượng hàm kinh tế lượng, kiểm định giả thuyết, dự báo 2.1. Lựa chọn các biến từ một Workfile. Sau khi khởi động Eviews, bạn hãy mở một workfile đã được tạo ra từ trước bằng cách nhấp vào File/Open/Workfile, sau đó tìm đến file cần mở (ví dụ ở đây là file có tên Bai18.wf1) hãy nhấp đúp vào Bai18.wf1. Với mục đích lựa chọn một biến (hoặc nhiều biến) để làm việc, bạn hãy bôi đen chúng. Nếu bạn muốn bôi đen nhiều biến, thì hãy giữ phím Ctrl và nhấp vào mỗi biến, hoặc kéo con trỏ qua các biến mà bạn muốn bôi đen. Hãy bôi đen Y, X2 và X3. Nhấp đúp vào một trong các biến đã bôi đen (hoặc nhấp chuột phải), chọn Open/ as Group, và sau đó cả ba biến đều hiện trên bảng tính như hình sau: Nhấp name và đặt tên cho nhóm Y, X2, X3 với tên nhóm mà bạn thích. Bạn có thể kiểm tra chuỗi Y, X2, X3 bằng cách sử dụng các phím ←↑→↓ để di chuyển trên bảng tính.
  21. 19 2.2. Vẽ đồ thị trong Eviews. Có nhiều cách để vẽ đồ thị trong Eviews, và Eviews cũng cho phép chúng ta vẽ nhiều loại đồ thị khác nhau. Sau đây trình bày hai cách vẽ chủ yếu. Vẽ đồ thị bằng cách mở chuỗi dưới dạng bảng. ( Nếu bạn muốn vẽ đồ thị mô tả xu hướng sự biến thiên của một biến (hay nhiều biến) nào đó, từ cửa sổ nhóm mà ta đã mở như ở trên, bạn nhấn View/Graph/Line như hình sau: Kết quả được thể hiện ở hình sau:
  22. 20 Lưu ý: Nếu bạn chỉ vẽ đồ thị cho một biến thì nên mở một biến thôi. Nếu bạn chọn Graph thì máy sẽ vẽ đồ thị của tất cả các biến số có trong Group trên cùng một hệ trục tọa độ, với trục tung là biến số được chọn, trục hoành là thứ tự các quan sát (nếu là dữ liệu chéo) hay thời gian (nếu là dữ liệu theo thời gian). Các biến số được vẽ với các màu khác nhau để bạn dễ nhận biết. Nếu bạn chọn Multiple Graphs thì mỗi biến số được vẽ trên một đồ thị riêng biệt. ( Nếu bạn muốn vẽ đồ thị phân tán của hai biến nào đó (ví dụ, ta vẽ đồ thị phân tán của Y theo X2). Để vẽ đồ thị này trước tiên bạn hãy mở biến X2 và Y trên cùng một nhóm (ghi nhớ là biến số nằm trên trục hoành chọn trước rồi mới chọn biến số trên trục tung), xem hình sau: Từ cửa sổ này bạn chọn View/Graph/Scatter/simple Scatter hoặc View/Graph/Scatter/ Scatter with Regression, khi đó đồ thị phân tán sẽ như sau:
  23. 21 Bạn có thể thấy sự khác nhau của hai cách chọn với hai đồ thị khác nhau như hình trên. Trên cửa sổ Group có nhiều thực đơn khác nhau, mỗi thực đơn có nhiều lựa chọn khác nhau, ở đây không trình bày hết các lựa chọn đó. Bạn đọc có thể thử từng lựa chọn một rồi xem kết quả để rút ra bài học riêng cho mình. Vẽ đồ thị không cần mở chuỗi dưới dạng bảng. Bây giờ hãy trở lại workfile. Hãy vào menu chính và nhấp vào Quick/Graph dùng để vẽ đồ thị linh động hơn. Cách vẽ này không cần phải mở chuỗi dữ liệu như cách đã vẽ ở trên. Một cửa sổ mở ra yêu cầu bạn xác định chuỗi hoặc các nhóm, bạn cần đánh máy X2 Y, mối biến cách nhau một khoảng trắng và nhấn OK. Biến mà bạn
  24. 22 liệt kê đầu tiên được vẽ trên trục hoành. Hãy lưu ý tới sự đa dạng của các lựa chọn trong menu. 2.3. Tính các trị thống kê mô tả của mẫu. Giả sử ta muốn tính các trị thống kê mô tả của các biến Y, X2, và X3 ta làm như sau: Trước tiên các bạn lựa chọn và mở các biến cần tính trên một Group, sau đó chọn View/Descriptive Statistics/Common Sample.
  25. 23 2.4. Tính hệ số tương quan (ma trận tương quan) giữa các biến. Giả sử ta muốn tìm ma trận tương quan của các biến Y, X2, và X3 ta làm như sau: Trước tiên các bạn lựa chọn và mở các biến cần tính trên một Group, sau đó chọn View/Correlations/Common Sample.
  26. 24 2.5. Lựa chọn mẫu dữ liệu (định mẫu mới). Lựa chọn mẫu dữ liệu là chọn giai đoạn nghiên cứu trong dữ liệu hiện có trong workfile. Chúng ta thường muốn tập trung phân tích vào một mẫu phụ của dữ liệu. EViews cho phép chúng ta làm điều này theo hai cách: (1) bằng cách xác định khoảng mẫu mà chúng ta muốn xem xét, (2) hoặc là bằng cách xác định các
  27. 25 quan sát thoả mãn một điều kiện logic (if) nào đó. Nếu chúng ta sử dụng cả hai phương pháp, thì mẫu kết quả là giao của các mẫu được tạo ra bởi hai phương pháp này. Ví dụ, bây giờ ta muốn sử dụng một mẫu mới gồm 7 quan sát, từ quan sát thứ 4 đến quan sát thứ 10 trong mẫu này. Để làm việc này ta nhấp vào nút Sample trong bảng tính và đánh vào một mẫu mới: 4 10 (mỗi con số cách nhau ít nhất một khoảng trắng). Sau khi đánh vào một mẫu mới theo mong muốn, bạn chọn OK, công việc sẽ hoàn tất. Để kiểm tra mẫu dữ liệu mới có đúng như mong muốn không, bạn hãy mở các biến ra theo nhóm sẽ thấy màn hình có kết quả như sau:
  28. 26 Nếu mẫu mới của bạn chỉ gồm những quan sát có Y lớn hơn 120 chẳng hạn, khi đó bạn gõ vào khung IF condition (optional): Y > 120. Hoặc nếu mẫu của bạn chỉ gồm những quan sát thỏa X2 bằng 18, thì khi đó bạn đánh máy vào khung IF condition (optional): X2 = 18. 2.6. Mở rộng Workfile làm việc. Hãy tưởng tượng rằng chúng ta mong muốn nhận được dữ liệu bổ sung của 8 quan sát nữa cho workfile này. Chúng ta có thể mở rộng workfile này với mục đích bổ sung thêm dữ liệu này. Nhấp Proc/Structure Resize Current Page và đánh máy vào khung Data range chỗ “observations” con số 20 (Vì workfile cũ hiện có 12 quan sát, ta muốn bổ sung thêm 8 quan sát nữa nên có tổng cộng là 20 quan sát). Bạn đọc cần lưu ý, nếu dữ liệu nghiên cứu là dữ liệu theo thời gian thì bạn chỉ cần đánh máy một End Date (dữ liệu cuối) mới.
  29. 27 Sau khi bạn chọn OK thì công việc đã hoàn tất. Tiếp tục mở nhóm gồm 3 biến Y, X2, và X3 ta sẽ có kết quả như sau: Nhìn vào bảng tính ta thấy từ quan sát thứ 13 đến 20 đều không có dữ liệu. Bây giờ bạn có thể biên tập bảng tính này để bổ sung thêm dữ liệu mới bằng cách nhập bằng tay từ bàn phím hoặc copy và dán thêm dữ liệu mới từ một tập tin Excel đã có sẵn chẳng hạn. Nên nhớ là khi nhập dữ liệu bổ sung bạn cần phải mở chức năng Edit trong Eviews nhé. 2.7. Tạo các biến mới, các độ trễ, các sai phân, xu hướng và các biến giả.
  30. 28 2.7.1. Tạo các biến mới. Nếu chúng ta muốn tạo ra biến mới là một hàm số của các biến hiện có, thì chúng ta sử dụng chức năng Genr trên Eviews. Ví dụ, để tạo ra Z như một logarit tự nhiên của X2 chúng ta sẽ nhấp vào Genr trên menu của workfile, sau đó đánh máy Z = log(X2). Bạn cũng có thể tạo ra bất kỳ biến mới nào theo yêu cầu của bạn. Menu Genr có chức năng giống như một máy tính con, và còn hơn thế nữa. Lưu ý rằng không bắt buộc phải tạo ra các biến mà bạn định sử dụng trong một phép hồi qui (hoặc qui trình khác), biểu thức có thể được đưa trực tiếp vào phần xác định phương trình hồi qui. Đặc tính này giúp ta giữ lại một workfile nhỏ bé. Chọn OK là bạn đã hoàn tất công việc của mình. Máy tính sẽ tạo ra biến Z ngay trên Workfile của bạn. Bạn mở chuỗi Z ra và chọn View/Descriptive Statistics/Histogram and Stats., khi đó màn hình sẽ như sau:
  31. 30 Điều này cho thấy chúng ta có thể kiểm tra phân bố xác suất của một biến đơn như thế nào. Kết quả trên cho ta thấy biến Z có phân phối chuẩn, vì thống kê JB = 1.1749, với xác suất (P-value) = 0.5557 rất lớn nên ta không bác bỏ giả thuyết phân phối chuẩn của Z. Cửa sổ này sẽ rất hữu ích khi chúng ta xem xét các phần dư hồi qui. Để tạo sự thuận lợi cho các bạn khi thực hiên các phép biến đổi, sau đây là một số hàm thông dụng trong Eviews mà ta thường sử dụng. EViews có một số lớn các chức năng mà bạn có thể khám phá dưới địa chỉ Help/Function Reference.
  32. 31 2.7.2. Tạo biến độ trễ và sai phân. Trong nhiều ứng dụng chuỗi thời gian chúng ta đã sử dụng các biến có độ trễ, các sai phân bậc 1 (và bậc cao hơn), các biến giả có tính mùa vụ (hoặc theo tháng, quí, ), và các xu hướng thời gian. EViews có các lệnh rất dễ để tạo ra chuỗi theo ý muốn. Để giúp bạn đọc có thể thực hiện một số công việc trong thực hành một cách dễ dàng, sau đây là một số hàm cơ bản trong Eviews. Một số hàm trong Eviews Ý nghĩa X(-1) Độ trễ của biến X (tạo ra chuỗi dữ liệu của Xt-1) D(X) Sai phân bậc 1 của X (D(X)=Xt-Xt-1) D(X,n) Sai phân bậc n của X LOG(X) Ln(X) EXP(X) eX (Hàm eX) ABS(X) Giá trị tuyệt đối của X SQR(X) Căn bặc hai của X @SUM(X) Tổng của X @SUMSQ(X) Tổng của X2
  33. 32 @MEAN(X) Trung bình của X @VAR(X) Phương sai của X @COV(X,Y) Hiệp phương sai giữa X và Y @COR((X,Y) Hệ số tương quan giữa X và Y Biến xu thế theo thời gian được chuẩn hóa về 0 @TREND(d) ở thời kỳ d. Biến giả theo mùa bằng 1 khi quý hoặc tháng @SEAS(d) bằng d, bằng 0 nếu khác d. Giá trị tới hạn của đại lượng ngẫu nhiên t (phân @ABS(@QTDIST(α, df)) phối student) với mức ý nghĩa α và bậc tự do df. @TDIST(|tj|, df) Cho ta P-value ứng với 2 phía của thống kê t. Cho ta giá trị tới hạn của chi-bình phương với mức ý nghĩa α và bậc tự do df. (lưu ý: trong @QCHISQ(α, df) Eviews các giá trị tới hạn được tính theo đuôi bên trái, ngược lại với Excel). Cho ta P-value của chi-bình phương theo công 2 @CHISQ(χ 0 ,df) 22 thức P-value = P(χ ; χ 0 ) . Cho ta giá trị tới hạn của đại lượng ngẫu nhiên Fisher với mức ý nghĩa α và bậc tự do của tử số @QFDIST(α, df1,df2) là df1, bậc tự do của mẫu là df2. (lưu ý: trong Eviews các giá trị tới hạn được tính theo đuôi bên trái, ngược lại với Excel). Cho ta P-value của phân phối FISHER theo @FDIST(FC, df1,df2) công thức P-value = P(F > Fc). MATRIX(5x5) X Tạo ma trận cỡ 5x5 lấy tên là X Cộng 2 ma trận (hai ma trận cùng kích thước) MATRIX C = a+b matrix(3,4) a matrix(3,4) b Trừ 2 ma trận (hai ma trận cùng kích thước) MATRIX C = a-b matrix(3,4) a matrix(3,4) b MATRIX C = a*b Nhân 2 ma trận (ma trận a cấp nxm và b cấp
  34. 33 mxq) matrix(5,9) a matrix(9,10) b MATRIX W = @TRANSPOSE(Y) Chuyển vị của ma trận Y MATRIX W = @INVERSE(Y) Nghịch đảo của ma trận Y MATRIX C = 3.14159*A Nhân, chia một số (scalar) vào ma trận tên A MATRIX Z = A/3 @DET(A) Định thức của ma trận A Scalar (single number). Chứa một giá trị nào đó do ta nhập vào hay là kết quả tính toán từ một Scalar X (scalar_name) = Vd: Scalar pi = 3.14159 Scalar x = 3*y + 4 Workfile CAHOIBIENMOI.wf1 có chứa dữ liệu về nhu cầu cá hồi (Qt), giá của cá hồi (Pt), thu nhập bình quân đầu người (It), ở Việt Nam. Quan sát đầu tiên là 1998M01 (tháng 01 năm 1998) và quan sát cuối cùng là 2006M12 (tháng 12 năm 2006). Giá trị có độ trễ của nhu cầu cá hồi (Qt) có thể được tạo ra bằng cách nhấp Genr, sau đó đánh máy vào phương trình: DOTREQt = Qt(-1).
  35. 34 Để tạo ra sai phân thứ nhất của cầu cá hồi (Qt), hãy nhấp Genr, và đánh máy vào phương trình: SAIPHAN1Qt = D(Qt). Bôi đen Qt, DOTREQt và SAIPHAN1Qt và kiểm tra dạng bảng tính của chúng, rất dễ thấy các mối tương quan giữa chúng.
  36. 35 Các độ trễ có độ dài j có thể được tạo ra bằng cách sử dụng Qt(-j) và các sai phân bậc j có thể được tạo ra bằng cách sử dụng: SAIPHANjQt = Qt- Qt(-j). Các sai phân bậc cao hơn được tạo ra bởi toán tử sai phân D(Qt, j). Ví dụ nếu j = 2, thì toán từ này sẽ tạo ra sai phân của các sai phân bậc nhất. D(Qt,2) = [Qt - Qt(-1)] - [Qt(-1) - Qt(-2)] ( Công thức tạo biến mới chi tiết trong Eviews: Nhằm đi xa hơn nữa các công thức tạo biến phức tạp, nếu không có hướng dẫn của giáo viên hoặc các chuyên gia phần mềm Eviews các bạn cần sử dụng lệnh sau đây: Help / EViews Help Topics / Index Sau đó đánh vào Expressions. Khi chữ Expessions được bôi đen, nhấn Display và đọc các chỉ dẫn hiện ra.
  37. 36 2.7.3. Tạo biến giả và biến xu hướng. EViews có một số chức năng đặc biệt để tạo ra các biến giả có tính mùa vụ và các xu hướng thời gian. Nhấn Genr trên menu của workfile, sau đó đánh máy phương trình: D1 = @SEAS(1) Việc này tạo ra một biến giả theo tháng (D1) có giá trị là 1 đối với tháng thứ nhất của mỗi năm và giá trị 0 đối với các tháng khác. Tạo D2, D3, D4, bằng cách sử dụng cùng phương pháp y như vậy. Để tạo ra biến xu hướng ta làm như sau: Nhấp Genr trên menu của workfile, sau đó đánh vào phương trình: T = @TREND(1989:12)
  38. 37 Việc này tạo ra một xu hướng thời gian có giá trị là 1 trong tháng đầu của năm 1998 và tăng thêm 1 sau mỗi tháng. Khi bạn sử dụng toán tử @TREND(d), tham số d chỉ ra giai đoạn mà đối với nó giá trị của biến xu hướng bằng zero. Để kiểm tra xem các biến giả theo tháng và biến xu hướng đã được tạo ra như thế nào, bạn hãy bôi đen D1, D2, D3, D4, D5, D6, và T, rồi kiểm tra dạng bảng tính của nhóm này. ( Ở trên đã ta nói việc tao ra các biến giả có tính thời vụ hoặc theo thời gian. Tuy nhiên, Eviews cũng có thể tạo ra các biến giả cho dữ liệu chéo và các biến giả được sử dụng để đại diện cho sự có mặt hoặc là vắng mặt của các thuộc tính định lượng hoặc định tính.
  39. 38 Ví dụ, ta muốn tạo ra một biến giả có tên là DUM để xác định những quan sát (tháng) mà có nhu cầu (Qt) lớn hơn 50 chẳng hạn. Để làm việc này bạn chọn Genr trên menu của workfile và đánh vào phương trình: DUM = Qt > 50. Việc này tạo ra một biến giả có giá trị bằng 1 khi nhu cầu cá hồi lớn hơn 50 (Qt > 50) và bằng 0 nếu không phải như vậy. Các bạn có thể mở biến Qt và DUM theo nhóm để kiểm tra xem có đúng như vậy không nhé. Bây giờ, ta lấy một ví dụ về dữ liệu chéo để minh họa cho việc tạo ra các biến giả. Để nghiên cứu nhu cầu của một loại hàng hóa, người ta đã tiến hành khảo sát giá cả và lượng hàng tiêu thụ được ở 10 cửa hàng như sau:
  40. 39 Lượng hàng bán được Giá bán Khu vực (Y - tấn/tháng) (X - 1000đ/kg) bán 30,0 2,0 Nông thôn 29,5 2,1 Thành thị 29,2 2,2 Nông thôn 28,2 2,3 Thành thị 28,9 2,4 Thành thị 28,5 2,5 Nông thôn 28,2 2,6 Nông thôn 27,7 2,7 Thành thị 27,3 2,8 Thành thị 27,5 2,9 Nông thôn Hãy xây dựng biến giả cho biến "khu vực", với thành thị là phạm trù điều khiển. Dữ liệu của ví dụ trên được nhập vào Eviews, màn hình như sau: Lưu ý: Biến KHUVUC không phải là một chuỗi số mà là một chuỗi vừa là ký số vừa là ký tự (Alphanumeric). Để xây dựng biến giả cho biến “khu vực”, với thành thị là phạm trù điều khiển, có nghĩa là “thành thị” sẽ nhận giá trị bằng 0.
  41. 40 Từ cửa sổ Workfile bạn chọn Genr rồi đánh vào câu lệnh sau: DUM=KHUVUC= “Nông thôn”. Việc này tạo ra một biến giả có tên là DUM với “Nông thôn” nhận giá trị bằng 1, và bằng 0 nếu không phải là “Nông thôn”. Bây giờ bạn mở hai biến KHUVUC và DUM ra thành một nhóm và kiểm tra chúng. 2.8. Ước lượng mô hình hồi quy: Để thuận lợi cho các bạn trong việc thực hiện phép ước lượng mô hình hồi quy, sau đây là một số dạng hàm hồi quy thông dụng và câu lệnh tương ứng dùng để ước lượng mô hình.
  42. 41 MỘT SỐ DẠNG HÀM HỒI QUY CÂU LỆNH Y = β1 + β2X2 + + βKXK + U LS Y C X2 .XK Ln(Y) = β1 + β2Ln(K) + β3Ln(L) + U LS Log(Y) C Log(K) Log(L) Ln(Y) = β1 + β2Xt + U LS Log(Y) C X Y = β1 + β2Ln(X) +U LS Y C Log(X) Y = β1 + β21/X + U LS Y C 1/X 2 K 2 K Y = β0 + β1X + β2X + + βKX + U LS Y C X X^ .X^ 2 2 Ln(ei ) = β1 + β2Ln(Xi) + vi LS Log(Resid^ ) C Log(X) | ei| = β1 + β2Xi + vi LS ABS(Resid) C X | ei| = β1 + β2 X + vi LS ABS(Resid) C Sqr(X) | ei| = β1 + β2 1/X + vi LS ABS(Resid) C 1/X | ei| = β1 + β2 1/ X + vi LS ABS(Resid) C 1/Sqr(X) Ghi chú: ei là phần dư (trong eviews được ký hiệu là Resid). LS: Viết tắt chữ Least Square (Phương pháp OLS). C: Vector hệ số - tương ứng với hệ số tung độ gốc. Như vậy, trong phần câu lệnh chúng ta thấy với mô hình hồi quy như thế nào thì câu lệnh được viết tương ứng. Đầu tiên là chúng ta khai báo phương pháp ước lượng bình phương bé nhất – LS, kế đến là biến phụ thuộc, vector hệ số (C), rồi đến các biến độc lập. Mỗi biến cách nhau ít nhất một khoảng trắng. 2.8.1. Ước lượng mô hình hồi quy đơn. Bạn có thể ước lượng mô hình bằng nhiều cách khác nhau, sau đây là hai trong các cách để ước ước lượng mô hình hồi quy. Hãy khởi động EViews và mở workfile Bai18.wf1 ra. Workfile này chứa dữ liệu của ba biến gồm: Y (Doanh số), X2 (Chi phí quảng cáo), X3 (Tiền lương của nhân viên tiếp thị) của 12 công ty. Cách 1: Giả sử ta muốn ước lượng mô hình hồi quy tuyến tính mẫu của Y (doanh l l m số) theo X2 (chi phí quảng cáo). Mô hình có dạng như sau: SRF: YXii=+ββ122.
  43. 42 Trên cửa sổ lệnh của menu chính bạn đánh vào câu lệnh: LS Y C X2 như ở hình trên rồi gõ Enter. Kết quả ước lượng sẽ như sau:
  44. 43 Cách 2: Bạn bôi đen biến Y và X2(chọn biến phụ thuộc trước, rồi đến các biến độc lập), sau đó đưa chuột tới chỗ đã đánh dấu rồi bấm chuột phải, chọn Open/ as Equation Bạn có thể nhìn thấy ở hình sau. Khi bạn chọn as Equation một màn hình sẽ xuất hiện như sau: Trong khung Equation specification, bạn đánh câu lệnh vào. Ghi nhớ là biến đầu tiên bao giờ cũng là biến phụ thộc, tiếp theo là các biến độc lập. Hệ số
  45. 44 tung độ gốc được Eviews ngầm định là C. Vector hệ số C có thể để ở sau cùng hoặc ngay sau biến phụ thuộc đều được. Trong khung Estimation Settings, bạn cần phải khai báo vào chỗ “Method” phương pháp dùng để ước lượng. Ở đây ta sử dụng phương pháp OLS nên ta chọn “LS – Least square ”. Lựa chọn “Sample” cho ta biết mẫu ước lượng của ta là từ quan sát thứ 1 đến quan sát thứ 12. Nếu bạn muốn ước lượng mô hình nhưng không sử dụng hết các quan sát của mẫu thì bạn có thể điều chỉnh cho phù hợp với mẫu mà bạn muốn. Chẳng hạn, bạn muốn ước mô hình nhưng chỉ với các quan sát từ quan sát thứ 4 đến quan sát thứ 10 thì bạn thay đổi “1 12” thành “4 10”. Sau khi khai báo xong, bạn chọn “OK”, kết quả ước lượng hiện ra trong bảng sau: Bạn có thể đặt tên cho mô hình này để phân biệt với các mô hình khác đã ước lượng hoặc sau này tiếp tục sử dụng đến nó. Muốn vậy, trên menu Equation bạn chọn Name, máy sẽ tự động tạo ra một tên khác với tên các phương trình đã có trước đó, theo thứ tự từ nhỏ đến lớn: EQ01, EQ02, Dĩ nhiên, bạn có thể đặt một tên nào đó mà bạn thích. Ở đây tôi đặt tên là MOHINH1.
  46. 45 Cửa sổ Equation: MOHINH1 cho ta kết quả tóm tắt của phân tích hồi quy. Các bạn giải thích kết quả ước lượng này và liên hệ nó với bài học của mình trên lớp nhé. Dependent Variable: Y - Biến phụ thuộc Y Method: Least Squares – Phương pháp bình phương nhỏ nhất (OLS) Date: 05/13/09 Time: 15:19 – Ngày, giờ thực hiện hồi quy này. Sample: 1 12 – Mẫu ước lượng từ quan sát thứ 1 đến quan sát thứ 12. Included observations: 12 – Tổng số quan sát là 12 Std. Error (Sai số chuẩn Prob. Variable Coefficient t-Statistic ước lượng của (P-value (Cột Biến độc lập) (Cột hệ số hồi quy) (Thống kê t) các hệ số hồi của t) quy) X2 4.394118 1.175133 3.739251 0.0039 C 56.51176 22.76141 2.482788 0.0324 R-squared: 0.583021 Mean dependent var: 140.0000 (Hệ số xác định R2) (Trung bình của biến phụ thuộc) Adjusted R-squared: 0.541323 S.D. dependent var: 22.62340 ( R2 hiệu chỉnh) (Độ lệch chuẩn của biến phụ thuộc) S.E. of regression 15.32186 Akaike info criterion: 8.447450 (Sai số chuẩn của hàm hồi quy mẫu) (Tiêu chuẩn Akaike – AIC) Sum squared resid: 2347.594 Schwarz criterion: 8.528268 ( Tổng bình phương các phần dư - RSS) (Tiêu chuẩn Schwarz – SC) Log likelihood: -48.68470 F-statistic: 13.98200 ( Ln hàm hợp lý) (Thống kê F) Durbin-Watson stat: 1.913594 Prob(F-statistic): 0.003851 (Thống kê Durbin-Watson) (P-value của F) 2.8.2. Ước lượng mô hình hồi quy bội. Bây giờ, ta muốn ước lượng mô hình hồi quy tuyến tính mẫu của Y (doanh số) theo X2 (chi phí quảng cáo) và X3 (tiền lương của nhân viên tiếp thị). l l m l Khi đó mô hình hồi quy bội có dạng như sau: SRF: YXii=+ββ1223 + βX3i. Với mục đích ước lượng phương trình này, bạn có thể làm giống như khi ta ước lượng mô hình hồi quy đơn. Bạn chỉ việc gõ thêm biến độc lập X3 vào hộp xác định phương trình (Equation Specification) như sau: Y C X2 X3.
  47. 46 Chọn “OK” kết quả như sau: Các bạn có thể giải thích kết quả này tương tự như bảng kết quả trong mô hình hồi quy đơn.
  48. 47 2.9. Tìm ma trận hiệp phương sai của các hệ số hồi quy và một số giá trị khác như phần dư(ei), giá trị Yi, Sau khi ước lượng mô hình hồi quy xong, chúng ta có thể xác định ma trận hiệp phương sai của các hệ số hồi quy như sau. Từ cửa sổ Equation: MOHINH2 bạn chọn View/Covariance Matrix, khi đó màn hình như sau: Nhấp chuột, kết quả tìm được là ma trận hiệp phương sai của các hệ số hồi quy như sau: Nếu bạn chọn View/Actual, Fitted, Residual, khi đó màn hình sẽ như sau:
  49. 48 Nhấp chuột từng lựa chọn một, các bạn sẽ thấy kết quả và từ đó rút ra bài học cho mình. Một kết quả tìm được như sau: Bảng này cho ta biết giá trị quan sát thật (Actual - Yi), giá trị ước lượng l (Fitted -Yi ), phần dư (Residual – ei), và biểu đồ phần dư ( Residual Plot). Trên cửa sổ “Equation” bạn bấm vào thực đơn View, sau đó lựa chọn từng “món” có trong thực đơn để xem kết quả là gì nhé. Đừng sợ! Đây là cách học rất hiệu quả khi không có sự hướng dẫn của giáo viên hay các chuyên gia phần mềm Eviews.
  50. 49 Chương 3: KIỂM ĐỊNH CÁC GIẢ THUYẾT CỦA MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN BẰNG EVIEWS 3.1. Kiểm định giả thuyết về phân phối chuẩn của sai số ngẫu nhiên Ui. Giả thuyết: H0: Ui tuân theo phân phối chuẩn H1: Ui không tuân theo phân phối chuẩn. 2 Giả thuyết Ui ∼ N(0,σ ) của mô hình hồi quy tuyến tính cổ điển có thể được kiểm định bằng thống kê Jarque – Bera (JB) như sau: Từ cửa sổ Equation: MOHINH2 bạn chọn View/Residual Tests/Histogram – Normality Test, khi đó màn hình như sau: Nhấp chuột, kết quả tìm được như sau:
  51. 50 Kết quả trên cho ta thấy JB = 0.5469 và P-value = 0.7607. Giá trị P-value này qúa lớn nên ta không bác bỏ giả thuyết H0. Kết luận Ui có phân phối chuẩn. 3.2. Kiểm định giả thuyết về tính đa cộng tuyến. Để biết có hiện tượng đa cộng tuyến hay không, bạn có thể sử dụng ma trận tương quan giữa các biến độc lập trong mô hình và xem xét độ mạnh giữa các biến. Cách thức tiến hành trên Eviews tôi đã giới thiệu ở phần trên. Ngoài ra, bạn cũng có thể sử dụng một số phương pháp khác như: Mô hình hồi quy phụ, thừa số tăng phương sai (VIF), 3.3. Kiểm định giả thuyết về phương sai thay đổi của sai số ngẫu nhiên Ui. Để phát hiện phương sai của sai số có thay đổi không ta có nhiều cách thức khác nhau. Ví dụ: Cho các số liệu quan sát về chi tiêu cho tiêu dùng (Y) và thu nhập (X) hàng tháng của 20 hộ gia đình ở một vùng nông thôn (đơn vị: 10.000đ). Y X Y X Y X 19,9 22,3 25,5 26,1 14,8 16,4 31,2 32,3 10,3 10,3 21,6 24,1 31,8 33,6 38,8 40,2 29,3 30,1 12,1 12,1 8,0 8,1 25,0 28,3 40,7 42,3 33,1 34,5 17,9 18,2 6,1 6,2 33,5 38,0 19,8 20,1 38,6 44,7 13,1 14,1 a) Vẽ đồ thị phần dư. Cho nhận xét? b) Kiểm định Park? Cho nhận xét? c) Kiểm định Glejser? Cho nhận xét? d) Kiểm định White (dạng có tích chéo và không có tích chéo). Đầu tiên các bạn mở workfile này ra (nếu đã lưu từ trước) hoặc các bạn phải tạo ra file làm việc cho ví dụ này.
  52. 51 Cách 1: Phương pháp đồ thị. Để vẽ đồ thị phân tán của phần dư theo biến độc lập X, trước hết bạn phải ước lượng hàm hồi quy Y theo X. Đặt tên cho hàm này là EQ01. Kết quả ước lượng như sau: Sau khi ước lượng xong, bạn có thể tạo ra chuỗi giá trị cho Y ước lượng l (Yi ) bằng cách chọn Forecast trên cửa sổ EQ01. Một cửa sổ mới được tạo ra như sau:
  53. 52 Trong khung Forecast name bạn thấy máy tính đã tự động tạo ra một chuỗi dự báo có tên là yf ( dĩ nhiên bạn có thể thay đổi tên này và đặt tên mới tùy l thích). Đây chính là chuỗi giá trị Y ước lượng (Yi ). Chọn OK là hoàn tất. Hãy đóng cửa sổ EQ01 lại. Giờ bạn hãy mở phần dư (resid) ra. Từ cửa sổ Resid, chọn Object/Copy Object Lựa chọn này cho phép bạn copy ra một chuỗi phần dư mới. Từ chuỗi mới này bạn vào Name và đặt tên cho nó (ở đây tôi đặt tên cho nó là RESIDEQ01), và ghi nhớ đây là phần dư được tạo ra từ phương trình hồi quy gốc (EQ01). Sau này nếu chúng ta cần đến phần dư gốc để thực hiện một số kiểm định thì bạn chọn vào RESIDEQ01 nhé, vì vector phần dư (Resid) do máy tạo ra nhằm để chứa phần dư của một mô hình vừa mới ước lượng sau cùng. Do đó, vector phần dư “resid” sẽ thay đổi khi ta ước lượng nhiều phương trình khác nhau. Giờ thì bạn hiểu tại sao tôi khuyên bạn nên copy ra một chuỗi phần dư mới và đặt tên cho nó rồi chứ!
  54. 53 Từ cửa sổ Workfile, bạn có thể vẽ đồ thị phân tán của phần dư theo biến độc lập X (cho hồi quy đơn), nếu là hồi quy bội bạn vẽ theo từng biến độc lập l hoặc theo giá trị Y ước lượng (Yi ). Đồ thị phần dư theo biến độc lập và theo giá l trị Yi có dạng như sau:
  55. 54 Lưu ý: Trong hồi quy đơn nếu bạn vẽ đồ thị phần dư theo biến độc lập X l hoặc theo Yi thì hình dạng của nó giống nhau. Nhìn vào đồ thị trên ta thấy có hiện tượng phương sai của sai số thay đổi. Tuy nhiên, phương pháp đồ thị chỉ cho ta cái nhìn trực quan từ đó phán đoán xem có hiện tượng phương sai thay đổi hay không thôi, nó không thay thế được các kiểm định. Cách 2: Phát hiện phương sai thay đổi bằng các kiểm định. - Kiểm định Park: Kiểm định Park đòi hỏi bạn phải ước lượng mô hình sau: 2 Ln(ei ) = β1 + β2Ln(Xi) + vi Sau khi ước lượng mô hình trên, bạn phải đi kiểm định giả thuyết: H0: β2 = 0 → Phương sai của sai số không đổi. H1: β2 ≠ 0 → Phương sai của sai số thay đổi đổi. Kết quả ước lượng mô hình trên như sau:
  56. 55 Kết quả kiểm định Park cho ta kết luận có hiện tượng phương sai của sai số thay đổi. Vì P-value(β2) = 0.0000 quá nhỏ. Ta kết luận bác bỏ H0. - Kiểm định Glejser: Kiểm định Glejser đòi hỏi bạn phải ước lượng các mô hình sau: | ei| = β1 + β2Xi + vi (1) | ei| = β1 + β2 X + vi (2) | ei| = β1 + β2 1/X + vi (3) | ei| = β1 + β2 1/ X + vi (4) Sau khi ước lượng các mô hình trên, bạn phải đi kiểm định giả thuyết: H0: β2 = 0 → Phương sai của sai số không đổi. H1: β2 ≠ 0 → Phương sai của sai số thay đổi đổi. Kết quả ước lượng các mô hình trên như sau: Mô hình 1:
  57. 56 Mô hình 2: Mô hình 3:
  58. 57 Mô hình 4: Kết quả ước lượng 4 dạng mô hình mà Glejser đề xuất đều cho kết quả bác bỏ giả thuyết H0. Có nghĩa là có hiện tượng phương sai của sai số thay đổi. - Kiểm định White:
  59. 58 Kiểm định White đã được lập trình sẵn trên Eviews, do đó bạn không phải mất thời gian để ước lượng như kiểm định Park và Glejser. Để thực hiện kiểm định này bạn làm như sau: Từ cửa sổ Workfile bạn mở phương trình hồi quy gốc (EQ01) ra. Trên cửa sổ EQ01 bạn chọn View/Residual Tests/White Heteroskedasticity (no cross terms) dạng không có tích chéo và View/Residual Tests/White Heteroskedasticity (cross terms) dạng có tích chéo. Kết quả kiểm định White (dạng không có tích chéo) như sau:
  60. 59 Nhìn vào kết quả trên cho ta thấy: χ2 = nR2 = 12.59517 (Obs*R-squared = 12.59517) và P-value = 0.00841 (Prob. Chi-Square(2) = 0.001841). Kết luận bác bỏ H0, có nghĩa là có phương sai thay đổi. Ngoài các kiểm định trên, còn có một số kiểm định khác nữa như kiểm định Nhân Tử Larrange (LM). Đặt trưng tổng quát mô hình hồi quy bội là: Yi = β1 + β2X2i + β3X3i + + βkXki + Ui Các phương trình hồi quy phụ sau đây đã bao quát hầu hết các trường hợp giả thuyết về nguyên nhân gây ra phương sai của sai số thay đổi. 2 - Breusch-Pagan: σ i = α1 + α2Z2i + α3Z3i + + αpZpi + vi - Glejser: | σi | = α1+ α2Z2i + α3Z3i + + αpZpi + vi 2 - Harvey-Godfrey: ln(σ i ) = α1 + α2Z2i + α3Z3i + + αpZpi + vi Tuy nhiên, trong phạm vi tài liệu này các kiểm định trên không được giới thiệu ở đây. Bạn đọc có thể tự thực hiện các kiểm định trên theo trình tự các bước mà chúng ta đã học trên lớp. 3.4. Kiểm định giả thuyết về tự tương quan của sai số ngẫu nhiên Ui. ( Để phát hiện có tương quan chuỗi giữa các nhiễu hay không, ta có thể tiến hành theo một số cách sau: Cách 1: Phương pháp đồ thị. - Cách 2: Kiểm định Durbin Watson: - Cách 3: Kiểm định nhân tử Larrange (LM) – Kiểm định BG. - Cách 4: Sử dụng giản đồ tương quan (correlogram). Ví dụ: File DATA-02.wf1 sau đây chứa dữ liệu về Chi Phí Bảo Trì Xe (COST) và Tuổi Thọ Xe (AGE). Sử dụng Eviews để: a. Thực hiện một mô hình hồi qui đơn giản xác định rằng COST là một hàm tuyến tính theo AGE. Viết phương trình hồi qui mẫu của mô hình này. Sử dụng kiểm định dựa trên giá trị P-value, hãy xác định xem có mối quan hệ tuyến tính có ý nghĩa về mặt thống kê với mức ý nghĩa 5% giữa hai biến COST và AGE hay không. b. Vẽ đồ thị phần dư của mô hình hồi qui ở câu a theo AGE. Dựa vào đồ thị nói trên. Anh/Chị có ý kiến gì về vấn đề tương quan chuỗi.
  61. 60 c. Tất nhiên, với dữ liệu chuỗi thời gian chúng ta nghi ngờ rằng thành phần sai số có thể có tương quan chuỗi bậc 1. Hãy trình bày kiểm định Durbin-Watson xem phần dư của phương trình hồi qui nói trên có tương quan chuỗi bậc 1 hay không? d. Một sinh viên khóa 49 đề nghị nên dựa vào giản đồ tương quan (correlogram) để kiểm định phần dư có tương quan chuỗi bậc 1 hay không với mức ý nghĩa 5%. Anh/Chị hãy dựa vào giản đồ tương quan của phần dư của phép hồi qui nói trên để xác nhận sự tồn tại của tương quan chuỗi bậc 1. e. Một sinh viên khóa 50 đề nghị nên dùng kiểm định nhân tử Lagrange để kiểm định phần dư có tương quan chuỗi bậc 1 hay không với mức ý nghĩa 5%. Anh/Chị hãy tiến hành kiểm định nhân tử Lagrange để xác nhận sự tồn tại của tương quan chuỗi bậc 1. f. Hãy giải thích các hậu quả của việc tồn tại tương quan chuỗi đối với hàm ước lượng OLS. Hãy đề nghị giải pháp khắc phục tương quan chuỗi (nếu có) trong phép hồi qui nói trên. File dữ liệu trên sau khi mở ra có dạng như sau: a) Trước tiên bạn phải ước lượng mô hình COST theo AGE. Kết quả ước lượng cho ở bảng sau:
  62. 61 Bạn hãy lưu phương trình này với tên EQ01. Kết quả trên cho thấy AGE có ảnh hưởng đến COST vì P-value = 0.0000 < 5%. b) Phương pháp đồ thị. Sau khi ước lượng mô hình, bạn có thể vẽ đồ thị phần dư để nhận định có tự tương quan hay không. Ở trên tôi đã hướng dẫn các bạn cách vẽ đồ thị, do vậy việc vẽ các đồ thị sau đây không phải là quá khó đối với bạn! 2 ( Vẽ đồ thị phần dư et (hoặc et ) theo AGE.
  63. 62 ( Vẽ đồ thị phần dư et theo et-1 (còn gọi là lược đồ tự tương quan bậc nhất - AR(1) e ( Vẽ đồ thị phần dư chuẩn hóa ( t ) theo thời gian. σl Từ cửa sổ EQ01, bạn chọn View/Actual/Fitted/Residual/Standardized Residual Graph. Khi đó, đồ thị phần dư chuẩn hóa như sau:
  64. 63 Các đồ thị trên đều cho kết quả có tự tương quan giữa các nhiễu Ui. c) Kiểm định Durbin – Watson cho tương quan chuỗi bậc 1: Kết quả ước lượng cho ta thấy thống kê Durbin – Watson là: Durbin-Watson stat 0.237982 Ta thấy, d = 0.237982 <1. Kết luận có tự tương quan dương. (Áp dụng theo quy tắt kinh nghiệm). d) Sử dụng giản đồ tương quan (correlogram). Từ của sổ EQ01, bạn chọn View/Residual Tests/Correlogram – Q - Statistics, kết quả cho ở bảng sau: Kết luận có tương quan chuỗi vì P-vlue = 0.000 < 5% ứng với tự tương quan bậc 1. Nên bác bỏ giả thuyết cho rằng không có tương quan chuỗi. Các bậc tự tương quan từ bậc 2 đến 12 đều cho kết quả tương tự. e) Kiểm định nhân tử Larrange (LM) – Kiểm định BG. Từ của sổ EQ01, bạn chọn View/Residual Tests/Serial Correlation LM Test Một màn hình hiện ra như sau.
  65. 64 Trong khung “Lags to include” nhập vào số 1(Nếu muốn kiểm tra tự tương quan bậc 2 thì nhập số 2, bậc 3 nhập số 3, .). Bấm OK, kết quả như sau: Kết luận có tương quan chuỗi vì thống kê χ2 và thống kê F đều cho kết quả P-vlue = 0.00000 < 5%. Nên bác bỏ giả thuyết cho rằng không có tương quan chuỗi. ( Khắc phục tự tương quan: Có nhiều cách để khắc phục hiện tượng tự tương quan. Ở đây, chỉ giới thiệu cách khắc phục bằng phương pháp lặp Cochrane – Orcutt trên Eviews (vì Eviews đã lập trình sẵn phương pháp này). Các phương pháp khác không được lập trình sẵn nên bạn đọc thực hiện một cách thủ công theo trình tự các bước chúng ta đã thảo luận trên lớp, và nên làm trên Eviews sẽ nhanh hơn. Các bạn có thể xem phần help trong Eviews về cách khắc phục theo phương pháp Cochrane – Orcutt.
  66. 65 Để sử dụng phương pháp lặp Cochrane – Orcutt, ta quay lại thủ tục ước lượng mô hình gốc. Ở vế phải của mô hình ta khai báo bậc của tự tương quan bằng cách đánh máy vào AR(k), với k là bậc của tự tương quan. Lưu ý là bạn cần phải khai báo một cách đầy đủ bậc của tự tương quan nhé. Chẳng hạn, nếu bậc của tự tương quan là 1, 2, và 4 thì các bạn phải đánh vào bên phải của mô hình là AR(1), AR(2), AR(4). Những số hạng này cách nhau ít nhất một khoảng trắng. Ở ví dụ trên, bậc của tự tương quan là bậc 1 nên ta khai báo là AR(1). Các bạn có thể nhìn thấy cách làm ở hình sau:
  67. 66 Sau khi khai báo xong, bạn chọn OK, kết quả sẽ như sau: Kết quả ước lượng ở trên được hiểu là kết quả ước lượng ở bước cuối cùng của phương pháp lặp Cochrance – Orcutt. Ta được hàm hồi quy sau: COST = -670.4549779 + 7.283446361*AGE + [AR(1)=0.8588899523] AR(1)=0.8588899523 có nghĩa là et = 0.8588899523et-1 + εt Các thông tin khác trong bảng kết quả trên được hiểu một cách bình thường.
  68. 67 TÀI LIỆU THAM KHẢO 1. Appendix A, EViews 5.1 Command and Programming Reference, Quantitative Micro Software. 2. Eviews 5.1 User’s Guide, Quantitative Micro Software. 3. Nguyễn Quang Dong (2002) Bài tập kinh tế lượng với sự trợ giúp của phần mềm Eviews. Hà Nội: NXB Khoa học và Kỹ thuật. 4. Phạm Trí Cao - Vũ Minh Châu (2006) Kinh Tế lượng ứng dụng. TP. HCM: NXB Lao động Xã hội. 5. Ramu Ramanathan (2002) Nhập Môn Kinh Tế Lượng. NXB Harcourt, (Bản dịch tiếng Việt của Chương trình giảng dạy kinh tế Fulbright).
  69. 68 Chương 4. PHÂN TÍCH NHẬN DẠNG VÀ LỰA CHỌN MÔ HÌNH.
  70. 69 Chương 5: ỨNG DỤNG PHÂN TÍCH HỒI QUY – VẤN ĐỀ DỰ BÁO