Bài giảng Giới thiệu về thống kê DEPOCEN - Chương 1: Giới thiệu chung và cách thu thập số liệu

ppt 55 trang phuongnguyen 2860
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Giới thiệu về thống kê DEPOCEN - Chương 1: Giới thiệu chung và cách thu thập số liệu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptgioi_thieu_ve_thong_ke_depocen.ppt

Nội dung text: Bài giảng Giới thiệu về thống kê DEPOCEN - Chương 1: Giới thiệu chung và cách thu thập số liệu

  1. Giới thiệu về thống kê DEPOCEN Chương 1 Giới thiệu chung và cách thu thập số liệu
  2. • Các phương pháp thống kê là gì? • Tại sao chúng ta lại cần các phương pháp thống kê?
  3. Các phương pháp thống kê được mô tả như việc định nghĩa các phương pháp sử dụng trong việc thu thập số liệu, biểu diễn, phân tích và làm sáng tỏ dữ liệu (Weinberg and Schumaker 1962)
  4.  Để hiểu việc biểu diễn các tính chất và mô tả các thông tin như thế nào?  Để biết việc vẽ minh họa về một tổng thể lớn mà chỉ dựa trên thông tin thu được từ các mẫu ra sao?  Để biết các dự báo thu được chắc chắn đến mức độ nào?  Để biết bằng cách nào cải tiến quy trình
  5.  Một công ty có kế hoạch giới thiệu một sản phẩm mới.  Lợi tức của một sản phẩm trong công ty giảm xuống nghiêm trọng trong sáu tháng gần đây.  Công ty muốn thay đổi mẫu mã của sản phẩm đã có. Giám đốc Marketing muốn kiểm tra xem mẫu mã mới ảnh hưởng đến thái độ của khách hàng với sản phẩm mới như thế nào?
  6.  Cổ điển và Bayesian Cổ điển: Fisher and Pearson Bayesian: Thomas Bayes  Tham số và phi tham số (nửa tham số)  Nguyên nhân (causal) và tương quan
  7. Bước 1: Xác định bài toán Bước 2: Thiết lập các đối tượng nghiên cứu. Bước 3: Xác định dạng dữ liệu cần thu thập. Bước 4: Xác định nguồn lấy thông tin. Bước 5: Xác định cỡ mẫu và cách lấy mẫu. Bước 6: Xác định phương pháp thu thập số liệu. Bước 7: Tiến hành thu thập số liệu. Bước 8: Mô tả số liệu. Bước 9: Phân tích số liệu. Bước 10: Chuẩn bị và diễn giải báo cáo kết quả.
  8. Phân loại Thống kê •Thống kê mô tả: • Lấy số liệu từ mẫu. • Mô tả số liệu. •Thống kê suy luận: •Phân tích số liệu. •Đưa ra kết luận.
  9. Thống kê mô tả •Thu thập số liệu (khảo sát) •Biểu diễn số liệu (bảng, đồ thị) •Đặc trưng của số liệu: mức ý nghĩa  x i n Một đặc trưng: tổng thể: là một tham số Mẫu: là một thống kê
  10. Các bước xác định bài toán: (1) Các vấn đề liên quan. (2) Thông tin về công ty như:sản phẩm, dịch vụ, thị trường, khách hàng . (3) Những thay đổi gần đây có thể làm ảnh hưởng đến công ty. (4) Các hoạt động có thể làm giảm nhẹ bài toán.
  11.  Để thu được thông tin cơ bản, xác định giới hạn, làm rõ bài toán và giả thuyết, xác định nguyên nhân và tạo các câu “nếu thì ”.  Các loại kế hoạch nghiên cứu: - Thăm dò - Mô tả - Nguyên nhân
  12.  Thiết kế cấu trúc số liệu thu thập được dựa trên các đối tượng nghiên cứu.
  13. Bước 4: Các số liệu gốc Chính Phụ Thu thập số liệu Số liệu phức tạp Bản in hoặc điện tử Quan sát Khảo sát Thí nghiệm
  14.  Tổng thể: là tất cả các đối tượng được quan sát.  Mẫu: là một phần của tổng thể được chọn để phân tích.
  15. Các phương pháp lấy mẫu Mẫu Mẫu không có xác Mẫu có xác suất suất Mẫu ngẫu nhiên đơn Mẫu phân giản tầng Mẫu Mẫu hệ thống chùm
  16. Mẫu có xác suất Các đối tượng mẫu được chọn dựa trên những khả năng đã biết. Mẫu có xác suất Mẫu ngẫu nhiên đơn Mẫu hệ thống Mẫu phân tầng Mẫu chùm giản
  17. Mẫu ngẫu nhiên đơn giản • Mọi đối tượng có khả năng được chọn như nhau. • Việc chọn có thể hoàn lại hoặc không hoàn lại. • Một trong các cách là sử dụng bảng số liệu ngẫu nhiên thu thập được từ mẫu.
  18. Mẫu hệ thống • Lấy cỡ mẫu: n • Chia tổng thể gồm N phần tử thành k nhóm riêng biệt: k = N/n • Chọn ngẫu nhiên một phần tử từ nhóm thứ 1. • Các nhóm tiếp theo cũng được làm tương tự như vậy. N = 64 n = 8 Nhóm 1 k = 8
  19. Mẫu phân tầng • Tổng thể được chia thành 2 hoặc nhiều nhóm tùy theo một vài đặc trưng thông dụng. • Mẫu ngẫu nhiên đơn giản được chọn từ các nhóm vừa phân chia. • Hai hoặc nhiều mẫu được kết nối với nhau.
  20. Mẫu chùm • tổng thể được chia thành một vài “chùm”, mỗi chùm biểu diễn lại tổng thể. • Mẫu ngẫu nhiên đơn giản được chọn từ các chùm. • Các mẫu đơn giản được kết nối làm một. tổng thể chia làm 4 “chùm”.
  21.  Phương pháp định tính  Phương pháp định lượng
  22.  Quan sát  Nhóm trọng tâm  Phân tích ban đầu  Xác định kỹ thuật
  23.  Được sử dụng với cỡ mẫu lớn  Các câu hỏi được xây dựng với các câu trả lời đã có từ trước.
  24. Phương pháp suy luận Quản lý chất lượng Dự báo Kiểm định giả Ước lượng thuyết Hồi quy Chuỗi thời gian
  25. Bước 10: Báo cáo kết quả
  26. Giới thiệu về thống kê DEPOCEN Chương 2 Biểu diễn số liệu bằng bảng và biểu đồ
  27. Các chủ đề •Tổ chức số liệu: theo thứ tự mảng và hiển thị bằng biểu đồ hình cây-lá •Bảng và đồ thị số liệu: •Phân phối tần xuất : bảng, biểu đồ, đường gấp khúc •Phân phối tích lũy: bảng, biểu đồ, hình cung •Tổ chức số liệu định tính một chiều: tổng hợp các bảng •Đồ thị của số liệu định tính 1 chiều: cột, tròn •Bảng số liệu định tính 2 chiều: Cột, bảng ngẫu nhiên
  28. Tổ chức số liệu Số liệu 41, 24, 32, 26, 27, 27, 30, 24, 38, 21 Thứ tự mảng Phân phối tần xuất 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 Phân phối tích lũy Biểu diễn hình Biểu đồ Hình cây-lá 2 144677 cung 3 028 Bảng Đường 4 1 gấp khúc
  29. Biểu diễn hình cây-lá: là một kỹ thuật thống kê để hiển thị một tập số liệu. Mỗi giá trị số liệu được chia thành hai phần: phần chính là cây và phần phụ là lá cây.
  30. Tổ chức số liệu: •Số liệu biểu diễn hàng ngang: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 •Số liệu biểu diến theo thứ tự từ nhỏ đến lớn: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 •Biểu diễn cây-lá: 2 1 4 4 6 7 7 3 0 2 8 4 1
  31. Một phân phối tần xuất là việc nhóm các số liệu thành các mục riêng biệt để chỉ ra số quan sát trong mỗi lớp.
  32. Bảng số liệu: Phân phối tần xuất Số liệu theo thứ tự mảng: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Tỉ lệ tần Phần trăm Lớp Tần xuất xuất 10 đến 20 3 .15 15 20 đến 30 6 .30 30 30 đến 40 5 .25 25 40 đến 50 4 .20 20 50 đến 60 2 .10 10 Tổng số 20 1 100
  33. Tỉ lệ tần xuất: Là phần trăm của các quan sát trong mỗi lớp trong tổng thể. Ta lấy số lượng trong mỗi lớp chia cho tổng số quan sát. Note: Tác dụng của biểu diễn cây-lá với một bảng phân phối tần xuất là không làm mất đi tính đồng nhất của mỗi quan sát.
  34. Có ba dạng đồ thị thường được sử dụng là: biểu đồ, đường gấp khúc, và phân phối tần xuất tích lũy (dạng đường cong).
  35. Biểu đồ: tạo nên bằng cách các lớp nằm trên trục ngang và tần xuất nằm trên trục thẳng đứng, tần xuất của mỗi lớp biểu diễn độ cao của hình cột và mỗi cột được vẽ cạnh nhau.
  36. Một đường gấp khúc gồm các đoạn thẳng nối các điểm nằm chính giữa các lớp và tần xuất của lớp đó.
  37. Được sử dụng để xác định tỉ lệ của các giá trị số liệu là nằm trên hay dưới một giá trị chắc chắn nào đó là bao nhiêu.
  38. Đồ thị số liệu: Biểu đồ Số liệu theo hàng ngang: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 H is t o g r a m 7 6 6 5 5 4 4 3 3 2 2 Fre que ncy 1 0 0 0 5 15 25 36 45 55 M o r e
  39. Đồ thị số liệu : Đường gấp khúc Số liệu: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 F r e q u e n c y 7 6 5 4 3 2 1 0 5 15 25 36 45 55 M o r e
  40. Bảng số liệu: Tần số tích lũy Số liệu: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Lớp Tần số % 10 đến 20 3 15 20 đến 30 9 45 30 đến 40 14 70 40 đến 50 18 90 50 đến 60 20 100
  41. Đồ thị số liệu: Dạng hình cung Số liệu: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 O g iv e 120 100 80 60 40 20 0 10 20 30 40 50 60
  42. Tổ chức số liệu định tính Số liệu định tính Đồ thị số liệu Bảng số liệu Tổng kết thành bảng Hình quạt Dạng cột Dạng khác
  43. Ví dụ: Tổng kết số liệu bằng bảng 1 chiều (với một nhà đầu tư) Danh mục đầu tư Số lượng % (ngàn đôla) Dự trữ 46.5 42.27 Cổ phần 32 29.09 Tiết kiệm 16 14.55 Chi phí khác 15.5 14.09 Tổng cộng 110 100 Biến định tính
  44. Rất hữu ích trong việc thể hiện mối quan hệ của một phân phối tần: một hình tròn được chia tỉ lệ với các tần xuất của số liệu.
  45. Dạng hình quạt Tiết kiệm 15% Dự trữ CP K 42% 14% Cổ phần 29%
  46. Tổ chức số liệu định tính dạng bảng 2 chiều •Bảng ngẫu nhiên •Dạng cột
  47. Tổ chức số liệu định tính dạng bảng 2 chiều Bảng ngẫu: nhiên Danh mục Nhà đầu tư A Nhà đầu tư B Nhà đầu tư C Tổng số đầu tư Dự trữ 46.5 55 27.5 129 Cổ phần 32 44 19 95 Tiết kiệm 16 28 7 51 Chi phí khác 15.5 20 13.5 49 Tổng số 110 147 67 324
  48.  Biểu diễn số liệu được thiết kế tốt nếu: Bản chất Thống kê  Liên kết các ý tưởng với sự rõ ràng, chính xác và hiệu quả.  Yêu cầu đưa ra thông tin chính xác về số liệu.
  49.  Sử dụng ‘Biểu đồ gãy khúc’  Không liên hệ với giá trị chuẩn khi so sánh các mảng số liệu  Co các trục  Không có số 0 trên trục
  50. Biểu diễn sai ✓ Biểu diễn đúng Minimum Wage Minimum Wage $ 1960: $1.00 4 1970: $1.60 2 1980: $3.10 0 1990: $3.80 1960 1970 1980 1990
  51. Biểu diễn sai ✓ Biểu diễn đúng Freq. 300 30% % 200   10% 0  FR SO JR SR FR SO JR SR FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
  52. Biểu diễn sai ✓ Biểu diễn đúng $ $ 200 50 100 25 0 0 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4
  53. Biểu diễn sai ✓ Biểu diễn đúng $ $ 45 45 42 42 39 39 36 36 J F M A M J 0 J F M A M J Graphing the first six months of sales.