Giáo trình Nguyên lý thống kê kinh tế - PGS. TS. Ngô Thị Thuận

pdf 118 trang phuongnguyen 5851
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Nguyên lý thống kê kinh tế - PGS. TS. Ngô Thị Thuận", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_nguyen_ly_thong_ke_kinh_te_pgs_ts_ngo_thi_thuan.pdf

Nội dung text: Giáo trình Nguyên lý thống kê kinh tế - PGS. TS. Ngô Thị Thuận

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI PGS. TS. Ngô Thị Thuận (Chủ biên ) TS. Phạm Vân Hùng - TS. Nguyễn Hữu Ngoan GIÁO TRÌNH NGUYÊN LÝ THỐNG KÊ KINH TẾ (Dùng cho sinh viên các ngành kinh tế, kế toán, kinh doanh và quản trị doanh nghiệp) HÀ NỘI – 2006 Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 1
  2. LỜI NÓI ĐẦU hống kê là một trong các nghiệp vụ không thể thiếu được trong công tác Tqu ản lý nhà nước và quản trị kinh doanh của doanh nghiệp. Nó còn được sử dụng như một công cụ bắt buộc trong nghiên cứu khoa học và triển khai các hoạt động thực tiễn. Do vậy, nguyên lý thống kê kinh tế là môn học không thể thiếu được trong hầu hết các ngành đào tạo. Trước đây, công tác thống kê ở nước ta chủ yếu được áp dụng trong khu vực kinh tế nhà nước nhằm thu thập các thông tin phục vụ cho việc quản lý kinh tế, xã hội của các ngành, các cấp. Cùng với chính sách mở cửa và cải cách quản lý kinh tế, công tác thống kê ngày càng được chú trọng trong các doanh nghiệp ở tất cả các ngành. Để đáp ứng nhu cầu đào tạo ngày càng cao, phù hợp với xu thế ”hội nhập và phát triển”, Bộ môn Kinh tế lượng, Khoa Kinh tế & Phát triển nông thôn biên soạn giáo trình "Nguyên lý thống kê kinh tế”. Giáo trình được biên soạn theo chương trình môn học đã được Hội đồng khoa học giáo dục Khoa Kinh tế & Phát triển nông thôn thông qua với phương châm chú trọng thực hành, gắn kết với thực tế, có ứng dụng và khai thác các phần mềm tin học thông dụng. Giáo trình bao gồm các chương: Chương I : Giới thiệu môn học Chương II : Thu thập thông tin thống kê Chương III : Tổng hợp và trình bày các dữ liệu thống kê Chương IV : Thống kê mức độ của hiện tượng Chương V : Điều tra chọn mẫu Chương VI : Kiểm định thống kê Chương VII : Thống kê biến động của hiện tượng Chương VIII : Phân tích tương quan và hồi quy Từng chương có các bài tập và một số bài có gợi ý cách giải. Tham gia biên soạn cuốn giáo trình "Nguyên lý thống kê kinh tế” gồm: - PGS.TS. Ngô Thị Thuận (chủ biên) và viết các chương I, II, III, IV, VI, VII. - TS. Phạm Vân Hùng viết chương VIII Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 2
  3. - TS. Nguyễn Hữu Ngoan cùng viết chương V. Chúng tôi hy vọng cuốn giáo trình "Nguyên lý thống kê kinh tế” sẽ phục vụ được đông đảo bạn đọc, các nhà nghiên cứu, các nhà doanh nghiệp và sinh viên các ngành kinh tế, kế toán, quản trị kinh doanh của các trường đại học có các ngành đào tạo này. Mặc dù các tác giả đã rất cố gắng, song do khả năng có hạn và cùng với những điểm mới bổ sung, nên nội dung giáo trình biên soạn khó tránh khỏi thiếu sót và những hạn chế nhất định. Chúng tôi mong muốn nhận được các ý kiến đóng góp của bạn đọc để giáo trình ngày càng hoàn thiện hơn. CÁC TÁC GIẢ Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 3
  4. DANH MỤC CÁC CHỮ VIẾT TẮT ĐBSCL Đồng bằng sông Cửu Long ĐHNNI Đại học Nông nghiệp I ĐVT Đơn vị tính HTX Hợp tác xã NN & PTNT Nông nghiệp và Phát triển nông thôn TSCĐ Tài sản cố định UBND Uỷ ban nhân dân Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 4
  5. Chương I GIỚI THIỆU MÔN HỌC 1. SƠ LƯỢC VỀ SỰ RA ĐỜI VÀ PHÁT TRIỂN CỦA THỐNG KÊ HỌC 1.1. Khái niệm về thống kê Trong thực tế sản xuất kinh doanh, cũng như trong đời sống kinh tế xã hội chúng ta thường sử dụng thuật ngữ ”thống kê” như thống kê lại các công việc đã làm trong ngày, các số liệu đã có, các khoản thu, chi Vậy thống kê học là gì? Trước khi xét đến khái niệm thống kê học, chúng ta quan sát các ví dụ sau: Ví dụ 1: Kết quả chính thức điều tra mức sống hộ gia đình Việt Nam 2002 và kết quả sơ bộ khảo sát mức sống hộ gia đình Việt Nam năm 2004 của Tổng cục Thống kê về tỷ lệ hộ nghèo cho năm 2002 và 2004 theo chuẩn nghèo được Thủ tướng Chính phủ ban hành áp dụng cho giai đoạn 2006 - 2010 (200 nghìn đồng/người/tháng cho khu vực nông thôn, 260 nghìn đồng/người/tháng cho khu vực thành thị) như sau: Biểu 1.1. Tỷ lệ hộ nghèo theo chuẩn mới ĐVT: % Năm Năm Diễn giải 2002 2004 Cả nước 23,0 18,1 Số liệu bảng 1.1 cho thấy, tính chung cả nước tỷ lệ hộ Chia theo khu vực nghèo đã giảm từ 23,0% năm Thành thị 10,6 8,6 2002 còn 18,1% năm 2004. Nông thôn 26,9 21,2 Vùng Đồng bằng sông Hồng là một trong những vùng có tỷ lệ Chia theo vùng số nghèo giảm nhanh nhất, năm Đồng bằng sông Hồng 18,2 12,9 2002 là 18,2%, năm 2004 chỉ còn 12,9%. Đông Bắc 28,5 23,2 Vùng Tây Bắc tỷ lệ hộ Tây Bắc 54,5 46,1 nghèo cao nhất, năm 2002 là Bắc Trung Bộ 37,1 29,4 54,5%, năm 2004 có giảm nhưng chậm vẫn còn 46,1%. Duyên hải Nam Trung Bộ 23,3 21,3 Vùng Đông Nam Bộ có tỷ lệ Tây Nguyên 43,7 29,2 hộ nghèo ít nhất. Đông Nam Bộ 8,9 6,1 Đồng bằng sông Cửu Long 17,5 15,3 Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 5
  6. Ví dụ 2: Có tài liệu về diện tích, dân số của 13 tỉnh ở Đồng bằng sông Cửu Long (ĐBSCL) năm 2003 ở bảng 2.1. Các số liệu ở bảng 2.1 cho biết: Đồng bằng sông Cửu Long gồm 13 tỉnh, với tổng diện tích là 39.763 km2; 16,964 triệu dân và 10,164 triệu lao động trong độ tuổi. Bình quân số dân trên 1 đơn vị diện tích là 427 người/km2. Kiên Giang là tỉnh có diện tích lớn nhất. Tỉnh có số dân đông nhất là An Giang. Thành phố Cần Thơ có diện tích đất ít nhưng số dân tương đối đông, nên mật độ dân số là cao nhất (807 người/km2). Bảng 2.1. Diện tích và dân số 13 tỉnh ĐBSCL năm 2003 Diện tích tự Lao động trong Dân số Mật độ TT Tỉnh nhiên tuổi (người) (người/km2) (km2) (người) 1 TP Cần Thơ 1.390 1.121.141 807 696003 2 Hậu Giang 1.607 772.239 481 470.130 3 Tiền giang 2.367 1.655.000 699 1.178.000 4 Long An 4.493 1.381.305 307 823.119 5 Đồng Tháp 3.238 1.640.309 507 1.016.309 6 Bến Tre 2.322 1.348.137 581 841.726 7 Trà Vinh 2.215 1.009.643 456 606.493 8 Vĩnh Long 1.475 1.038.965 704 665.000 9 An Giang 3.406 2.155.121 633 1.038.520 10 Kiên Giang 6.269 1.623.834 259 832.859 11 Sóc Trăng 3.223 1.243.982 386 771.269 12 Bạc Liêu 2.547 784.462 308 486.366 13 Cà Mau 5.211 1.190.676 228 738.219 Cộng 39.763 16.964.814 427 10.164.696 Nguồn: Niên giám thống kê kinh tế - xã hội tỉnh ĐBSCL năm 2003 Từ các ví dụ nêu trên chúng ta có nhận xét sau: - Các số liệu thể hiện trong các bảng là các số liệu thống kê. Các số liệu này thu thập được là dựa vào các tài liệu thống kê; Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 6
  7. - Tài liệu thống kê có được do kết quả tổng hợp của các cơ quan từ xã - huyện - tỉnh - toàn quốc bằng cách ghi chép quá trình diễn biến trong sản xuất, trong đời sống xã hội, văn hoá và lập các báo cáo hàng năm; - Từ các tài liệu thống kê từng năm, ta có thể tính bình quân rồi so sánh giữa các giai đoạn thời gian khác nhau dựa vào số liệu của từng giai đoạn. - Các số liệu thống kê cho phép đánh giá kết quả (bản chất) của các hiện tượng kinh tế xã hội của một đất nước ở từng năm và xu hướng phát triển của nó qua các năm (theo thời gian). - Các số liệu này cũng gợi mở cho người sử dụng nó các biện pháp thúc đẩy quá trình sản xuất tốt hơn hoặc dự kiến khả năng đạt được trong giai đoạn tới. Tóm lại: Tất cả các công việc từ theo dõi diễn biến của các hiện tượng, ghi chép tài liệu - tổng hợp tài liệu ở phạm vi rộng hơn, phân tích rút ra kết luận về bản chất, tính quy luật và đề ra các biện pháp chỉ đạo là một quá trình nghiên cứu thống kê. Như vậy, thống kê không chỉ là việc cộng dồn đơn thuần các số liệu sẵn có mà là cả một quá trình nghiên cứu theo trình tự nhất định có nội dung, mục đích và phương pháp khoa học để đáp ứng các nhu cầu của xã hội. Một cách tổng quát, chúng ta có thể đi đến khái niệm về thống kê như sau: Thống kê học là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con số (mặt lượng) của hiện tượng kinh tế-xã hội để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể. Như vậy, từ “Thống kê’ có 2 nghĩa: Nghĩa thông thường là thu thập số liệu; nghĩa rộng là một môn khoa học về bố trí, hoạch định các quan sát và thí nghiệm; thu thập và phân tích các số liệu và rút ra kết luận về các số liệu đã phân tích. Do đó, thống kê được coi là một công cụ của nghiên cứu khoa học, quản lý kinh tế và quản lý xã hội. Đây chính là “bộ đồ nghề” của các nhà nghiên cứu và lãnh đạo. 1.2. Sơ lược về sự ra đời và phát triển của thống kê Thống kê ra đời từ bao giờ và quá trình phát triển của nó ra sao? Để trả lời câu hỏi này các nhà khoa học chuyên nghiên cứu sự hình thành và phát triển của thống kê học đã đưa ra nhận định sau: Thống kê học ra đời và phát triển theo yêu cầu của xã hội . Để chứng minh cho nhận định này người ta thường điểm lại lịch sử phát triển của xã hội loài người qua các thời kỳ: - Thời kỳ cộng sản nguyên thuỷ: Thời kỳ này chưa có sản xuất, chưa có sở hữu tư nhân về tư liệu sản xuất, của cải do thiên nhiên cung cấp và là của chung, loài người chưa có tính toán, nên chưa có nhu cầu về thống kê. - Thời kỳ chiếm hữu nô lệ: Thời kỳ này, có sở hữu tư nhân về tư liệu sản xuất , đất, nông nô, có sản xuất, có dư thừa, của cải thuộc về người chiếm hữu tư liệu sản xuất (chủ nô) nên chủ nô hoặc trực tiếp hoặc gián tiếp ghi chép, tính toán những tài sản thuộc quyền chiếm hữu của mình như: Có bao nhiêu ruộng đất, trâu bò, nhà cửa Thực tế có Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 7
  8. di tích cổ mà người ta đã tìm thấy ở Trung Quốc, Hy Lạp, Ai Cập, La Mã thì những ghi chép và tính toán này còn đơn giản, mang tính chất cộng dồn, trong phạm vi hẹp, có thể nói rằng mới là công việc sơ khai của thống kê. - Thời kỳ phong kiến: Thời kỳ này, sản xuất phát triển hơn, sản phẩm nhiều hơn, phạm vi chiếm hữu tư liệu sản xuất mở rộng hơn nên yêu cầu tính toán nhiều hơn và phức tạp hơn. Các tài liệu cũ cho biết, hầu hết các nước ở châu Âu, châu Á đã tổ chức việc đăng ký kê khai về ruộng đất, nhân khẩu, tài sản Những công việc này đã thể hiện tính chất thống kê. Sản xuất nông nghiệp ngày càng phát triển, sản phẩm dồi dào dẫn đến nhu cầu trao đổi hàng hoá, các ngành nghề thủ công ra đời từ đó công việc ghi chép mở rộng ra ngoài lĩnh vực mỗi ngành, nhưng thống kê học chưa được hình thành. - Thời kỳ tư bản chủ nghĩa cũ: Thời kỳ này, lực lượng sản xuất phát triển hơn, các ngành sản xuất mới ra đời, công nghiệp, giao thông vận tải, thương nghiệp Các hoạt động kinh tế xã hội ngày càng phức tạp hơn, sự phân công lao động xã hội cũng phát triển, phân chia giai cấp và đấu tranh giai cấp cùng gay gắt. Để phục vụ cho giai cấp thống trị, đòi hỏi phải theo dõi mọi mặt của xã hội (kinh tế, chính trị). Người ta đã đi sâu nghiên cứu về lý luận và phương pháp thu thập, tính toán các tài liệu sao cho phản ánh đúng hiện tượng và giúp cho người làm công tác quản lý kinh tế, quản lý xã hội điều hành tốt các công việc của mình. Cuối thế kỷ 17, một số tài liệu sách báo của thống kê được xuất bản hoặc một số trường đã bắt đầu giảng môn lý luận thống kê. Năm 1660, H.Cohring - nhà kinh tế học người Đức giảng bài tại Trường đại học Holmsted về phương pháp nghiên cứu hiện tượng xã hội dựa vào số liệu điều tra cụ thể. Năm 1682, cuốn sách “Số học chính trị” của William Petty – nhà kinh tế học người Anh; năm 1759, G.Achen Wall (1719-1772) -giáo sư người Đức dùng từ “statistik”, “status” (Thống kê). Ở thời kỳ này, sự phát triển của toán học, nhất là lý thuyết xác suất cũng rất mạnh mẽ đã góp phần trang bị thêm phương pháp tính toán và quản lý công việc của các nhà thống trị. Trong hoàn cảnh đó, thống kê đã được hình thành. Như vậy, thống kê học hình thành vào cuối thế kỷ 17, đầu thế kỷ 18 và chủ nghĩa tư bản cũ đã tạo điều kiện cho thống kê ra đời và phát triển. Nhưng trong xã hội có giai cấp, sự phân hoá giàu nghèo rất rõ rệt, đặc biệt là trong chiến tranh giữa các nước, các cường quốc, giai cấp thống trị thường sử dụng các tài liệu thống kê như một công cụ để phục vụ cho giai cấp mình, để xoa dịu đấu tranh giai cấp hoặc che dấu bí mật kinh doanh, nên họ thường đưa ra những tài liệu thống kê không trung thực và khách quan lắm. Vì lý do đó mà giai đoạn cuối của chủ nghĩa tư bản cũ (chủ nghĩa đế quốc) thống kê không phát huy được vai trò tiến bộ của mình. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 8
  9. - Thời kỳ hình thành và phát triển của hệ thống XHCN: Theo quan điểm của CNXH muốn cho toàn dân hiểu được thực tế khách quan về sản xuất, kinh tế và xã hội để mỗi người đều có trách nhiệm góp phần của mình vào việc thúc đẩy xã hội tiến lên, CNXH đã tạo điều kiện cho khoa học thống kê phát huy tác dụng tích cực và ngày càng hoàn thiện về lý luận và phương pháp để có thể phản ánh đúng thực tế khách quan xã hội. - Ngày nay, do sự phát triển của xã hội loài người, do sự tiến triển của khoa học - kỹ thuật đòi hỏi khoa học thống kê cũng ngày càng hoàn thiện về lý luận, về phương pháp, có nhiều thông tin nhanh, phong phú, phương tiện tổng hợp tốt hơn, phương pháp phân tích, đánh giá và dự báo ngày càng hiện đại hơn Thống kê chính là một công cụ mạnh mẽ nhất để nhận thức xã hội. Tuy nhiên, tuỳ theo mục đích khác nhau mà thứ công cụ này phục vụ có khác nhau. - Ở nước ta: Trong kháng chiến chống Pháp (1945-1954), chúng ta đã sử dụng công tác thống kê với các thành tựu của khoa học thống kê thế giới để lên án chế độ thực dân, phong kiến, động viên toàn dân làm kháng chiến thắng lợi. Cùng với sự phát triển của đất nước, thống kê học ngày càng hoàn thiện dần về mạng lưới thống kê, về phương pháp tổ chức, về kỹ thuật tổng hợp, phân tích. Song do nền kinh tế nước ta chưa ổn định, chuyển hướng liên tục nên thống kê học ở nước ta còn có những hạn chế nhất định. 2. ĐỐI TƯỢNG NGHIÊN CỨU CỦA THỐNG KÊ Các nhà thống kê học nổi tiếng trên thế giới đều thống nhất đưa ra nhận định sau đây về đối tượng nghiên cứu của thống kê. Thống kê học là môn khoa học xã hội, nghiên cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chất của các hiện tượng kinh tế- xã hội số lớn, trong điều kiện thời gian và địa điểm cụ thể. Từ nhận định này, chúng ta cần hiểu đúng đối tượng nghiên cứu của thống kê ở các điểm chính sau. 2.1. Thống kê học là một môn khoa học xã hội Thống kê học là một môn khoa học xã hội, bởi vì thống kê nghiên cứu các hiện tượng kinh tế - xã hội hay quá trình kinh tế xã hội. Các hiện tượng và quá trình đó thường là: * Các hiện tượng về quá trình tái sản xuất mở rộng như cung cấp nguyên liệu, quy trình công nghệ, chế biến sản phẩm * Các hiện tượng về phân phối, trao đổi, tiêu dùng sản phẩm (marketing) như giá cả, lượng hàng xuất, nhập hàng hoá, nguyên liệu * Các hiện tượng dân số, lao động như tỷ lệ sinh, tử, nguồn lao động, sự phân bố dân cư, lao động Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 9
  10. * Các hiện tượng về văn hoá, sức khoẻ như trình độ văn hoá, số người mắc bệnh, các loại bệnh, phòng chống bệnh * Các hiện tượng về đời sống chính trị, xã hội, bầu cử, biểu tình * Ngoài ra thống kê còn nghiên cứu ảnh hưởng của các hiện tượng tự nhiên đến sự phát triển của các hiện tượng kinh tế xã hội, như ảnh hưởng của khí hậu, thời tiết, của các biện pháp kỹ thuật tới quá trình sản xuất nông nghiệp, kết quả sản xuất nông nghiệp và đời sống nhân dân. 2.2. Thống kê nghiên cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chất của số lớn hiện tượng và quá trình kinh tế xã hội a) Mặt lượng (những biểu hiện cụ thể, đo lường được): * Quy mô của hiện tượng: Các mức độ to nhỏ, lớn bé, rộng hẹp. Ví dụ: Diện tích canh tác của 1 doanh nghiệp nông nghiệp A năm 2005 là 500 ha, dân số trung bình của Việt Nam 2003 là 80,90 triệu người (Niên giám thống kê 2003), tổng số sinh viên của 1 lớp năm học 2005 - 2006 là 80 người. * Kết cấu của hiện tượng: Hiện tượng tạo nên từ các bộ phận nào, mỗi bộ phận chiếm bao nhiêu %; Ví dụ: Lớp có 50 học sinh, nam là 40 học sinh, chiếm 80%, nữ là 10, chiếm 20%. * Tốc độ phát triển của hiện tượng: So sánh mức độ của hiện tượng theo thời gian để thấy mức độ tăng hay giảm của hiện tượng; * Trình độ phổ biến của hiện tượng: Tính cụ thể phạm vi xảy ra hiện tượng, cá biệt hay phổ biến từ đó thấy được ảnh hưởng của nó tới hiện tượng lớn hơn. Ví dụ: Tỷ lệ tai nạn giao thông xe máy năm 2004 là 2%, có nghĩa là cứ 100 người đi xe máy thì có 2 người tai nạn * Mối quan hệ tỷ lệ giữa các hiện tượng hoặc giữa các tiêu thức của cùng một hiện tượng. b) Liên hệ chặt chẽ với mặt chất của số lớn hiện tượng: * Thông qua các mặt lượng của hiện tượng để đánh giá bản chất của hiện tượng như quy mô to nhỏ, bộ phận nào nhiều hay ít, xu hướng tiến lên hay giảm đi, mức độ phổ biến của hiện tượng thế nào nhưng để đánh giá một cách khách quan bản chất của hiện tượng thì mặt lượng của hiện tượng phải được thể hiện ở số lớn đơn vị chứ không phải ở từng đơn vị cá biệt. Ví dụ, đánh giá kết quả học tập 2 sinh viên A, B cần dựa vào kết quả học tập nhiều học kỳ, nhiều môn; dựa vào ý thức phấn đấu, sự tham gia các phong trào đoàn, quan hệ bạn bè Việc làm như vậy người ta gọi là nghiên cứu mặt lượng ở số lớn . Nhưng để hiểu sâu sắc hơn bản chất của hiện tượng, người ta cũng nghiên cứu những đơn vị tiên tiến, hoặc lạc hậu là những biểu hiện cá biệt. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 10
  11. * Thống kê không nghiên cứu bản chất và quy luật của hiện tượng, mà thông qua mặt lượng có thể đánh giá được bản chất và tính quy luật của hiện tượng. 2.3. Thống kê nghiên cứu các hiện tượng và quá trình kinh tế xã hội trong điều kiện địa điểm và thời gian cụ thể Mỗi hiện tượng, hay quá trình kinh tế xã hội ở thời gian, địa điểm khác nhau thì mặt lượng cũng khác nhau. Do đó, đối tượng nghiên cứu của thống kê học cũng cần cụ thể hoá ở thời gian nào, địa điểm nào hay trả lời câu hỏi bao giờ ? và ở đâu ? 3. PHƯƠNG PHÁP NGHIÊN CỨU CỦA THỐNG KÊ 3.1. Phương pháp luận của thống kê - Khái niệm: Tổng hợp về mặt lý luận các phương pháp chuyên môn của thống kê gọi là phương pháp luận của thống kê học - Cơ sở phương pháp luận: Dựa vào định luật số lớn trong lý thuyết xác suất đã xác định. Định luật này được vận dụng và thể hiện là quan sát số lớn các đơn vị cá biệt đến mức đủ lớn để có thể tổng hợp, phân tích, đánh giá bản chất khách quan và tính quy luật của hiện tượng. Vì từ sự kiện cá biệt, ngẫu nhiên quan sát số lớn giúp chúng ta suy ra sự kiện chung. Qua tổng hợp số lớn, sự kiện cá biệt sẽ bù trừ cho nhau. - Mức độ lớn phụ thuộc vào hiện tượng và mục đích nghiên cứu. Phương pháp luận này của thống kê được thể hiện rất rõ trong các phương pháp chuyên môn của thống kê. 3.2. Các phương pháp chuyên môn của thống kê - Điều tra thống kê: Điều tra toàn bộ, điều tra chọn mẫu, điều tra trực tiếp, điều tra gián tiếp; - Tổng hợp thống kê: Hệ thống hoá các tài liệu, phân tổ thống kê. - Phân tích thống kê: Phân tích mức độ, động thái, mối liên hệ 3.3. Tính quy luật của thống kê Tính quy luật của thống kê là tính quy luật số lớn các đơn vị trong đó có sự chênh lệch về lượng của từng đơn vị cá biệt. Tính quy luật này cũng phụ thuộc vào địa điểm và thời gian nhất định. 4. MỘT SỐ KHÁI NIỆM THƯỜNG DÙNG TRONG THỐNG KÊ 4.1. Tổng thể thống kê và đơn vị tổng thể a) Tổng thể thống kê: Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 11
  12. Tổng thể thống kê (còn gọi là tổng thể chung) là tập hợp các đơn vị cá biệt (hay phần tử) thuộc hiện tượng nghiên cứu, cần quan sát, thu thập và phân tích mặt lượng của chúng theo một hay một số tiêu thức nào đó. Xác định tổng thể là xác định phạm vi của đối tượng nghiên cứu. Tuỳ theo mục đích nghiên cứu mà tổng thể xác định có khác nhau. Ví dụ, dân số trung bình của Việt Nam năm 2003 là 80,9 triệu người thì tổng số dân trung bình năm 2003 là tổng thể thống kê; hoặc số mẫu đất phân tích tính chất lý hoá để lập bản đồ nông hoá thổ nhưỡng của 1 xã năm 2004 là 300 mẫu thì tổng số mẫu đất cần phân tích năm 2004 là một tổng thể. b) Đơn vị tổng thể: Các đơn vị cá biệt (hay phần tử) cấu thành nên tổng thể thống kê gọi là đơn vị tổng thể. Tuỳ mục đích nghiên cứu mà xác định tổng thể và từ tổng thể xác định được đơn vị tổng thể. Ví dụ (quay lại ví dụ trên): Đơn vị tổng thể là người dân, là từng mẫu đất. Đơn vị tổng thể bao giờ cũng có đơn vị tính phù hợp. Đơn vị tổng thể là xuất phát điểm của quá trình nghiên cứu thống kê, bởi vì nó chứa đựng những thông tin ban đầu cần cho quá trình nghiên cứu. Trên thực tế có xác định được đơn vị tổng thể thì mới xác định được tổng thể. Thực chất xác định tổng thể là xác định các đơn vị tổng thể. c) Các loại tổng thể thống kê: * Tổng thể bộc lộ: Tổng thể trong đó bao gồm các đơn vị (hay phân tử) mà ta có thể quan sát hoặc nhận biết trực tiếp được. Thí dụ: Tổng số sinh viên của Trường đại học Nông nghiệp I năm học 2005-2006. * Tổng thể tiềm ẩn: Tổng thể trong đó bao gồm các đơn vị (hay phân tử) mà ta không thể quan sát hoặc nhận biết trực tiếp được. Thí dụ: Tổng số sinh viên yêu ngành nông nghiệp. * Tổng thể đồng chất: Tổng thể trong đó bao gồm các đơn vị (hay phân tử) giống nhau ở một hay một số đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu. Thí dụ: Sản lượng lúa của Việt Nam năm 2004. * Tổng thể không đồng chất: Tổng thể trong đó bao gồm các đơn vị (hay phân tử) không giống nhau ở một hay một số đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu. Thí dụ: Sản lượng các loại cây hàng năm. * Tổng thể mẫu: Tổng thể bao gồm một số đơn vị được chọn ra từ tổng thể chung theo một phương pháp lấy mẫu nào đó. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 12
  13. Thí dụ: Số sinh viên được chọn tham dự Đại hội Đảng bộ Trường ĐHNNI Hà Nội năm 2005 là 150 người. 4.2. Tiêu thức Tiêu thức thống kê là chỉ đặc tính của đơn vị tổng thể. Ví dụ, mỗi người dân có tiêu thức giới tính, độ tuổi, trình độ văn hoá, nghề nghiệp. Mỗi doanh nghiệp có các tiêu thức như số lao động, diện tích đất, vốn cố định, vốn lưu động Mỗi đơn vị tổng thể có nhiều tiêu thức. Mỗi tiêu thức có thể biểu hiện giống nhau hoặc khác nhau ở các đơn vị tổng thể. Tiêu thức được phân chia thành các loại sau: * Tiêu thức bất biến và tiêu thức biến động - Tiêu thức bất biến biểu hiện giống nhau ở mọi đơn vị tổng thể, căn cứ vào tiêu thức này người ta tập hợp các đơn vị tổng thể để xây dựng nên tổng thể. Ví dụ: Tiêu thức quốc tịch “Việt Nam” xây dựng tổng số dân Việt Nam. Giới tính “nam”, “nữ” xây dựng tổng thể dân số nữ, dân số nam. - Tiêu thức biến động là tiêu thức biểu hiện của nó không giống nhau ở các đơn vị tổng thể. Ví dụ độ tuổi, trình độ văn hoá * Tiêu thức số lượng và tiêu thức chất lượng - Tiêu thức số lượng là tiêu thức thể hiện trực tiếp bằng con số. Ví dụ độ tuổi, mức lương - Tiêu thức chất lượng là tiêu thức thể hiện không bằng con số. Ví dụ giới tính, quốc tịch, trình độ ngoại ngữ. * Tiêu thức thay phiên chỉ có 2 biểu hiện không trùng nhau. Thí dụ: giới tính, sinh tử * Chú ý: Có những tiêu thức thể hiện tương đối tổng hợp nhiều đặc tính của đơn vị tổng thể thì có thể trùng với chỉ tiêu thống kê như năng suất lúa, năng suất lao động, giá thành 4.3. Lượng biến Lượng biến là biểu hiện cụ thể về lượng của các đơn vị tổng thể theo tiêu thức số lượng. Ví dụ: Độ tuổi 3, 4, 5, 10, 20 tuổi là lượng biến của tiêu thức độ tuổi, biểu hiện mức độ của tiêu thức số lượng. Có hai loại lượng biến. Lượng biến rời rạc và lượng biến liên tục. - Lượng biến rời rạc là lượng biến mà các giá trị có thể có của nó là hữu hạn hay vô hạn nhưng có thể đếm được. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 13
  14. Thí dụ: Số công nhân trong một doanh nghiệp; số sản phẩm sản xuất ra trong một ngày của 1 phân xưởng may. - Lượng biến liên tục: Là lượng biến mà các giá trị có thể có của nó được lấp kín cả một khoảng trên trục số. Thí dụ: năng suất cây trồng; giá bán hàng hoá. 4.4. Chỉ tiêu thống kê * Khái niệm: Chỉ tiêu thống kê là một khái niệm thể hiện tổng hợp mối quan hệ giữa lượng và chất của hiện tượng hay quá trình kinh tế xã hội trong điều kiện địa điểm và thời gian cụ thể. * Đặc điểm của chỉ tiêu thống kê: - Phản ánh kết quả nghiên cứu thống kê. - Mỗi chỉ tiêu thống kê phản ánh nội dung mặt lượng trong mối liên hệ với mặt chất về một khía cạnh, một đặc điểm nào đó của hiện tượng. - Đặc trưng về lượng biểu hiện bằng những con số cụ thể, khác nhau trong điều kiện thời gian và địa điểm cụ thể, có đơn vị đo lường và phương pháp tính đã quy định. Ví dụ: Tổng diện tích trồng trọt toàn quốc tính bình quân 3 năm 1989 - 1990 là 8.933.000 ha. Tổng diện tích gieo trồng toàn quốc là chỉ tiêu thống kê, nó có nội dung kinh tế, có ý nghĩa, có lượng là 8933000 ha, là một con số cụ thể gọi là số liệu thống kê, thời gian bình quân 3 năm 1989-1990, địa điểm toàn quốc, phương pháp tính bình quân, đơn vị tính ha. * Các loại chỉ tiêu thống kê: - Chỉ tiêu thống kê khối lượng: Phản ánh quy mô về lượng của hiện tượng nghiên cứu. Ví dụ tổng số dân, diện tích gieo trồng, số học sinh. - Chỉ tiêu chất lượng: Phản ánh các đặc điểm về mặt chất của hiện tượng như trình độ phổ biến, mức độ tốt xấu và quan hệ của các tiêu thức. Ví dụ giá thành, giá cả, hiệu quả sử dụng vốn. * Hình thức đơn vị đo lường: Có 2 hình thức hiện vật và giá trị - Chỉ tiêu hiện vật là chỉ tiêu thể hiện bằng các số liệu có đơn vị đo lường tự nhiên như cái, con, đơn vị đo chiều dài, trọng lượng. - Chỉ tiêu giá trị là chỉ tiêu biểu hiện số liệu có đơn vị đo lường là tiền. 4.5. Hệ thống chỉ tiêu thống kê Hệ thống chỉ tiêu thống kê là tập hợp nhiều chỉ tiêu có quan hệ mật thiết với nhau, có thể phản ánh nhiều mặt của hiện tượng hay quá trình kinh tế xã hội trong điều kiện thời gian và địa điểm cụ thể. - Ai xác định? Tổng cục thống kê. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 14
  15. - Cho từng ngành và toàn nền kinh tế quốc dân. - Nó được thay đổi và bổ sung, hoàn chỉnh trong các điều kiện lịch sử cụ thể. 5. CÁC LOẠI THANG ĐO Để lượng hoá hiện tượng nghiên cứu, tuỳ theo tính chất của dữ liệu, thống kê đo lường bằng các loại thang đo sau. 5.1. Thang đo định danh Thang đo định danh là thang đo dùng các mẫ số để phân loại các đối tượng. Thang đo dịnh danh không mang ý nghĩa nào cả mà chỉ để lượng hoá các dữ liệu cần cho nghiên cứu. Nó thường được sử dụng cho các tiêu thức thuộc tính. Người ta thường dùng các chữ số tự nhiên như 1, 2, 3, 4 để làm mã số. Thí dụ: Giới tính: người ta thường mã số nam là 1; nữ là 2. Tình trạng gia đình: 1: Độc thân ; 2: Kết hôn; 3: Ly dị; 4: Khác. 5.2. Thang đo thứ bậc Thang đo thứ bậc là thang đo sự chênh lệch giữa các biểu hiện của tiêu thức có quan hệ thứ bậc hơn kém. Sự chênh lệch này không nhất thiết phải bằng nhau. Nó được dùng cho cả tiêu thức thuộc tính và tiêu thức số lượng. Thí dụ: - Tiền lương của công nhân trong doanh nghiệp hàng tháng là: 1500 ngàn đồng. - Mức độ khó khăn của nông dân Việt Nam: Thứ nhất : Thiếu vốn Thứ hai: Thiếu kiến thức Thứ ba: Thiếu lao động 5.3. Thang đo khoảng Thang đo khoảng là thang đo thứ bậc có khoảng cách đều nhau. Nó được dùng cho cả tiêu thức thuộc tính và tiêu thức số lượng. Thang đo khoảng cho phép chúng ta đo lường một cách chính xác sự khác nhau giữa hai giá trị. Thí dụ: Đề nghị sinh viên hãy cho biết ý kiến của mình về tầm quan trọng của các vấn đề sau đây trong dạy học ở đại học bằng cách khoanh tròn các con số tương ứng trên thang đánh giá chỉ mức độ từ 1 đến 5 như sau: Không Rất Các vấn đề Bình thường quan trọng quan trọng Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 15
  16. 1. Giảng viên giỏi 1 2 3 4 5 2. Có giáo trình, tài liệu 1 2 3 4 5 3. Sự say sưa và ham học của sinh viên 1 2 3 4 5 4. Giảng đường hiện đại 1 2 3 4 5 5. Môi trường không khí trong lành 1 2 3 4 5 5.4. Thang đo tỷ lệ Thang đo tỷ lệ là loại thang đo cao nhất trong thống kê. Nó sử dụng các số tự nhiên như từ 1 đến 9 và 0 để lượng hoá các dữ liệu. Nó được sử dụng chủ yếu cho các tiêu thức số lượng. Thí dụ: Doanh thu của một cửa hàng bán văn phòng phẩm Trâu Quỳ tháng 1/2005 là 200 triệu đồng; Nhiệt độ ngày 2/12/2005 là 23 oC. Trong thực tế thang đo rất phức tạp và quan trọng, vì đôi khi chúng ta có thể áp dụng thang đo định tính cho tiêu thức số lượng và ngược lại. 6. KHÁI QUÁT QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ Xác định vấn đề, mục đích, nội dung, đối tượng nghiên cứu Giai đoạn I: Điều tra Xây dựng hệ thống các khái niệm, thống kê chỉ tiêu thống kê Điều tra thống kê Xử lý số liệu - Tập hợp, sắp xếp số liệu - Chọn các phần mềm xử lý số liệu Giai đoạn II: Tổng hợp - Phân tích thống kê sơ bộ thống kê - Lựa chọn các phương pháp phân tích thống kê sơ bộ Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 16 Phân tích và giải thích kết quả, dự đoán xu hướng phát triển Giai đoạn III: Phân tích thống kê Báo cáo và truyền đạt kết quả nghiên cứu
  17. Sơ đồ 1.1. Quá trình nghiên cứu thống kê Quá trình nghiên cứu thống kê theo trình tự được khái quát hoá bằng sơ đồ 1.1. Theo sơ đồ này, quá trình nghiên cứu thống kê được chia thành 6 bước theo 3 giai đoạn với trình tự từ trên xuống. Hai mũi tên có hướng đi từ dưới lên nhằm chỉ rõ các cộng đoạn cần phải kiểm tra lại, bổ sung thông tin hoặc làm lại nếu dữ liệu chưa đạt yêu cầu Giai đoạn I: Điều tra thống kê bao gồm thu thập các thông tin ban đầu về các tiêu thức ở từng đơn vị tổng thể; Giai đoạn II: Tổng hợp thống kê bao gồm tổng hợp và hệ thống hoá các tài liệu đã thu thập được từ giai đoạn I; Giai đoạn III: Phân tích thống kê nhằm sử dụng những phương pháp chuyên môn của thống kê để phát hiện các vấn đề làm cơ sở đề xuất các giải pháp. Các bước và các giai đoạn này đều có mối liên hệ rất chặt chẽ. Kết quả và chất lượng kết quả của bước trước làm cơ sở và có ảnh hưởng đến chất lượng bước sau. CÂU HỎI THẢO LUẬN CHƯƠNG I 1. Đối tượng nghiên cứu của thống kê là gì? Giải thích và chứng minh? 2. Các khái niệm thường dùng trong thống kê là gì? Giải thích, cho ví dụ cụ thể? Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 17
  18. Chương II THU THẬP THÔNG TIN THỐNG KÊ Theo quá trình nghiên cứu thống kê, sau khi xác định được hướng, mục đích, nội dung và đối tượng nghiên cứu, thì việc thu thập các thông tin phục vụ cho quá trình nghiên cứu là bước rất cần thiết và quan trọng. Công việc thu thập thông tin đòi hỏi nhiều thời gian, công sức và chi phí cho nên việc thu thập thông tin cần được tiến hành một cách có hệ thống, theo một kế hoạch thống nhất để thu thập các thông tin sao cho vừa đáp ứng mục tiêu, nội dung và vừa phù hợp với khả năng nhân lực và kinh phí trong giới hạn cho phép. 1. THÔNG TIN THỐNG KÊ 1.1. Khái niệm và ý nghĩa a) Khái niệm: Thông tin là gì ? Thông tin là một phạm trù được dùng để mô tả các tin tức của một hiện tượng, một sự vật, một sự kiện, một quá trình đã xuất hiện ở mọi lúc, mọi nơi trong các hoạt động kinh tế- xã hội của con người. Thông tin thống kê là gì? Thông tin thống kê là tin tức của hiện tượng hay quá trình kinh tế- xã hội do cơ quan thống kê thu thập trong điều kiện thời gian và không gian cụ thể. Như vậy, thông tin thống kê là một trong các loại thông tin, nên nó cũng mang những đặc trưng và giá trị của thông tin nói chung như: nội dung mới (không có cái mới thì không có thông tin); hình thức biểu hiện đa dạng (ngôn ngữ, con số, chữ viết); vật dẫn thông tin (sóng âm, trang giấy, băng đĩa từ) và có nội dung tin tức (thể hiện ý định, biểu đạt). b) Ý nghĩa: Thông tin thống kê là một nguồn lực của sản xuất kinh doanh, là nguồn lực vô giá. Nó có thể sử dụng cho nhiều mục tiêu và sử dụng nhiều lần. Với các giá trị này, khi sử dụng thông tin cần xử lí thông tin và xây dựng ngân hàng cơ sở dữ liệu cho nề nếp. Thông tin thống kê cũng có các tính chất sau: khách quan, phụ thuộc, lan truyền, cùng hưởng, có hiệu lực, biến động, khuyếch tán và thu gọn. Thông tin cần thu thập là gì? Thông tin cần thu thập là những thông tin phục vụ cho vấn đề và mục đích cần nghiên cứu. Xác định thông tin cần thu thập là xác định rõ những dữ liệu nào, thứ tự ưu tiên của các dữ liệu này và phạm vi dữ liệu cần thu thập. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 18
  19. Tại sao phải xác định thông tin cần thu thu thập? Trong thực tế có rất nhiều thông tin liên quan đến hiện tượng hay quá trình kinh tế xã hội. Tuỳ theo vấn đề và mục tiêu nghiên cứu mà xác định những thông tin hay dữ liệu nào cần thiết. Do đó, vấn đề đầu tiên của công việc thu thập thông tin là xác định rõ và cụ thể những dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này. Nếu không thực hiện được điều này sẽ dẫn đến tình trạng dữ liệu thu thập được rất nhiều nhưng dữ liệu đáp ứng cho mục đích nghiên cứu thì ít hoặc thiếu, gây lãng phí thời gian, tiền bạc. Thí dụ: Nghiên cứu mối liên hệ giữa tình hình tự học và kết quả học tập của sinh viên Đại học Nông nghiệp I Hà Nội, hai nhóm dữ liệu cần thu thập là: tình hình tự học và kết quả học tập. Về nhóm dữ liệu tình hình tự học, có thể thu thập các dữ liệu sau: 1. Có tự học ở nhà không? 2. Thời gian dành cho tự học ở nhà thế nào? (hàng ngày, hàng tuần) 3. Phương pháp sử dụng thời gian tự học ở nhà thế nào? 4. Mục đích tự học? 5. Hình thức tự học: học một mình, học nhóm ? 6. Khó khăn và thuận lợi khi tự học? 7. Kết quả và hiệu quả tự học? 8. Các yếu tố ảnh hưởng đến tự học. Có nhiều dữ liệu khác có liên quan đến tự học, nhưng không liên quan lắm đến mục đích nghiên cứu “mối liên hệ giữa tự học với kết quả học tập” thì không nhất thiết phải thu thập. Thí dụ: - Bạn thường mặc quần áo gì khi tự học? - Người cùng học với bạn quê ở đâu? - Bạn có uống nước hay ăn gì trong giờ tự học không? - Ai nhắc nhở bạn tự học? 1.2. Các loại thông tin cần thu thập Có nhiêu tiêu chí để phân loại thông tin. Tuỳ thuộc vào mục đích, ý nghĩa và phạm vi ứng dụng mà người ta có thể lựa chọn những tiêu thức phù hợp. ở đây trình bày một số phân loại thông tin được sử dụng chủ yếu trong nghiên cứu thống kê. a) Căn cứ tính chất của thông tin: Có hai loại dữ liệu chủ yếu là dữ liệu định tính và dữ liệu định lượng. * Dữ liệu định tính là dữ liệu phản ánh tính chất và sự hơn kém về tính chất của đối tượng nghiên cứu. Thí dụ như giới tính của sinh viên (nam, hay nữ); thời gian tự học ở nhà dài hay ngắn (dưới 2 giờ; từ 2 đến 4 giờ; trên 4 giờ). Dữ liệu định tính được thu thập dễ hơn và người ta thường dùng các thang đo định danh hay thứ bậc để xác định. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 19
  20. * Dữ liệu định lượng là dữ liệu phản ánh mức độ hay mức độ hơn, kém theo một tiêu thức số lượng nào đó của đối tượng nghiên cứu. Thí dụ như độ tuổi của sinh viên, thời gian tự học 1 ngày, 1 tuần. Dữ liệu định lượng trong nghiên cứu thống kê thường gặp nhiều hơn, dễ áp dụng những phương pháp tính toán, phân tích hơn. Khi xác định các dữ liệu định tính, người ta thường dùng thang đo khoảng cách hay thứ bậc. Mục đích của cách phân loại này nhằm giúp cho người nghiên cứu xác định trước các phương pháp xử lý, tổng hợp và phân tích cần sử dụng cho từng loại dữ liệu sao cho phù hợp và đáp ứng mục tiêu nghiên cứu đặt ra. Thí dụ: Các dữ liệu và phương pháp phân tích có thể áp dụng trong nghiên cứu mối liên hệ giữa tự học và kết quả học tập của sinh viên cho ở bảng 1.2. Bảng 1.2. Tự học ở nhà/ngày Kết quả học tập Thang đo Phương pháp phân tích Định tính: Định tính Thứ bậc Phân tổ - Dưới 2 giờ - Khá giỏi Định danh - Từ 2 đến 4 giờ - Trung bình - Trên 4 giờ - yếu kém Định tính Định lượng Thứ bậc Phân tích phương sai 1 yếu tố - Dưới 2 giờ - Điểm trung bình chung Khoảng - Từ 2 đến 4 giờ học tập/1 sinh viên cách - Trên 4 giờ Định lượng Định lượng Khoảng Phân tích hồi quy và tương - Số giờ tự học 1 - Điểm trung bình chung cách quan tuần học tập/1 sinh viên b) Căn cứ nguồn cung cấp: Theo nguồn cung cấp thông tin có hai loại dữ liệu: dữ liệu thứ cấp và dữ liệu sơ cấp. * Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn có sẵn. Những dữ liệu này đã qua tổng hợp, xử lý công bố hay xuất bản. Thí dụ: Những dữ liệu về kết quả học tập của sinh viên có thể lấy ở phòng đào tạo hay trợ lý đào tạo của từng khoa là dữ liệu thứ cấp. Dữ liệu thứ cấp có ưu điểm là thu thập nhanh, rẻ nhưng thiếu chi tiết và đôi khi không đáp ứng đúng yêu cầu nghiên cứu. Nguồn dữ liệu thứ cấp khá phong phú thường gặp ở các nguồn chủ yếu sau: Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 20
  21. - Nội bộ: Các số liệu báo cáo về tình hình sản xuất, tiêu thụ, tài chính, vật tư, nhân sự của các phòng ban, bộ phận; các số liệu báo cáo từ các cuộc điều tra khảo sát trước đây ở từng đơn vị (doanh nghiệp, cơ quan, ban, ngành ). - Cơ quan thống kê nhà nước: Các số liệu do các cơ quan thống kê nhà nước (Tổng cục Thống kê, Cục Thống kê, Phòng Thống kê ) cung cấp trong các niên giám thống kê. - Cơ quan chính phủ: Số liệu do các cơ quan trực thuộc Chính phủ (Bộ, cơ quan ngang bộ, Uỷ ban nhân dân các cấp) công bố hay cung cấp. Các số liệu này thường chi tiết hơn, mang tính chất đặc thù của ngành hay địa phương. - Sách, báo, tạp chí đã xuất bản. Các số liệu này thường mang tính thời sự và cập nhật cao, mức độ tin cậy tuỳ thuộc vào nguồn số liệu của từng tờ báo hay tạp chí; - Các tổ chức, hiệp hội, viện nghiên cứu, trường đại học; - Các công ty nghiên cứu và cung cấp thông tin. * Dữ liệu sơ cấp (thông tin gốc) là dữ liệu không có sẵn, dữ liệu ban đầu thu thập trực tiếp từ đối tượng nghiên cứu. Thí dụ: Các dữ liệu có liên quan đến việc tự học của sinh viên là các dữ liệu sơ cấp, không có sẵn mà chúng ta muốn có phải điều tra từ sinh viên. - Dữ liệu sơ cấp có ưu điểm là chi tiết, độ tin cậy cao đối với các tình huống cụ thể. Song hạn chế của nó là thu thập tốn kém, phụ thuộc vào trình độ chủ quan của người nghiên cứu (nhất là những tình huống dự báo). - Dữ liệu sơ cấp được thu thập bằng các cuộc điều tra khảo sát khác nhau. Dựa vào tính chất liên tục hay không liên tục của thu thập dữ liệu sơ cấp, người ta chia thành 2 loại là điều tra thường xuyên và điều tra không thường xuyên. + Điều tra thường xuyên là loại điều tra nhằm thu thập các thông tin ban đầu về hiện tượng cần nghiên cứu một cách có hệ thống theo sát với sự biến động của hiện tượng. Thí dụ: Ghi chép tình hình sinh, tử, chuyển đến, chuyển đi trong theo dõi và quản lý nhân khẩu của một địa phương. Việc theo dõi, ghi chép hàng ngày về số lượng công nhân đi làm, số lượng sản phẩm bán ra, mua vào trong công ty thương mại (Bách hoá Trâu Quỳ). Dữ liệu của điều tra thường xuyên làm cơ sở để lập báo cáo thống kê định kỳ. + Điều tra không thường xuyên là loại điều tra thống kê nhằm thu thập các dữ liệu ban đầu về hiện tượng nghiên cứu một cách không thường xuyên, không liên tục mà chỉ tiến hành khi có nhu cầu cần nghiên cứu. Thí dụ: Điều tra dân số, điều tra thị trường, điều tra đất đai nông nghiệp, điều tra lao động và việc làm . Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 21
  22. Dữ liệu của điều tra không thường xuyên phản ánh trạng thái của hiện tượng tại một thời điểm nhất định. Nó có thể được tiến hành định kỳ (3 tháng, 6 tháng, 2 năm, 5 năm, 10 năm) hoặc không theo định kỳ. Dựa theo phạm vi điều tra thống kê người ta chia thành 2 loại: Điều tra toàn bộ và điều tra không toàn bộ. + Điều tra toàn bộ là điều tra thống kê nhằm thu thập dữ liệu ban đầu ở tất cả các đơn vị tổng thể hiện tượng nghiên cứu (còn gọi là tổng điều tra, tổng kiểm kê). Ví dụ tổng điều tra dân số, tổng kiểm kê tài chính cuối năm, báo cáo kết quả học từng môn tất cả sinh viên học kỳ I, II. Ưu điểm của điều tra toàn bộ là cung cấp dữ liệu khá đầy đủ, phong phú và đảm bảo tin cậy. Các dữ liệu này giúp ta tính toán các chỉ tiêu thể hiện quy mô, cơ cấu, biến động và dự đoán xu hướng biến động của hiện tượng. Nhược điểm của điều tra toàn bộ là chi phí tốn kém, thời gian kéo dài, không áp dụng cho mọi trường hợp được và mức độ chính xác không đồng đều. Điều tra không toàn bộ là điều tra thống kê nhằm thu thập dữ liệu ban đầu ở một số đơn vị của tổng thể hiện tượng nghiên cứu. Yêu cầu của điều tra không toàn bộ cần xác định rõ 3 vấn đề: - Số đơn vị điều tra: Tuỳ theo yêu cầu và điều kiện nghiên cứu, người ta có thể chọn từ tổng thể hiện tượng nghiên cứu một số đơn vị để điều tra là nhiều hay ít. - Phương pháp chọn số đơn vị mẫu điều tra: Chọn ngẫu nhiên hay phi ngẫu nhiên (lí thuyết xác suất). - Các đơn vị được chọn ra phải đáp ứng được mục đích và yêu cầu nghiên cứu để kết quả điều tra có thể suy rộng cho tổng thể chung. Ưu điểm của điều tra không toàn bộ là chi phí ít tốn kém, thời gian nhanh, khả năng thu thập tài liệu cũng tỉ mỉ, đảm bảo chính xác, kịp thời và áp dụng cho những trường hợp nghiên cứu mà hiện tượng đó không thể áp dụng điều tra toàn bộ. Nhược điểm chủ yếu là tài liệu nếu thu thập từ các đơn vị điều tra được chọn không đáp ứng yêu cầu, mục đích nghiên cứu thì phản ánh không đúng thực tế khách quan. Vì vậy khâu chọn đơn vị điều tra rất quan trọng. Ví dụ: Điều tra năng suất, sản lượng cây trồng, gia súc, điều tra chi phí, giá thành sản phẩm, điều tra mức sống, điều tra chất lượng sản phẩm. Tuỳ theo cách chọn đơn vị điều tra mà điều tra không toàn bộ được chia thành 3 loại sau: - Điều tra chọn mẫu: Loại điều tra chỉ tiến hành thu thập dữ liệu ở một số đơn vị được chọn ra từ tổng thể hiện tượng nghiên cứu. Các đơn vị này phải mang tính chất đại biểu cho tổng thể. Kết quả điều tra chọn mẫu có thể suy ra kết quả chung cho cả tổng thể. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 22
  23. Hiện nay đây là loại điều tra không toàn bộ khoa học nhất được áp dụng nhiều nhất trong nghiên cứu kinh tế - xã hội. Ví dụ: Điều tra mức sống dân cư, điều tra kinh tế hộ, điều tra năng suất cây trồng - Điều tra trọng điểm: Loại điều tra chỉ tiến hành điều tra ở bộ phận tập trung lớn nhất của tổng thể hiện tượng nghiên cứu. Kết quả điều tra của bộ phận này không có ý nghĩa suy rộng mà chỉ dùng làm căn cứ để nhận định, đánh giá chung về các đặc điểm, nội dung chủ yếu của tổng thể. Ví dụ: Điều tra tình hình sản xuất cây ăn quả đặc sản như nhãn lồng, vải thiều thì thực hiện chủ yếu ở vùng Hưng Yên, Lục Ngạn; cà phê, hạt tiêu chủ yếu ở Đắc Lắc. - Điều tra chuyên đề: Loại điều tra chỉ tiến hành điều tra ở một hoặc một số đơn vị tổng thể điển hình (thường là một đơn vị tiên tiến hay lạc hậu) về một đặc tính nào đó, nghiên cứu tỉ mỉ và nhiều khía cạnh. Kết quả điều tra nhằm rút ra kinh nghiệm và phổ biến kinh nghiệm để có thể vận dụng chung cho các điều kiện tương tự. Ví dụ: Điều tra báo cáo kết quả học tập, kinh nghiệm học tập, người tốt, việc tốt. 1.3. Chất lượng thông tin Thông tin có thể được phát sinh, lưu trữ, truyền đi, được tìm kiếm, sao chép, xử lý và nhân bản. Mặt khác, thông tin cũng có thể biến dạng, sai lệch, hoặc bị phá huỷ. Vì vậy chất lượng thông tin có thể bị ảnh hưởng mà nguyên nhân là do: - Các sự cố vật lí: Các sự cố về kỹ thuật gây ra hoặc sự cố về môi trường. Muốn khắc phục sự cố này cần kiểm tra kỹ thuật thường xuyên. - Do ngữ nghĩa: Do ngôn ngữ mà xuất hiện những từ đồng âm dị nghĩa, đồng nghĩa khác âm hoặc ngôn ngữ bất đồng mà dẫn đến hiểu không đồng nhất về các khái niệm, văn phạm không rõ làm cho con người hiểu biết và nhận thức khác nhau về hiện tượng hay đối tượng nghiên cứu. - Do tính thực dụng của con người: Xuất phát từ lợi ích nào đó trong quan hệ xã hội mà các thông tin đưa ra không chính xác, sai lệch sự thật. Nguyên nhân này xảy ra rất nhiều và thường xuyên trong nền kinh tế thị trường. Trong nghiên cứu thống kê, thông tin là nguyên liệu đầu vào của mô hình phân tích nên rất cần những thông tin có ích. Thông tin có ích là những thông tin có độ chính xác cao, độ bất định thấp. Thông tin có ích là thông tin có chất lượng phải đảm bảo 3 yêu cầu: đầy đủ, chính xác và kịp thời. * Đầy đủ: Đủ, đúng các nội dung, các đơn vị hoặc các hiện tượng thuộc phạm vi nghiên cứu. Yêu cầu này có thể bị ảnh hưởng của cả 3 nguyên nhân nói trên. * Chính xác: Phản ánh đúng thực tế tình hình các đơn vị, các nội dung mà con người cần biết. Yêu cầu này bị ảnh hưởng bởi tất cả các nguyên nhân. * Kịp thời: Thông tin phản ảnh đúng lúc mà con người cần sử dụng. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 23
  24. 2. PHƯƠNG PHÁP THU THẬP DỮ LIỆU BAN ĐẦU 2.1. Hình thức tổ chức thu thập dữ liệu ban đầu Có hai hình thức tổ chức thu thập các dữ liệu ban đầu là báo cáo thống kê định kỳ và điều tra chuyên môn. a) Báo cáo thống kê định kỳ: * Khái niệm: Là hình thức tổ chức thu thập dữ liệu ban đầu một cách thường xuyên, định kỳ theo hình thức, nội dung, phương pháp và chế độ báo cáo đã quy định. Ví dụ: Báo cáo kết quả thi và kiểm tra môn học của sinh viên; báo cáo tài chính cuối tháng, cuối năm; báo cáo số người đi làm từng ngày * Yêu cầu của báo cáo thống kê định kỳ: Đúng biểu mẫu, đúng kỳ hạn, nội dung có thể mở rộng hoặc thu hẹp * Phạm vi áp dụng: Hình thức này áp dụng chủ yếu cho các doanh nghiệp nhà nước, hoặc đối với các hiện tượng và quá trình kinh tế xã hội do địa phương hay nhà nước quản lý. Trong nền kinh tế thị trường, hình thức này áp dụng chủ yếu trong nội bộ doanh nghiệp. * Cách lập các báo cáo thống kê định kỳ: Báo cáo thống kê định kỳ được lập theo trình tự sau: - Mỗi cơ sở sản xuất tổ chức theo dõi quá trình sản xuất, ghi chép các diễn biến của nó vào các sổ sách. Công việc này được gọi là ghi chép ban đầu. Ví dụ: Ghi các khoản thu, chi hàng ngày, phiếu xuất kho, phiếu thu, chi, bảng chấm công - Đến thời hạn báo cáo, người ta tập hợp các tài liệu ban đầu theo nội dung và phương pháp tính được chỉ dẫn trong báo cáo. Bản giải thích các biểu mẫu báo cáo thống kê định kỳ do Tổng cục Thống kê ban hành. - Ghi các số liệu vào biểu mẫu và báo cáo. - Các báo cáo này được lưu trữ nhiều năm, khi cần nghiên cứu người ta có thể lấy tài liệu từ các báo cáo đó phục vụ cho mục đích nghiên cứu. b) Điều tra chuyên môn: * Khái niệm: Là hình thức tổ chức thu thập các dữ liệu ban đầu không thường xuyên, không định kỳ mà tiến hành theo một kế hoạch và phương pháp quy định riêng cho mỗi lần điều tra. - Điều tra chuyên môn chỉ thu thập tài liệu vào thời kỳ hoặc thời điểm có yêu cầu nghiên cứu. Ví dụ: Điều tra dân số, điều tra gia súc, điều tra tội phạm Các cuộc điều tra chuyên môn trên phạm vi toàn quốc như điều tra dân số, điều tra tình hình kinh tế và đời sống nông thôn, điều tra năng lực sản xuất công nghiệp của các thành phần kinh tế ngoài quốc doanh, thường gọi là tổng điều tra. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 24
  25. * Phạm vi áp dụng: Dùng để thu thập tài liệu về các vấn đề mà báo cáo thống kê định kỳ không thu thập hoặc không thể thu thập được. Cụ thể là các hiện tượng nằm ngoài kế hoạch, hoặc ít liên quan đến kế hoạch, các hiện tượng xảy ra bất thường và chủ yếu đối với các xí nghiệp ngoài quốc doanh như các tập đoàn tư nhân, các gia đình và cá nhân có doanh nghiệp riêng. Đối với nông nghiệp nước ta, từ khi thực hiện Chỉ thị khoán 10 của Bộ Chính trị, hình thức này áp dụng phổ biến nhằm thu thập các thông tin ban đầu phục vụ cho lãnh đạo và chỉ đạo sản xuất nông nghiệp của Đảng và chính quyền các cấp. * Ý nghĩa: - Tài liệu thu thập rộng khắp và phong phú hơn. - Kiểm tra chất lượng các báo cáo thống kê định kỳ. * Tổ chức điều tra chuyên môn: Tiến hành một điều tra chuyên môn, người ta thường xây dựng phương án điều tra gồm các nội dung sau: - Mục đích yêu cầu - Đối tượng điều tra - Nội dung điều tra và giải thích cách ghi chép - Kế hoạch tiến hành. 2.2. Phương pháp thu thập dữ liệu ban đầu a) Phương pháp trực tiếp: Theo phương pháp này, người làm công tác điều tra phải tự mình trực tiếp quan sát, phỏng vấn thực tế, cân, đong, đo đếm và tự ghi chép tài liệu. Ví dụ: Trong điều tra dân số, theo dõi thí nghiệm, điều tra năng suất cây trồng, khối lượng gia súc người điều tra đều phải trực tiếp phỏng vấn, đo, đếm để thu thập dữ liệu. Ưu điểm của phương pháp này là tài liệu đảm bảo chính xác nên thường được áp dụng phổ biến. Tuy nhiên phương pháp này có nhược điểm chủ yếu là tốn nhiều kinh phí (cả về nhân lực và thời gian). b) Phương pháp gián tiếp: Theo phương pháp này, người điều tra thu thập tài liệu theo các nội dung cần nghiên cứu phải thông qua một phương tiện trung gian như điện thoại, thư tín, hoặc các chứng từ sổ sách đã ghi chép ở thời gian trước. Ví dụ điều tra thu chi trong doanh nghiệp, điều tra tình hình sinh tử, điều tra tài sản Ưu điểm của phương pháp này là đỡ tốn kém, nhưng có nhược điểm là mức độ đầy đủ và chính xác không cao, nên chỉ áp dụng trong những trường hợp khó khăn hoặc không có điều kiện thu thập trực tiếp. 3. KẾ HOẠCH THU THẬP DỮ LIỆU BAN ĐẦU Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 25
  26. Để thu thập các dữ liệu ban đầu đảm bảo đầy đủ, khách quan và kịp thời thì điều tra thống kê cần được tổ chức một cách khoa học, thống nhất và chu đáo. Muốn vậy, trước khi tiến hành thu thập dữ liệu cần xây dựng kế hoạch. Kế hoạch thu thập dữ liệu ban đầu (gọi tắt là kế hoạch điều tra) là một tài liệu dưới dạng văn bản, trong đó trình bày những nội dung, trình tự, phương pháp tiến hành, các công việc cụ thể cần chuẩn bị và tiến hành điều tra thống kê. Đối với mỗi loại dữ liệu, cũng như mỗi hình thức tổ chức điều tra thống kê cần xây dựng kế hoạch điều tra phù hợp. 3.1. Dữ liệu thứ cấp Nội dung cơ bản của kế hoạch thu thập dữ liệu thứ cấp cần trả lời các câu hỏi: Những tài liệu nào cần thu thập? Tài liệu đó ở đâu? cấp nào? được thể hiện qua ví dụ ở bảng 2.2. Bảng 2.2. Nguồn gốc và phương pháp thu thập tài liệu thứ cấp Cấp nào? Ở ®©u? Tµi liÖu nµo? C¸c sè liÖu vÒ c¸c dù ¸n, c¸c ch−¬ng tr×nh ph¸t triÓn kinh Së KÕ ho¹ch vµ ®Çu t− tÕ cña c¶ n−íc, tØnh Côc Thèng kª C¸c sè liÖu thèng kª vÒ kinh tÕ, x· héi Së N«ng nghiÖp & PTNT C¸c tµi liÖu vÒ t×nh h×nh s¶n xuÊt n«ng nghiÖp, n«ng th«n Bé, tØnh Côc §Þnh canh, ®Þnh c− Së §Þa chÝnh C¸c tµi liÖu vÒ ®Êt ®ai HiÖp héi N«ng d©n lµm kinh tÕ giái Phßng thèng kª C¸c sè liÖu thèng kª vÒ t×nh h×nh kinh tÕ x· héi cña huyÖn HuyÖn Phßng n«ng l©m C¸c sè liÖu vÒ t×nh h×nh s¶n xuÊt n«ng nghiÖp cña huyÖn C¸c ®Ò tµi nghiªn cøu khoa häc ®· nghiÖm thu Tr−êng, viÖn C¸c luËn v¨n, luËn ¸n ®· b¶o vÖ nghiªn cøu Tr−êng §HNN I Hµ Néi C¸c kÕt qu¶ øng dông tiÕn bé khoa häc UBND x· C¸c tµi liÖu vÒ t×nh h×nh kinh tÕ x· héi cña x· X· Th«n, hé n«ng d©n C¸c tµi liÖu cña th«n, hé n«ng d©n 3.2. Dữ liệu sơ cấp Để thu thập các dữ liệu sơ cấp, người ta thường tổ chức hình thức điều tra chuyên môn. Vì vậy, kế hoạch điều tra bao gồm các nội dung sau: Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 26
  27. a) Xác định mực đích điều tra: Xác định mục đích điều tra là nhằm thu thập những dữ liệu ở khía cạnh nào của hiện tượng, phục vụ cho yêu cầu nghiên cứu nào? và yêu cầu quản lý nào? Mục đích điều tra là nội dung quan trọng đầu tiên của kế hoạch điều tra. Nó có tác dụng định hướng cho toàn bộ quá trình điều tra. Nó giúp chúng ta xác định đối tượng, đơn vị và nội dung điều tra. Bất kỳ một hiện tượng nào khi nghiên cứu cũng được quan sát, tìm hiểu ở nhiều góc độ khác nhau. Song, trong điều tra thống kê thì không thể và không nhất thiết phải điều tra tất cả các khía cạnh của hiện tượng mà chỉ nên tập trung khảo sát những khía cạnh có liên quan trực tiếp, phục vụ yêu cầu nghiên cứu . Thí dụ: Nghiên cứu các yếu tố ảnh hưởng đến kết quả học tập của sinh viên Đại học Nông nghiệp I. Mục đích điều tra là nhằm thu thập các dữ liệu phản ánh kết quả học tập của sinh viên từ 1-3 học kỳ gần đây và các yếu tố ảnh hưởng đến kết quả học tập. Các dữ liệu khác có liên quan đến sinh viên nhưng không cần thu thập như sinh viên quê quán ở đâu? Là con thứ mấy trong gia đình? b) Xác định đối tượng điều tra và đơn vị điều tra: * Đối tượng điều tra: Đối tượng điều tra là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có các dữ liệu cần thiết khi tiến hành điều tra. Xác định đối tượng điều tra là quy định rõ phạm vi, ranh giới của hiện tượng nghiên cứu so với hiện tượng khác. Trong thí dụ trên, đối tượng điều tra là các sinh viên đang học ít nhất 3 học kỳ gần đây của Trường Đại học Nông nghiệp I. Xác định đối tượng điều tra đúng giúp chúng ta xác định đúng số đơn vị cần điều tra, tránh được những nhầm lẫn khi thu thập dữ liệu. Để xác định đúng đắn đối tượng điều tra, cần dựa vào các căn cứ sau: - Dựa vào mục đích điều tra. - Các tiêu chuẩn phân biệt. Những tiêu chuẩn này chúng ta khi xác định đối tượng điều tra cần định nghĩa và đưa ra. Thí dụ: Tiêu chuẩn đưa ra là sinh viên của Trường Đại học Nông nghiệp I đang học khác với đã học, học tập trung tại trường chứ không phải hệ vừa học vừa làm. * Đơn vị điều tra: Là từng đơn vị cá biệt thuộc đối tượng điều tra và được xác định sẽ điều tra thực tế. Trong điều tra toàn bộ, số đơn vị điều tra cũng chính là số đơn vị thuộc đối tượng điều tra. Trong điều tra không toàn bộ thì số đơn vị điều tra là những đơn vị được chọn ra từ tổng số các đơn vị thuộc đối tượng điều tra. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 27
  28. Xác định đơn vị điều tra chính là xác định nơi sẽ cung cấp những dữ liệu cần thiết cho quá trình nghiên cứu. Đơn vị điều tra còn là căn cứ để tiến hành tổng hợp dữ liệu, phân tích và dự báo thống kê cần thiết. Tuỳ thuộc vào mục đích và đối tượng điều tra mà đơn vị điều tra được xác định khác nhau. Thí dụ: Trong điều tra dân số, đơn vị điều tra là hộ gia đình và từng người dân; trong điều tra sản xuất và kinh doanh rau an toàn, đơn vị điều tra có thể là doanh nghiệp, hợp tác xã, hộ nông dân hoặc từng người dân có sản xuất và kinh doanh rau an toàn. c) Nội dung điều tra: Nội dung cần điều tra là những danh mục về các tiêu thức hay đặc trưng của các đơn vị điều tra cần thu thập. Mỗi đơn vị điều tra có rất nhiều tiêu thức khác nhau. Nhưng trong mỗi cuộc điều tra dữ liệu sơ cấp không nhất thiết thu thập tất cả các tiêu thức, mà chỉ thu thập theo một số tiêu thức chủ yếu, những tiêu thức quan trọng nhất đáp ứng cho mục đích điều tra và mục đích nghiên cứu. Do đó, trong kế hoạch điều tra cần xác định và thống nhất danh mục các tiêu thức cần thu thập. Những danh mục này không thể thiếu khi tiến hành điều tra. Thí dụ: Điều tra mức sống dân cư năm 2002 của Tổng cục Thống kê gồm các nội dung điều tra như sau: - Tình hình cơ bản của các hộ gia đình - Tình hình thu và cơ cấu các nguồn thu - Tình hình chi và cơ cấu các khoản chi - Tình hình thu nhập - Ý kiến của hộ gia đình về khó khăn, thuận lợi, nguyện vọng. Để xác định được đúng, đủ nội dung cần điều tra nên dựa trên các căn cứ sau: - Mục đích nghiên cứu - Mục đích điều tra - Khả năng về nhân lực, chi phí và thời gian cho phép. Mỗi tiêu thức trong danh mục các tiêu thức cần điều tra phải được diễn đạt thành câu hỏi ngắn gọn, dễ hiểu, cụ thể, rõ ràng để cả người điều tra và đơn vị điều tra đều hiểu một cách thống nhất. d) Xác định thời điểm và thời kỳ điều tra: * Thời điểm điều tra: Mốc thời gian được xác định để thống nhất đăng ký dữ liệu cho toàn bộ các đơn vị điều tra. Thí dụ: Thời điểm điều tra dân số năm 1999 là 0 giờ ngày 1 tháng 04 năm 1999. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 28
  29. Xác định thời điểm điều tra là xác định cụ thể giờ, ngày để thống nhất đăng ký dữ liệu nhằm nghiên cứu trạng thái của hiện tượng tại thời điểm đó. Tuỳ theo tính chất, đặc điểm của hiện tượng nghiên cứu mà xác định thời điểm điều tra. Tuy nhiên, khi xác định thời điểm điều tra người ta thường chọn thời điểm mà tại đó hiện tượng ít biến động nhất và gắn kết với những kế hoạch của địa phương. Thí dụ: Điều tra thị trường áo bơi tại Việt Nam thì không thể chọn vào mùa đông. * Thời kỳ điều tra: Khoảng thời gian được xác định để thống nhất đăng ký dữ liệu của các đơn vị điều tra trong suốt khoảng thời gian đó (cả ngày, cả tuần, 5 ngày, 10 ngày, 1 tháng, 3 tháng, 1 năm ). Thí dụ: Điều tra số người vi phạm luật giao thông đường bộ 1 ngày, 1 tuần, 1 tháng của một địa phương. Thời kỳ điều tra dài hay ngắn phụ thuộc vào mục đích nghiên cứu. * Thời hạn điều tra: Là thời gian dành cho việc đăng ký thu thập tất cả các dữ liệu điều tra, được tính từ bắt đầu cho đến khi kết thúc toàn bộ công việc thu thập dữ liệu. Thí dụ: Điều tra dân số, thời hạn điều tra trong vòng 10 ngày. Điều tra số lượng áo bơi bán trên thị trường Hà Nội trong 1 tháng của Công ty may Thăng Long, thời hạn điều tra 5 ngày. Như vậy, thời hạn điều tra dài hay ngắn phụ thuộc vào quy mô, tính chất phức tạp của hiện tượng, nội dung nghiên cứu và lực lượng tham gia, nhưng không nên quá dài. e) Biểu mẫu điều tra và bản giải thích cách ghi biểu mẫu: * Biểu mẫu điều tra (gọi tắt là phiếu điều tra, bản câu hỏi) là loại văn bản in sẵn theo mẫu quy định trong kế hoạch điều tra, được sử dụng thống nhất để ghi dữ liệu của đơn vị điều tra. Yêu cầu của biểu mẫu điều tra là: - Có đầy đủ các nội dung cần điều tra - Các thang đo định tính sử dụng trong nội dung điều tra cần được mã hoá sẵn - Các câu hỏi được thiết kế cụ thể, khoa học thuận lợi cho việc kiểm tra và tổng hợp dữ liệu. * Bản giải thích cách ghi biểu mẫu là bản giải thích và hướng dẫn cụ thể cách xác định và ghi dữ liệu vào biểu mẫu điều tra. Nội dung, ý nghĩa của các câu hỏi phải được giải thích khoa học và chính xác. Những câu hỏi phức tạp có nhiều khả năng trả lời cần có ví dụ cụ thể. Ngoài những nội dung chủ yếu nêu trên, bản giải thích còn đề cập tới một số vấn đề về phương pháp, cách tổ chức và tiến hành điều tra như sau: - Cách chọn mẫu Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 29
  30. - Phương pháp thu thập và ghi chép dữ liệu ban đầu - Các bước và tiến độ điều tra - Tổ chức và quy định nhiệm vụ của cán bộ tham gia điều tra - Phân công khu vực điều tra - Tổ chức tập huấn cán bộ điều tra - Điều tra thử để rút kinh nghiệm - Tổ chức tuyên truyền mục đích, ý nghĩa và yêu cầu của cuộc điều tra. 4. SAI SỐ TRONG THU THẬP DỮ LIỆU THỐNG KÊ 4.1. Khái niệm, ý nghĩa Trong thu thập dữ liệu thống kê (gọi tắt là điều tra thống kê) dù tổ chức bằng hình thức nào, trong phạm vi nào và theo phương pháp nào bao giờ cũng chỉ đảm bảo yêu cầu chính xác với mức độ nhất định, hay nói cách khác dữ liệu thống kê thu thập được thường có sai số. Sai số trong điều tra thống kê là gì? Sai số trong điều tra thống kê là sự chênh lệch giữa trị số thu thập được trong điều tra với trị số thực tế của đơn vị điều tra. Sai số trong điều tra thống kê là sai số vốn có, được phép trong phạm vi sai số là 5%. Tuy nhiên, sai số càng lớn càng làm giảm chất lượng của kết quả điều tra và chất lượng của cả quá trình nghiên cứu thống kê. Vấn đề đặt ra trong điều tra thống kê là phải tìm ra các nguyên nhân làm phát sinh sai số để chủ động tìm biện pháp khắc phục. 4.2. Các loại sai số * Sai số do đăng ký là loại sai số phát sinh do xác định và ghi chép dữ liệu không chính xác. Các nguyên nhân dẫn đến sai số này thường là: - Lập kế hoạch điều tra sai hoặc không khoa học, không sát với thực tế của hiện tượng. - Do trình độ của nhân viên điều tra không hiểu chính xác nội dung các câu hỏi, không biết cách khai thác số liệu. - Do đơn vị điều tra không hiểu câu hỏi nên trả lời sai. - Do ý thức, tinh thần trách nhiệm của cán bộ điều tra hoặc của đơn vị điều tra thấp dẫn đến việc xác định, cung cấp và ghi chép sai. - Do dụng cụ đo lường không chính xác. - Do công tác tuyên truyền, vận động không tốt dẫn đến đơn vị điều tra không hiểu hết hoặc hiểu sai mục đích điều tra nên cung cấp dữ liệu sai. - Do thiếu tinh thần trung thực, khách quan nên cố tính cung cấp hoặc ghi chép sai dữ liệu. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 30
  31. - Do lỗi in ấn biểu mẫu, phiếu điều tra và bản giải thích sai. - Những nguyên nhân khác * Sai số do tính chất đại biểu là sai số xảy ra trong điều tra không toàn bộ do chọn mẫu không đảm bảo tính chất đại diện. Như vậy, nguyên nhân chính của sai số này là do việc lựa chọn đơn vị điều tra thực tế không có tính đại diện cao. Thí dụ: Trong điều tra chọn mẫu về kinh tế hộ, 2 vấn đề đặt ra khi chọn các hộ là đơn vị điều tra là số lượng hộ là bao nhiêu? Kết cấu các loại hộ (khá, trung bình, nghèo)? Nếu chọn số hộ điều tra thực tế quá ít, kết cấu các hộ điều tra không phù hợp thì từ kết quả điều tra các hộ này suy rộng thành kết quả của tổng thể sẽ xuất hiện sai số do tính chất đại biểu. 4.3. Biện pháp chủ yếu khắc phục sai số trong điều tra thống kê Sai số trong điều tra thống kê là sai số vốn có. Vì thế chúng ta chỉ tìm các biện pháp khắc phục tới mức thấp nhất các sai số nói trên trong điều tra thống kê. Các biện pháp chủ yếu là: * Quán triệt mục đích ý nghĩa và yêu cầu từng cuộc điều tra. Cần tổ chức tốt công tác tuyên truyền cho đơn vị điều tra và nâng cao tinh thần trách nhiệm đối với cán bộ điều tra thông qua trang bị điều kiện làm việc, thời gian, thù lao và chế độ thưởng phạt. * Làm tốt công tác chuẩn bị: Chọn, huấn luyện nhân viên, in ấn chính xác phiếu điều tra và các tài liệu hướng dẫn. * Kiểm tra một cách có hệ thống các tài liệu thu thập được: + Kiểm tra tính logic của tài liệu. + Kiểm tra về mặt tính toán. + Kiểm tra tính đại biểu của đơn vị mẫu (cụ thể trong điều tra chọn mẫu). CÂU HỎI THẢO LUẬN CHƯƠNG II 1. Thế nào là thông tin thống kê? Các loại thông tin thường dùng trong nghiên cứu kinh tế - xã hội? 2. Hãy nêu các phương pháp thu thập thông tin kinh tế - xã hội? Cho ví dụ ? 3. Chất lượng thông tin là gì? Các nguyên nhân ảnh hưởng đến chất lượng thông tin? Biện pháp khắc phục? Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 31
  32. Chương III TỔNG HỢP VÀ TRÌNH BÀY CÁC SỐ LIỆU THỐNG KÊ 1. TỔNG HỢP THỐNG KÊ 1.1. Khái niệm, ý nghĩa, nhiệm vụ a) Khái niệm: Kết quả của giai đoạn điều tra thông tin ban đầu cho chúng ta các dữ liệu thô về các đặc trưng riêng biệt của từng đơn vị tổng thể. Các dữ liệu này mang tính chất rời rạc, rất khó quan sát để đưa ra các nhận xét chung cho cả hiện tượng nghiên cứu và cũng không thể sử dụng ngay vào phân tích và dự báo thống kê được. Ví dụ: Nghiên cứu tình hình trang bị máy tính của trường ta, ở giai đoạn điều tra thống kê cho ta những tài liệu ban đầu về từng đơn vị, số lượng máy, năm sản xuất, năm trang bị, nơi sản xuất, công suất, mã hiệu, hãng, tình trạng máy Bây giờ chúng ta cần trả lời các câu hỏi: - Trường có bao nhiêu máy tính? - Mỗi khoa, phòng bao nhiêu? - Loại máy, công suất? - Nơi sản xuất? - Khó khăn và thuận lợi? - Muốn có được các tài liệu phản ánh chung cho cả tổng thể nghiên cứu như trên thì từ các thông tin riêng biệt của từng đơn vị chúng ta phải sắp xếp lại, hệ thống hoá, phân loại theo những tiêu thức cần nghiên cứu để thấy được các đặc trưng chung của tổng thể mẫu hay toàn bộ tổng thể nghiên cứu. Toàn bộ những công việc đó, người ta gọi là tổng hợp thống kê. Tổng hợp thống kê là sự tập trung, chỉnh lý và hệ thống hoá các tài liệu ban đầu thu thập được trong điều tra thống kê của từng đơn vị tổng thể thành tài liệu phản ánh đặc trưng chung của cả tổng thể. b) Ý nghĩa: Tổng hợp thống kê là giai đoạn thứ 2 của quá trình nghiên cứu thống kê, không thể thiếu được, cũng không thể không khoa học và không thể không đúng phương pháp, nó là cơ sở rất quan trọng cho giai đoạn phân tích thống kê. c) Nhiệm vụ: Nhiệm vụ của giai đoạn này là: - Tập trung và sắp xếp các tài liệu theo một trình tự nhất định. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 32
  33. Nếu tài liệu điều tra thu thập được ở số ít các đơn vị người ta thường sắp xếp dữ liệu này theo một trình tự nào đó (thứ tự tăng dần về lượng biến của 1 tiêu thức số lượng nào đó, hoặc theo trật tự quy định nào đó đối với dữ liệu định tính). - Sắp xếp các đơn vị vào các tổ nhóm theo một hay một vài tiêu thức đặc trưng và tính toán các đại lượng thống kê đặc trưng cho tổ nhóm và toàn bộ tổng thể. Nhiệm vụ này thường gặp khi tài liệu điều tra thu thập được ở số lớn các đơn vị, khối lượng dữ liệu nhiều. Ví dụ: Trong điều tra dân số, tài liệu thu thập được ở từng người dân rất lớn, người ta thường tổng hợp theo cách sắp xếp người dân theo độ tuổi, trình độ văn hoá hay nghề nghiệp sau đó tính các chỉ tiêu thống kê mô tả từng tổ như số lượng trung bình, nhiều nhất, ít nhất, tần số hay tần suất. - Trình bày dữ liệu tổng hợp dưới hình thức bảng hay đồ thị thống kê. 1.2. Nội dung của tổng hợp thống kê Theo trình tự nội dung của tổng hợp thống kê bao gồm xác định mục đích phân tích; nội dung tổng hợp; kiểm tra tài liệu; phân chia các đơn vị thành các tổ hay tiểu tổ và trình bày kết quả tổng hợp. Chương này trình bày chủ yếu 2 bước là phân tổ thống kê và trình bày kết quả tổng hợp thống kê dưới hình thức bảng hay đồ thị thống kê. Xác định mục đích của tổng hợp thống kê là cụ thể hoá tiêu thức cần sắp xếp và phân loại. Đây là bước quan trọng vì tổng thể nghiên cứu có biểu hiện khác nhau. Mặt khác mục đích tổng hợp thống kê làm cơ sở cho phân tích thống kê nên rất cần cụ thể hoá mục đích tổng hợp. Ví dụ: Tổng thể dân số có biểu hiện về nghề nghiệp, lứa tuổi, trình độ văn hoá, ngoại ngữ, quê quán, tôn giáo Do vậy, khi nghiên cứu tổng thể ở đặc tính nào thì tổng hợp thống kê mới khái quát hoá, sắp xếp, hệ thống hoá theo các đặc trưng và khía cạnh đó. * Xác định mục đích tổng hợp thường dựa vào mục đích nghiên cứu của thống kê. Có thể nói rằng mục đích nghiên cứu của thống kê xuyên suốt cả 3 giai đoạn, hay nói cách khác cả 3 giai đoạn này đều nhằm đáp ứng yêu cầu của nghiên cứu thống kê. * Xác định nội dung của tổng hợp thống kê: Những danh mục về các biểu hiện của các tiêu thức đã có ở điều tra thống kê, nhưng không tất cả các biểu hiện của tiêu thức đều đưa vào tổng hợp, mà chỉ chọn các tiêu thức nào có nội dung tổng hợp vừa đủ đáp ứng mục đích nghiên cứu. Ví dụ: Điều tra dân số, người ta thường tổng hợp theo độ tuổi dưới 1 tuổi, 1-3 tuổi, 4-6 tuổi, 7-11 tuổi, 12-15 tuổi, 16-55 tuổi, 56-100 tuổi, hơn 100 tuổi. Nhưng tên quê quán không nhất thiết phải tổng hợp. Xác định nội dung tổng hợp thống kê là thống nhất danh mục chính thức về các biểu hiện của các tiêu thức bằng hệ thống các tiêu thức hay chỉ tiêu thống kê cần cho nghiên cứu. Người ta thường dùng phân tổ thống kê để thực hiện các nội dung tổng hợp thống kê. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 33
  34. * Kiểm tra tài liệu dùng để tổng hợp: Chất lượng của tổng hợp thống kê phụ thuộc vào chất lượng của tài liệu đưa vào tổng hợp. Ở điều tra thống kê người ta đã kiểm tra tài liệu rồi, tuy nhiên trong giai đoạn này vẫn cần kiểm tra lại trước khi tổng hợp. Nội dung kiểm tra gồm: - Kiểm tra điển hình: Chọn mẫu các phiếu điều tra để kiểm tra. - Kiểm tra theo nội dung: Chính xác, đầy đủ, kịp thời và lô gíc. 2. PHÂN TỔ THỐNG KÊ 2.1. Khái niệm, ý nghĩa và tác dụng a) Khái niệm: Phân tổ thống kê là căn cứ vào 1 hay một số tiêu thức để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ và tiểu tổ sao cho các đơn vị trong cùng một tổ thì giống nhau về tính chất, ở khác tổ thì khác nhau về tính chất. Ví dụ: Phân tổ các em sinh viên trong lớp Kinh tế nông nghiệp khoá 50 theo tiêu thức giới tính (bảng 1.3). Bảng 1.3. Diễn Số lượng Tỷ lệ Khi phân tổ thống kê, các đơn vị tổng thể giải (người) (%) được tập hợp vào một số tổ, giữa các tổ lại có sự Tổng 90 100,00 khác nhau về tính chất. Còn trong phạm vi mỗi tổ, Nam 40 36,67 các đơn vị có cùng (hoặc gần giống nhau) về tính chất theo tiêu thức được dùng làm căn cứ phân tổ. Nữ 50 63,33 b) Ý nghĩa: * Dùng phân tổ để chọn ra các đơn vị điều tra (nhất là trong điều tra chọn mẫu). * Phân tổ thống kê là phương pháp cơ bản của tổng hợp thống kê. * Phân tổ thống kê là cơ sở và là một phương pháp phân tích thống kê. c) Tác dụng của phân tổ thống kê: Với ý nghĩa của phân tổ đã nêu trên, xuất phát từ yêu cầu của thực tễn xã hội mà phân tổ thống kê có tác dụng sau đây: * Phân tổ thống kê nghiên cứu các loại hình kinh tế xã hội (phân tổ phân loại): Bất kì một nền kinh tế xã hội nào cũng bao gồm nhiều loại hình kinh tế. Chẳng hạn nền kinh tế Việt Nam hiện tại bao gồm nhiều loại hình kinh tế khác nhau như: kinh tế Nhà nước; kinh tế tập thể; kinh tế tư nhân; kinh tế cá thể; kinh tế hỗn hợp. Sự vận động và phát triển của nền kinh tế xã hội đó như thế nào, phụ thuộc vào vị trí, vai trò và xu hướng phát triển của từng loại hình kinh tế. Khi nghiên cứu đặc trưng Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 34
  35. của nền kinh tế xã hội đó người ta phải nêu rõ: Có bao nhiều loại hình kinh tế? Là những loại hình kinh tế gì? Tỷ trọng mỗi loại hình như thế nào? Mối quan hệ giữa các loại hình? Xu hướng phát triển của các loại hình? Để đáp ứng yêu cầu nghiên cứu trên, chỉ có thể thực hiện được thông qua phân tổ thống kê. Ví dụ: Sự phát triển các thành phần kinh tế Việt Nam từ 1995 đến 2003 (bảng 2.3). Bảng 2.3. Cơ cấu tổng sản phẩm trong nước theo thành phần kinh tế qua các năm ĐVT: % Thành phần kinh tế 1995 2000 2001 2002 2003 Kinh tế Nhà nước 40,18 38,53 38,40 38,38 39,08 Kinh tế tập thể 10,06 8,58 8,06 7,99 7,49 Kinh tế tư nhân 7,44 7,31 7,95 8,30 8,23 Kinh tế cá thể 36,02 32,31 31,84 31,57 30,73 Kinh tế có vốn đầu tư nước ngoài 6,30 13,28 13,75 13,76 14,47 Cộng 100,00 100,00 100,00 100,00 100,00 Nguồn: Niên giám thống kê 2003. Theo bảng 2.3, nền kinh tế Việt Nam từ năm 1995 đến 2003 kinh tế Nhà nước vẫn chiếm tỷ trọng lớn nhất và giữ vai trò chủ đạo. Kinh tế cá thể được chú trọng phát triển, đang cạnh tranh mạnh mẽ với kinh tế Nhà nước. Kinh tế có vốn đầu tư nước ngoài tăng nhanh. * Phân tổ thống kê nghiên cứu kết cấu nội bộ tổng thể (phân tổ kết cấu): Kết cấu nội bộ tổng thể là tỷ lệ các bộ phận chiếm trong tổng thể và quan hệ tỷ lệ về lượng giữa các bộ phận đó nói lên kết cấu nội bộ tổng thể. Mỗi hiện tượng kinh tế xã hội hay quá trình kinh tế xã hội đều do cấu thành từ nhiều bộ phận, nhiều nhóm đơn vị có tính chất khác nhau hợp thành. Ví dụ, theo khu vực, dân số của Việt Nam gồm 2 nhóm khác nhau là thành thị và nông thôn. Giữa 2 nhóm có sự khác nhau về tính chất ngành nghề, công việc và cá tính của người dân; tỷ lệ mỗi bộ phận này và quan hệ tỷ lệ giữa 2 nhóm nói lên kết cấu dân số Việt Nam theo khu vực. Nghiên cứu kết cấu nội bộ tổng thể giúp ta đi sâu nghiên cứu bản chất của hiện tượng, thấy được tầm quan trọng của từng bộ phận trong tổng thể. Nếu nghiên cứu kết cấu nội bộ tổng thể theo thời gian cho ta thấy được xu hướng phát triển của hiện tượng nghiên cứu. Như vậy, muốn nghiên cứu kết cấu nội bộ tổng thể phải dựa trên cơ sở của phân tổ thống kê. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 35
  36. * Phân tổ thống kê nghiên cứu mối liên hệ ảnh hưởng lẫn nhau giữa các tiêu thức của hiện tượng (phân tổ phân tích hay liên hệ): Các quá trình hay hiện tượng kinh tế - xã hội phát sinh và phát triển không phải ngẫu nhiên, tách rời với các hiện tượng xung quanh mà chúng có liên hệ và phụ thuộc lẫn nhau theo những quy định nhất định. Sự biến động của hiện tượng này sẽ dẫn đến sự biến động của hiện tượng khác và ngược lại mỗi hiện tượng biến động đều do sự tác động của các hiện tượng xung quanh. Ví dụ: Trẻ em ăn no, đủ chất thì chóng lớn, khoẻ mạnh; lúa thiếu dinh dưỡng, mà tăng lượng phân bón dẫn đến năng suất tăng, giá thành hạ; hàng hoá nhiều thì giá bán hạ. Nhiệm vụ của thống kê không chỉ nghiên cứu bản chất mà còn nghiên cứu mối liên hệ giữa các hiện tượng kinh tế nói chung và các tiêu thức nói riêng. Khi nghiên cứu mối quan hệ ảnh hưởng lẫn nhau giữa các hiện tượng, người ta thường chia các tiêu thức thành hai loại: tiêu thức nguyên nhân, tiêu thức kết quả. + Tiêu thức nguyên nhân là tiêu thức mà lượng biến của nó thay đổi làm cho lượng biến của tiêu thức khác cũng thay đổi. + Tiêu thức kết quả là tiêu thức mà lượng biến của nó có thay đổi do sự biến động của tiêu thức nguyên nhân. Phân tổ hiện tượng kinh tế xã hội theo một trong hai tiêu thức trên thì biểu hiện về lượng của tiêu thức còn lại sẽ phản ánh mối quan hệ nhân quả mà ta cần nghiên cứu. Phân tổ thống kê nghiên cứu mối liên hệ ảnh hưởng lẫn nhau giữa các hiện tượng như vậy gọi là phân tổ phân tích hay phân tổ liên hệ. 2.2. Quá trình phân tổ thống kê Hiện nay do khoa học công nghệ, nhất là công nghệ tin học khá phát triển, người ta đã lập trình và vận dụng được các chương trình máy tính đưa vào ứng dụng trong nghiên cứu và phục vụ sản xuất. Về phân tổ thống kê cũng đã có nhiều chương trình vi tính chuyên cho xử lý số liệu thống kê đã thực hiện, ví dụ IRRISTAT, STATGRAF, SPSS và EXCEl. Nhưng, đó chỉ là công việc đơn thuần mà máy tính thực hiện, còn mục đích phân tổ của chúng ta để làm gì, chia làm bao nhiêu tổ máy tính không thể thực hiện được. Vì vậy người làm công tác chuyên môn thống kê hoặc vận dụng thống kê làm công cụ quản lý xã hội và kinh tế cần nắm vững, hiểu được những công việc của phân tổ thống kê là gì? Quá trình phân tổ thống kê bao gồm: Xác định tiêu thức phân tổ; xác định số tổ cần thiết và phạm vi mỗi tổ; xác định các chỉ tiêu giải thích. a) Tiêu thức phân tổ: * Khái niệm: Tiêu thức phân tổ là tiêu thức được lựa chọn làm căn cứ để tiến hành phân tổ thống kê. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 36
  37. * Ý nghĩa: Tiêu thức phân tổ phản ánh đúng bản chất của hiện tượng mà mục đích nghiên cứu đề ra. Sở dĩ như vậy là vì mỗi đơn vị tổng thể như chúng ta đã biết bao gồm nhiều tiêu thức khác nhau, tiêu thức nào cũng có thể dùng để phân tổ được, xong mỗi tiêu thức có ý nghĩa khác nhau. Thí dụ: Tổng thể dân số, có thể: - Phân tổ theo giới tính. Giới tính là tiêu thức phân tổ. - Phân tổ theo độ tuổi. Độ tuổi là tiêu thức phân tổ. - Phân tổ theo nghề nghiệp. Nghề nghiệp là tiêu thức phân tổ. Nhưng, cùng một nguồn tài liệu nếu chọn tiêu thức phân tổ khác nhau có thể đưa đến kết luận khác nhau, hoặc chọn tiêu thức phân tổ không đúng theo mục đích nghiên cứu sẽ dẫn đến nhận xét đánh giá khác nhau về thực tế của hiện tượng. * Thí dụ: Nghiên cứu kết quả học tập của sinh viên 1 lớp, Trường Đại học Nông nghiệp I Hà Nội năm học 2004 -2005. - Nếu chọn tiêu thức phân tổ là thời gian tự học thì ta có kết quả như bảng 3.3. Bảng 3.3. Phân tổ số sinh viên của lớp theo số giờ tự học trong ngày Số giờ tự Số sinh Cơ cấu Kết quả phân tổ ở bảng 3.3 học/ngày viên (%) cho biết số sinh viên sử dụng thời (giờ) (người) gian học ở nhà từ 3 - 4 giờ/ngày 0 5 6,25 chiếm 56,25% chứ chưa cho biết 1 7 8,75 kết quả học tập của sinh viên như 2 15 18,75 thế nào. 3 20 25,00 4 25 31,25 5 8 10,00 Cộng 80 100,00 - Nếu chọn tiêu thức phân tổ là điểm thi trung bình các môn thi trong năm của 1 sinh viên thì mới thể hiện kết quả học tập của sinh viên (bảng 4.3). Bảng 4.3. Phân tổ số sinh viên của lớp theo điểm thi trung bình 1 sinh viên Số sinh Cơ cấu Kết quả phân tổ ở bảng 4.3 Điểm thi trung bình viên (%) 1 sinh viên (điểm) cho biết số sinh viên có điểm thi (người) đạt điểm từ 5 trở lên chiếm 90%, Dưới 5,0 8 10,00 trong đó có 33,75% khá giỏi, Từ 5,0 đến 6,9 45 56,25 chứng tỏ kết quả học tập của lớp Từ 7,0 đến 8,9 25 31,25 này rất tốt. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 37
  38. Từ 9,0 trở lên 2 2,50 Cộng 80 100,00 * Những nguyên tắc để xác định đúng tiêu thức phân tổ: Thứ nhất: Phải dựa trên cơ sở phân tích lí luận kinh tế – xã hội một cách sâu sắc để chọn ra tiêu thức phản ánh bản chất, phù hợp với mục đích nghiên cứu. Tiêu thức bản chất là tiêu thức nêu rõ bản chất của hiện tượng, phản ánh đặc trưng cơ bản của hiện tượng trong điêu kiện thời gian và địa điểm cụ thể. Thí dụ: Điểm thi là tiêu thức phản ánh bản chất kết quả học của sinh viên, chứ thời gian tự học chỉ phản ánh một phần nguyên nhân của kết quả học. Bản chất của hiện tượng có thể được phản ánh qua nhiều tiêu thức khác nhau, vì vậy tuỳ mục đích nghiên cứu mà dùng lí luận kinh tế – xã hội để chọn ra tiêu thức bản chất nhất. Thứ hai: Phải căn cứ vào điều kiện lịch sử cụ thể của hiện tượng nghiên cứu. Cùng một hiện tượng nhưng ở các điều kiện lịch sử khác nhau thì tiêu thức phân tổ cũng mang ý nghĩa khác nhau. Nếu chỉ dùng một tiêu thức phân tổ chung cho mọi trường hợp thì tiêu thức đó trong điều kiện lịch sử này có thể giúp ta nghiên cứu chính xác, nhưng ở điều kiện lịch sử khác lại không có tác dụng. Quay lại với thí dụ về kết quả học tập của sinh viên: Khi sinh viên còn đang học tại trường thì tiêu thức phản ánh đúng đắn nhất kết quả học tập là điểm thi trung bình; khi sinh viên đã làm việc thì điểm thi lại không phản ánh đúng bản chất của kết quả làm việc. Thứ ba: Tuỳ theo tính chất phức tạp của hiện tượng và mục đích yêu cầu nghiên cứu có thể lựa chọn 1 hay nhiều tiêu thức phân tổ. - Phân tổ tài liệu theo 1 tiêu thức gọi là phân tổ giản đơn, cách phân tổ này thường dùng nghiên cứu các hiện tượng đơn giản và với 1 mục đích yêu cầu nhất định. Thí dụ: Phân tổ sinh viên theo giới tính: nam, nữ. - Phân tổ tài liệu theo từ 2 tiêu thức trở lên kết hợp với nhau gọi là phân tổ kết hợp. Cách phân tổ này thường dùng nghiên cứu các hiện tượng phức tạp và thoả mãn nhu cầu mục đích nghiên cứu. Thí dụ: Phân tổ sinh viên theo điểm thi trung bình và giới tính. Phân tổ kết hợp tuy có nhiều ưu điểm, song cũng không nên kết hợp quá nhiều tiêu thức dễ làm cho việc phân tổ trở nên phức tạp, dẫn đến có những sai sót làm giảm mức độ chính xác của tài liệu. b) Xác định số tổ cần thiết và phạm vi mỗi tổ: Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 38
  39. Việc xác định số tổ cần thiết (bao nhiêu tổ) và ranh giới giữa các tổ phụ thuộc vào tiêu thức phân tổ là tiêu thức số lượng hay tiêu thức chất lượng (thuộc tính). * Tiêu thức thuộc tính: Các tổ được hình thành là do sự khác nhau về thuộc tính, tính chất hay loại hình. Khi phân tổ theo tiêu thức thuộc tính thì số tổ được hình thành theo 2 xu hướng sau: - Đơn giản: Có một số trường hợp, việc xác định số tổ và ranh giới giữa các tổ rất đơn giản và rất dễ dàng vì số tổ ít và ranh giới hình thành một cách đương nhiên. Thí dụ: 1) Phân tổ dân số theo giới tính: Số tổ 2, nam, nữ. 2) Phân tổ diện tích trồng lúa trong năm theo thời vụ gieo trồng: 2 vụ, vụ đông xuân, vụ mùa. Trong trường hợp này ta coi mỗi loại hình là 1 tổ, số tổ = số loại hình. - Có những trường hợp phức tạp: Thí dụ: Phân tổ lao động theo nghề nghiệp. Có rất nhiều nghề như làm bánh kẹo, dệt, thêu ren, làm ruộng, làm gạch Phân loại cây trồng: lúa, ngô, khoai, sắn, cải bắp, su hào, cà chua Nếu cứ coi mỗi loại hình là 1 tổ thì số tổ sẽ quá nhiều, hơn nữa giữa các loại hình chưa chắc chắn đã khác nhau về chất. Thí dụ: ngô, khoai, sắn là cây hoa màu dùng làm lương thực. Trong những trường hợp này, người ta thường ghép một số loại hình nhỏ vào cùng một tổ theo nguyên tắc “Các loại hình đó phải giống nhau hoặc gần giống nhau về tính chất nào đó hay ý nghĩa kinh tế”. Thí dụ: 1) Lúa, ngô, khoai, sắn có ý nghĩa đều làm lương thực, xếp vào 1 tổ gọi là cây lương thực. 2) Dệt, thêu, ren xếp vào công nghiệp dệt. - Đối với một số phân tổ theo tiêu thức thuộc tính mà dùng cho toàn quốc có quy định chung thống nhất gọi là danh mục phân loại. Phương pháp phân loại là một công trình nghiên cứu khoa học, có tác dụng trong nền kinh tế quốc dân. Thí dụ: Phân loại ngành kinh tế: Nông, Lâm, Ngư nghiệp, Công nghiệp & tiểu thủ công nghiệp theo quy định của Tổng cục Thống kê. * Tiêu thức số lượng: - Cơ sở để xác định số tổ và phạm vi mỗi tổ là sự khác nhau về lượng biến của tiêu thức phân tổ. Tức là dựa vào sự biểu hiện lượng biến khác nhau mà sắp xếp các đơn vị vào các tổ khác nhau về tính chất. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 39
  40. Dựa trên cơ sở này số tổ và ranh giới giữa các tổ được xác định như sau: - Nếu lượng biến của tiêu thức phân tổ mà ít, có một số các trị số xác định, khi đó ứng với mỗi trị số lượng biến của tiêu thức phân tổ ta lập 1 tổ. Thí dụ: Nghiên cứu tình hình sinh đẻ có kế hoạch của một địa phương, có phân tổ số phụ nữ theo số lần sinh con như ở bảng 5.3. Bảng 5.3. Phân tổ số phụ nữ của địa phương A theo số con của 1 mẹ Số con của 1 mẹ Số mẹ - Nếu lượng biến của Cơ cấu (%) (con) (người) tiêu thức phân tổ mà nhiều và 0 6 3,51 biến thiên lớn, thí dụ, phân tổ 1 35 20,47 dân số theo độ tuổi, trong 2 82 47,95 trường hợp này ta cần chú ý 3 38 22,22 mối liên hệ giữa lượng biến 4 10 5,85 và tính chất trong phân tổ. Cộng 171 100,00 Dùng lí luận để phân tích xem lượng biến tích luỹ đến mức độ nào thì tính chất của nó mới thay đổi làm xuất hiện 1 tổ khác. Như vậy, mỗi tổ sẽ ứng với 1 khoảng trị số lượng biến nhất định của tiêu thức phân tổ, nghĩa là mỗi tổ có 2 giới hạn. - Giới hạn dưới là lượng biến nhỏ nhất để làm cho tổ đó được hình thành. - Giới hạn trên là lượng biến lớn nhất của tổ, nếu vượt quá giới hạn trên thì tính chất của hiện tượng thay đổi và chuyển sang tổ khác. - Mức độ chênh lệch giới hạn trên và giới hạn dưới của mỗi tổ gọi là khoảng cách tổ. - Tổ đầu và tổ cuối có thể chỉ có 1 giới hạn. Những tổ đó gọi là tổ mở. Việc thành lập các tổ mở trong thống kê rất cần thiết vì nó có tác dụng thu nạp đầy đủ các đơn vị có trị số tiêu thức nhỏ và cực lớn. Trường hợp này gọi là phân tổ có khoảng cách tổ. Ranh giới giữa các tổ được xác định như sau: - Trị số lượng biến của tiêu thức phân tổ biến thiên không liên tục thì giới hạn dưới của 1 tổ nào đó là trị số sát với giới hạn trên của tổ trước và giới hạn trên của tổ đó là trị sát với giới hạn dưới của tổ sau. Thí dụ: Độ tuổi: Lượng biến của nó biến thiên không liên tục. 1 tuổi = 1 năm = 12 tháng; Nếu ta gọi 13 tháng = 1,1 tuổi không có ý nghĩa lắm. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 40
  41. Bảng 6.3. Phân tổ nhân khẩu thực tế thường trú trong hộ gia đình theo nhóm tuổi của cả nước năm 2000 Nhóm tuổi (tuổi) Số người (triệu người) Từ bảng 6.3 ta thấy, ở Dưới 15 23,41 tổ thứ 3 giới hạn dưới của Từ 15 đến 24 15,23 tổ là 25, là trị số nằm sát Từ 25 đến 34 11,69 với giới hạn trên của tổ 2 là 24; giới hạn trên của tổ 3 là Từ 35 đến 44 11,67 34, là trị số nằm sát với giới Từ 45 đến 54 6,83 hạn dưới của tổ sau. Từ 55 đến 59 1,94 Từ 60 tuổi trở lên 6,96 Cộng 77,69 Nguồn: Thực trạng lao động - việc làm ở Việt Nam năm 2000 (NXB Lao động - Xã hội 2001) - Trị số lượng biến của tiêu thức phân tổ biến thiên liên tục thì giới hạn dưới của tổ nào đó là trị số trùng với giới hạn trên của tổ trước và giới hạn trên của tổ đó là trị số trùng với giới hạn dưới của tổ sau. Thí dụ: Giá cả, tiền lương, điểm thi của sinh viên lượng biến thường biến thiên liên tục (bảng 7.3). Bảng 7.3. Phân tổ số công nhân ở 1 doanh nghiệp theo tiền lương bình quân 1 người 1 tháng Tiền lương Số người Từ bảng 7.3 ta thấy, ở tổ (1000 đ/tháng) (người) thứ 3 giới hạn dưới của tổ là Đến 500 20 800, là trị số trùng với giới hạn Từ 500 - 800 30 trên của tổ 2; giới hạn trên của Từ 800 - 1000 40 tổ 3 là 1000, là trị số trùng với Trên 1000 10 giói hạn dưới của tổ sau. Cộng 100 Chú ý: - Nếu có đơn vị tổng thể nào đó có trị số lượng biến của tiêu thức phân tổ trùng với giới hạn giữa 2 tổ thì thông thường người ta xếp vào tổ trước (tức là tổ có trị số tiêu thức phân tổ bé hơn). Thí dụ: Mức lương là 800 thì xếp vào tổ 2 chứ không xếp vào tổ 3. Nhìn chung khi phân tổ theo tiêu thức số lượng thì khoảng cách giữa các tổ nói chung không bằng nhau vì hiện tượng kinh tế hay quá trình kinh tế xã hội biến thiên thường là không đều đặn, không máy móc cơ học, không phải cứ ứng với một sự thay đổi về lượng như nhau thì tính chất của hiện tượng cũng thay đổi, có khi lượng biến thay đổi khá nhiều mà tính chất của hiện tượng thay đổi chưa rõ rệt lắm (khoảng cách tổ Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 41
  42. lớn), còn có khi lượng biến mới thay đổi ít thì tính chất của hiện tượng đã thay đổi (khoảng cách tổ nhỏ). Thí dụ: Nghiên cứu khả năng tiêu hoá thịt của con người (bảng 8.3). Bảng 8.3. Mối quan hệ giữa lượng thịt ăn với khả năng tiêu hoá Lượng thịt ăn bình quân 1 người 1 ngày Tính chất tiêu hoá (g/người) 50 Tốt 100 Tốt 150 Tốt 200 Tốt 250 t.bình 300 Kém 350 Kém 400 Quá kém - Trong thực tiễn đối với những hiện tượng mà sự biến đổi về chất đều đặn từ nhỏ đến lớn, thấp đến cao người ta thường và có thể phân tổ có khoảng cách tổ bằng nhau. Khi đó khoảng cách tổ được xác định theo công thức sau: x − x d = max min n Trong đó: - d là khoảng cách tổ - xmax và xmin là trị số lượng biến lớn nhất và bé nhất của tiêu thức phân tổ - n là số tổ định chia. Thí dụ: Năng suất lúa bình quân 1 ha gieo trồng của các hộ trồng lúa trong 1 xã biến động đều đặn từ 30 đến 70 tạ/ha. Nếu định chia thành 5 tổ thì khoảng cách tổ là: x − x 70 − 30 d = max min = = 8 (tạ/ha) n 5 Các tổ được hình thành như sau: 1. Từ 30 đến 38 tạ/ha 2. Từ 38 đến 46 tạ/ha 3. Từ 46 đến 54 tạ/ha 4. Từ 54 đến 62 tạ/ha 5. Từ 62 đến 70 tạ/ha Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 42
  43. Tóm lại: Trên đây là lí luận và kỹ thuật về xác định số tổ cần thiết và khoảng cách tổ khi tiến hành phân tổ thống kê. Song cần lưu ý không nên chia số tổ quá nhiều hay quá ít. Trong thực tế người ta đã sử dụng chương trình máy tính để phân tổ. c) Chỉ tiêu giải thích: * Khái niệm: Chỉ tiêu giải thích là những chỉ tiêu dùng để nói rõ đặc điểm của các tổ cũng như toàn bộ tổng thể. Lấy lại ví dụ phân tổ các hộ trồng lúa theo năng suất: Các chỉ tiêu giải thích là diện tích gieo trồng, sản lượng lúa, chi phí của mỗi nhóm. * Ý nghĩa: Chỉ tiêu giải thích có vai trò quan trọng trong phân tổ vì: - Nó nói rõ đặc trưng của từng tổ và toàn bộ tổng thể; - Nó làm căn cứ để so sánh các tổ với nhau và tính một số chỉ tiêu phân tích khác. * Cơ sở chọn đúng các chỉ tiêu giải thích + Căn cứ vào mục đích nghiên cứu Ví dụ phân tổ các hộ theo năng suất lúa: - Nếu mục đích nghiên cứu là ảnh hưởng của các biện pháp canh tác đến năng suất lúa, thì các chỉ tiêu giải thích sẽ là: tổng lượng phân bón, diện tích cấy giống mới, diện tích tưới tiêu chủ động, mật độ cấy - Nếu mục đích nghiên cứu là quy mô sản xuất thì các chỉ tiêu giải thích là giá trị sản lượng, diện tích canh tác, lao động, TSCĐ, vốn. + Các chỉ tiêu giải thích phải liên quan chặt chẽ đến tiêu thức phân tổ. Thí dụ: Năng suất lúa là tiêu thức phân tổ, các chỉ tiêu giải thích là diện tích gieo trồng lúa, phân bón đối với lúa 2.3. Dãy số phân phối Kết quả của phân tổ thống kê cho chúng ta một dãy số phân phối. * Khái niệm: Dãy số phân phối là 1 dãy số được lập nên do phân phối các đơn vị tổng thể vào các tổ theo 1 tiêu thức phân tổ nào đó và được sắp xếp theo trình tự biến động của lượng biến tiêu thức phân tổ. * Các loại dãy số phân phối: Tuỳ theo tiêu thức phân tổ là tiêu thức số lượng hay tiêu thức thuộc tính mà có 2 loại dãy số phân phối. - Dãy số lượng biến: Là dãy số được hình thành từ việc phân tổ theo tiêu thức số lượng, dãy số này phản ánh kết cấu của tổng thể theo tiêu thức số lượng. Thí dụ: Phân tổ người lao động theo mức lương. Một dãy số lượng biến có 2 yếu tố: Lượng biến và tần số. - Lượng biến là các trị số biểu hiện cụ thể mức độ của tiêu thức số lượng, kí hiệu là xi. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 43
  44. - Tần số là đơn vị tổng thể được phân phối vào mỗi tổ, kí hiệu là fi, nếu tần số biểu hiện bằng số tương đối (%) gọi là tần suất, kí hiệu là si. - Nếu lượng biến là 1 trị số xác định (không liên tục), gọi là dãy số phân tổ. - Nếu lượng biến là 1 khoảng trị số (liên tục), gọi là dãy số có khoảng cách tổ. Dạng tổng quát của 1 dãy số lượng biến như sau: Lượng biến Tần số Hoặc tần suất X1 f1 f1/∑fi X2 f2 f2/∑fi xn fn fn/∑fi Tổng số ∑fi 100 - Dãy số thuộc tính là dãy số được hình thành từ phân tổ theo tiêu thức thuộc tính, nó cũng bao gồm cột tần số hay tần suất, còn cột lượng biến thay bằng thuộc tính nào đó của hiện tượng. Thí dụ: Phân tổ nhân khẩu theo giới tính. * Mục đích sử dụng dãy số phân phối. Dãy số phân phối trong thống kê được dùng vào các mục đích sau: - Nghiên cứu cấu thành tổng thể; - So sánh dãy số phân phối theo thời gian để nêu lên sự biến đổi của hiện tượng theo thời gian và so sánh giữa 2 hiện tượng cùng loại, cùng thời gian nhưng ở 2 địa điểm khác nhau. Ở mục đích này khi so sánh cần chú ý: . Hai dãy số phải phản ánh cùng một hiện tượng; . Hai dãy số phải phân tổ như nhau; . Nếu quy mô so sánh khác nhau phải dùng tần suất. - Tính tổng trị số tiêu thức: Tổng trị số tiêu thức phản ánh quy mô của từng tổ và quy mô của cả tổng thể. n Công thức tính : ∑fi x i i=1 Trong trường hợp dãy số có khoảng cách tổ thì xi là trung bình cộng của 2 giới hạn mỗi tổ. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 44
  45. 3. TRÌNH BÀY SỐ LIỆU THỐNG KÊ 3.1. Bảng thống kê a) Khái niệm, ý nghĩa: * Khái niệm: Bảng thống kê là một hình thức trình bày kết quả tổng hợp số liệu thống kê theo từng nội dung riêng biệt nhằm phục vụ cho yêu cầu của quá trình nghiên cứu thống kê. * Ý nghĩa: - Phản ánh đặc trưng cơ bản của từng tổ và của cả tổng thể; - Mô tả mối liên quan mật thiết giữa các số liệu thống kê; - Làm cơ sở áp dụng các phương pháp phân tích thống kê khác nhau một cách dễ dàng b) Kết cấu của bảng thống kê: + Về hình thức - Bảng thống kê bao gồm các hàng ngang và cột dọc, các tiêu đề và các tài liệu con số. - Hàng ngang cột dọc phản ánh quy mô của bảng thống kê, thường được đánh số thứ tự. - Ô của bảng dùng để điền số liệu thống kê. - Tiêu đề của bảng: Phản ánh nội dung của bảng và của từng chỉ tiêu trong bảng. Có 2 loại tiêu đề: Tiêu đề chung: Tên bảng. Tiêu đề nhỏ (mục): Tên hàng, cột. - Các số liệu được ghi vào các ô của bảng, mỗi số liệu phản ánh đặc trưng về mặt lượng của hiện tượng nghiên cứu. Hình thức của bảng được mô tả qua sơ đồ sau: Tên bảng: Tên hàng Tên cột (Phần giải thích) (Phần chủ đề) 1 2 3 4 k Cộng cột A. B. C. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 45
  46. Cộng hàng Chú thích của bảng : * Về nội dung: chia thành 2 phần: Phần chủ để và phần giải thích. - Phần chủ để: Nội dung phần chủ đề nhằm nêu rõ tổng thể nghiên cứu được phân thành những bộ phận nào, hoặc mô tả đối tượng nghiên cứu là những đơn vị nào, loại hình gì, tên địa phương hoặc các thời gian nghiên cứu khác nhau. Hay nói cách khác, phân chủ đề thể hiện tiêu thức phân tổ các đơn vị tổng thể thành các tổ. Vị trí của phần này thường để ở bên phải phía dưới của bảng (tên của các hàng- tiêu đề hàng). - Phần giải thích: Nội dung phần này gồm các chỉ tiêu giải thích về các đặc điểm của đối tượng nghiên cứu (giải thích phần chủ đề của bảng). Vị trí của phần này thường để ở bên trái phía trên của bảng (tên của các cột- tiêu đề cột). c) Nguyên tắc lập bảng thống kê: Khi sử dụng bảng thống kê để trình bày các số liệu thống kê cần tôn trọng những vấn đề mang tính nguyên tắc như sau: - Quy mô của bảng thống kê không nên quá lớn. Nếu bảng thống kê quá lớn (nhiều hàng, cột) có thể tách thành 2 hoặc 3 bảng nhỏ hơn; - Các tiêu đề, tiêu mục nên ngắn gọn, chính xác và dễ hiểu; - Các hàng và các cột được ghi kí hiệu và đánh số; - Các chỉ tiêu giải thích sắp xếp hợp lí; - Cách ghi số liệu vào bảng thống kê theo quy ước sau: (-): Không có tài liệu; ( ): Biểu thị số liệu còn thiếu có thể bổ sung; (x) Biểu thị hiện tượng không có liên quan đến chỉ tiêu đó; Các đơn vị có cùng 1 đơn vị tính toán giống nhau phải ghi theo mức độ chính xác như nhau (0,1 hay 0,01 ) theo nguyên tắc làm tròn số. - Cuối bảng cần có ghi chú giải thích tài liệu trong bảng như nguồn tài liệu trích, cách tính d) Các loại bảng thống kê: * Bảng đơn giản: Bảng thống kê mà phần chủ đề không phân tổ, chỉ liệt kê các đơn vị tổng thể, tên gọi các địa phương hoặc các thời gian khác nhau của quá trình nghiên cứu. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 46
  47. Thí dụ: Bảng 9.3. Hiện trạng đất đai và dân số trung bình của vùng Tây Nguyên năm 2002 Bình quân Diện tích đất Dân số trung bình Các tỉnh đất/người (1000 ha) (1000 người) (ha/người) Kon Tum 961,5 339,5 2,83 Gia Lai 1549,6 1064,6 1,46 Đắk Lăk 1959,9 1938,8 1,01 Lâm Đồng 976,5 1064,3 0,92 Cộng 5447,5 4407,2 1,24 Nguồn: Niên giám thống kê 2003 * Bảng tần số (bảng phân tổ): Là bảng thống kê mà tổng thể đối tượng nghiên cứu ghi trong phần chủ để được chia thành các tổ theo 1 tiêu thức nào đó. Bảng phân tổ thường bao gồm 2 cột tính toán là tần số và tần suất. Khi phân tổ theo tiêu thức thuộc tính hay tiêu thức số lượng, người ta thường đếm xem có bao nhiêu đơn vị có cùng một biểu hiện và so với tổng số quan sát thì số đơn vị có cùng biểu hiện này chiếm bao nhiêu phần trăm. Thí dụ: Bảng 10.3. Dân số trung bình của Việt Nam phân theo giới tính năm 2003 Tần số Tần suất Giới tính (1000 người) (%) Nam 39.755,4 49,14 Nữ 41.147,0 50,86 Cộng 80.902,4 100,00 Bảng 11.3. Phân tổ số sinh viên của lớp theo số giờ tự học trong ngày Số giờ tự học/ngày (giờ) Tần số (người) Tần suất (%) 0 5 6,25 1 7 8,75 2 15 18,75 Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 47
  48. 3 20 25,00 4 25 31,25 5 8 10,00 Cộng 80 100,00 Bảng tần số có thể được phân tổ theo nhiều tiêu thức, khi đó người ta gọi là bảng tần số có ghép nhóm (có phân tổ) (bảng12.3). Bảng 12.3. Hiện trạng đất nông nghiệp của Việt Nam năm 2002 Các loại đất Tần số (1000 ha) Tần suất (%) 1. Đất trồng cây hàng năm 5977,6 63,55 - Đất trồng lúa 4061,7 43,18 - Đất nương rẫy 642,7 6,83 - Đất trồng cây hàng năm khác 1273,2 13,53 2. Đất vườn tạp 623,2 6,62 3. Đất trồng cây lâu năm 2213,1 23,53 4. Đất đồng cỏ dùng cho chăn unôi 39,5 0,42 5. Đất có mặt nước nuôi trồng thuỷ sản 553,4 5,88 Cộng 9406,8 100,00 Nguồn: Niên giám thống kê 2003. Bảng phân tổ được dùng để: - Nêu rõ kết cấu và biến động kết cấu của hiện tượng nghiên cứu; - Phân tích mối liên hệ giữa các hiện tượng. * Bảng kết hợp: Là bảng trong đó tổng thể đối tượng nghiên cứu ghi ở phần chủ đề được phân tổ theo 2 tiêu thức trở lên. Bảng kết hợp giúp ta phân tích sâu hơn về đối tượng đang nghiên cứu. Bảng kết hợp thường gặp ở các dạng sau: - Bảng kết hợp 2 tiêu thức thuộc tính. Thí dụ: Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 48
  49. Bảng 13.3. Số người đủ 15 tuổi trở lên hoạt động kinh tế thường xuyên đã qua các trình độ đào tạo ở Việt Nam năm 2000 Tổng số Thành thị Nông thôn Tần số Tần số Tần số Diễn giải Tỷ lệ Tỷ lệ Tỷ lệ (Số (Số (Số (%) (%) (%) người) người) người) 1. Học nghề 22569 25,69 17180 26,38 5389 23,70 2. Trung học chuyên 48485 55,18 32718 50,24 15767 69,35 nghiệp 3. Cao đẳng 7602 8,65 6528 10,02 1074 4,72 4. Đại học 9099 10,36 8592 13,19 507 2,23 5. Thạc sĩ 83 0,09 83 0,13 0,00 6. Tiến sĩ 22 0,03 22 0,03 0,00 Cộng 87860 100.00 65123 100,00 22737 100,00 Nguồn: Thực trạng lao động - việc làm ở Việt Nam năm 2000 Bảng 13.3 cho biết người ta đã kết hợp 2 tiêu thức định tính là trình độ đào tạo và khu vực (thành thị, nông thôn). - Bảng kết hợp 3 tiêu thức định tính Thí dụ: Số người lao động phân theo tình trạng việc làm của Hà Nội năm 2000 người ta đã kết hợp 3 tiêu thức định tính như tình trạng việc làm, tuổi quy định và giới tính ở bảng 14.3. Bảng 14.3. Số lượng lao động phân theo tình trạng việc làm của Hà Nội năm 2000 Thiếu việc và Tổng số Đủ việc làm thất nghiệp Diễn giải Tần số Tỷ lệ Tần số Tỷ lệ Tần số Tỷ lệ (người) (%) (người) (%) (người) (%) 1. Trong độ tuổi lao động 1300704 100 894392 68,76 406312 31,24 Nữ 638456 100 450569 70,57 187887 29,43 Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 49
  50. Nam 662248 100 443823 67,02 218425 32,98 2. Ngoài tuổi quy định 1376585 100 935056 67,93 441529 32,07 Nữ 682719 100 478168 70,04 204551 29,96 Nam 693866 100 456888 65,85 236978 34,15 Nguồn: Thực trạng lao động – việc làm ở Việt Nam năm 2000 - Bảng kết hợp giữa tiêu thức số lượng với tiêu thức thuộc tính Thí dụ: Số người lao động phân theo tình trạng việc làm của Hà Nội năm 2000 người ta đã kết hợp 3 tiêu thức, trong đó 2 tiêu thức định tính như tình trạng việc làm và giới tính, 1 tiêu thức số lượng là độ tuổi như sau (bảng 15.3). Bảng 15.3. Số lượng lao động phân theo tình trạng việc làm của Hà Nội năm 2000 Thiếu việc và Tổng số Đủ việc làm thất nghiệp Nhóm tuổi Tần số Tỷ lệ Tần số Tỷ lệ Tần số Tỷ lệ (tuổi) (người) (%) (người) (%) (người) (%) Từ 15 - 24 225517 100 138608 61,46 86909 38,54 Từ 25 - 34 382976 100 283396 74,00 99580 26,00 Từ 35 - 44 408847 100 291292 71,25 117555 28,75 Từ 45 - 54 252854 100 165248 65,35 87606 34,65 Từ 55 - 60 45227 100 26336 58,23 18891 41,77 Trên 60 61148 100 30170 49,34 30978 50,66 Nguồn: Thực trạng lao động – việc làm ở Việt Nam năm 2000 3.2. Biểu đồ và đồ thị thống kê a) Khái niệm, ý nghĩa: Biểu đồ và đồ thị thống kê là các hình vẽ, đường nét hình học dùng để mô tả có tính quy ước các số liệu thống kê. Khác với bảng thống kê, đồ thị hay biểu đồ thống kê sử dụng các số liệu kết hợp với hình vẽ, đường nét hay màu sắc để tóm tắt và trình bày các đặc trưng chủ yếu của hiện tượng nghiên cứu, phản ánh một cách khái quát các đặc điểm về cơ cấu, xu hướng biến động, mối liên hệ, quan hệ so sánh của hiện tượng cần nghiên cứu. Vì dùng các hình vẽ, đường nét và màu sắc để biểu hiện các đặc trưng của hiện tượng nên tài liệu thống kê rất sinh động, có sức hấp dẫn lôi cuốn người đọc, giúp cho người xem nhận thức được những biểu hiện của hiện tượng một cách nhanh chóng, từ đó nhận ra được những nội dung chủ yếu của vấn đề nghiên cứu. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 50
  51. b) Các loại đồ thị thống kê: * Theo nội dung phản ánh của đồ thị, có thể phân chia đồ thị thành các loại sau đây: - Đồ thị kết cấu - Đồ thị xu hướng biến động - Đồ thị mối liên hệ - Đồ thị so sánh - Đồ thị phân phối - Đồ thị hoàn thành kế hoạch. * Theo hình thức biểu hiện, có thể chia đồ thị thành các loại: - Đồ thị hình cột - Đồ thị hình tròn - Đồ thị đường gấp khúc - Đồ thị hình tượng - Bản đồ thống kê. * Một số ví dụ về đồ thị thống kê: Thí dụ 1: Đồ thị hình tròn thể hiện cơ cấu tổng sản phẩm quốc nội theo giá thực tế phân theo ngành kinh tế (đồ thị 3.1) 2003 1990 38.22% 21.83% 38.59% 38.74% N«ng, L©m N«ng, L©m &Thuû s¶n &Thuû s¶n C«ng nghiÖp 22.67% & x©y dùng C«ng 39.95% DÞch vô nghiÖp & x©y dùng DÞch vô Đồ thị 3.1. Cơ cấu tổng sản phẩm quốc nội của Việt Nam qua 2 năm 1990 và 2003 (Niên giám thống kê 2003) Thí dụ 2: Đồ thị hình cột Số hộ vay vốn Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 51
  52. 1800 1600 1400 1200 1000 800 600 400 200 0 123456 Ghi chú: 1. Vay từ ngân hàng NN; 2. Vay từ ngân hàng chính sách 3. Vay từ quỹ tín dụng; 4. Vay từ hội nông dân 5. Vay từ HTX NN; 6. Vay từ nguồn khác Đồ thị 3.2. Số hộ điều tra vay vốn từ các nguồn vay của Việt Nam năm 2003 (Điều tra hộ nông dân trên 7 vùng. ĐHNNI Hà Nội - 2003) Thí dụ 3: Đồ thị đường gấp khúc 40 35 30 25 20 15 10 5 0 1990 1994 1996 1997 1998 1999 2000 2001 2002 2003 DiÖn tÝch (Tr.ha) N¨ng suÊt (t¹/ha) S¶n l−îng(tr.tÊn) Đồ thị 3.3. Diện tích, năng suất và sản lượng lạc trên thế giới 1990 - 2003 (Nguồn: FAOSTAT, Agricultural Data, 24/5/2004) Thí dụ 4: Bản đồ thống kê về các vùng sinh thái của Việt Nam Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 52
  53. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 53
  54. c) Những vấn đề chú ý khi xây dựng biểu đồ và đồ thị thống kê: Yêu cầu của một đồ thị hay biểu đồ thống kê là chính xác, đầy đủ, dễ hiểu và thể hiện tính thẩm mỹ. Do đó, khi xây dựng đồ thị thống kê cần chú ý các điểm sau: * Lựa chọn đồ thị cho phù hợp với nội dung, tính chất của các số liệu cần diễn đạt. Mỗi loại đồ thị có khả năng diễn đật khác nhau, đồng thời có thể diễn tả nhiều khía cạnh. Vì thế, cần lựa chọn loại đồ thị diễn tả phù hợp nhất, dễ quan sát nhất. Thí dụ: Khi cần mô tả cơ cấu của hiện tượng thì nên dùng đồ thị hình tròn. Ngược lại khi cần biểu diễn biến động của hiện tượng theo thời gian thì nên dùng đồ thị đường gấp khúc hoặc hình cột . * Xác định quy mô của đồ thị cho thích hợp. Quy mô của đồ thị được thể hiện qua chiều dài, chiều rộng và mối quan hệ tỷ lệ giữa 2 chiều này. Quy mô thích hợp là tuỳ thuộc vào mục đích sử dụng. Thí dụ, dùng đồ thị trong báo cáo phân tích thì không nên dùng đồ thị quá lớn, nhưng dùng vào tuyên truyền, cổ động thì lại không nên dùng đồ thị quá nhỏ. * Các thanh đo tỷ lệ cần thống nhất và chính xác. * Cần ghi số liệu, đơn vị tính, thời gian không gian của hiện tượng nghiên cứu sao cho thích hợp với từng loại đồ thị cụ thể. Đặc biệt cần ghi chú rõ các ký hiệu, màu sắc quy ước được dùng trong đồ thị. * Trong thực tế vẽ đồ thị, người ta thường dùng các phần mềm máy tính. Phần mềm EXCEL được sử dụng khá phổ biến, rộng rãi và rất tiện lợi. Nó có thể liên kết rất tốt với các phần mềm soạn thảo văn bản như Winwords. Vì vậy chúng ta nên sử dụng EXCEL để vẽ đồ thị. CÂU HỎI THẢO LUẬN CHƯƠNG III 1. Thế nào là phân tổ thống kê? Ý nghĩa và cách phân tổ thống kê? Cho ví dụ minh hoạ? 2. Các hình thức trình bày các tài liệu thống kê? Các loại bảng thống kê? Cho ví dụ minh họa? Trường Đại học Nông nghiệp Hà Nội – Giáo trình Nguyên Lỹ Thống kê 54