Bài giảng Phân tích và xử lý dữ liệu với R - Bài thực hành 4: Phân tích dữ liệu bằng biểu đồ - Học viện Ngân hàng

pptx 25 trang phuongnguyen 3210
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phân tích và xử lý dữ liệu với R - Bài thực hành 4: Phân tích dữ liệu bằng biểu đồ - Học viện Ngân hàng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptxbai_giang_phan_tich_va_xu_ly_du_lieu_voi_r_phan_4_phan_tich.pptx

Nội dung text: Bài giảng Phân tích và xử lý dữ liệu với R - Bài thực hành 4: Phân tích dữ liệu bằng biểu đồ - Học viện Ngân hàng

  1. Phân tích dữ liệu với R Chương 2 _ phần 4 Phân tích dữ liệu bằng biểu đồ
  2. Các hàm R cơ bản ▪Biểu đồ phân bố (histogram) ▪Biểu đồ hộp (box plot) ▪Biểu đồ thanh (bar plot) ▪Biểu đồ tương quan (scatter plot)
  3. Đọc dữ liệu > setwd("D:/") > ob = read.csv ("salary.csv", header = T) > attach(ob) > head(ob) id salbeg sex time age salnow edlevel work jobcat minority sexrace 1 7 6900 0 79 28.00 16080 15 3.17 1 0 1 2 8 5400 0 67 28.75 14100 15 0.50 1 0 1 3 9 5040 0 96 27.42 12420 15 1.17 1 0 1 4 11 6300 0 84 33.50 15720 15 6.00 1 0 1 5 12 6000 0 88 54.33 8880 12 27.00 1 0 1 6 18 6900 0 72 32.67 10380 15 6.92 1 0 1
  4. Mục đích ▪ Muốn mô tả phân bố biến salnow ▪ Phân bố salnow có khác nhau giữa nam và nữ (sex)
  5. Biểu đồ phân bố
  6. Hàm hist () ▪ Hist(var, xlab, ylab, main, xlim, ylim, col, border, prob)
  7. Hist(salnow) Histogram of salnow 200 100 Frequency 50 0 10000 30000 50000 salnow
  8. > hist(salnow, col= "blue", border = "white") Histogram of salnow 200 150 100 Frequency 50 0 10000 20000 30000 40000 50000 salnow
  9. ➢hist(salnow, col= Phân bố mức luong hiện tại của nhân viên "blue", border = "white", xlab = 8e-05 "lương hiện tại 6e-05 ($)", ylab = "tỉ lệ tỉ lệ", prob = T, 4e-05 main = "Phân bố 2e-05 mức lương hiện 0e+00 tại của nhân 10000 20000 30000 40000 50000 luong hiện tại ($) viên")
  10. Biểu đồ hộp
  11. Hàm boxplot ▪ Boxplot(var, xlab, ylab, main, xlim, ylim, col, border, horizontal) ▪ Boxplot(var ~ group, xlab, ylab, main, xlim, ylim, col, border, horizontal)
  12. boxplot(salnow)
  13. boxplot (salnow, xlab ="lương hiện tại", main = "lương hiện tại", col = "blue")
  14. boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue")
  15. boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)
  16. boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)
  17. boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = c("blue","red"), horizontal=T)
  18. Biểu đồ thanh
  19. Hàm barplot ▪ table (groupA, GroupB) ▪ means = with(data,tapply(var,group, mean)) ▪ barplot(table, horiz) ▪ barplot(mean, horiz)
  20. f = table(sex) barplot(f)
  21. barplot(means, horiz = T, xlab ="số nhân viên", ylab = "nhóm nghề")
  22. Biểu đồ tương quan
  23. Hàm plot() ▪ plot(varx~vary, pch, main, xlab, ylab, xlim, ylim, col, lwd) ▪ abline(lm(varX~varY),col = , lwd)
  24. ▪ plot(salnow~edlevel,ch =16, col = "blue") ▪ abline(lm(salnow~edlevel),col ="red" , lwd=2)