Bài giảng Phân tích và xử lý dữ liệu với R - Bài thực hành 4: Phân tích dữ liệu bằng biểu đồ - Học viện Ngân hàng
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phân tích và xử lý dữ liệu với R - Bài thực hành 4: Phân tích dữ liệu bằng biểu đồ - Học viện Ngân hàng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_phan_tich_va_xu_ly_du_lieu_voi_r_phan_4_phan_tich.pptx
Nội dung text: Bài giảng Phân tích và xử lý dữ liệu với R - Bài thực hành 4: Phân tích dữ liệu bằng biểu đồ - Học viện Ngân hàng
- Phân tích dữ liệu với R Chương 2 _ phần 4 Phân tích dữ liệu bằng biểu đồ
- Các hàm R cơ bản ▪Biểu đồ phân bố (histogram) ▪Biểu đồ hộp (box plot) ▪Biểu đồ thanh (bar plot) ▪Biểu đồ tương quan (scatter plot)
- Đọc dữ liệu > setwd("D:/") > ob = read.csv ("salary.csv", header = T) > attach(ob) > head(ob) id salbeg sex time age salnow edlevel work jobcat minority sexrace 1 7 6900 0 79 28.00 16080 15 3.17 1 0 1 2 8 5400 0 67 28.75 14100 15 0.50 1 0 1 3 9 5040 0 96 27.42 12420 15 1.17 1 0 1 4 11 6300 0 84 33.50 15720 15 6.00 1 0 1 5 12 6000 0 88 54.33 8880 12 27.00 1 0 1 6 18 6900 0 72 32.67 10380 15 6.92 1 0 1
- Mục đích ▪ Muốn mô tả phân bố biến salnow ▪ Phân bố salnow có khác nhau giữa nam và nữ (sex)
- Biểu đồ phân bố
- Hàm hist () ▪ Hist(var, xlab, ylab, main, xlim, ylim, col, border, prob)
- Hist(salnow) Histogram of salnow 200 100 Frequency 50 0 10000 30000 50000 salnow
- > hist(salnow, col= "blue", border = "white") Histogram of salnow 200 150 100 Frequency 50 0 10000 20000 30000 40000 50000 salnow
- ➢hist(salnow, col= Phân bố mức luong hiện tại của nhân viên "blue", border = "white", xlab = 8e-05 "lương hiện tại 6e-05 ($)", ylab = "tỉ lệ tỉ lệ", prob = T, 4e-05 main = "Phân bố 2e-05 mức lương hiện 0e+00 tại của nhân 10000 20000 30000 40000 50000 luong hiện tại ($) viên")
- Biểu đồ hộp
- Hàm boxplot ▪ Boxplot(var, xlab, ylab, main, xlim, ylim, col, border, horizontal) ▪ Boxplot(var ~ group, xlab, ylab, main, xlim, ylim, col, border, horizontal)
- boxplot(salnow)
- boxplot (salnow, xlab ="lương hiện tại", main = "lương hiện tại", col = "blue")
- boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue")
- boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)
- boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)
- boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = c("blue","red"), horizontal=T)
- Biểu đồ thanh
- Hàm barplot ▪ table (groupA, GroupB) ▪ means = with(data,tapply(var,group, mean)) ▪ barplot(table, horiz) ▪ barplot(mean, horiz)
- f = table(sex) barplot(f)
- barplot(means, horiz = T, xlab ="số nhân viên", ylab = "nhóm nghề")
- Biểu đồ tương quan
- Hàm plot() ▪ plot(varx~vary, pch, main, xlab, ylab, xlim, ylim, col, lwd) ▪ abline(lm(varX~varY),col = , lwd)
- ▪ plot(salnow~edlevel,ch =16, col = "blue") ▪ abline(lm(salnow~edlevel),col ="red" , lwd=2)