Bài giảng Phân tích và xử lý dữ liệu với R - Chương 2 - Phần 4 Phân tích dữ liệu bằng biểu đồ
Các hàm R cơ bản Biểu đồ phân bố (histogram) Biểu đồ hộp (box plot) Biểu đồ thanh (bar plot) Biểu đồ tương quan (scatter plot)
Bạn đang xem trước 20 trang tài liệu Bài giảng Phân tích và xử lý dữ liệu với R - Chương 2 - Phần 4 Phân tích dữ liệu bằng biểu đồ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Phân tích dữ liệu với RChương 2 _ phần 4Phân tích dữ liệu bằng biểu đồCác hàm R cơ bảnBiểu đồ phân bố (histogram)Biểu đồ hộp (box plot)Biểu đồ thanh (bar plot)Biểu đồ tương quan (scatter plot)Đọc dữ liệu> setwd("D:/")> ob = read.csv ("salary.csv", header = T)> attach(ob)> head(ob) id salbeg sex time age salnow edlevel work jobcat minority sexrace1 7 6900 0 79 28.00 16080 15 3.17 1 0 12 8 5400 0 67 28.75 14100 15 0.50 1 0 13 9 5040 0 96 27.42 12420 15 1.17 1 0 14 11 6300 0 84 33.50 15720 15 6.00 1 0 15 12 6000 0 88 54.33 8880 12 27.00 1 0 16 18 6900 0 72 32.67 10380 15 6.92 1 0 1Mục đíchMuốn mô tả phân bố biến salnowPhân bố salnow có khác nhau giữa nam và nữ (sex)Hàm hist ()Hist(var, xlab, ylab, main, xlim, ylim, col, border, prob)Hist(salnow)> hist(salnow, col= "blue", border = "white")hist(salnow, col= "blue", border = "white", xlab = "lương hiện tại ($)", ylab = "tỉ lệ", prob = T, main = "Phân bố mức lương hiện tại của nhân viên")Hàm boxplotBoxplot(var, xlab, ylab, main, xlim, ylim, col, border, horizontal)Boxplot(var ~ group, xlab, ylab, main, xlim, ylim, col, border, horizontal)boxplot(salnow)boxplot (salnow, xlab ="lương hiện tại", main = "lương hiện tại", col = "blue")boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue")boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = c("blue","red"), horizontal=T)Hàm barplottable (groupA, GroupB)means = with(data,tapply(var,group, mean))barplot(table, horiz)barplot(mean, horiz) f = table(sex)barplot(f)barplot(means, horiz = T, xlab ="số nhân viên", ylab = "nhóm nghề")Hàm plot()plot(varx~vary, pch, main, xlab, ylab, xlim, ylim, col, lwd)abline(lm(varX~varY),col = , lwd) plot(salnow~edlevel,ch =16, col = "blue")abline(lm(salnow~edlevel),col ="red" , lwd=2)