Bài giảng Phân tích và xử lý dữ liệu với R - Chương 2 - Phần 4 Phân tích dữ liệu bằng biểu đồ

Các hàm R cơ bản Biểu đồ phân bố (histogram) Biểu đồ hộp (box plot) Biểu đồ thanh (bar plot) Biểu đồ tương quan (scatter plot)

pptx25 trang | Chia sẻ: thanhlam12 | Lượt xem: 542 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Phân tích và xử lý dữ liệu với R - Chương 2 - Phần 4 Phân tích dữ liệu bằng biểu đồ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Phân tích dữ liệu với RChương 2 _ phần 4Phân tích dữ liệu bằng biểu đồCác hàm R cơ bảnBiểu đồ phân bố (histogram)Biểu đồ hộp (box plot)Biểu đồ thanh (bar plot)Biểu đồ tương quan (scatter plot)Đọc dữ liệu> setwd("D:/")> ob = read.csv ("salary.csv", header = T)> attach(ob)> head(ob) id salbeg sex time age salnow edlevel work jobcat minority sexrace1 7 6900 0 79 28.00 16080 15 3.17 1 0 12 8 5400 0 67 28.75 14100 15 0.50 1 0 13 9 5040 0 96 27.42 12420 15 1.17 1 0 14 11 6300 0 84 33.50 15720 15 6.00 1 0 15 12 6000 0 88 54.33 8880 12 27.00 1 0 16 18 6900 0 72 32.67 10380 15 6.92 1 0 1Mục đíchMuốn mô tả phân bố biến salnowPhân bố salnow có khác nhau giữa nam và nữ (sex)Hàm hist ()Hist(var, xlab, ylab, main, xlim, ylim, col, border, prob)Hist(salnow)> hist(salnow, col= "blue", border = "white")hist(salnow, col= "blue", border = "white", xlab = "lương hiện tại ($)", ylab = "tỉ lệ", prob = T, main = "Phân bố mức lương hiện tại của nhân viên")Hàm boxplotBoxplot(var, xlab, ylab, main, xlim, ylim, col, border, horizontal)Boxplot(var ~ group, xlab, ylab, main, xlim, ylim, col, border, horizontal)boxplot(salnow)boxplot (salnow, xlab ="lương hiện tại", main = "lương hiện tại", col = "blue")boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue")boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = c("blue","red"), horizontal=T)Hàm barplottable (groupA, GroupB)means = with(data,tapply(var,group, mean))barplot(table, horiz)barplot(mean, horiz) f = table(sex)barplot(f)barplot(means, horiz = T, xlab ="số nhân viên", ylab = "nhóm nghề")Hàm plot()plot(varx~vary, pch, main, xlab, ylab, xlim, ylim, col, lwd)abline(lm(varX~varY),col = , lwd) plot(salnow~edlevel,ch =16, col = "blue")abline(lm(salnow~edlevel),col ="red" , lwd=2)