Bài giảng Six sigma - Chương 14: Kiểm định biến thiên bằng nhau

Mục đích kiểm tra biến thiên bằng nhau “Kiểm tra biến thiên bằng nhau” được thực hiện để kiểm tra thống kê xem liệu có bất kỳ chênh lệch nào về biến thiên giữa các đối tượng được so sánh hay không. Điều kiện ban đầu để thực hiện kiểm tra của các trị số trung bình dành cho hai tập hợp. Ví dụ: Liệu chúng ta có thể nói rằng các trường hợp sau đây có các biến thiên như nhau tương ứng hay không? Kiểm tra thống kê luôn luôn gợi ý các kết quả đồng nhất của phân tích (ra quyết định)

ppt16 trang | Chia sẻ: thuyduongbt11 | Ngày: 09/06/2022 | Lượt xem: 273 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Bài giảng Six sigma - Chương 14: Kiểm định biến thiên bằng nhau, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Mục tiêu học tập Hiểu được làm thế nào để so sánh các biến thiên của hai tập hợp Hiểu được trình tự của việc xác định nên chấp nhận hay từ chối một giả thuyết được ứng dụng cho hai biến thiên Phân tích các ví dụ khác nhau thông qua bài tập Minitab Test for Equal Variances Kiểm định biến thiên bằng nhau Sơ đồ thử nghiệm giả thiết Stat -Tables - Chi-square Test Stat -Basic Stats -2 proportion Stat -Basic Stats -1 proportion Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t select “ assume equal variances” Ho: M1 = M (Target) H 1 : M1 ¹ M (Target) Stat - Nonparametric - 1 Sample-Sign or Stat - Nonparametric - 1 Sample-Wilcoxon Continuous Data Normality Test Hypothesis Testing One-way ANOVA Discrete Data Chi-Square Test Ho: m1 = m2 = m3 = ... H 1 : at least one is different Stat - Anova- One-way Ho: Data is normal. H 1 : Data is not normal. Stat - Basic Stat - Normality Test When significance level  = 0.05 : If P-value >0.05 , cannot reject Ho If P-value <0.05 , reject Ho Normal Data CI for Standard Deviation One population Two or more population 2 Sample t (variance equal ) 2 Sample t (variance not equal) 1 Sample t or 1 Sample Z Ho: m1 = m (target) H 1 : m1 ¹ m (target) Stat - Basic Stats - 1 Sample-t ( s is unknown) 1Sample Z ( s is known) 1 Sample-Sign or 1 Sample-Wilcoxon Mann-Whitney Test Two or more populations Two populations 1-Proportion 2-Proportion One population Two population Two or more population Non Normal Data Equal Variance Yes No Kruskal-Wallis Test One population Two populations Two or more populations Ho: M1 = M2 H 1 : M1 ¹ M2 Stat - Nonparametric - Mann-Whitney Ho: M1 = M2 = M3 = ... H 1 : at least one is different Stat - Nonparametric - Kruskal-Wallis Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t do not select “ assume equal variances” Test for Equal Variances (Levene’s Test) Test for Equal Variances (F Test or Bartlett’s Test) Ho: s1 = s2 = s3 = .. ... H 1 : at least one is different Stat - Anova - Test for Equal Variances Use F-test when comparing two populations only Ho: s 1 = s (Target) H 1 : s 1 ¹ s (Target) Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu. Stat -Basic Statistics - Display Descriptive Stats B iến thiên là gì? Một giá trị chỉ ra độ dàn trải của dữ liệu. Một đo lường đại diện, hiển thị độ phân tán Sự phân tán nhỏ của dữ liệu Dữ liệu được tập trung quanh trị số trung bình Dạng mong muốn của sự phân bố Kiểm định biến thiên bằng nhau Yêu cầu của khách hàng Sự phân tán lớn của dữ liệu Dữ liệu rời rạc quanh trị số trung bình Giống như một quá trình cần được cải tiến Mục đích kiểm tra biến thiên bằng nhau “K iểm tra biến thiên bằng nhau ” được thực hiện để kiểm tra thống kê xem liệu có bất kỳ chênh lệch nào về biến thiên giữa các đối tượng được so sánh hay không. Điều kiện ban đầu để thực hiện kiểm tra của các trị số trung bình dành cho hai tập hợp. Ví dụ: Liệu chúng ta có thể nói rằng các trường hợp sau đây có các biến thiên như nhau tương ứng hay không? Kiểm tra thống kê luôn luôn gợi ý các kết quả đồng nhất của phân tích (ra quyết định) Trường hợp 1 Trường hợp 2 Trường hợp 3 Tổng quát Trình tự của kiểm tra biến thiên bằng nhau Thiết lập giả thuyết Kiểm tra bình thường dữ liệu Phân tích biểu đồ Phân tích thống kê Ra quyết định Quy trình phân tích thống kê Chọn thử nghiệm thống kê Xác định mức α Xác định khu vực loại bỏ Kiểm tra thống kê Tính P-Value Thực hiện Minitab Kiểm tra P-Value Số tập hợp là đối tượng so sánh 1 population 2 populations 3 or more populations Bartlett’s Test Phân bố thường Phân bố không thường Levene’s Test χ 2 -Test F-Test Phân bố thường Phân bố không thường Levene’s Test Phân bố thường Phân bố không thường Sai lệch chuẩn là vô nghĩa Minitab hỗtrợ 2 Variances.. Test for Equal Variances.. Trình tự phân tích (Hai tập hợp hoặc nhiều hơn) Bước 1 : Thiết lập giả thiết - Null hypothesis(H 0 ): thực tế đã biết - Alternative hypothesis(H 1 ): Sự khẳng định nếu bạn muốn xác nhận Thiết lập giả thiết Phân tích đồ thị Phân tích thống kê Rút ra kết luận Kiểm tra sự bình thường Bước 2 : Kiểm nghiệm sự bình thường của dũ liệu - Xem lại xem dữ liệu có bình thường hay không Bước 3 : Phân tích đồ thị - Xác định bằng mắt sự khác biệt về phân tán Bước 4 : Phân tích thống kê - Xác nhận thống kê sự khác biệt về độ phân tán - Minitab: Stat > ANOVA > Test for Equal Variances or Stat > Basic Statistics > 2 Variances - Xác nhận giá trị P-Value Bước 5 : Rút ra kết luận - Rút ra kết luận thống kê và kết luận theo thực tế - Nếu P-Value nhỏ hơn mức có nghĩa ( α ), loại bỏ Ho Ví dụ Chúng tôi muốn điều tra xem liệu có bất kỳ khác biệt nào trong việc sử dụng giấy A4, một trong những mặt hàng cung cấp cho văn phòng. Vì mục đích này, hai phòng được lựa chọn để phân tích biến thiên của họ trong việc sử dụng giấy trong 15 tuần. Bảng dưới đây thể hiện các số đo. Kiểm định để xác định liệu các biến thiên có giống nhau không ( Tên file: 2 Variances.mtw ) H 1 : σ A ≠ σ B σ A > σ B σ A < σ B Độ phân tán của phòng A và của phòng B là khác nhau. Độ phân tán của phòng A lớn hơn của phòng B. Độ phân tán của phòng A nhỏ hơn của phòng B Giả thuyết thay thế (H 1 ) H 0 : σ A = σ B Không có sự khác biệt về độ phân tán giữa phòng A và phòng B liên quan đến lượng giấy A4 được sử dụng . Giả thuyết không khác biệt (H 0 ) Biểu thức toán học Câu lệnh tường thuật Loại giả thuyết Phòng A 8.5 9.2 8.9 9.9 7.8 7.5 9.9 9.7 8.4 9.1 8.2 8.6 8.6 8.2 9.0 Phòng B 8.4 8.5 8.2 8.4 8.4 8.9 8.2 9.1 8.7 8.7 8.5 7.9 8.7 8.0 8.2 Bước 1: Thiết lập giả thuyết Giả thuyết không khác biệt (Null hypothesis) Giả thuyết thay thế (Alternative hypothesis) Bước 2: Kiểm tra sự bình thường của dữ liệu Minitab: Stat > Basic Statistics > Normality Test 2 1 Lựa chọn phương pháp kiểm tra phù hợp AD: Mặc định. Dựa vào chức năng phân bố tích lũy kinh nghiệm RJ: Dựa vào hệ số của sữ tương quan KS: Dựa vào Chi-Square Kết quả thực hiện từ Minitab Bởi vì cả hai giá trị P-values đều lớn hơn 0.05, cả hai dữ liệu đều hợp chuẩn Bước 3: Phân tích đồ thị Sử dụng đồ thị, xem lại sơ qua sự khác biệt về các biến thiên . Minitab : Graph > Box Plot > Multiple Y’s, Simple Bạn có thể rút ra phán đoán trực quan gì từ phân tích đồ thị? 3 1 2 1 3 4 Bước 4: Phân tích thống kê (tt) Kiểm định dành cho các biến thiên như nhau Cài đặt các cột với dữ liệu xếp chồng. Có thể so sánh các biến thiên của hai nhóm hoặc hơn Xếp thành chồng dữ liệu Đặt mức độ tin cậy 2 5 Kết quả thực hiện từ Minitab Bước 5: Rút ra kết luận Từ giá trị P-Value là 0.006, nhỏ hơn 0.05, loại bỏ Ho. Vì vậy, sự phân bố của việc sử dụng giấy A4 tại phòng A và B là khác nhau Xác định phương pháp kiểm định Nếu dữ liệu được tách ra từ sự phân bố chuẩn, sử dụng F-Test hoặc Bartlett-Test (3 tập hợp hoặc nhiều hơn) Thậm chí nếu dữ liệu không từ sự phân bố chuẩn, nếu nó được tách ra từ sự phân bố liên tục, sử dụng Levene’s test Bước 4: Phân tích thống kê (tt) Tóm tắt và ứng dụng Tóm tắt kiểm tra biến thiên bằng nhau kiểm tra biến thiên bằng nhau là phương pháp kiểm tra nhằm xác định xem liệu có bất kỳ sự khác biệt thống kê đáng kể nào về các biến thiên của hai mẫu hoặc hơn không. Trình tự kiểm tra dành cho các biến thiên như nhau được thể hiện như sau: Thiết lập giả thiết  Kiểm tra tính bình thường  Phân tích đồ thị  Phân tích thống kê  Rút ra kết luận Sẽ quan trọng khi đạt được sự giải thích thực tế một cách đúng đắn hơn là kết luận thống kê. Ứng dụng của kiểm tra dành cho các biến thiên như nhau Trong việc ứng dụng kiểm tra 2 samples nếu các biến thiên của hai tập hợp giống nhau, lựa chọn “Giả thiết các biến thiên như nhau”. Bằng cách làm như vậy, bạn có thể nâng cao độ chính xác của kiểm tra. Sẽ là giả thuyết cơ bản dành cho phân tích ANOVA như là One-way ANOVA và Two-way ANOVA, v.v... Nếu giả thuyết cơ bản này không được thiết lập, phân tích là vô nghĩa. Đó là một giả thuyết cơ bản dành cho phân tích DOE Bài tập 1 Dữ liệu được thu thập về số giờ làm việc của nhân viên phòng A và phòng B trong 10 ngày. Trong khi các công nhân của phòng A làm thêm giờ rất nhiều, thì các công nhân của phòng B có xu hướng ra về tương đối đúng giờ. Tiến hành kiểm định dành cho các biến thiên như nhau tại mức có nghĩa 5%. (Tên file: Test for equal variances _exercise 1.mtw) Phòng A: 10.6, 11.3, 13.7, 10.6, 12.5, 9.8, 10.8, 13.9, 13.8, 10.0 (giờ) Phòng B: 9.0, 8.5, 10.0, 10.5, 9.6, 8.9, 10.1, 10.5, 9.1, 9.9 (giờ) 2. Linh kiện A có độ chính xác cao nhưng rất đắt. Ngược lại, linh kiện B rẻ hơn linh kiện A nhưng có độ chính xác thấp hơn. Dữ liệu sau đây đạt được bằng cách lấy 15 mẫu từ các sản phẩm được sản xuất với lần lượt các linh kiện. Tiến hành kiểm định dành cho các biến thiên như nhau tại mức có nghĩa 5%. (Tên file: Test for equal variances _exercise 2.mtw) Part A: 53, 52, 56, 54, 58, 51, 50, 49, 48, 53, 58, 53, 55, 52, 55 (kg) Part B: 48, 47, 49, 57, 55, 51, 57, 46, 55, 63, 52, 48, 51, 56, 50 (kg) 3. Dữ liệu dưới đây thể hiện sự sử dụng internet từng tuần của 5 nhân viên trong 15 tuần. Kiểm định để xác nhận xem liệu các biến thiên dành cho các lần sử dụng internet trên mỗi nhân viên có giống nhau hay không. (Tên file: Test for Equal Variances_Ex3.mtw ) (Đơn vị tính: giờ) Tuần Nhân viên A Nhân viên B Nhân viên C Nhân viên D Nhân viên E 1 5 5.02 4.92 4.99 4.83 2 5 5.03 4.9 5.02 4.69 3 4.92 4.9 4.84 5.01 5.32 4 4.99 4.89 4.93 4.93 5.09 5 5.03 5.07 4.9 4.97 5.12 6 4.9 4.91 4.85 5.16 5.18 7 4.91 5.07 4.9 4.94 4.85 8 5.03 5.03 4.95 5.03 4.91 9 5.01 5 4.93 4.89 5.05 10 4.99 5.06 4.91 4.97 5.06 11 5.01 5.08 4.93 5 4.94 12 5 5.01 4.86 5.11 5.03 13 5.04 5.13 4.93 4.99 5.09 14 4.99 5.12 4.94 5.05 5 15 5.06 4.94 4.94 4.99 5.14 Trả lời 1. Từ giá trị P-Value = 0.020 (<0.05), loại bỏ Ho. ⇒ Có thể nói rằng các biến thiên của thời gian làm việc trung bình của hai phòng là khác nhau 2. Từ giá trị P-Value=0.095 (>0.05) không thể loại bỏ Ho . ⇒ Không thể nói rằng các biến thiên của trọng lượng sản phẩm dành cho hai linh kiện là khác nhau. 3. Từ Levene’s Test, giá trị P-Value=0.001, (<0.05), loại bỏ Ho. ⇒ Các biến thiên của các lần sử dụng internet của các nhân viên là khác nhau .