Bài giảng Six sigma - Chương 15: ANOVA

Thuật ngữ Phản hồi: Đó là giá trị có được từ dữ liệu thực nghiệm sau. Nó cũng được gọi là giá trị đặc trưng. Ví dụ: Độ bền của sản phẩm, mức sinh lợi, tuổi thọ của các linh kiện Nhân tố: Trong số những nguyên nhân khác nhau mà ảnh hưởng đến giá trị đặc trưng, nhân tố được cho là trực tiếp liên quan đến một thực nghiệm. Mức độ của nhân tố: Sắp đặt nhân tố cho việc thực hiện thử nghiệm. Cách xử lý - Sự kết hợp của từng mức độ của một vài nhân tố.

ppt32 trang | Chia sẻ: thuyduongbt11 | Ngày: 09/06/2022 | Lượt xem: 477 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 15: ANOVA, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ANOVA Mục tiêu học tập Hiểu được khái niệm ANOVA và chuẩn bị bảng ANOVA như thế nào Hiểu được ANOVA thông qua các bài tập ứng dụng phần mềm Minitab One-way ANOVA Hypothesis Test Roadmap Stat -Tables - Chi-square Test Stat -Basic Stats -2 proportion Stat -Basic Stats -1 proportion Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t select “ assume equal variances” Ho: M1 = M (Target) H 1 : M1 ¹ M (Target) Stat - Nonparametric - 1 Sample-Sign or Stat - Nonparametric - 1 Sample-Wilcoxon Continuous Data Normality Test Hypothesis Testing One-way ANOVA Discrete Data Chi-Square Test Ho: m1 = m2 = m3 = ... H 1 : at least one is different Stat - Anova- One-way Ho: Data is normal. H 1 : Data is not normal. Stat - Basic Stat - Normality Test When significance level  = 0.05 : If P-value >0.05 , cannot reject Ho If P-value <0.05 , reject Ho Normal Data CI for Standard Deviation One population Two or more population 2 Sample t (variance equal ) 2 Sample t (variance not equal) 1 Sample t or 1 Sample Z Ho: m1 = m (target) H 1 : m1 ¹ m (target) Stat - Basic Stats - 1 Sample-t ( s is unknown) 1Sample Z ( s is known) 1 Sample-Sign or 1 Sample-Wilcoxon Mann-Whitney Test Two or more populations Two populations 1-Proportion 2-Proportion One population Two population Two or more population Non Normal Data Equal Variance Yes No Kruskal-Wallis Test One population Two populations Two or more populations Ho: M1 = M2 H 1 : M1 ¹ M2 Stat - Nonparametric - Mann-Whitney Ho: M1 = M2 = M3 = ... H 1 : at least one is different Stat - Nonparametric - Kruskal-Wallis Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t do not select “ assume equal variances” Test for Equal Variances (Levene’s Test) Test for Equal Variances (F Test or Bartlett’s Test) Ho: s1 = s2 = s3 = .. ... H 1 : at least one is different Stat - Anova - Test for Equal Variances Use F-test when comparing two populations only Ho: s 1 = s (Target) H 1 : s 1 ¹ s (Target) Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu. Stat -Basic Statistics - Display Descriptive Stats Two-way ANOVA Phản hồi: Đó là giá trị có được từ dữ liệu thực nghiệm sau. Nó cũng được gọi là giá trị đặc trưng. Ví dụ: Độ bền của sản phẩm, mức sinh lợi, tuổi thọ của các linh kiện Nhân tố: Trong số những nguyên nhân khác nhau mà ảnh hưởng đến giá trị đặc trưng, nhân tố được cho là trực tiếp liên quan đến một thực nghiệm. Mức độ của nhân tố: Sắp đặt nhân tố cho việc thực hiện thử nghiệm. Cách xử lý - Sự kết hợp của từng mức độ của một vài nhân tố. Thuật ngữ ANOVA là gì (Phân tích biến thiên )? ANOVA xác định xem liệu sự khác biệt về các trị số trung bình giữa các nhóm, có lớn hơn biến thiên nội tại nhóm hay không Qui trình hiện tại Qui trình đề xuất Sự khác nhau (Delta) Biến thiên toàn phần ( biến thiên giữa các nhóm ) Delta biến thiên trong các nhóm Định nghĩa ANOVA (Analysis of Variance) ANOVA thẩm tra xem sự khác biệt về các trị số trung bình của hai tập hợp hoặc nhiều hơn có ý nghĩa về mặt thống kê hay không. Một phương pháp để so sánh biến thiên giữa các tập hợp (biến thiên giữa các nhóm) và các biến thiên trong các tập hợp (biến thiên trong các nhóm)  Sự cần thiết của ANOVA Example Nhằm mục đích xác nhận xem có hay không sư khác nhau trong thời gian phê duyệt của từng loại báo cáo, một thử nghiệm đã được thực hiện với 5 loại báo cáo. Cho từng loại xử lý, có 10 mẫu được rút ra từ dữ liệu thử nghiệm thu được. Có hay không sự khác nhau trong tiến độ sản xuất bởi phương pháp sản xuất ? Dữ liệu này có thể được phân tích thế nào? Tổng quan về ANOVA Trial Type A Type B Type C Type D Type E 1 6.528 6.768 6.054 5.247 8.405 2 6.896 6.214 6.301 4.787 8.175 3 6.389 5.936 7.127 5.854 6.933 4 6.806 6.737 6.778 5.396 6.455 5 7.064 6.515 6.171 5.436 7.271 6 6.962 7.543 5.242 5.837 7.422 7 6.028 6.583 5.931 5.463 7.325 8 7.028 7.082 5.461 5.433 7.476 9 6.602 7.110 5.716 5.509 7.502 10 6.858 6.421 5.887 5.797 7.749 Điều gì sẽ xảy ra nếu kiểm định t được thực hiện nhiều lần? Tiến trình phê duyệt của mỗi loại báo cáo như sau. ( Tên file :ANOVA_Catalyzer.mtw) Liệu tiến độ sản xuất có khác nhau dựa theo phương thức sản xuất? Các kết quả từ Minitab Minitab: Graph > Boxplot Minitab: Graph > Dotplot Đối với mỗi sự kết hợp của các giá trị trung bình, kiểm định 2 Sample t có thể được thực hiện - Loại A vs. B, A vs. C, A vs. D, A vs. E - Loại B vs. C, B vs. D, B vs. E - Loại C vs. D, C vs. E - Loại D vs. E Tại sao đây là một phương pháp không tốt? - Nó đòi hỏi nhiều kiểm định - Do nhiều kiểm định, mức có nghĩa  sẽ trở nên lớn hơn. Kiểm định trị số trung bình đối với một tập hợp - Kiểm định z khi kích thước mẫu giống nhau hoặc  đã biết - Kiểm định t khi kích thước mẫu nhỏ hoặc  chưa biết Kiểm định trị số trung bình đối với hai tập hợp Kiểm định trị số trung bình đối với hai tập hợp hoặc nhiều hơn - Kiểm định 2-Sample t - Kiểm định Paired t H 0 :  =  o H 1 : <  o >  o   o H 0 :  1 =  2 H 1 :  1 <  2  1 >  2  1   2 H 0 :  1 =  2 = ···=  k H 1 : At least one has a different value - One-way ANOVA  1  2  1  2  k ...  o Các kiểu kiểm định trị số trung bình ANOVA (Phân tích biến thiên ) Trong thực tế, ANOVA là sự mở rộng của kiểm định 2-sample t . ANOVA là phương pháp nhận biết sự khác nhau giữa một vài trị số trung bình mẫu Tại sao lại gọi là ANOVA (phân tích của biến thiên )? - ANOVA so sánh / phân tích các biến thiên . > Biến thiên trong các nhóm: biến thiên trong các điều kiện hoặc sự xử lý giống nhau > Biến thiên giữa các nhóm: Biến thiên giữa các điều kiện hoặc sự xử lý Các kiểu của ANOVA (Phân tích của biến thiên : ANOVA) One-way ANOVA: It is the test to see what differences will be brought about in effect by one test factor when it goes through different treatments. That is, it is used when you want to know differences in response values by level of factor. Nó là kiểm tra để xem những khác biệt gì sẽ được đưa ra về hiệu quả bởi một nhân tố kiểm tra khi nó đi qua nhiều mức thử nghiệm khác nhau . Vì vậy, nó được sử dụng khi bạn muốn biết những khác biệt trong các giá trị (Y) tương ứng bởi mức độ của nhân tố. Two-way ANOVA: It is the test to identify whether there is differences in levels of factors when there are two test factors and each factor has several levels. Nó là kiểm tra để phân biệt xem liệu có sự khác biệt nào về các mức độ của các nhân tố khi có hai nhân tố kiểm tra và từng nhân tố có một vài mức độ . Biến thiên trong các nhóm ( Số dư, lỗi) Biến thiên giữa các nhóm (Sự xử lý) ANOVA sử dụng kiểm định F để xác định xem liệu có sự khác biệt về các trị số trung bình hay không. Biến thiên trung bình giữa các nhóm ANOVA kiểm tra tỷ lệ thức của Biến thiên trung bình trong các nhóm A 1 A 2 A 3 Nét đặc trưng và sự phân tích của biến thiên Các giả định của ANOVA (Các giá trị phản hồi) độc lập với nhau Để phân biệt rõ sự khác biệt giữa các mức độ, chúng nên độc lập . (Các giá trị phản hồi) có sự phân bố chuẩn Để sử dụng sự phân bố F cho việc so sánh các biến thiên của sự biến thiên, chúng nên tuân theo sự phân bố chuẩn B iến thiên tập hợp là như nhau ngang qua tất cả các mức độ của nhân tố Nếu biến thiên khác nhau, Y có thể bị ảnh hưởng bởi các nhân tố khác nhau tại các mức độ xác định và sẽ dẫn đến một tập hợp với các đặc tính khác nhau. Và sẽ là vô nghĩa khi so sánh các biến thiên hoặc các trị số trung bình của các tập hợp với các dạng khác nhau Bước 1 : Nói rõ vấn đề theo thực tế Bước 2 : Thiết lập giả thuyết (Null hypothesis & Alternative hypothesis) Trình tự phân tích ANOVA Trình tự phân tích Nói rõ vấn đề theo thực tế Lập giả thuyết Triển khai bảng ANOVA Giải thích giá trị P-value Xác nhận các giả thuyết cơ bản Rút ra kết luận thực tế Bước 3 : Xác định rằng các giả thuyết cơ bản dành cho ANOVA được thỏa mãn Biến số đầu ra độc lập và thể hiện tính tiêu chuẩn biến thiên tập hợp của biến số đầu ra là như nhau ngang qua tất cả các mức độ của các nhân tố. Bước 4 : Triển khai bảng ANOVA Bước 5 : Giải thích giá trị P-value Nếu P-Value <  , thì loại bỏ Ho. Bước 7 : Biến kết luận thống kê thành kết luận thực tế A B C D E 16.5 18.0 14.1 17.8 17.6 15.3 14.8 16.1 14.2 19.0 18.4 15.3 17.3 16.9 17.1 16.3 18.4 16.9 15.2 15.1 14.9 14.6 14.2 ANOVA sử dụng Minitab Ví dụ) Tiến độ giao hàng bởi các nhà thầu phụ giao hàng Công ty S đang cố gắng để rút ngắn tiến độ giao hàng. Như một sự nỗ lực, công ty đó đã điều tra sự sử dụng thời gian trên từng lần giao hàng bởi từng nhà thầu phụ giao hàng, như sau Công ty chuẩn bị kiểm tra với ANOVA xem có bất kỳ sự khác biệt nào về tiến độ đối với từng lần giao hàng đơn bởi các nhà thầu phụ giao hàng không. Mức có nghĩa được đặt tại  = 0.05 . (Tên file: ANOVA_AirTransport.mtw) ( Đơn vị: giờ ) H o :  A =  B =  C =  D =  E H 1 : Tối thiểu có một nhà thầu phụ có tiến độ giao hàng là khác. Thiết lập giả thuyết Nói rõ vấn đề theo thực tế Sự khắc sâu có khác nhau theo từng vị trí không ? Bước 1 Bước 2 Các b iến số đầu ra độc lập với nhau và thể hiện tính tiêu chuẩn Các giả định của kiểu mẫu có hiệu quả hay không? Chọn cột chứa dữ liệu Bước 3 Minitab: Stat > Basic Statistics > Normality Test 1 2 Phương pháp kiểm tra dựa vào chức năng phân bố tích lũy kinh nghiệm Phương pháp kiểm định dựa vào sự tương quan Phương pháp kiểm định dựa vào sự phân bố chi-square Sau kết quả kiểm định chuẩn của A,B,C,D and E các giá trị p-values lớn hơn 0.05. Cho nên, chúng tuân theo phân bố chuẩn. Xác nhận kết quả Các giả định của kiểu mẫu có hiệu quả hay không? Tạo cột dữ liệu xếp chồng Bước 3 Minitab: Data > Stack > Columns 1 2 Hãy xếp chồng và chọn cột dữ liệu Nhập cột chứa dữ liệu đã được chọn Nhập cột chứa nhân tố đã được chọn STACK UNSTACK 1 2 3 4 Các giả định của kiểu mẫu có hiệu quả hay không? Tập hợp biến thiên của biến số đầu ra là như nhau qua tất cả các mức độ của nhân tố Bước 3 Minitab: Stat > ANOVA > Test for Equal Variances Dữ liệu sau khi xếp chồng, lựa chọn cột để nhập dữ liệu đầu ra. Chọn cột với nhân tố đã được nhập vào. Nhập khoảng tin cậy 1- α Từ kiểm định của Bartlett chỉ ra rằng giá trị P = 0.254 lớn hơn so với mức có ý nghĩa 0.05, chúng ta không thể nói rằng biến thiên của các nhà thầu phụ A, B, C, D, và E là khác nhau. Xác nhận kết quả Khi phân bố là Bình thường Khi phân bố là không bình thường 1 2 3 4 5 7 6 Triển khai bảng ANOVA Minitab: Stat > ANOVA > One-way Bước 4 Chọn loại đồ thị Chọn cột với dữ liệu ngõ ra đã được nhập Chọn cột với nhân tố đã được nhập Xác nhận kết quả Từ giá trị p-value là 0.016 , chúng ta không thể nói rằng tiến trình giao nhận của tất cả nhà thầu phụ là giống nhau. - (-----*----) đại diện 95% khoảng tin cậy đối với từng cấp của tập hợp. - Nếu khoảng tin cậy bị trùng lắp, chúng ta không thể quyết định rằng: các giá trị trung bình của các loại là khác nhau. Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- A Air 5 16.800 1.617 (-------*-------) B Air 4 15.100 0.804 (--------*-------) C Air 5 17.380 1.434 (-------*------) D Air 5 16.780 1.169 (-------*------) E Air 4 14.700 0.392 (--------*--------) -+---------+---------+---------+-------- 13.5 15.0 16.5 18.0 Xác nhận kết quả One-way ANOVA: C8 versus C7 Source DF SS MS F P C7 4 24.20 6.05 4.10 0.016 Error 18 26.56 1.48 Total 22 50.75 Nếu p-Value < 0.05, thì loại bỏ giả thuyết không khác biệt (Ho) Giải thích giá trị p-value Bước 5 Total DF (Tổng số mẫu – 1) = 23 - 1 = 22 DF của nhà thầu phụ (Số cấp – 1) = 5 – 1 = 4 Error term’s FD (Total DF – Location’s DF) = 22 – 4 = 18 SS Location + SS Error = SS TOTAL Biến thiên do sự khác biệt về hiệu quả giữa các cấp của các nhà thầu phụ được tính là 47.68% trong biến thiên tổng Biến thiên gây ra bởi các nhà thầu phụ Tổng biến thiên = (24.20 /50.75) ×100 = 47.68% ×100 One-way ANOVA: C8 versus C7 Source DF SS MS F P C7 4 24.20 6.05 4.10 0.016 Error 18 26.56 1.48 Total 22 50.75 Nếu p-value nhỏ hơn 5%, tối thiểu có một mức của trị trung bình là khác nhau Trong trường hợp này, giả thuyết (H o ) cho rằng các trị số trung bình của tất cả các cấp là như nhau, bị loại bỏ. Vì vậy, tiến độ giao hàng của ít nhất của một nhà thầu phụ là khác nhau F statistic = MS Location /MS ERROR = 6.05/1.48 = 4.10 Bình phương trung bình là sự biến thiên được phân chia bởi DF MS = SS/DF = 24.2/4=6.05 Biến kết luận thống kê thành kết luận thực tế Sự biến thiên do sự khác biệt về hiệu quả giữa các cấp độ của các nhà thầu phụ được tính là 47.68% trong biến thiên tổng SS(nhà thầu phụ) / SS(tổng) = 0.4768 Bởi vì giá trị P là 0,016, tiến độ giao hàng của các nhà thầu phụ giao hàng A, B, C, D và E không phải là giống nhau tất cả Bước 6 Tóm tắt ANOVA là một phương pháp kiểm tra xác định xem liệu sự khác biệt về các giá trị trung bình của hai hay nhiều hơn các tập hợp có đáng kể về mặt thống kê hay không Giá trị P đạt được thông qua giá trị F của tỷ lệ biến thiên bằng cách so sánh sự biến thiên trong phạm vi các nhóm (bình phương trung bình) và biến thiên giữa các nhóm (bình phương trung bình) Được so sánh với biến thiên tổng, chúng ta có thể nhận được tỷ lệ biến thiên, do sự khác biệt về hiệu quả giữa các cấp độ của nhân tố. ANOVA được dựa trên các giả thuyết về tính độc lập , sự phân bố chuẩn và biến thiên như nhau . Nói rõ vấn đề theo thực tế Lập giả thuyết Xác nhận các giả thuyết cơ bản Triển khai bảng ANOVA Giải thích giá trị P-value Kiểm định mô hình phù hợp Rút ra kết luận thực tế Tính tiêu chuẩn biến thiên như nhau Phân tích số dư 1. Để điều tra sở thích màu sắc của máy cầm tay PCS, chúng tôi đã đo được sở thích màu sắc liên quan đến bốn màu dưới đây Với dữ liệu tổng hợp dưới đây, hãy tiến hành một kiểm định để xem liệu có sự khác biệt về sở thích màu sắc hay không (Tại mức có ý nghĩa 5%) (Tên file: ANOVA_Ex1.mtw) 23 23 18 15 30 28 32 30 18 14 20 15 31 27 26 28 30 Bài tập Đỏ Trắng Xám Đen 2. 3 người bán hàng (A 1 , A 2 , A 3 ) giao các mặt hàng văn phòng cho công ty S. Chúng ta đã đo được thời gian giao hàng của 3 người bán hàng đó khi S đặt hàng các mặt hàng văn phòng giống nhau. Với dữ liệu tổng hợp dưới đây, kiểm định để xác định xem liệu có sự khác biệt về thời gian giao hàng bởi các người bán hàng hay không (Tại mức có ý nghĩa 5%) (Tên file : ANOVA_Ex2.mtw) 84.5 83.0 84.0 87.5 86.5 87.0 89.5 89.0 90.5 A 1 A 2 A 3 3. Chỉ số hài lòng về các chính sách phúc lợi của công ty đã được điều tra đối với từng phòng. Dưới đây là kết quả của chỉ số hài lòng trên từng phòng khi được ghi với thang điểm 10. Kiểm định để xác định xem liệu có sự khác biệt về chỉ số hài lòng trên từng phòng (Tại mức có ý nghĩa 5%) (Tên file: ANOVA_Ex3.mtw) A 1 8.1 7.8 8.8 8.5 8.2 A 2 7.4 7.0 8.9 8.0 8.8 A 3 6.8 7.6 8.6 7.1 8.7 7.5 A 4 8.8 7.6 8.6 7.1 8.7 7.5 Trả lời 1. Normality Test: A1(0.236), A2(0.410), A3(0.552), A4(0.723) Test for Equal Variance: P-Value 0.492 ANOVA result: P-Value 0.000 Kết luận thực tế: Chúng ta có thể kết luận rằng màu sắc ảnh hưởng đến sở thích. 2. Normality Test: A1(0.487), A2(0.631), A3(0.487) Test for Equal Variance: P-Value 0.840 ANOVA result: P-Value 0.000 Kết luận thực tế : Có sự khác biệt về tiến độ giao hàng trên từng nhà thầu phụ . 3. Normality Test: A1(0.879), A2(0.509), A3(0.373), A4(0.155) Test for Equal Variance: P-Value 0.526 ANOVA result: P-Value 0.632 Kết luận thực tế : Không có sự khác biệt về sự hài lòng đối với các chính sách phúc lợi của công ty