Thuật ngữ Phản hồi: Đó là giá trị có được từ dữ liệu thực nghiệm sau. Nó cũng được gọi là giá trị đặc trưng. Ví dụ: Độ bền của sản phẩm, mức sinh lợi, tuổi thọ của các linh kiện Nhân tố: Trong số những nguyên nhân khác nhau mà ảnh hưởng đến giá trị đặc trưng, nhân tố được cho là trực tiếp liên quan đến một thực nghiệm. Mức độ của nhân tố: Sắp đặt nhân tố cho việc thực hiện thử nghiệm. Cách xử lý - Sự kết hợp của từng mức độ của một vài nhân tố.
                
              
                                            
                                
            
 
             
            Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 15: ANOVA, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ANOVA 
 Mục tiêu học tập 
 Hiểu được khái niệm ANOVA và chuẩn bị bảng ANOVA như thế nào 
 Hiểu được ANOVA thông qua các bài tập ứng dụng phần mềm Minitab 
 One-way ANOVA 
Hypothesis Test Roadmap 
Stat -Tables - Chi-square Test 
Stat -Basic Stats -2 proportion 
Stat -Basic Stats -1 proportion 
Ho: m1 = m2 
H 1 : m1 ¹ m2 
Stat - Basic Stats - 2-Sample t 
 select “ assume equal variances” 
Ho: M1 = M (Target) 
H 1 : M1 ¹ M (Target) 
Stat - Nonparametric - 1 Sample-Sign or 
Stat - Nonparametric - 1 Sample-Wilcoxon 
Continuous Data 
 Normality Test 
Hypothesis Testing 
One-way 
ANOVA 
Discrete Data 
Chi-Square Test 
Ho: m1 = m2 = m3 = ... 
H 1 : at least one is different 
Stat - Anova- One-way 
Ho: Data is normal. 
H 1 : Data is not normal. 
Stat - Basic Stat - Normality Test 
When significance level  = 0.05 : 
If P-value >0.05 , cannot reject Ho 
If P-value <0.05 , reject Ho 
Normal Data 
CI for Standard Deviation 
One population 
Two or more 
population 
2 Sample t 
(variance equal ) 
2 Sample t 
(variance not equal) 
 1 Sample t or 
1 Sample Z 
Ho: m1 = m (target) 
H 1 : m1 ¹ m (target) 
Stat - Basic Stats - 1 Sample-t ( s is unknown) 
 1Sample Z ( s is known) 
1 Sample-Sign or 
1 Sample-Wilcoxon 
Mann-Whitney Test 
Two or more 
populations 
Two populations 
1-Proportion 
2-Proportion 
One population 
Two population 
Two or more 
population 
Non Normal Data 
Equal Variance 
Yes 
No 
Kruskal-Wallis Test 
One population 
Two 
populations 
Two or more 
populations 
Ho: M1 = M2 
H 1 : M1 ¹ M2 
Stat - Nonparametric - Mann-Whitney 
Ho: M1 = M2 = M3 = ... 
H 1 : at least one is different 
Stat - Nonparametric - Kruskal-Wallis 
Ho: m1 = m2 
H 1 : m1 ¹ m2 
Stat - Basic Stats - 2-Sample t 
do not select “ assume equal variances” 
 Test for Equal Variances 
(Levene’s Test) 
 Test for Equal Variances 
(F Test or Bartlett’s Test) 
Ho: s1 = s2 = s3 = .. ... 
H 1 : at least one is different 
Stat - Anova - Test for Equal Variances 
Use F-test when comparing two populations only 
Ho: s 1 = s (Target) 
H 1 : s 1 ¹ s (Target) 
Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu. 
 Stat -Basic Statistics - Display Descriptive Stats 
Two-way 
ANOVA 
 Phản hồi: 
 Đó là giá trị có được từ dữ liệu thực nghiệm sau. Nó cũng được gọi là giá trị 
 đặc trưng. 
 Ví dụ: Độ bền của sản phẩm, mức sinh lợi, tuổi thọ của các linh kiện 
 Nhân tố: 
Trong số những nguyên nhân khác nhau mà ảnh hưởng đến giá trị đặc trưng, nhân tố được cho là trực tiếp liên quan đến một thực nghiệm. 
 Mức độ của nhân tố: Sắp đặt nhân tố cho việc thực hiện thử nghiệm. 
 Cách xử lý 
-	 Sự kết hợp của từng mức độ của một vài nhân tố. 
Thuật ngữ 
ANOVA là gì (Phân tích biến thiên )? 
ANOVA xác định xem liệu sự khác biệt về các trị số trung bình giữa các nhóm, có lớn hơn biến thiên nội tại nhóm hay không 
Qui trình hiện tại 
Qui trình đề xuất 
Sự khác nhau (Delta) 
Biến thiên toàn phần 
( biến thiên giữa các nhóm ) 
Delta 
biến thiên trong các nhóm 
 Định nghĩa ANOVA (Analysis of Variance) 
ANOVA thẩm tra xem sự khác biệt về các trị số trung bình của hai tập hợp hoặc nhiều hơn có ý nghĩa về mặt thống kê hay không. 
Một phương pháp để so sánh biến thiên giữa các tập hợp (biến thiên giữa các nhóm) và các biến thiên trong các tập hợp (biến thiên trong các nhóm) 
 Sự cần thiết của ANOVA 
Example 
Nhằm mục đích xác nhận xem có hay không sư khác nhau trong thời gian phê duyệt của từng loại báo cáo, một thử nghiệm đã được thực hiện với 5 loại báo cáo. 
	 Cho từng loại xử lý, có 10 mẫu được rút ra từ dữ liệu thử nghiệm thu được. 
 Có hay không sự khác nhau trong tiến độ sản xuất bởi phương pháp sản xuất ? 
Dữ liệu này có thể được phân tích thế nào? 
Tổng quan về ANOVA 
Trial 
Type A 
Type B 
Type C 
Type D 
Type E 
1 
6.528 
6.768 
 6.054 
 5.247 
 8.405 
2 
6.896 
6.214 
 6.301 
 4.787 
 8.175 
3 
6.389 
5.936 
 7.127 
 5.854 
 6.933 
4 
6.806 
6.737 
 6.778 
 5.396 
 6.455 
5 
7.064 
6.515 
 6.171 
 5.436 
 7.271 
6 
6.962 
7.543 
 5.242 
 5.837 
 7.422 
7 
6.028 
6.583 
 5.931 
 5.463 
 7.325 
8 
7.028 
7.082 
 5.461 
 5.433 
 7.476 
9 
6.602 
7.110 
 5.716 
 5.509 
 7.502 
10 
6.858 
6.421 
 5.887 
 5.797 
 7.749 
Điều gì sẽ xảy ra nếu kiểm định t được thực hiện nhiều lần? 
Tiến trình phê duyệt của mỗi loại báo cáo như sau. 
( Tên file :ANOVA_Catalyzer.mtw) 
Liệu tiến độ sản xuất có khác nhau dựa theo phương thức sản xuất? 
 Các kết quả từ Minitab 
Minitab: Graph > Boxplot 
Minitab: Graph > Dotplot 
 Đối với mỗi sự kết hợp của các giá trị trung bình, kiểm định 2 Sample t 
 có thể được thực hiện 
- Loại A vs. B, A vs. C, A vs. D, A vs. E 
- Loại B vs. C, B vs. D, B vs. E 
- Loại C vs. D, C vs. E 
- Loại D vs. E 
 Tại sao đây là một phương pháp không tốt? 
 - Nó đòi hỏi nhiều kiểm định 
 - Do nhiều kiểm định, mức có nghĩa  sẽ trở nên lớn hơn. 
 Kiểm định trị số trung bình đối với một tập hợp 
 - Kiểm định z khi kích thước mẫu giống nhau hoặc  đã biết 
 - Kiểm định t khi kích thước mẫu nhỏ hoặc  chưa biết 
 Kiểm định trị số trung bình đối với hai tập hợp 
 Kiểm định trị số trung bình đối với hai tập hợp hoặc nhiều hơn 
 - 	 Kiểm định 2-Sample t 
 - 	 Kiểm định Paired t 
 H 0 :  =  o 
 H 1 : <  o 
 >  o 
   o 
 H 0 :  1 =  2 
 H 1 :  1 <  2 
  1 >  2 
  1   2 
 H 0 :  1 =  2 = ···=  k 
 H 1 : At least one has a different value 
 - 	 One-way ANOVA 
 1 
 2 
 1 
 2 
 k 
... 
 o 
 Các kiểu kiểm định trị số trung bình 
 ANOVA (Phân tích biến thiên ) 
Trong thực tế, ANOVA là sự mở rộng của kiểm định 2-sample t . 
ANOVA là phương pháp nhận biết sự khác nhau giữa một vài trị số 
 trung bình mẫu 
Tại sao lại gọi là ANOVA (phân tích của biến thiên )? 
	- ANOVA so sánh / phân tích các biến thiên . 
 > Biến thiên trong các nhóm: biến thiên trong các điều kiện hoặc sự xử lý 
 giống nhau 
 > Biến thiên giữa các nhóm: Biến thiên giữa các điều kiện hoặc sự xử lý 
 Các kiểu của ANOVA (Phân tích của biến thiên : ANOVA) 
 One-way ANOVA: 
It is the test to see what differences will be brought about in effect by one test factor when it goes through different treatments. That is, it is used when you want to know differences in response values by level of factor. 
Nó là kiểm tra để xem những khác biệt gì sẽ được đưa ra về hiệu quả bởi một nhân tố kiểm tra khi nó đi qua nhiều mức thử nghiệm khác nhau . Vì vậy, nó được sử dụng khi bạn muốn biết những khác biệt trong các giá trị (Y) tương ứng bởi mức độ của nhân tố. 
 Two-way ANOVA: 
It is the test to identify whether there is differences in levels of factors when there are two test factors and each factor has several levels. 
Nó là kiểm tra để phân biệt xem liệu có sự khác biệt nào về các mức độ của các nhân tố khi có hai nhân tố kiểm tra và từng nhân tố có một vài mức độ . 
Biến thiên trong các nhóm 
( Số dư, lỗi) 
Biến thiên giữa các nhóm (Sự xử lý) 
ANOVA sử dụng kiểm định F để xác định xem liệu có sự khác biệt về các trị số trung bình hay không. 
 	 Biến thiên trung bình giữa các nhóm 
 ANOVA kiểm tra tỷ lệ thức của 
 	 Biến thiên trung bình trong các nhóm 
A 1 
A 2 
A 3 
 Nét đặc trưng và sự phân tích của biến thiên 
 Các giả định của ANOVA 
 (Các giá trị phản hồi) độc lập với nhau 
Để phân biệt rõ sự khác biệt giữa các mức độ, chúng nên độc lập . 
 (Các giá trị phản hồi) có sự phân bố chuẩn 
Để sử dụng sự phân bố F cho việc so sánh các biến thiên của sự biến thiên, chúng nên tuân theo sự phân bố chuẩn 
 B iến thiên tập hợp là như nhau ngang qua tất cả các mức độ của nhân tố 
Nếu biến thiên khác nhau, Y có thể bị ảnh hưởng bởi các nhân tố khác nhau tại các mức độ xác định và sẽ dẫn đến một tập hợp với các đặc tính khác nhau. Và sẽ là vô nghĩa khi so sánh các biến thiên hoặc các trị số trung bình của các tập hợp với các dạng khác nhau 
Bước 1 : Nói rõ vấn đề theo thực tế 
Bước 2 : Thiết lập giả thuyết (Null hypothesis & Alternative hypothesis) 
Trình tự phân tích ANOVA 
 Trình tự phân tích 
Nói rõ vấn đề theo thực tế 
Lập giả thuyết 
Triển khai bảng ANOVA 
Giải thích giá trị P-value 
Xác nhận các giả thuyết cơ bản 
Rút ra kết luận thực tế 
Bước 3 : Xác định rằng các giả thuyết cơ bản dành cho ANOVA được thỏa mãn 
Biến số đầu ra độc lập và thể hiện tính tiêu chuẩn 
biến thiên tập hợp của biến số đầu ra là như nhau ngang qua tất cả các mức độ của các nhân tố. 
Bước 4 : Triển khai bảng ANOVA 
Bước 5 : Giải thích giá trị P-value 
 Nếu P-Value <  , thì loại bỏ Ho. 
Bước 7 : Biến kết luận thống kê thành kết luận thực tế 
A 	B 	C 	 D 	E 
16.5 
18.0 
14.1 
17.8 
17.6 
15.3 
14.8 
16.1 
14.2 
19.0 
18.4 
15.3 
17.3 
16.9 
17.1 
16.3 
18.4 
16.9 
15.2 
15.1 
14.9 
14.6 
14.2 
ANOVA sử dụng Minitab 
Ví dụ) Tiến độ giao hàng bởi các nhà thầu phụ giao hàng 
Công ty S đang cố gắng để rút ngắn tiến độ giao hàng. Như một sự nỗ lực, công ty đó đã điều tra sự sử dụng thời gian trên từng lần giao hàng bởi từng nhà thầu phụ giao hàng, như sau 
Công ty chuẩn bị kiểm tra với ANOVA xem có bất kỳ sự khác biệt nào về tiến độ đối với từng lần giao hàng đơn bởi các nhà thầu phụ giao hàng không. Mức có nghĩa được đặt tại  = 0.05 .  (Tên file: ANOVA_AirTransport.mtw) 
( Đơn vị: giờ ) 
H o :  A =  B =  C =  D =  E 
H 1 : Tối thiểu có một nhà thầu phụ có tiến độ giao hàng là khác. 
 Thiết lập giả thuyết 
 Nói rõ vấn đề theo thực tế 
 Sự khắc sâu có khác nhau theo từng vị trí không ? 
Bước 1 
Bước 2 
Các b iến số đầu ra độc lập với nhau và thể hiện tính tiêu chuẩn 
Các giả định của kiểu mẫu có hiệu quả hay không? 
Chọn cột chứa dữ liệu 
Bước 3 
Minitab: Stat > Basic Statistics > Normality Test 
1 
2 
 Phương pháp kiểm tra dựa vào chức năng phân bố tích lũy kinh nghiệm 
Phương pháp kiểm định dựa vào sự tương quan 
Phương pháp kiểm định dựa vào sự phân bố chi-square 
Sau kết quả kiểm định chuẩn của A,B,C,D and E các giá trị p-values lớn hơn 0.05. Cho nên, chúng tuân theo phân bố chuẩn. 
Xác nhận kết quả 
Các giả định của kiểu mẫu có hiệu quả hay không? 
Tạo cột dữ liệu xếp chồng 
Bước 3 
Minitab: Data > Stack > Columns 
1 
2 
Hãy xếp chồng và chọn cột dữ liệu 
Nhập cột chứa dữ liệu đã được chọn 
Nhập cột chứa nhân tố đã được chọn 
STACK 
UNSTACK 
1 
2 
3 
4 
Các giả định của kiểu mẫu có hiệu quả hay không? 
Tập hợp biến thiên của biến số đầu ra là như nhau qua tất cả các mức độ của nhân tố 
Bước 3 
Minitab: Stat > ANOVA > Test for Equal Variances 
Dữ liệu sau khi xếp chồng, 
lựa chọn cột để nhập dữ liệu đầu ra. 
Chọn cột với nhân tố đã được nhập vào. 
Nhập khoảng tin cậy 1- α 
Từ kiểm định của Bartlett chỉ ra rằng giá trị P = 0.254 lớn hơn so với mức có ý nghĩa 0.05, chúng ta không thể nói rằng biến thiên của các nhà thầu phụ A, B, C, D, và E là khác nhau. 
Xác nhận kết quả 
Khi phân bố là 
Bình thường 
Khi phân bố là 
không bình thường 
1 
2 
3 
4 
5 
7 
6 
Triển khai bảng ANOVA 
 Minitab: Stat > ANOVA > One-way 
Bước 4 
Chọn loại đồ thị 
Chọn cột với dữ liệu ngõ ra đã được nhập 
Chọn cột với nhân tố đã được nhập 
 Xác nhận kết quả 
Từ giá trị p-value là 0.016 , chúng ta không thể nói rằng tiến trình giao nhận của tất cả nhà thầu phụ là giống nhau. 
 - (-----*----) đại diện 95% khoảng tin cậy đối với từng cấp của tập hợp. 
 - Nếu khoảng tin cậy bị trùng lắp, chúng ta không thể quyết định rằng: các giá trị trung bình của các loại là khác nhau. 
 Individual 95% CIs For Mean Based on 
 Pooled StDev 
Level N Mean StDev -+---------+---------+---------+-------- 
A Air 5 16.800 1.617 (-------*-------) 
B Air 4 15.100 0.804 (--------*-------) 
C Air 5 17.380 1.434 (-------*------) 
D Air 5 16.780 1.169 (-------*------) 
E Air 4 14.700 0.392 (--------*--------) 
 -+---------+---------+---------+-------- 
 13.5 15.0 16.5 18.0 
 Xác nhận kết quả 
One-way ANOVA: C8 versus C7 
Source DF SS MS F P 
C7 4 24.20 6.05 4.10 0.016 
Error 18 26.56 1.48 
Total 22 50.75 
Nếu p-Value < 0.05, thì loại bỏ giả thuyết không khác biệt (Ho) 
Giải thích giá trị p-value 
Bước 5 
Total DF (Tổng số mẫu – 1) 
	= 23 - 1 = 22 
DF của nhà thầu phụ (Số cấp – 1) 
 	= 5 – 1 = 4 
Error term’s FD 
 	(Total DF – Location’s DF) 
	= 22 – 4 = 18 
SS Location + SS Error = SS TOTAL 
Biến thiên do sự khác biệt về hiệu quả giữa các cấp của các nhà thầu phụ được tính là 47.68% trong biến thiên tổng 
Biến thiên gây ra bởi các nhà thầu phụ 
 Tổng biến thiên 
= (24.20 /50.75) ×100 
= 47.68% 
×100 
One-way ANOVA: C8 versus C7 
Source DF SS MS F P 
C7 4 24.20 6.05 4.10 0.016 
Error 18 26.56 1.48 
Total 22 50.75 
Nếu p-value nhỏ hơn 5%, tối thiểu có một mức của trị trung bình là khác nhau 
Trong trường hợp này, giả thuyết (H o ) cho rằng các trị số trung bình của tất cả các cấp là như nhau, bị loại bỏ. 
Vì vậy, tiến độ giao hàng của ít nhất của một nhà thầu phụ là khác nhau 
F statistic = MS Location /MS ERROR 
= 6.05/1.48 = 4.10 
Bình phương trung bình là sự biến thiên 
được phân chia bởi DF 
MS = SS/DF = 24.2/4=6.05 
Biến kết luận thống kê thành kết luận thực tế 
Sự biến thiên do sự khác biệt về hiệu quả giữa các cấp độ của các nhà thầu phụ được tính là 47.68% trong biến thiên tổng 
 SS(nhà thầu phụ) / SS(tổng) = 0.4768 
Bởi vì giá trị P là 0,016, tiến độ giao hàng của các nhà thầu phụ giao hàng A, B, C, D và E không phải là giống nhau tất cả 
Bước 6 
Tóm tắt 
ANOVA là một phương pháp kiểm tra xác định xem liệu sự khác biệt về các giá trị trung bình của hai hay nhiều hơn các tập hợp có đáng kể về mặt thống kê hay không 
Giá trị P đạt được thông qua giá trị F của tỷ lệ biến thiên bằng cách so sánh sự biến thiên trong phạm vi các nhóm (bình phương trung bình) và biến thiên giữa các nhóm (bình phương trung bình) 
Được so sánh với biến thiên tổng, chúng ta có thể nhận được tỷ lệ biến thiên, do sự khác biệt về hiệu quả giữa các cấp độ của nhân tố. 
ANOVA được dựa trên các giả thuyết về tính độc lập , sự phân bố chuẩn và biến thiên như nhau . 
Nói rõ vấn đề theo thực tế 
Lập giả thuyết 
Xác nhận các giả thuyết cơ bản 
Triển khai bảng ANOVA 
Giải thích giá trị P-value 
Kiểm định mô hình phù hợp 
Rút ra kết luận thực tế 
Tính tiêu chuẩn 
biến thiên như nhau 
Phân tích số dư 
1.	 Để điều tra sở thích màu sắc của máy cầm tay PCS, chúng tôi đã đo được sở thích màu sắc liên quan đến bốn màu dưới đây 
Với dữ liệu tổng hợp dưới đây, hãy tiến hành một kiểm định để xem liệu có sự khác biệt về sở thích màu sắc hay không (Tại mức có ý nghĩa 5%) 
	(Tên file: ANOVA_Ex1.mtw) 
23 
23 
18 
15 
30 
28 
32 
30 
18 
14 
20 
15 
31 
27 
26 
28 
30 
Bài tập 
Đỏ	Trắng	Xám	Đen 
2. 	 3 người bán hàng (A 1 , A 2 , A 3 ) giao các mặt hàng văn phòng cho công ty S. 
Chúng ta đã đo được thời gian giao hàng của 3 người bán hàng đó khi S đặt hàng các mặt hàng văn phòng giống nhau. Với dữ liệu tổng hợp dưới đây, kiểm định để xác định xem liệu có sự khác biệt về thời gian giao hàng bởi các người bán hàng hay không (Tại mức có ý nghĩa 5%) 
	 (Tên file : ANOVA_Ex2.mtw) 
84.5 
83.0 
84.0 
87.5 
86.5 
87.0 
89.5 
89.0 
90.5 
A 1 
A 2 
A 3 
3.	 Chỉ số hài lòng về các chính sách phúc lợi của công ty đã được điều tra đối với từng phòng. Dưới đây là kết quả của chỉ số hài lòng trên từng phòng khi được ghi với thang điểm 10. Kiểm định để xác định xem liệu có sự khác biệt về chỉ số hài lòng trên từng phòng (Tại mức có ý nghĩa 5%) 
 (Tên file: ANOVA_Ex3.mtw) 
A 1 
8.1 
7.8 
8.8 
8.5 
8.2 
A 2 
7.4 
7.0 
8.9 
8.0 
8.8 
A 3 
6.8 
7.6 
8.6 
7.1 
8.7 
7.5 
A 4 
8.8 
7.6 
8.6 
7.1 
8.7 
7.5 
 Trả lời 
1.	Normality Test: A1(0.236), A2(0.410), A3(0.552), A4(0.723) 
 	Test for Equal Variance: P-Value 0.492 
 	 ANOVA result: P-Value 0.000 
 	Kết luận thực tế: Chúng ta có thể kết luận rằng màu sắc ảnh hưởng đến sở thích. 
2. 	Normality Test: A1(0.487), A2(0.631), A3(0.487) 
 	Test for Equal Variance: P-Value 0.840 
 	 ANOVA result: P-Value 0.000 
 	 Kết luận thực tế : Có sự khác biệt về tiến độ giao hàng trên từng nhà thầu phụ . 
3. 	Normality Test: A1(0.879), A2(0.509), A3(0.373), A4(0.155) 
 	Test for Equal Variance: P-Value 0.526 
 	 ANOVA result: P-Value 0.632 
 	 Kết luận thực tế : Không có sự khác biệt về sự hài lòng đối với các chính sách phúc lợi của công ty