Thuật ngữ Phản hồi: Đó là giá trị có được từ dữ liệu thực nghiệm sau. Nó cũng được gọi là giá trị đặc trưng. Ví dụ: Độ bền của sản phẩm, mức sinh lợi, tuổi thọ của các linh kiện Nhân tố: Trong số những nguyên nhân khác nhau mà ảnh hưởng đến giá trị đặc trưng, nhân tố được cho là trực tiếp liên quan đến một thực nghiệm. Mức độ của nhân tố: Sắp đặt nhân tố cho việc thực hiện thử nghiệm. Cách xử lý - Sự kết hợp của từng mức độ của một vài nhân tố.
Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 15: ANOVA, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ANOVA
Mục tiêu học tập
Hiểu được khái niệm ANOVA và chuẩn bị bảng ANOVA như thế nào
Hiểu được ANOVA thông qua các bài tập ứng dụng phần mềm Minitab
One-way ANOVA
Hypothesis Test Roadmap
Stat -Tables - Chi-square Test
Stat -Basic Stats -2 proportion
Stat -Basic Stats -1 proportion
Ho: m1 = m2
H 1 : m1 ¹ m2
Stat - Basic Stats - 2-Sample t
select “ assume equal variances”
Ho: M1 = M (Target)
H 1 : M1 ¹ M (Target)
Stat - Nonparametric - 1 Sample-Sign or
Stat - Nonparametric - 1 Sample-Wilcoxon
Continuous Data
Normality Test
Hypothesis Testing
One-way
ANOVA
Discrete Data
Chi-Square Test
Ho: m1 = m2 = m3 = ...
H 1 : at least one is different
Stat - Anova- One-way
Ho: Data is normal.
H 1 : Data is not normal.
Stat - Basic Stat - Normality Test
When significance level = 0.05 :
If P-value >0.05 , cannot reject Ho
If P-value <0.05 , reject Ho
Normal Data
CI for Standard Deviation
One population
Two or more
population
2 Sample t
(variance equal )
2 Sample t
(variance not equal)
1 Sample t or
1 Sample Z
Ho: m1 = m (target)
H 1 : m1 ¹ m (target)
Stat - Basic Stats - 1 Sample-t ( s is unknown)
1Sample Z ( s is known)
1 Sample-Sign or
1 Sample-Wilcoxon
Mann-Whitney Test
Two or more
populations
Two populations
1-Proportion
2-Proportion
One population
Two population
Two or more
population
Non Normal Data
Equal Variance
Yes
No
Kruskal-Wallis Test
One population
Two
populations
Two or more
populations
Ho: M1 = M2
H 1 : M1 ¹ M2
Stat - Nonparametric - Mann-Whitney
Ho: M1 = M2 = M3 = ...
H 1 : at least one is different
Stat - Nonparametric - Kruskal-Wallis
Ho: m1 = m2
H 1 : m1 ¹ m2
Stat - Basic Stats - 2-Sample t
do not select “ assume equal variances”
Test for Equal Variances
(Levene’s Test)
Test for Equal Variances
(F Test or Bartlett’s Test)
Ho: s1 = s2 = s3 = .. ...
H 1 : at least one is different
Stat - Anova - Test for Equal Variances
Use F-test when comparing two populations only
Ho: s 1 = s (Target)
H 1 : s 1 ¹ s (Target)
Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu.
Stat -Basic Statistics - Display Descriptive Stats
Two-way
ANOVA
Phản hồi:
Đó là giá trị có được từ dữ liệu thực nghiệm sau. Nó cũng được gọi là giá trị
đặc trưng.
Ví dụ: Độ bền của sản phẩm, mức sinh lợi, tuổi thọ của các linh kiện
Nhân tố:
Trong số những nguyên nhân khác nhau mà ảnh hưởng đến giá trị đặc trưng, nhân tố được cho là trực tiếp liên quan đến một thực nghiệm.
Mức độ của nhân tố: Sắp đặt nhân tố cho việc thực hiện thử nghiệm.
Cách xử lý
- Sự kết hợp của từng mức độ của một vài nhân tố.
Thuật ngữ
ANOVA là gì (Phân tích biến thiên )?
ANOVA xác định xem liệu sự khác biệt về các trị số trung bình giữa các nhóm, có lớn hơn biến thiên nội tại nhóm hay không
Qui trình hiện tại
Qui trình đề xuất
Sự khác nhau (Delta)
Biến thiên toàn phần
( biến thiên giữa các nhóm )
Delta
biến thiên trong các nhóm
Định nghĩa ANOVA (Analysis of Variance)
ANOVA thẩm tra xem sự khác biệt về các trị số trung bình của hai tập hợp hoặc nhiều hơn có ý nghĩa về mặt thống kê hay không.
Một phương pháp để so sánh biến thiên giữa các tập hợp (biến thiên giữa các nhóm) và các biến thiên trong các tập hợp (biến thiên trong các nhóm)
Sự cần thiết của ANOVA
Example
Nhằm mục đích xác nhận xem có hay không sư khác nhau trong thời gian phê duyệt của từng loại báo cáo, một thử nghiệm đã được thực hiện với 5 loại báo cáo.
Cho từng loại xử lý, có 10 mẫu được rút ra từ dữ liệu thử nghiệm thu được.
Có hay không sự khác nhau trong tiến độ sản xuất bởi phương pháp sản xuất ?
Dữ liệu này có thể được phân tích thế nào?
Tổng quan về ANOVA
Trial
Type A
Type B
Type C
Type D
Type E
1
6.528
6.768
6.054
5.247
8.405
2
6.896
6.214
6.301
4.787
8.175
3
6.389
5.936
7.127
5.854
6.933
4
6.806
6.737
6.778
5.396
6.455
5
7.064
6.515
6.171
5.436
7.271
6
6.962
7.543
5.242
5.837
7.422
7
6.028
6.583
5.931
5.463
7.325
8
7.028
7.082
5.461
5.433
7.476
9
6.602
7.110
5.716
5.509
7.502
10
6.858
6.421
5.887
5.797
7.749
Điều gì sẽ xảy ra nếu kiểm định t được thực hiện nhiều lần?
Tiến trình phê duyệt của mỗi loại báo cáo như sau.
( Tên file :ANOVA_Catalyzer.mtw)
Liệu tiến độ sản xuất có khác nhau dựa theo phương thức sản xuất?
Các kết quả từ Minitab
Minitab: Graph > Boxplot
Minitab: Graph > Dotplot
Đối với mỗi sự kết hợp của các giá trị trung bình, kiểm định 2 Sample t
có thể được thực hiện
- Loại A vs. B, A vs. C, A vs. D, A vs. E
- Loại B vs. C, B vs. D, B vs. E
- Loại C vs. D, C vs. E
- Loại D vs. E
Tại sao đây là một phương pháp không tốt?
- Nó đòi hỏi nhiều kiểm định
- Do nhiều kiểm định, mức có nghĩa sẽ trở nên lớn hơn.
Kiểm định trị số trung bình đối với một tập hợp
- Kiểm định z khi kích thước mẫu giống nhau hoặc đã biết
- Kiểm định t khi kích thước mẫu nhỏ hoặc chưa biết
Kiểm định trị số trung bình đối với hai tập hợp
Kiểm định trị số trung bình đối với hai tập hợp hoặc nhiều hơn
- Kiểm định 2-Sample t
- Kiểm định Paired t
H 0 : = o
H 1 : < o
> o
o
H 0 : 1 = 2
H 1 : 1 < 2
1 > 2
1 2
H 0 : 1 = 2 = ···= k
H 1 : At least one has a different value
- One-way ANOVA
1
2
1
2
k
...
o
Các kiểu kiểm định trị số trung bình
ANOVA (Phân tích biến thiên )
Trong thực tế, ANOVA là sự mở rộng của kiểm định 2-sample t .
ANOVA là phương pháp nhận biết sự khác nhau giữa một vài trị số
trung bình mẫu
Tại sao lại gọi là ANOVA (phân tích của biến thiên )?
- ANOVA so sánh / phân tích các biến thiên .
> Biến thiên trong các nhóm: biến thiên trong các điều kiện hoặc sự xử lý
giống nhau
> Biến thiên giữa các nhóm: Biến thiên giữa các điều kiện hoặc sự xử lý
Các kiểu của ANOVA (Phân tích của biến thiên : ANOVA)
One-way ANOVA:
It is the test to see what differences will be brought about in effect by one test factor when it goes through different treatments. That is, it is used when you want to know differences in response values by level of factor.
Nó là kiểm tra để xem những khác biệt gì sẽ được đưa ra về hiệu quả bởi một nhân tố kiểm tra khi nó đi qua nhiều mức thử nghiệm khác nhau . Vì vậy, nó được sử dụng khi bạn muốn biết những khác biệt trong các giá trị (Y) tương ứng bởi mức độ của nhân tố.
Two-way ANOVA:
It is the test to identify whether there is differences in levels of factors when there are two test factors and each factor has several levels.
Nó là kiểm tra để phân biệt xem liệu có sự khác biệt nào về các mức độ của các nhân tố khi có hai nhân tố kiểm tra và từng nhân tố có một vài mức độ .
Biến thiên trong các nhóm
( Số dư, lỗi)
Biến thiên giữa các nhóm (Sự xử lý)
ANOVA sử dụng kiểm định F để xác định xem liệu có sự khác biệt về các trị số trung bình hay không.
Biến thiên trung bình giữa các nhóm
ANOVA kiểm tra tỷ lệ thức của
Biến thiên trung bình trong các nhóm
A 1
A 2
A 3
Nét đặc trưng và sự phân tích của biến thiên
Các giả định của ANOVA
(Các giá trị phản hồi) độc lập với nhau
Để phân biệt rõ sự khác biệt giữa các mức độ, chúng nên độc lập .
(Các giá trị phản hồi) có sự phân bố chuẩn
Để sử dụng sự phân bố F cho việc so sánh các biến thiên của sự biến thiên, chúng nên tuân theo sự phân bố chuẩn
B iến thiên tập hợp là như nhau ngang qua tất cả các mức độ của nhân tố
Nếu biến thiên khác nhau, Y có thể bị ảnh hưởng bởi các nhân tố khác nhau tại các mức độ xác định và sẽ dẫn đến một tập hợp với các đặc tính khác nhau. Và sẽ là vô nghĩa khi so sánh các biến thiên hoặc các trị số trung bình của các tập hợp với các dạng khác nhau
Bước 1 : Nói rõ vấn đề theo thực tế
Bước 2 : Thiết lập giả thuyết (Null hypothesis & Alternative hypothesis)
Trình tự phân tích ANOVA
Trình tự phân tích
Nói rõ vấn đề theo thực tế
Lập giả thuyết
Triển khai bảng ANOVA
Giải thích giá trị P-value
Xác nhận các giả thuyết cơ bản
Rút ra kết luận thực tế
Bước 3 : Xác định rằng các giả thuyết cơ bản dành cho ANOVA được thỏa mãn
Biến số đầu ra độc lập và thể hiện tính tiêu chuẩn
biến thiên tập hợp của biến số đầu ra là như nhau ngang qua tất cả các mức độ của các nhân tố.
Bước 4 : Triển khai bảng ANOVA
Bước 5 : Giải thích giá trị P-value
Nếu P-Value < , thì loại bỏ Ho.
Bước 7 : Biến kết luận thống kê thành kết luận thực tế
A B C D E
16.5
18.0
14.1
17.8
17.6
15.3
14.8
16.1
14.2
19.0
18.4
15.3
17.3
16.9
17.1
16.3
18.4
16.9
15.2
15.1
14.9
14.6
14.2
ANOVA sử dụng Minitab
Ví dụ) Tiến độ giao hàng bởi các nhà thầu phụ giao hàng
Công ty S đang cố gắng để rút ngắn tiến độ giao hàng. Như một sự nỗ lực, công ty đó đã điều tra sự sử dụng thời gian trên từng lần giao hàng bởi từng nhà thầu phụ giao hàng, như sau
Công ty chuẩn bị kiểm tra với ANOVA xem có bất kỳ sự khác biệt nào về tiến độ đối với từng lần giao hàng đơn bởi các nhà thầu phụ giao hàng không. Mức có nghĩa được đặt tại = 0.05 . (Tên file: ANOVA_AirTransport.mtw)
( Đơn vị: giờ )
H o : A = B = C = D = E
H 1 : Tối thiểu có một nhà thầu phụ có tiến độ giao hàng là khác.
Thiết lập giả thuyết
Nói rõ vấn đề theo thực tế
Sự khắc sâu có khác nhau theo từng vị trí không ?
Bước 1
Bước 2
Các b iến số đầu ra độc lập với nhau và thể hiện tính tiêu chuẩn
Các giả định của kiểu mẫu có hiệu quả hay không?
Chọn cột chứa dữ liệu
Bước 3
Minitab: Stat > Basic Statistics > Normality Test
1
2
Phương pháp kiểm tra dựa vào chức năng phân bố tích lũy kinh nghiệm
Phương pháp kiểm định dựa vào sự tương quan
Phương pháp kiểm định dựa vào sự phân bố chi-square
Sau kết quả kiểm định chuẩn của A,B,C,D and E các giá trị p-values lớn hơn 0.05. Cho nên, chúng tuân theo phân bố chuẩn.
Xác nhận kết quả
Các giả định của kiểu mẫu có hiệu quả hay không?
Tạo cột dữ liệu xếp chồng
Bước 3
Minitab: Data > Stack > Columns
1
2
Hãy xếp chồng và chọn cột dữ liệu
Nhập cột chứa dữ liệu đã được chọn
Nhập cột chứa nhân tố đã được chọn
STACK
UNSTACK
1
2
3
4
Các giả định của kiểu mẫu có hiệu quả hay không?
Tập hợp biến thiên của biến số đầu ra là như nhau qua tất cả các mức độ của nhân tố
Bước 3
Minitab: Stat > ANOVA > Test for Equal Variances
Dữ liệu sau khi xếp chồng,
lựa chọn cột để nhập dữ liệu đầu ra.
Chọn cột với nhân tố đã được nhập vào.
Nhập khoảng tin cậy 1- α
Từ kiểm định của Bartlett chỉ ra rằng giá trị P = 0.254 lớn hơn so với mức có ý nghĩa 0.05, chúng ta không thể nói rằng biến thiên của các nhà thầu phụ A, B, C, D, và E là khác nhau.
Xác nhận kết quả
Khi phân bố là
Bình thường
Khi phân bố là
không bình thường
1
2
3
4
5
7
6
Triển khai bảng ANOVA
Minitab: Stat > ANOVA > One-way
Bước 4
Chọn loại đồ thị
Chọn cột với dữ liệu ngõ ra đã được nhập
Chọn cột với nhân tố đã được nhập
Xác nhận kết quả
Từ giá trị p-value là 0.016 , chúng ta không thể nói rằng tiến trình giao nhận của tất cả nhà thầu phụ là giống nhau.
- (-----*----) đại diện 95% khoảng tin cậy đối với từng cấp của tập hợp.
- Nếu khoảng tin cậy bị trùng lắp, chúng ta không thể quyết định rằng: các giá trị trung bình của các loại là khác nhau.
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev -+---------+---------+---------+--------
A Air 5 16.800 1.617 (-------*-------)
B Air 4 15.100 0.804 (--------*-------)
C Air 5 17.380 1.434 (-------*------)
D Air 5 16.780 1.169 (-------*------)
E Air 4 14.700 0.392 (--------*--------)
-+---------+---------+---------+--------
13.5 15.0 16.5 18.0
Xác nhận kết quả
One-way ANOVA: C8 versus C7
Source DF SS MS F P
C7 4 24.20 6.05 4.10 0.016
Error 18 26.56 1.48
Total 22 50.75
Nếu p-Value < 0.05, thì loại bỏ giả thuyết không khác biệt (Ho)
Giải thích giá trị p-value
Bước 5
Total DF (Tổng số mẫu – 1)
= 23 - 1 = 22
DF của nhà thầu phụ (Số cấp – 1)
= 5 – 1 = 4
Error term’s FD
(Total DF – Location’s DF)
= 22 – 4 = 18
SS Location + SS Error = SS TOTAL
Biến thiên do sự khác biệt về hiệu quả giữa các cấp của các nhà thầu phụ được tính là 47.68% trong biến thiên tổng
Biến thiên gây ra bởi các nhà thầu phụ
Tổng biến thiên
= (24.20 /50.75) ×100
= 47.68%
×100
One-way ANOVA: C8 versus C7
Source DF SS MS F P
C7 4 24.20 6.05 4.10 0.016
Error 18 26.56 1.48
Total 22 50.75
Nếu p-value nhỏ hơn 5%, tối thiểu có một mức của trị trung bình là khác nhau
Trong trường hợp này, giả thuyết (H o ) cho rằng các trị số trung bình của tất cả các cấp là như nhau, bị loại bỏ.
Vì vậy, tiến độ giao hàng của ít nhất của một nhà thầu phụ là khác nhau
F statistic = MS Location /MS ERROR
= 6.05/1.48 = 4.10
Bình phương trung bình là sự biến thiên
được phân chia bởi DF
MS = SS/DF = 24.2/4=6.05
Biến kết luận thống kê thành kết luận thực tế
Sự biến thiên do sự khác biệt về hiệu quả giữa các cấp độ của các nhà thầu phụ được tính là 47.68% trong biến thiên tổng
SS(nhà thầu phụ) / SS(tổng) = 0.4768
Bởi vì giá trị P là 0,016, tiến độ giao hàng của các nhà thầu phụ giao hàng A, B, C, D và E không phải là giống nhau tất cả
Bước 6
Tóm tắt
ANOVA là một phương pháp kiểm tra xác định xem liệu sự khác biệt về các giá trị trung bình của hai hay nhiều hơn các tập hợp có đáng kể về mặt thống kê hay không
Giá trị P đạt được thông qua giá trị F của tỷ lệ biến thiên bằng cách so sánh sự biến thiên trong phạm vi các nhóm (bình phương trung bình) và biến thiên giữa các nhóm (bình phương trung bình)
Được so sánh với biến thiên tổng, chúng ta có thể nhận được tỷ lệ biến thiên, do sự khác biệt về hiệu quả giữa các cấp độ của nhân tố.
ANOVA được dựa trên các giả thuyết về tính độc lập , sự phân bố chuẩn và biến thiên như nhau .
Nói rõ vấn đề theo thực tế
Lập giả thuyết
Xác nhận các giả thuyết cơ bản
Triển khai bảng ANOVA
Giải thích giá trị P-value
Kiểm định mô hình phù hợp
Rút ra kết luận thực tế
Tính tiêu chuẩn
biến thiên như nhau
Phân tích số dư
1. Để điều tra sở thích màu sắc của máy cầm tay PCS, chúng tôi đã đo được sở thích màu sắc liên quan đến bốn màu dưới đây
Với dữ liệu tổng hợp dưới đây, hãy tiến hành một kiểm định để xem liệu có sự khác biệt về sở thích màu sắc hay không (Tại mức có ý nghĩa 5%)
(Tên file: ANOVA_Ex1.mtw)
23
23
18
15
30
28
32
30
18
14
20
15
31
27
26
28
30
Bài tập
Đỏ Trắng Xám Đen
2. 3 người bán hàng (A 1 , A 2 , A 3 ) giao các mặt hàng văn phòng cho công ty S.
Chúng ta đã đo được thời gian giao hàng của 3 người bán hàng đó khi S đặt hàng các mặt hàng văn phòng giống nhau. Với dữ liệu tổng hợp dưới đây, kiểm định để xác định xem liệu có sự khác biệt về thời gian giao hàng bởi các người bán hàng hay không (Tại mức có ý nghĩa 5%)
(Tên file : ANOVA_Ex2.mtw)
84.5
83.0
84.0
87.5
86.5
87.0
89.5
89.0
90.5
A 1
A 2
A 3
3. Chỉ số hài lòng về các chính sách phúc lợi của công ty đã được điều tra đối với từng phòng. Dưới đây là kết quả của chỉ số hài lòng trên từng phòng khi được ghi với thang điểm 10. Kiểm định để xác định xem liệu có sự khác biệt về chỉ số hài lòng trên từng phòng (Tại mức có ý nghĩa 5%)
(Tên file: ANOVA_Ex3.mtw)
A 1
8.1
7.8
8.8
8.5
8.2
A 2
7.4
7.0
8.9
8.0
8.8
A 3
6.8
7.6
8.6
7.1
8.7
7.5
A 4
8.8
7.6
8.6
7.1
8.7
7.5
Trả lời
1. Normality Test: A1(0.236), A2(0.410), A3(0.552), A4(0.723)
Test for Equal Variance: P-Value 0.492
ANOVA result: P-Value 0.000
Kết luận thực tế: Chúng ta có thể kết luận rằng màu sắc ảnh hưởng đến sở thích.
2. Normality Test: A1(0.487), A2(0.631), A3(0.487)
Test for Equal Variance: P-Value 0.840
ANOVA result: P-Value 0.000
Kết luận thực tế : Có sự khác biệt về tiến độ giao hàng trên từng nhà thầu phụ .
3. Normality Test: A1(0.879), A2(0.509), A3(0.373), A4(0.155)
Test for Equal Variance: P-Value 0.526
ANOVA result: P-Value 0.632
Kết luận thực tế : Không có sự khác biệt về sự hài lòng đối với các chính sách phúc lợi của công ty