Mục đích kiểm tra biến thiên bằng nhau
“Kiểm tra biến thiên bằng nhau” được thực hiện để kiểm tra thống kê xem liệu có bất kỳ chênh lệch nào về biến thiên giữa các đối tượng được so sánh hay không.
Điều kiện ban đầu để thực hiện kiểm tra của các trị số trung bình dành cho hai tập hợp.
Ví dụ: Liệu chúng ta có thể nói rằng các trường hợp sau đây có các biến thiên như nhau tương ứng hay không?
Kiểm tra thống kê luôn luôn gợi ý các kết quả đồng nhất của phân tích (ra quyết định)
Bạn đang xem nội dung tài liệu Bài giảng Six sigma - Chương 14: Kiểm định biến thiên bằng nhau, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Mục tiêu học tập
Hiểu được làm thế nào để so sánh các biến thiên của hai tập hợp
Hiểu được trình tự của việc xác định nên chấp nhận hay từ chối một giả thuyết
được ứng dụng cho hai biến thiên
Phân tích các ví dụ khác nhau thông qua bài tập Minitab
Test for Equal Variances
Kiểm định biến thiên bằng nhau
Sơ đồ thử nghiệm giả thiết
Stat -Tables - Chi-square Test
Stat -Basic Stats -2 proportion
Stat -Basic Stats -1 proportion
Ho: m1 = m2
H 1 : m1 ¹ m2
Stat - Basic Stats - 2-Sample t
select “ assume equal variances”
Ho: M1 = M (Target)
H 1 : M1 ¹ M (Target)
Stat - Nonparametric - 1 Sample-Sign or
Stat - Nonparametric - 1 Sample-Wilcoxon
Continuous Data
Normality Test
Hypothesis Testing
One-way
ANOVA
Discrete Data
Chi-Square Test
Ho: m1 = m2 = m3 = ...
H 1 : at least one is different
Stat - Anova- One-way
Ho: Data is normal.
H 1 : Data is not normal.
Stat - Basic Stat - Normality Test
When significance level = 0.05 :
If P-value >0.05 , cannot reject Ho
If P-value <0.05 , reject Ho
Normal Data
CI for Standard Deviation
One population
Two or more
population
2 Sample t
(variance equal )
2 Sample t
(variance not equal)
1 Sample t or
1 Sample Z
Ho: m1 = m (target)
H 1 : m1 ¹ m (target)
Stat - Basic Stats - 1 Sample-t ( s is unknown)
1Sample Z ( s is known)
1 Sample-Sign or
1 Sample-Wilcoxon
Mann-Whitney Test
Two or more
populations
Two populations
1-Proportion
2-Proportion
One population
Two population
Two or more
population
Non Normal Data
Equal Variance
Yes
No
Kruskal-Wallis Test
One population
Two
populations
Two or more
populations
Ho: M1 = M2
H 1 : M1 ¹ M2
Stat - Nonparametric - Mann-Whitney
Ho: M1 = M2 = M3 = ...
H 1 : at least one is different
Stat - Nonparametric - Kruskal-Wallis
Ho: m1 = m2
H 1 : m1 ¹ m2
Stat - Basic Stats - 2-Sample t
do not select “ assume equal variances”
Test for Equal Variances
(Levene’s Test)
Test for Equal Variances
(F Test or Bartlett’s Test)
Ho: s1 = s2 = s3 = .. ...
H 1 : at least one is different
Stat - Anova - Test for Equal Variances
Use F-test when comparing two populations only
Ho: s 1 = s (Target)
H 1 : s 1 ¹ s (Target)
Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu.
Stat -Basic Statistics - Display Descriptive Stats
B iến thiên là gì?
Một giá trị chỉ ra độ dàn trải của dữ liệu. Một đo lường đại diện, hiển thị độ phân tán
Sự phân tán nhỏ của dữ liệu
Dữ liệu được tập trung quanh trị số trung bình
Dạng mong muốn của sự phân bố
Kiểm định biến thiên bằng nhau
Yêu cầu của khách hàng
Sự phân tán lớn của dữ liệu
Dữ liệu rời rạc quanh trị số trung bình
Giống như một quá trình cần được cải tiến
Mục đích kiểm tra biến thiên bằng nhau
“K iểm tra biến thiên bằng nhau ” được thực hiện để kiểm tra thống kê xem liệu có bất kỳ chênh lệch nào về biến thiên giữa các đối tượng được so sánh hay không.
Điều kiện ban đầu để thực hiện kiểm tra của các trị số trung bình dành cho hai tập hợp.
Ví dụ: Liệu chúng ta có thể nói rằng các trường hợp sau đây có các biến thiên như nhau tương ứng hay không?
Kiểm tra thống kê luôn luôn gợi ý các kết quả đồng nhất của phân tích (ra quyết định)
Trường hợp 1
Trường hợp 2
Trường hợp 3
Tổng quát
Trình tự của kiểm tra biến thiên bằng nhau
Thiết lập giả thuyết
Kiểm tra bình thường dữ liệu
Phân tích biểu đồ
Phân tích thống kê
Ra quyết định
Quy trình phân tích thống kê
Chọn thử nghiệm thống kê
Xác định mức α
Xác định khu vực loại bỏ
Kiểm tra thống kê
Tính P-Value
Thực hiện Minitab
Kiểm tra P-Value
Số tập hợp
là đối tượng
so sánh
1 population
2 populations
3 or more populations
Bartlett’s Test
Phân bố thường
Phân bố không thường
Levene’s Test
χ 2 -Test
F-Test
Phân bố thường
Phân bố không thường
Levene’s Test
Phân bố thường
Phân bố
không thường
Sai lệch chuẩn là vô nghĩa
Minitab hỗtrợ
2 Variances..
Test for Equal Variances..
Trình tự phân tích (Hai tập hợp hoặc nhiều hơn)
Bước 1 : Thiết lập giả thiết
- Null hypothesis(H 0 ): thực tế đã biết
- Alternative hypothesis(H 1 ): Sự khẳng định nếu bạn muốn xác nhận
Thiết lập giả thiết
Phân tích đồ thị
Phân tích thống kê
Rút ra kết luận
Kiểm tra sự bình thường
Bước 2 : Kiểm nghiệm sự bình thường của dũ liệu
- Xem lại xem dữ liệu có bình thường hay không
Bước 3 : Phân tích đồ thị
- Xác định bằng mắt sự khác biệt về phân tán
Bước 4 : Phân tích thống kê
- Xác nhận thống kê sự khác biệt về độ phân tán
- Minitab: Stat > ANOVA > Test for Equal Variances
or Stat > Basic Statistics > 2 Variances
- Xác nhận giá trị P-Value
Bước 5 : Rút ra kết luận
- Rút ra kết luận thống kê và kết luận theo thực tế
- Nếu P-Value nhỏ hơn mức có nghĩa ( α ), loại bỏ Ho
Ví dụ
Chúng tôi muốn điều tra xem liệu có bất kỳ khác biệt nào trong việc sử dụng giấy A4, một trong những mặt hàng cung cấp cho văn phòng. Vì mục đích này, hai phòng được lựa chọn để phân tích biến thiên của họ trong việc sử dụng giấy trong 15 tuần. Bảng dưới đây thể hiện các số đo. Kiểm định để xác định liệu các biến thiên có giống nhau không ( Tên file: 2 Variances.mtw )
H 1 : σ A ≠ σ B
σ A > σ B
σ A < σ B
Độ phân tán của phòng A và của phòng B là khác nhau.
Độ phân tán của phòng A lớn hơn của phòng B.
Độ phân tán của phòng A nhỏ hơn của phòng B
Giả thuyết thay thế (H 1 )
H 0 : σ A = σ B
Không có sự khác biệt về độ phân tán giữa phòng A và phòng B liên quan đến lượng giấy A4 được sử dụng .
Giả thuyết không khác biệt (H 0 )
Biểu thức toán học
Câu lệnh tường thuật
Loại giả thuyết
Phòng A
8.5
9.2
8.9
9.9
7.8
7.5
9.9
9.7
8.4
9.1
8.2
8.6
8.6
8.2
9.0
Phòng B
8.4
8.5
8.2
8.4
8.4
8.9
8.2
9.1
8.7
8.7
8.5
7.9
8.7
8.0
8.2
Bước 1: Thiết lập giả thuyết
Giả thuyết không khác biệt (Null hypothesis)
Giả thuyết thay thế (Alternative hypothesis)
Bước 2: Kiểm tra sự bình thường của dữ liệu
Minitab: Stat > Basic Statistics > Normality Test
2
1
Lựa chọn phương pháp kiểm tra phù hợp
AD: Mặc định. Dựa vào chức năng phân bố tích lũy kinh nghiệm
RJ: Dựa vào hệ số của sữ tương quan
KS: Dựa vào Chi-Square
Kết quả thực hiện từ Minitab
Bởi vì cả hai giá trị P-values đều lớn hơn 0.05, cả hai dữ liệu đều hợp chuẩn
Bước 3: Phân tích đồ thị
Sử dụng đồ thị, xem lại sơ qua sự khác biệt về các biến thiên .
Minitab : Graph > Box Plot > Multiple Y’s, Simple
Bạn có thể rút ra phán đoán trực quan gì từ phân tích đồ thị?
3
1
2
1
3
4
Bước 4: Phân tích thống kê (tt)
Kiểm định dành cho các biến thiên như nhau
Cài đặt các cột với dữ liệu xếp chồng. Có thể so sánh các biến thiên của hai nhóm hoặc hơn
Xếp thành chồng dữ liệu
Đặt mức độ tin cậy
2
5
Kết quả thực hiện từ Minitab
Bước 5: Rút ra kết luận
Từ giá trị P-Value là 0.006, nhỏ hơn 0.05, loại bỏ Ho.
Vì vậy, sự phân bố của việc sử dụng giấy A4 tại phòng A và B là khác nhau
Xác định phương pháp kiểm định
Nếu dữ liệu được tách ra từ sự phân bố chuẩn, sử dụng F-Test hoặc Bartlett-Test (3 tập hợp hoặc nhiều hơn)
Thậm chí nếu dữ liệu không từ sự phân bố chuẩn, nếu nó được tách ra từ sự phân bố liên tục, sử dụng Levene’s test
Bước 4: Phân tích thống kê (tt)
Tóm tắt và ứng dụng
Tóm tắt kiểm tra biến thiên bằng nhau
kiểm tra biến thiên bằng nhau là phương pháp kiểm tra nhằm xác định xem liệu có bất kỳ sự khác biệt thống kê đáng kể nào về các biến thiên của hai mẫu hoặc hơn không.
Trình tự kiểm tra dành cho các biến thiên như nhau được thể hiện như sau:
Thiết lập giả thiết Kiểm tra tính bình thường Phân tích đồ thị Phân tích thống kê Rút ra kết luận
Sẽ quan trọng khi đạt được sự giải thích thực tế một cách đúng đắn hơn là kết luận thống kê.
Ứng dụng của kiểm tra dành cho các biến thiên như nhau
Trong việc ứng dụng kiểm tra 2 samples nếu các biến thiên của hai tập hợp giống nhau, lựa chọn “Giả thiết các biến thiên như nhau”. Bằng cách làm như vậy, bạn có thể nâng cao độ chính xác của kiểm tra.
Sẽ là giả thuyết cơ bản dành cho phân tích ANOVA như là One-way ANOVA và Two-way ANOVA, v.v... Nếu giả thuyết cơ bản này không được thiết lập, phân tích là vô nghĩa.
Đó là một giả thuyết cơ bản dành cho phân tích DOE
Bài tập
1 Dữ liệu được thu thập về số giờ làm việc của nhân viên phòng A và phòng B trong 10 ngày. Trong khi các công nhân của phòng A làm thêm giờ rất nhiều, thì các công nhân của phòng B có xu hướng ra về tương đối đúng giờ. Tiến hành kiểm định dành cho các biến thiên như nhau tại mức có nghĩa 5%.
(Tên file: Test for equal variances _exercise 1.mtw)
Phòng A: 10.6, 11.3, 13.7, 10.6, 12.5, 9.8, 10.8, 13.9, 13.8, 10.0 (giờ)
Phòng B: 9.0, 8.5, 10.0, 10.5, 9.6, 8.9, 10.1, 10.5, 9.1, 9.9 (giờ)
2. Linh kiện A có độ chính xác cao nhưng rất đắt. Ngược lại, linh kiện B rẻ hơn linh kiện A nhưng có độ chính xác thấp hơn. Dữ liệu sau đây đạt được bằng cách lấy 15 mẫu từ các sản phẩm được sản xuất với lần lượt các linh kiện. Tiến hành kiểm định dành cho các biến thiên như nhau tại mức có nghĩa 5%.
(Tên file: Test for equal variances _exercise 2.mtw)
Part A: 53, 52, 56, 54, 58, 51, 50, 49, 48, 53, 58, 53, 55, 52, 55 (kg)
Part B: 48, 47, 49, 57, 55, 51, 57, 46, 55, 63, 52, 48, 51, 56, 50 (kg)
3. Dữ liệu dưới đây thể hiện sự sử dụng internet từng tuần của 5 nhân viên trong 15 tuần. Kiểm định để xác nhận xem liệu các biến thiên dành cho các lần sử dụng internet trên mỗi nhân viên có giống nhau hay không.
(Tên file: Test for Equal Variances_Ex3.mtw )
(Đơn vị tính: giờ)
Tuần
Nhân viên A
Nhân viên B
Nhân viên C
Nhân viên D
Nhân viên E
1
5
5.02
4.92
4.99
4.83
2
5
5.03
4.9
5.02
4.69
3
4.92
4.9
4.84
5.01
5.32
4
4.99
4.89
4.93
4.93
5.09
5
5.03
5.07
4.9
4.97
5.12
6
4.9
4.91
4.85
5.16
5.18
7
4.91
5.07
4.9
4.94
4.85
8
5.03
5.03
4.95
5.03
4.91
9
5.01
5
4.93
4.89
5.05
10
4.99
5.06
4.91
4.97
5.06
11
5.01
5.08
4.93
5
4.94
12
5
5.01
4.86
5.11
5.03
13
5.04
5.13
4.93
4.99
5.09
14
4.99
5.12
4.94
5.05
5
15
5.06
4.94
4.94
4.99
5.14
Trả lời
1. Từ giá trị P-Value = 0.020 (<0.05), loại bỏ Ho.
⇒ Có thể nói rằng các biến thiên của thời gian làm việc trung bình của hai phòng là khác nhau
2. Từ giá trị P-Value=0.095 (>0.05) không thể loại bỏ Ho . ⇒ Không thể nói rằng các biến thiên của trọng lượng sản phẩm dành cho hai linh kiện là khác nhau.
3. Từ Levene’s Test, giá trị P-Value=0.001, (<0.05), loại bỏ Ho.
⇒ Các biến thiên của các lần sử dụng internet của các nhân viên là khác nhau .