Thử nghiệm sự tỷ lệ?
Định nghĩa thử nghiệm sự tỷ lệ 
Một thử nghiệm để xác định có hay không chấp nhận hoặc loại bỏ giả thuyết mẫu tỷ lệ dựa trên thử nghiệm thống kê 
 Thuật ngữ
 Sự tỷ lệ 
Nó nói đến sự tỷ lệ với thuộc tính chắc chắn trong tập hợp như là % lỗi, tỉ lệ hỗ trợ, tỉ lệ không được sử dụng. v.v 
 Mẫu tỷ lệ
Ước tính của tập hợp tỷ lệ p
                
              
                                            
                                
            
 
             
            Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 16: Thử nghiệm sự tỷ lệ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Thử nghiệm sự tỷ lệ 
 Mục tiêu học tập 
 - Hiểu cách ước tính tập hợp tỷ lệ sử dụng thống kê mẫu 
 - Biết được quá trình chấp nhận hoặc loại bỏ giả thuyết liên quan đến tập hợp tỷ lệ 
 - Biết được quy trình thử nghiệm đối xứng bằng việc sử dụng Minitab 
 1-Proportion Test 
 2-Proportions Test 
 Chi-Square Test 
Bản đồ chỉ dẫn thử nghiệm giả thuyết 
Stat -Tables - Chi-square Test 
Stat -Basic Stats -2 proportion 
Stat -Basic Stats -1 proportion 
Ho: m1 = m2 
H 1 : m1 ¹ m2 
Stat - Basic Stats - 2-Sample t 
 select “ assume equal variances” 
Ho: M1 = M (Target) 
H 1 : M1 ¹ M (Target) 
Stat - Nonparametric - 1 Sample-Sign or 
Stat - Nonparametric - 1 Sample-Wilcoxon 
Continuous Data 
 Normality Test 
Hypothesis Testing 
One-way 
ANOVA 
Discrete Data 
Chi-Square Test 
Ho: m1 = m2 = m3 = ... 
H 1 : at least one is different 
Stat - Anova- One-way 
Ho: Data is normal. 
H 1 : Data is not normal. 
Stat - Basic Stat - Normality Test 
When significance level  = 0.05 : 
If P-value >0.05 , cannot reject Ho 
If P-value <0.05 , reject Ho 
Normal Data 
CI for Standard Deviation 
One population 
Two or more 
population 
2 Sample t 
(variance equal ) 
2 Sample t 
(variance not equal) 
 1 Sample t or 
1 Sample Z 
Ho: m1 = m (target) 
H 1 : m1 ¹ m (target) 
Stat - Basic Stats - 1 Sample-t ( s is unknown) 
 1Sample Z ( s is known) 
1 Sample-Sign or 
1 Sample-Wilcoxon 
Mann-Whitney Test 
Two or more 
populations 
Two populations 
1-Proportion 
2-Proportion 
One population 
Two population 
Two or more 
population 
Non Normal Data 
Equal Variance 
Yes 
No 
Kruskal-Wallis Test 
One population 
Two 
populations 
Two or more 
populations 
Ho: M1 = M2 
H 1 : M1 ¹ M2 
Stat - Nonparametric - Mann-Whitney 
Ho: M1 = M2 = M3 = ... 
H 1 : at least one is different 
Stat - Nonparametric - Kruskal-Wallis 
Ho: m1 = m2 
H 1 : m1 ¹ m2 
Stat - Basic Stats - 2-Sample t 
do not select “ assume equal variances” 
 Test for Equal Variances 
(Levene’s Test) 
 Test for Equal Variances 
(F Test or Bartlett’s Test) 
Ho: s1 = s2 = s3 = .. ... 
H 1 : at least one is different 
Stat - Anova - Test for Equal Variances 
Use F-test when comparing two populations only 
Ho: s 1 = s (Target) 
H 1 : s 1 ¹ s (Target) 
Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu. 
 Stat -Basic Statistics - Display Descriptive Stats 
Two-way 
ANOVA 
 Định nghĩa thử nghiệm sự tỷ lệ 
Một thử nghiệm để xác định có hay không chấp nhận hoặc loại bỏ giả thuyết mẫu tỷ lệ dựa trên thử nghiệm thống kê 
 Thuật ngữ 
 Sự tỷ lệ 
Nó nói đến sự tỷ lệ với thuộc tính chắc chắn trong tập hợp như là % lỗi, tỉ lệ hỗ trợ, tỉ lệ không được sử dụng. v.v 
 Mẫu tỷ lệ 
Ước tính của tập hợp tỷ lệ p 
Thử nghiệm sự tỷ lệ ? 
Mẫu tỷ lệ 
X 
n 
p 
(Ơ đây, n: số mẫu, 
 X: Số nhân tố với thuộc tính chắc chắn) 
Tổng quan về thử nghiệm tỷ lệ 
 Các loại của thử nghiệm tỷ lệ 
 Thử nghiệm tỷ lệ cho 1 tập hợp 
1-Proportion test 
Ví dụ) Ư ớ c tính hoặc thử nghiệm của tập hợp tỷ lệ thông qua khảo sát lấy mẫu của tỉ lệ chương trình TV. 
 Thử nghiệm tỷ lệ cho 2 tập hợp 
2-Proportion test 
Ví dụ) Thử nghiệm sự khác nhau đáng kể giữa tỉ lệ % lỗi của 2 nhà máy. 
 Thử nghiệm tỷ lệ cho 2 tập hợp hoặc nhiều hơn 
Chi-Square Test 
Ví dụ) Thử nghiệm sở thích của 3 loại điện thoại tùy theo tuổi. 
 H 0 : p 1 =p 2 = ···= p k 
 H 1 : Tối thiểu có 1 tập hợp là khác 
 H 0 : p = p 0 (target) 
 H 1 : p < p 0 
 p > p 0 
 p  p 0 
 Chọn 1 
 H 0 : p 1 = p 2 
 H 1 : p 1 < p 2 
 p 1 > p 2 
 p 1  p 2 
 Chọn 1 
Bước 2 : Xác định mức có ý nghĩa (  ) 
Trình tự phân tích 
Thiết lập giả thuyết 
Chọn thử nghiệm thống kê 
Tính P-value 
Rút ra kết luận thống kê 
Xác định mức có ý nghĩa 
Chuyển đổi sang kết luận thực tế 
Bước 3 : Chọn thử nghiệm thống kê 
Bước 1 : Thiết lập giả thuyết 
 (H o ) và (H 1 ) 
Bước 4 : Tính P-value sử dụng Minitab 
Bước 5 : P-value < mức có ý nghĩa(  )  giả thuyết Ho bị loại bỏ 
Bước 6 : Chuyển đổi sang kết luận thực tế 
1 Proportion Test 
 Ví dụ 
Phòng kinh doanh báo cáo chỉ số thõa mãn của khách hàng về một sản phẩm của công ty là trên 80%. Để xác nhận khẳng định này, thì công ty đã làm một cuộc điều tra với 500 khách hàng, và 460 trong số họ đã trả lời là thỏa mãn với sản phẩm này. 
Thử nghiệm 5% mức để xem xét nếu báo cáo của phòng kinh doanh đáng tin cậy 
[Câu hỏi thống kê] 
Nếu mẫu tỷ lệ ( ) là 0.92, chúng ta có thể nói rằng nó lớn hơn tập hợp tỷ lệ ( ) của 0.8? 
- Mẫu quan sát 
- Sự khẳng định về tập hợp 
 Thử nghiệm 1-Proportion sử dụng Minitab 
 Thiết lập giả thuyết 
> H o: p = 0.8 
H 1: p > 0.8 
 Xác định mức có ý nghĩa 
> Thông thường là α = 5% (0.05) 
> Mặt khác, nếu không xác định được, Minitab dùng 5% như là mức có ý nghĩa. 
> Trong Minitab, mức tin cậy (1- α ) được nhập vào thay cho mức có ý nghĩa. 
Ví dụ) Nếu α = 5%, giá trị nhập vào Minitab sẽ là 95.0 
 Chọn thử nghiệm thống kê 
> Chọn thử nghiệm 1-Proportion 
Bước 1 
Bước 2 
Bước 3 
2 
3 
5 
4 
6 
7 
8 
1 
Stat > Basic Statistics > 1 Proportion 
Số thử nghiệm (cỡ mẫu) và các số lượng thành công trong phần sở thích (đó là, số người ủng hộ trong tỷ lệ hỗ trợ, số hàng sai sót trong trường hợp % sai sót) 
H1: p < p o  less than 
 p  p o  not equal 
 p > p o  greater than 
 Kết luận thống kê 
> Từ P-value = 0.000 < 0.05, H 0 bị loại bỏ.. 
 Kết luận thực tế 
> Chỉ số thõa mãn của khách hàng về một sản phẩm của công ty là trên 80%. 
Bước 4 
 Tính P-value 
Bước 5 
Bước 6 
Test and CI for One Proportion 
Test of p = 0.5 vs p not = 0.5 
 Exact 
Sample X N Sample p 95% CI P-Value 
1 460 500 0.920000 (0.892655, 0.942234) 0.000 
 Ví dụ 
Để xác nhận nếu có sự khác nhau về tỉ lệ đặt hàng tự động của phòng mua bán của GBM A và B, 250 và 200 đơn vị được làm mẫu GBM A và GBM B theo lần lượt. Các kết quả đã cho dưới đây. Thực hiện thử nghiệm 5% mức tương đối để xác định nếu có sự khác nhau về hệ số P/O tự động. 
[Câu hỏi thống kê] 
Nếu mẫu tỷ lệ qủa qui trình A là 0.44, và mẫu tỷ lệ của qui trình B là 0.52, chúng ta có thể nói rằng sự khác nhau trong phân bố tập hợp là đáng kể ? 
 Mẫu quan sát 
- Sự khẳng định về tập hợp 
2 Proportions Test 
Sự mô tả 
Số lượng mẫu 
Số lần đặt hàng tự động 
GBM A 
250 
110 
GBM B 
200 
104 
Total 
450 
214 
 2-Proportions Test using Minitab 
 Thiết lập giả thuyết 
> H o : p 1 = p 2 
> H 1 : p 1  p 2 
 Xác định mức có ý nghĩa 
> Thông thường là α = 5% (0.05). 
> Mặt khác, nếu không xác định được, Minitab dùng 5% như là mức có ý nghĩa. 
> Trong Minitab, mức tin cậy (1- α ) được nhập vào thay cho mức có ý nghĩa. 
Ví dụ) Nếu α = 5%, giá trị nhập vào Minitab sẽ là 95.0 
 Chọn thử nghiệm thống kê 
> Chọn thử nghiệm 2-Proportion 
Bước 1 
Bước 2 
Bước 3 
2 
3 
5 
4 
6 
8 
1 
7 
Stat > Basic Statistics > 2 Proportions 
Số lần thử nghiệm và số lần thành công trong khu vực quan sát. 
Trong trường hợp có sự khác biệt trong tỉ lệ thiết lập trong giả thuyết vô hiệu là 0 (zero) (Test Difference = 0) 
H1: p 1 < p 2  less than 
 p 1  p 2  not equal 
 p 1 > p 2  greater than 
Test and CI for Two Proportions 
Sample X N Sample p 
1 110 250 0.440000 
2 104 200 0.520000 
Difference = p (1) - p (2) 
Estimate for difference: -0.08 
95% CI for difference: (-0.172630, 0.0126298) 
Test for difference = 0 (vs not = 0): Z = -1.69 P-Value = 0.091 
 Kết luận thống kê 
> Từ P-value = 0.091 > 0.05, H 0 không thể bị loại bỏ.. 
 Kết luận thực tế 
> Chúng ta không thể nói rằng có sự khác nhau trong các đơn đặt hàng tự động giữa GBM A và GBM B. 
Bước 4 
Tính P-value 
Bước 5 
Bước 6 
95% khoảng tin cậy cho sự khác biêṭ trong tập hợp tỷ lệ . 
Chi-Square Test 
 Ví dụ 
Công ty SS ra đời 3 dòng điện thoại di động và chọn ngẫu nhiên 367 người khảo sát có hay không khách hàng yêu thích cho chiếc điện thoại này khác tùy theo độ tuổi. Kết quả khảo sát như bên dưới. Khách hàng yêu thích cho mẫu khác nhau về độ tuổi? (tên file: Chi_Mobile.mtw) 
[Câu hỏi thống kê] 
Khi chúng ta biết được sự cân xứng mẫu điện thoại ưu tiên theo độ tuổi, chúng ta có thể nói rằng khác nhau về cân xứng tập hợp theo độ tuổi là có ý nghĩa ? 
	 10’s	 20’s	 30’s 	40’s	 50’s 
Model 1 	 13 	 5	 8	 21	 43 
Model 2 	 18	 10	 36	 56	 29 
Model 3 	 16	 16	 35	 51	 10 
 Chi-Square Test sử dụng Minitab 
 Thiết lập giả thuyết 
> Giả thuyết vô hiệu H 0: 	( p 11 =p 12 =p 13 =p 14 =p 15 ), 
 	 (p 21 = p 22 =p 23 =p 24 = p 25 ), 
 	 (p 31 =p 32 =p 33 =p 34 =p 35 ) 
> Giả thuyết thay thế H 1: H 0 là sai. 
 Xác định mức có ý nghĩa 
> Thông thường thì α = 5% (0.05) 
 Chọn thử nghiệm thống kê 
> Chọn Chi-Square Test 
Bước 1 
Bước 2 
Bước 3 
2 
1 
Đối với 1-Proportion test và 2-Proportions test, số lần thử và số lần thành công được nhập vào. Nhung đối với Chi-Square test, thì số thành công, số thất bại được nhập vào. 
Stat > Tables > Chi-Square Test (Two-Way Table in Worksheet) 
Bước 4 
Tính P-value 
Chi-Square Test: 10s, 20s, 30s, 40s, 50s 
Expected counts are printed below observed counts 
Chi-Square contributions are printed below expected counts 
 10s 20s 30s 40s 50s Total 
 1 13 5 8 21 43 90 
 11.53 7.60 19.37 31.39 20.11 
 0.189 0.891 6.677 3.439 26.058 
 2 18 10 36 56 29 149 
 19.08 12.59 32.07 51.97 33.29 
 0.061 0.531 0.481 0.313 0.553 
 3 16 16 35 51 10 128 
 16.39 10.81 27.55 44.64 28.60 
 0.009 2.489 2.013 0.905 12.096 
Total 47 31 79 128 82 367 
Chi-Sq = 56.705, DF = 8, P-Value = 0.000 
 Kết luận thống kê 
Từ P-value( = 0.000) < mức có ý nghĩa 0.05, H 0 có thể bị loại bỏ.. 
 Kết luận thực tế 
Sự yêu thích mẫu điện thoại thì khác nhau theo tuổi. 
Tuy nhiên, phân tích thống kê trên không ngụ ý rằng nhóm tuổi l2 khác nhau. 
Bước 5 
Bước 6 
Khi tung ra dòng điện thoại di động, sẽ rất cần thiết để phân khúc khách hàng theo tuổi. Do đó, nếu chúng ta muốn nhận dạng nhóm tuổi đó khác biệt nhất, chúng ta cần tận dụng thống kê thử nghiệm mỗi độ tuổi. 
Tóm tắt 
 Proportion test 
Khi bạn có 1 mẫu tỷ lệ và bạn ước lượng tỷ lệ hoặc thử nghiệm giả thuyết của 1 tập hợp, áp dụng thử nghiệm 1-Proportion. 
( Stat > Basic Statistics > 1 Proportion) 
Khi bạn có 2 mẫu tỷ lệ và bạn ước lượng hoặc thử nghiệm sự khác nhau giữa 2 tập hợp tỷ lệ đó, áp dụng thử nghiệm 2-Proportion. 
( Stat > Basic Statistics > 2 Proportions) 
Khi bạn thử nghiệm phương sai tương đương của hai hoặc nhiều tập hợp tỷ lệ , thì áp dụng Chi-square test. 
( Stat > Tables > Chi-square Test) 
 Phân tích định lượng cho dữ liệu rời rạc 
Những nhân tố quan trọng có thể được chọn lựa thông qua thử nghiệm tỷ lệ của dữ liệu rời rạc. 
Cho việc chọn lựa những nhân tố then chốt (đó là, Vital Few X’s), xem lại có hay không mục tiêu đề tài có thể đạt được,và rồi chuyển chúng vào giai đoạn tối đa hóa kết hợp với những nhân tố đã được xác định. 
Để kiểm tra tỉ lệ nghỉ hưu của công nhân nữ tại GBM A, 120 nhân viên nữ gia nhập công ty từ quý 4 năm 2003, và 15 người trong số đó đã nghỉ hưu. Xác định khoảng tin cậy của tỉ lệ nghỉ hưu tại 95% mức tin cậy? 
2. 	Tỉ lệ đơn đặt hàng tự động của GBM A được biết là 0.118. Khi 100 đơn đặt hàng được lấy ngẫu nhiên để làm mẫu khảo sát, 9 đơn đặt hàng được phát hiện là đơn đặt hàng tự động. Chúng ta có thể nói rằng có sự thay đổi trong tỉ lệ đơn đặt hàng tự động ? (Ghi chú.  = 0.05) 
3. GBM A và GBM B khảo sát tỉ lệ nhân viên, những người muốn làm việc ngày thứ 7. Để thấy được có hay không tỉ lệ khác nhau giữa 2 GBM, 120 và 150 nhân viên được chọn ngẫu nhiên từ 2 GBM, theo thứ tự định sẵn. Kết quả chỉ ra rằng 12 từ GBM A và 9 từ GBM B muốn làm việc vào ngày thứ 7. Khoảng tin cậy được xác định là 95% cho sự khác nhau trong tỉ lệ người muốn làm việc vào ngày thứ 7 giữa GBM A và GBM B. 
4. 	Trong bài tập số 3, chúng ta có thể nói rằng tỉ lệ người muốn đi làm ngày thứ 7 là khác nhau giữa 2 GBM không? Thử nghiệm với mức có ý nghĩa là  = 0.05. 
Bài tập 
5. 	 S điện tử đã cho ra hai mẫu máy tính xách tay mới, và thực hiện khảo sát trên một khách hàng ưu tiên. Để khảo sát sự khác nhau ưu tiên theo nhóm tuổi, kết quả được tóm tắt theo bảng dưới đây. Chúng ta có thể khẳng định rằng sự yêu thích của máy xách tay A và B khác nhau tùy theo độ tuổi không? Thử nghiệm tại mức tương đối α = 0,05. 
Age group 
Máy xách tay A 
Máy xách tay B 
Số người được hỏi 
20 và nhỏ hơn 
65 
58 
123 
30 và nhỏ hơn 
52 
86 
138 
40 và nhỏ hơn 
43 
41 
84 
50 và nhỏ hơn 
48 
58 
106 
 Trả lời 
1.	( 0.071680, 0.197776) 
2.	Chúng ta không thể nói rằng có sự thay đổi trong tỉ lệ đơn đặt hàng tự động 
 ( P-value = 0.442) 
3.	 (-0.0257684, 0.105768) 
4.	 Chúng ta không thể nói rằng có sự khác nhau giữa 2 GBM. 
 (P-Value = 0.223) 
5.	 Chúng ta không thể nói rằng có sự yêu thích khác nhau tùy thoe độ tuổi 
 (P-Value = 0.068)