Bài giảng Six sigma - Chương 16: Thử nghiệm sự tỷ lệ

Thử nghiệm sự tỷ lệ? Định nghĩa thử nghiệm sự tỷ lệ Một thử nghiệm để xác định có hay không chấp nhận hoặc loại bỏ giả thuyết mẫu tỷ lệ dựa trên thử nghiệm thống kê Thuật ngữ Sự tỷ lệ Nó nói đến sự tỷ lệ với thuộc tính chắc chắn trong tập hợp như là % lỗi, tỉ lệ hỗ trợ, tỉ lệ không được sử dụng. v.v Mẫu tỷ lệ Ước tính của tập hợp tỷ lệ p

ppt22 trang | Chia sẻ: thuyduongbt11 | Lượt xem: 481 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 16: Thử nghiệm sự tỷ lệ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Thử nghiệm sự tỷ lệ Mục tiêu học tập - Hiểu cách ước tính tập hợp tỷ lệ sử dụng thống kê mẫu - Biết được quá trình chấp nhận hoặc loại bỏ giả thuyết liên quan đến tập hợp tỷ lệ - Biết được quy trình thử nghiệm đối xứng bằng việc sử dụng Minitab 1-Proportion Test 2-Proportions Test Chi-Square Test Bản đồ chỉ dẫn thử nghiệm giả thuyết Stat -Tables - Chi-square Test Stat -Basic Stats -2 proportion Stat -Basic Stats -1 proportion Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t select “ assume equal variances” Ho: M1 = M (Target) H 1 : M1 ¹ M (Target) Stat - Nonparametric - 1 Sample-Sign or Stat - Nonparametric - 1 Sample-Wilcoxon Continuous Data Normality Test Hypothesis Testing One-way ANOVA Discrete Data Chi-Square Test Ho: m1 = m2 = m3 = ... H 1 : at least one is different Stat - Anova- One-way Ho: Data is normal. H 1 : Data is not normal. Stat - Basic Stat - Normality Test When significance level  = 0.05 : If P-value >0.05 , cannot reject Ho If P-value <0.05 , reject Ho Normal Data CI for Standard Deviation One population Two or more population 2 Sample t (variance equal ) 2 Sample t (variance not equal) 1 Sample t or 1 Sample Z Ho: m1 = m (target) H 1 : m1 ¹ m (target) Stat - Basic Stats - 1 Sample-t ( s is unknown) 1Sample Z ( s is known) 1 Sample-Sign or 1 Sample-Wilcoxon Mann-Whitney Test Two or more populations Two populations 1-Proportion 2-Proportion One population Two population Two or more population Non Normal Data Equal Variance Yes No Kruskal-Wallis Test One population Two populations Two or more populations Ho: M1 = M2 H 1 : M1 ¹ M2 Stat - Nonparametric - Mann-Whitney Ho: M1 = M2 = M3 = ... H 1 : at least one is different Stat - Nonparametric - Kruskal-Wallis Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t do not select “ assume equal variances” Test for Equal Variances (Levene’s Test) Test for Equal Variances (F Test or Bartlett’s Test) Ho: s1 = s2 = s3 = .. ... H 1 : at least one is different Stat - Anova - Test for Equal Variances Use F-test when comparing two populations only Ho: s 1 = s (Target) H 1 : s 1 ¹ s (Target) Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu. Stat -Basic Statistics - Display Descriptive Stats Two-way ANOVA Định nghĩa thử nghiệm sự tỷ lệ Một thử nghiệm để xác định có hay không chấp nhận hoặc loại bỏ giả thuyết mẫu tỷ lệ dựa trên thử nghiệm thống kê Thuật ngữ Sự tỷ lệ Nó nói đến sự tỷ lệ với thuộc tính chắc chắn trong tập hợp như là % lỗi, tỉ lệ hỗ trợ, tỉ lệ không được sử dụng. v.v Mẫu tỷ lệ Ước tính của tập hợp tỷ lệ p Thử nghiệm sự tỷ lệ ? Mẫu tỷ lệ X n p (Ơ đây, n: số mẫu, X: Số nhân tố với thuộc tính chắc chắn) Tổng quan về thử nghiệm tỷ lệ Các loại của thử nghiệm tỷ lệ Thử nghiệm tỷ lệ cho 1 tập hợp 1-Proportion test Ví dụ) Ư ớ c tính hoặc thử nghiệm của tập hợp tỷ lệ thông qua khảo sát lấy mẫu của tỉ lệ chương trình TV. Thử nghiệm tỷ lệ cho 2 tập hợp 2-Proportion test Ví dụ) Thử nghiệm sự khác nhau đáng kể giữa tỉ lệ % lỗi của 2 nhà máy. Thử nghiệm tỷ lệ cho 2 tập hợp hoặc nhiều hơn Chi-Square Test Ví dụ) Thử nghiệm sở thích của 3 loại điện thoại tùy theo tuổi. H 0 : p 1 =p 2 = ···= p k H 1 : Tối thiểu có 1 tập hợp là khác H 0 : p = p 0 (target) H 1 : p < p 0 p > p 0 p  p 0 Chọn 1 H 0 : p 1 = p 2 H 1 : p 1 < p 2 p 1 > p 2 p 1  p 2 Chọn 1 Bước 2 : Xác định mức có ý nghĩa (  ) Trình tự phân tích Thiết lập giả thuyết Chọn thử nghiệm thống kê Tính P-value Rút ra kết luận thống kê Xác định mức có ý nghĩa Chuyển đổi sang kết luận thực tế Bước 3 : Chọn thử nghiệm thống kê Bước 1 : Thiết lập giả thuyết (H o ) và (H 1 ) Bước 4 : Tính P-value sử dụng Minitab Bước 5 : P-value < mức có ý nghĩa(  )  giả thuyết Ho bị loại bỏ Bước 6 : Chuyển đổi sang kết luận thực tế 1 Proportion Test Ví dụ Phòng kinh doanh báo cáo chỉ số thõa mãn của khách hàng về một sản phẩm của công ty là trên 80%. Để xác nhận khẳng định này, thì công ty đã làm một cuộc điều tra với 500 khách hàng, và 460 trong số họ đã trả lời là thỏa mãn với sản phẩm này. Thử nghiệm 5% mức để xem xét nếu báo cáo của phòng kinh doanh đáng tin cậy [Câu hỏi thống kê] Nếu mẫu tỷ lệ ( ) là 0.92, chúng ta có thể nói rằng nó lớn hơn tập hợp tỷ lệ ( ) của 0.8? - Mẫu quan sát - Sự khẳng định về tập hợp Thử nghiệm 1-Proportion sử dụng Minitab Thiết lập giả thuyết > H o: p = 0.8 H 1: p > 0.8 Xác định mức có ý nghĩa > Thông thường là α = 5% (0.05) > Mặt khác, nếu không xác định được, Minitab dùng 5% như là mức có ý nghĩa. > Trong Minitab, mức tin cậy (1- α ) được nhập vào thay cho mức có ý nghĩa. Ví dụ) Nếu α = 5%, giá trị nhập vào Minitab sẽ là 95.0 Chọn thử nghiệm thống kê > Chọn thử nghiệm 1-Proportion Bước 1 Bước 2 Bước 3 2 3 5 4 6 7 8 1 Stat > Basic Statistics > 1 Proportion Số thử nghiệm (cỡ mẫu) và các số lượng thành công trong phần sở thích (đó là, số người ủng hộ trong tỷ lệ hỗ trợ, số hàng sai sót trong trường hợp % sai sót) H1: p < p o  less than p  p o  not equal p > p o  greater than Kết luận thống kê > Từ P-value = 0.000 < 0.05, H 0 bị loại bỏ.. Kết luận thực tế > Chỉ số thõa mãn của khách hàng về một sản phẩm của công ty là trên 80%. Bước 4 Tính P-value Bước 5 Bước 6 Test and CI for One Proportion Test of p = 0.5 vs p not = 0.5 Exact Sample X N Sample p 95% CI P-Value 1 460 500 0.920000 (0.892655, 0.942234) 0.000 Ví dụ Để xác nhận nếu có sự khác nhau về tỉ lệ đặt hàng tự động của phòng mua bán của GBM A và B, 250 và 200 đơn vị được làm mẫu GBM A và GBM B theo lần lượt. Các kết quả đã cho dưới đây. Thực hiện thử nghiệm 5% mức tương đối để xác định nếu có sự khác nhau về hệ số P/O tự động. [Câu hỏi thống kê] Nếu mẫu tỷ lệ qủa qui trình A là 0.44, và mẫu tỷ lệ của qui trình B là 0.52, chúng ta có thể nói rằng sự khác nhau trong phân bố tập hợp là đáng kể ? Mẫu quan sát - Sự khẳng định về tập hợp 2 Proportions Test Sự mô tả Số lượng mẫu Số lần đặt hàng tự động GBM A 250 110 GBM B 200 104 Total 450 214 2-Proportions Test using Minitab Thiết lập giả thuyết > H o : p 1 = p 2 > H 1 : p 1  p 2 Xác định mức có ý nghĩa > Thông thường là α = 5% (0.05). > Mặt khác, nếu không xác định được, Minitab dùng 5% như là mức có ý nghĩa. > Trong Minitab, mức tin cậy (1- α ) được nhập vào thay cho mức có ý nghĩa. Ví dụ) Nếu α = 5%, giá trị nhập vào Minitab sẽ là 95.0 Chọn thử nghiệm thống kê > Chọn thử nghiệm 2-Proportion Bước 1 Bước 2 Bước 3 2 3 5 4 6 8 1 7 Stat > Basic Statistics > 2 Proportions Số lần thử nghiệm và số lần thành công trong khu vực quan sát. Trong trường hợp có sự khác biệt trong tỉ lệ thiết lập trong giả thuyết vô hiệu là 0 (zero) (Test Difference = 0) H1: p 1 < p 2  less than p 1  p 2  not equal p 1 > p 2  greater than Test and CI for Two Proportions Sample X N Sample p 1 110 250 0.440000 2 104 200 0.520000 Difference = p (1) - p (2) Estimate for difference: -0.08 95% CI for difference: (-0.172630, 0.0126298) Test for difference = 0 (vs not = 0): Z = -1.69 P-Value = 0.091 Kết luận thống kê > Từ P-value = 0.091 > 0.05, H 0 không thể bị loại bỏ.. Kết luận thực tế > Chúng ta không thể nói rằng có sự khác nhau trong các đơn đặt hàng tự động giữa GBM A và GBM B. Bước 4 Tính P-value Bước 5 Bước 6 95% khoảng tin cậy cho sự khác biêṭ trong tập hợp tỷ lệ . Chi-Square Test Ví dụ Công ty SS ra đời 3 dòng điện thoại di động và chọn ngẫu nhiên 367 người khảo sát có hay không khách hàng yêu thích cho chiếc điện thoại này khác tùy theo độ tuổi. Kết quả khảo sát như bên dưới. Khách hàng yêu thích cho mẫu khác nhau về độ tuổi? (tên file: Chi_Mobile.mtw) [Câu hỏi thống kê] Khi chúng ta biết được sự cân xứng mẫu điện thoại ưu tiên theo độ tuổi, chúng ta có thể nói rằng khác nhau về cân xứng tập hợp theo độ tuổi là có ý nghĩa ? 10’s 20’s 30’s 40’s 50’s Model 1 13 5 8 21 43 Model 2 18 10 36 56 29 Model 3 16 16 35 51 10 Chi-Square Test sử dụng Minitab Thiết lập giả thuyết > Giả thuyết vô hiệu H 0: ( p 11 =p 12 =p 13 =p 14 =p 15 ), (p 21 = p 22 =p 23 =p 24 = p 25 ), (p 31 =p 32 =p 33 =p 34 =p 35 ) > Giả thuyết thay thế H 1: H 0 là sai. Xác định mức có ý nghĩa > Thông thường thì α = 5% (0.05) Chọn thử nghiệm thống kê > Chọn Chi-Square Test Bước 1 Bước 2 Bước 3 2 1 Đối với 1-Proportion test và 2-Proportions test, số lần thử và số lần thành công được nhập vào. Nhung đối với Chi-Square test, thì số thành công, số thất bại được nhập vào. Stat > Tables > Chi-Square Test (Two-Way Table in Worksheet) Bước 4 Tính P-value Chi-Square Test: 10s, 20s, 30s, 40s, 50s Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts 10s 20s 30s 40s 50s Total 1 13 5 8 21 43 90 11.53 7.60 19.37 31.39 20.11 0.189 0.891 6.677 3.439 26.058 2 18 10 36 56 29 149 19.08 12.59 32.07 51.97 33.29 0.061 0.531 0.481 0.313 0.553 3 16 16 35 51 10 128 16.39 10.81 27.55 44.64 28.60 0.009 2.489 2.013 0.905 12.096 Total 47 31 79 128 82 367 Chi-Sq = 56.705, DF = 8, P-Value = 0.000 Kết luận thống kê Từ P-value( = 0.000) < mức có ý nghĩa 0.05, H 0 có thể bị loại bỏ.. Kết luận thực tế Sự yêu thích mẫu điện thoại thì khác nhau theo tuổi. Tuy nhiên, phân tích thống kê trên không ngụ ý rằng nhóm tuổi l2 khác nhau. Bước 5 Bước 6 Khi tung ra dòng điện thoại di động, sẽ rất cần thiết để phân khúc khách hàng theo tuổi. Do đó, nếu chúng ta muốn nhận dạng nhóm tuổi đó khác biệt nhất, chúng ta cần tận dụng thống kê thử nghiệm mỗi độ tuổi. Tóm tắt Proportion test Khi bạn có 1 mẫu tỷ lệ và bạn ước lượng tỷ lệ hoặc thử nghiệm giả thuyết của 1 tập hợp, áp dụng thử nghiệm 1-Proportion. ( Stat > Basic Statistics > 1 Proportion) Khi bạn có 2 mẫu tỷ lệ và bạn ước lượng hoặc thử nghiệm sự khác nhau giữa 2 tập hợp tỷ lệ đó, áp dụng thử nghiệm 2-Proportion. ( Stat > Basic Statistics > 2 Proportions) Khi bạn thử nghiệm phương sai tương đương của hai hoặc nhiều tập hợp tỷ lệ , thì áp dụng Chi-square test. ( Stat > Tables > Chi-square Test) Phân tích định lượng cho dữ liệu rời rạc Những nhân tố quan trọng có thể được chọn lựa thông qua thử nghiệm tỷ lệ của dữ liệu rời rạc. Cho việc chọn lựa những nhân tố then chốt (đó là, Vital Few X’s), xem lại có hay không mục tiêu đề tài có thể đạt được,và rồi chuyển chúng vào giai đoạn tối đa hóa kết hợp với những nhân tố đã được xác định. Để kiểm tra tỉ lệ nghỉ hưu của công nhân nữ tại GBM A, 120 nhân viên nữ gia nhập công ty từ quý 4 năm 2003, và 15 người trong số đó đã nghỉ hưu. Xác định khoảng tin cậy của tỉ lệ nghỉ hưu tại 95% mức tin cậy? 2. Tỉ lệ đơn đặt hàng tự động của GBM A được biết là 0.118. Khi 100 đơn đặt hàng được lấy ngẫu nhiên để làm mẫu khảo sát, 9 đơn đặt hàng được phát hiện là đơn đặt hàng tự động. Chúng ta có thể nói rằng có sự thay đổi trong tỉ lệ đơn đặt hàng tự động ? (Ghi chú.  = 0.05) 3. GBM A và GBM B khảo sát tỉ lệ nhân viên, những người muốn làm việc ngày thứ 7. Để thấy được có hay không tỉ lệ khác nhau giữa 2 GBM, 120 và 150 nhân viên được chọn ngẫu nhiên từ 2 GBM, theo thứ tự định sẵn. Kết quả chỉ ra rằng 12 từ GBM A và 9 từ GBM B muốn làm việc vào ngày thứ 7. Khoảng tin cậy được xác định là 95% cho sự khác nhau trong tỉ lệ người muốn làm việc vào ngày thứ 7 giữa GBM A và GBM B. 4. Trong bài tập số 3, chúng ta có thể nói rằng tỉ lệ người muốn đi làm ngày thứ 7 là khác nhau giữa 2 GBM không? Thử nghiệm với mức có ý nghĩa là  = 0.05. Bài tập 5. S điện tử đã cho ra hai mẫu máy tính xách tay mới, và thực hiện khảo sát trên một khách hàng ưu tiên. Để khảo sát sự khác nhau ưu tiên theo nhóm tuổi, kết quả được tóm tắt theo bảng dưới đây. Chúng ta có thể khẳng định rằng sự yêu thích của máy xách tay A và B khác nhau tùy theo độ tuổi không? Thử nghiệm tại mức tương đối α = 0,05. Age group Máy xách tay A Máy xách tay B Số người được hỏi 20 và nhỏ hơn 65 58 123 30 và nhỏ hơn 52 86 138 40 và nhỏ hơn 43 41 84 50 và nhỏ hơn 48 58 106 Trả lời 1. ( 0.071680, 0.197776) 2. Chúng ta không thể nói rằng có sự thay đổi trong tỉ lệ đơn đặt hàng tự động ( P-value = 0.442) 3. (-0.0257684, 0.105768) 4. Chúng ta không thể nói rằng có sự khác nhau giữa 2 GBM. (P-Value = 0.223) 5. Chúng ta không thể nói rằng có sự yêu thích khác nhau tùy thoe độ tuổi (P-Value = 0.068)