Thử nghiệm sự tỷ lệ?
Định nghĩa thử nghiệm sự tỷ lệ
Một thử nghiệm để xác định có hay không chấp nhận hoặc loại bỏ giả thuyết mẫu tỷ lệ dựa trên thử nghiệm thống kê
Thuật ngữ
Sự tỷ lệ
Nó nói đến sự tỷ lệ với thuộc tính chắc chắn trong tập hợp như là % lỗi, tỉ lệ hỗ trợ, tỉ lệ không được sử dụng. v.v
Mẫu tỷ lệ
Ước tính của tập hợp tỷ lệ p
22 trang |
Chia sẻ: thuyduongbt11 | Ngày: 09/06/2022 | Lượt xem: 468 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 16: Thử nghiệm sự tỷ lệ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Thử nghiệm sự tỷ lệ
Mục tiêu học tập
- Hiểu cách ước tính tập hợp tỷ lệ sử dụng thống kê mẫu
- Biết được quá trình chấp nhận hoặc loại bỏ giả thuyết liên quan đến tập hợp tỷ lệ
- Biết được quy trình thử nghiệm đối xứng bằng việc sử dụng Minitab
1-Proportion Test
2-Proportions Test
Chi-Square Test
Bản đồ chỉ dẫn thử nghiệm giả thuyết
Stat -Tables - Chi-square Test
Stat -Basic Stats -2 proportion
Stat -Basic Stats -1 proportion
Ho: m1 = m2
H 1 : m1 ¹ m2
Stat - Basic Stats - 2-Sample t
select “ assume equal variances”
Ho: M1 = M (Target)
H 1 : M1 ¹ M (Target)
Stat - Nonparametric - 1 Sample-Sign or
Stat - Nonparametric - 1 Sample-Wilcoxon
Continuous Data
Normality Test
Hypothesis Testing
One-way
ANOVA
Discrete Data
Chi-Square Test
Ho: m1 = m2 = m3 = ...
H 1 : at least one is different
Stat - Anova- One-way
Ho: Data is normal.
H 1 : Data is not normal.
Stat - Basic Stat - Normality Test
When significance level = 0.05 :
If P-value >0.05 , cannot reject Ho
If P-value <0.05 , reject Ho
Normal Data
CI for Standard Deviation
One population
Two or more
population
2 Sample t
(variance equal )
2 Sample t
(variance not equal)
1 Sample t or
1 Sample Z
Ho: m1 = m (target)
H 1 : m1 ¹ m (target)
Stat - Basic Stats - 1 Sample-t ( s is unknown)
1Sample Z ( s is known)
1 Sample-Sign or
1 Sample-Wilcoxon
Mann-Whitney Test
Two or more
populations
Two populations
1-Proportion
2-Proportion
One population
Two population
Two or more
population
Non Normal Data
Equal Variance
Yes
No
Kruskal-Wallis Test
One population
Two
populations
Two or more
populations
Ho: M1 = M2
H 1 : M1 ¹ M2
Stat - Nonparametric - Mann-Whitney
Ho: M1 = M2 = M3 = ...
H 1 : at least one is different
Stat - Nonparametric - Kruskal-Wallis
Ho: m1 = m2
H 1 : m1 ¹ m2
Stat - Basic Stats - 2-Sample t
do not select “ assume equal variances”
Test for Equal Variances
(Levene’s Test)
Test for Equal Variances
(F Test or Bartlett’s Test)
Ho: s1 = s2 = s3 = .. ...
H 1 : at least one is different
Stat - Anova - Test for Equal Variances
Use F-test when comparing two populations only
Ho: s 1 = s (Target)
H 1 : s 1 ¹ s (Target)
Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu.
Stat -Basic Statistics - Display Descriptive Stats
Two-way
ANOVA
Định nghĩa thử nghiệm sự tỷ lệ
Một thử nghiệm để xác định có hay không chấp nhận hoặc loại bỏ giả thuyết mẫu tỷ lệ dựa trên thử nghiệm thống kê
Thuật ngữ
Sự tỷ lệ
Nó nói đến sự tỷ lệ với thuộc tính chắc chắn trong tập hợp như là % lỗi, tỉ lệ hỗ trợ, tỉ lệ không được sử dụng. v.v
Mẫu tỷ lệ
Ước tính của tập hợp tỷ lệ p
Thử nghiệm sự tỷ lệ ?
Mẫu tỷ lệ
X
n
p
(Ơ đây, n: số mẫu,
X: Số nhân tố với thuộc tính chắc chắn)
Tổng quan về thử nghiệm tỷ lệ
Các loại của thử nghiệm tỷ lệ
Thử nghiệm tỷ lệ cho 1 tập hợp
1-Proportion test
Ví dụ) Ư ớ c tính hoặc thử nghiệm của tập hợp tỷ lệ thông qua khảo sát lấy mẫu của tỉ lệ chương trình TV.
Thử nghiệm tỷ lệ cho 2 tập hợp
2-Proportion test
Ví dụ) Thử nghiệm sự khác nhau đáng kể giữa tỉ lệ % lỗi của 2 nhà máy.
Thử nghiệm tỷ lệ cho 2 tập hợp hoặc nhiều hơn
Chi-Square Test
Ví dụ) Thử nghiệm sở thích của 3 loại điện thoại tùy theo tuổi.
H 0 : p 1 =p 2 = ···= p k
H 1 : Tối thiểu có 1 tập hợp là khác
H 0 : p = p 0 (target)
H 1 : p < p 0
p > p 0
p p 0
Chọn 1
H 0 : p 1 = p 2
H 1 : p 1 < p 2
p 1 > p 2
p 1 p 2
Chọn 1
Bước 2 : Xác định mức có ý nghĩa ( )
Trình tự phân tích
Thiết lập giả thuyết
Chọn thử nghiệm thống kê
Tính P-value
Rút ra kết luận thống kê
Xác định mức có ý nghĩa
Chuyển đổi sang kết luận thực tế
Bước 3 : Chọn thử nghiệm thống kê
Bước 1 : Thiết lập giả thuyết
(H o ) và (H 1 )
Bước 4 : Tính P-value sử dụng Minitab
Bước 5 : P-value < mức có ý nghĩa( ) giả thuyết Ho bị loại bỏ
Bước 6 : Chuyển đổi sang kết luận thực tế
1 Proportion Test
Ví dụ
Phòng kinh doanh báo cáo chỉ số thõa mãn của khách hàng về một sản phẩm của công ty là trên 80%. Để xác nhận khẳng định này, thì công ty đã làm một cuộc điều tra với 500 khách hàng, và 460 trong số họ đã trả lời là thỏa mãn với sản phẩm này.
Thử nghiệm 5% mức để xem xét nếu báo cáo của phòng kinh doanh đáng tin cậy
[Câu hỏi thống kê]
Nếu mẫu tỷ lệ ( ) là 0.92, chúng ta có thể nói rằng nó lớn hơn tập hợp tỷ lệ ( ) của 0.8?
- Mẫu quan sát
- Sự khẳng định về tập hợp
Thử nghiệm 1-Proportion sử dụng Minitab
Thiết lập giả thuyết
> H o: p = 0.8
H 1: p > 0.8
Xác định mức có ý nghĩa
> Thông thường là α = 5% (0.05)
> Mặt khác, nếu không xác định được, Minitab dùng 5% như là mức có ý nghĩa.
> Trong Minitab, mức tin cậy (1- α ) được nhập vào thay cho mức có ý nghĩa.
Ví dụ) Nếu α = 5%, giá trị nhập vào Minitab sẽ là 95.0
Chọn thử nghiệm thống kê
> Chọn thử nghiệm 1-Proportion
Bước 1
Bước 2
Bước 3
2
3
5
4
6
7
8
1
Stat > Basic Statistics > 1 Proportion
Số thử nghiệm (cỡ mẫu) và các số lượng thành công trong phần sở thích (đó là, số người ủng hộ trong tỷ lệ hỗ trợ, số hàng sai sót trong trường hợp % sai sót)
H1: p < p o less than
p p o not equal
p > p o greater than
Kết luận thống kê
> Từ P-value = 0.000 < 0.05, H 0 bị loại bỏ..
Kết luận thực tế
> Chỉ số thõa mãn của khách hàng về một sản phẩm của công ty là trên 80%.
Bước 4
Tính P-value
Bước 5
Bước 6
Test and CI for One Proportion
Test of p = 0.5 vs p not = 0.5
Exact
Sample X N Sample p 95% CI P-Value
1 460 500 0.920000 (0.892655, 0.942234) 0.000
Ví dụ
Để xác nhận nếu có sự khác nhau về tỉ lệ đặt hàng tự động của phòng mua bán của GBM A và B, 250 và 200 đơn vị được làm mẫu GBM A và GBM B theo lần lượt. Các kết quả đã cho dưới đây. Thực hiện thử nghiệm 5% mức tương đối để xác định nếu có sự khác nhau về hệ số P/O tự động.
[Câu hỏi thống kê]
Nếu mẫu tỷ lệ qủa qui trình A là 0.44, và mẫu tỷ lệ của qui trình B là 0.52, chúng ta có thể nói rằng sự khác nhau trong phân bố tập hợp là đáng kể ?
Mẫu quan sát
- Sự khẳng định về tập hợp
2 Proportions Test
Sự mô tả
Số lượng mẫu
Số lần đặt hàng tự động
GBM A
250
110
GBM B
200
104
Total
450
214
2-Proportions Test using Minitab
Thiết lập giả thuyết
> H o : p 1 = p 2
> H 1 : p 1 p 2
Xác định mức có ý nghĩa
> Thông thường là α = 5% (0.05).
> Mặt khác, nếu không xác định được, Minitab dùng 5% như là mức có ý nghĩa.
> Trong Minitab, mức tin cậy (1- α ) được nhập vào thay cho mức có ý nghĩa.
Ví dụ) Nếu α = 5%, giá trị nhập vào Minitab sẽ là 95.0
Chọn thử nghiệm thống kê
> Chọn thử nghiệm 2-Proportion
Bước 1
Bước 2
Bước 3
2
3
5
4
6
8
1
7
Stat > Basic Statistics > 2 Proportions
Số lần thử nghiệm và số lần thành công trong khu vực quan sát.
Trong trường hợp có sự khác biệt trong tỉ lệ thiết lập trong giả thuyết vô hiệu là 0 (zero) (Test Difference = 0)
H1: p 1 < p 2 less than
p 1 p 2 not equal
p 1 > p 2 greater than
Test and CI for Two Proportions
Sample X N Sample p
1 110 250 0.440000
2 104 200 0.520000
Difference = p (1) - p (2)
Estimate for difference: -0.08
95% CI for difference: (-0.172630, 0.0126298)
Test for difference = 0 (vs not = 0): Z = -1.69 P-Value = 0.091
Kết luận thống kê
> Từ P-value = 0.091 > 0.05, H 0 không thể bị loại bỏ..
Kết luận thực tế
> Chúng ta không thể nói rằng có sự khác nhau trong các đơn đặt hàng tự động giữa GBM A và GBM B.
Bước 4
Tính P-value
Bước 5
Bước 6
95% khoảng tin cậy cho sự khác biêṭ trong tập hợp tỷ lệ .
Chi-Square Test
Ví dụ
Công ty SS ra đời 3 dòng điện thoại di động và chọn ngẫu nhiên 367 người khảo sát có hay không khách hàng yêu thích cho chiếc điện thoại này khác tùy theo độ tuổi. Kết quả khảo sát như bên dưới. Khách hàng yêu thích cho mẫu khác nhau về độ tuổi? (tên file: Chi_Mobile.mtw)
[Câu hỏi thống kê]
Khi chúng ta biết được sự cân xứng mẫu điện thoại ưu tiên theo độ tuổi, chúng ta có thể nói rằng khác nhau về cân xứng tập hợp theo độ tuổi là có ý nghĩa ?
10’s 20’s 30’s 40’s 50’s
Model 1 13 5 8 21 43
Model 2 18 10 36 56 29
Model 3 16 16 35 51 10
Chi-Square Test sử dụng Minitab
Thiết lập giả thuyết
> Giả thuyết vô hiệu H 0: ( p 11 =p 12 =p 13 =p 14 =p 15 ),
(p 21 = p 22 =p 23 =p 24 = p 25 ),
(p 31 =p 32 =p 33 =p 34 =p 35 )
> Giả thuyết thay thế H 1: H 0 là sai.
Xác định mức có ý nghĩa
> Thông thường thì α = 5% (0.05)
Chọn thử nghiệm thống kê
> Chọn Chi-Square Test
Bước 1
Bước 2
Bước 3
2
1
Đối với 1-Proportion test và 2-Proportions test, số lần thử và số lần thành công được nhập vào. Nhung đối với Chi-Square test, thì số thành công, số thất bại được nhập vào.
Stat > Tables > Chi-Square Test (Two-Way Table in Worksheet)
Bước 4
Tính P-value
Chi-Square Test: 10s, 20s, 30s, 40s, 50s
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
10s 20s 30s 40s 50s Total
1 13 5 8 21 43 90
11.53 7.60 19.37 31.39 20.11
0.189 0.891 6.677 3.439 26.058
2 18 10 36 56 29 149
19.08 12.59 32.07 51.97 33.29
0.061 0.531 0.481 0.313 0.553
3 16 16 35 51 10 128
16.39 10.81 27.55 44.64 28.60
0.009 2.489 2.013 0.905 12.096
Total 47 31 79 128 82 367
Chi-Sq = 56.705, DF = 8, P-Value = 0.000
Kết luận thống kê
Từ P-value( = 0.000) < mức có ý nghĩa 0.05, H 0 có thể bị loại bỏ..
Kết luận thực tế
Sự yêu thích mẫu điện thoại thì khác nhau theo tuổi.
Tuy nhiên, phân tích thống kê trên không ngụ ý rằng nhóm tuổi l2 khác nhau.
Bước 5
Bước 6
Khi tung ra dòng điện thoại di động, sẽ rất cần thiết để phân khúc khách hàng theo tuổi. Do đó, nếu chúng ta muốn nhận dạng nhóm tuổi đó khác biệt nhất, chúng ta cần tận dụng thống kê thử nghiệm mỗi độ tuổi.
Tóm tắt
Proportion test
Khi bạn có 1 mẫu tỷ lệ và bạn ước lượng tỷ lệ hoặc thử nghiệm giả thuyết của 1 tập hợp, áp dụng thử nghiệm 1-Proportion.
( Stat > Basic Statistics > 1 Proportion)
Khi bạn có 2 mẫu tỷ lệ và bạn ước lượng hoặc thử nghiệm sự khác nhau giữa 2 tập hợp tỷ lệ đó, áp dụng thử nghiệm 2-Proportion.
( Stat > Basic Statistics > 2 Proportions)
Khi bạn thử nghiệm phương sai tương đương của hai hoặc nhiều tập hợp tỷ lệ , thì áp dụng Chi-square test.
( Stat > Tables > Chi-square Test)
Phân tích định lượng cho dữ liệu rời rạc
Những nhân tố quan trọng có thể được chọn lựa thông qua thử nghiệm tỷ lệ của dữ liệu rời rạc.
Cho việc chọn lựa những nhân tố then chốt (đó là, Vital Few X’s), xem lại có hay không mục tiêu đề tài có thể đạt được,và rồi chuyển chúng vào giai đoạn tối đa hóa kết hợp với những nhân tố đã được xác định.
Để kiểm tra tỉ lệ nghỉ hưu của công nhân nữ tại GBM A, 120 nhân viên nữ gia nhập công ty từ quý 4 năm 2003, và 15 người trong số đó đã nghỉ hưu. Xác định khoảng tin cậy của tỉ lệ nghỉ hưu tại 95% mức tin cậy?
2. Tỉ lệ đơn đặt hàng tự động của GBM A được biết là 0.118. Khi 100 đơn đặt hàng được lấy ngẫu nhiên để làm mẫu khảo sát, 9 đơn đặt hàng được phát hiện là đơn đặt hàng tự động. Chúng ta có thể nói rằng có sự thay đổi trong tỉ lệ đơn đặt hàng tự động ? (Ghi chú. = 0.05)
3. GBM A và GBM B khảo sát tỉ lệ nhân viên, những người muốn làm việc ngày thứ 7. Để thấy được có hay không tỉ lệ khác nhau giữa 2 GBM, 120 và 150 nhân viên được chọn ngẫu nhiên từ 2 GBM, theo thứ tự định sẵn. Kết quả chỉ ra rằng 12 từ GBM A và 9 từ GBM B muốn làm việc vào ngày thứ 7. Khoảng tin cậy được xác định là 95% cho sự khác nhau trong tỉ lệ người muốn làm việc vào ngày thứ 7 giữa GBM A và GBM B.
4. Trong bài tập số 3, chúng ta có thể nói rằng tỉ lệ người muốn đi làm ngày thứ 7 là khác nhau giữa 2 GBM không? Thử nghiệm với mức có ý nghĩa là = 0.05.
Bài tập
5. S điện tử đã cho ra hai mẫu máy tính xách tay mới, và thực hiện khảo sát trên một khách hàng ưu tiên. Để khảo sát sự khác nhau ưu tiên theo nhóm tuổi, kết quả được tóm tắt theo bảng dưới đây. Chúng ta có thể khẳng định rằng sự yêu thích của máy xách tay A và B khác nhau tùy theo độ tuổi không? Thử nghiệm tại mức tương đối α = 0,05.
Age group
Máy xách tay A
Máy xách tay B
Số người được hỏi
20 và nhỏ hơn
65
58
123
30 và nhỏ hơn
52
86
138
40 và nhỏ hơn
43
41
84
50 và nhỏ hơn
48
58
106
Trả lời
1. ( 0.071680, 0.197776)
2. Chúng ta không thể nói rằng có sự thay đổi trong tỉ lệ đơn đặt hàng tự động
( P-value = 0.442)
3. (-0.0257684, 0.105768)
4. Chúng ta không thể nói rằng có sự khác nhau giữa 2 GBM.
(P-Value = 0.223)
5. Chúng ta không thể nói rằng có sự yêu thích khác nhau tùy thoe độ tuổi
(P-Value = 0.068)