Bài giảng Six sigma - Chương 12: Ước tính và thử nghiệm giả thuyết

Ước tính là gì? Định nghĩa sự ước tính Là ước tính những thống kê của một tập hợp dựa trên dữ liệu mẫu Qui trình thống kê ước tính các giá trị (ví dụ như số trung bình của tập hợp, sự cân xứng của tập hợp, biến thiên tập hợp) biểu thị những đặc tính của sự phân bố tập hợp dựa trên thống kê của các mẫu. Kết luận thống kê và ra quyết định liên quan tới tập hợp dựa trên những thống kê của các mẫu.

ppt36 trang | Chia sẻ: thuyduongbt11 | Lượt xem: 550 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 12: Ước tính và thử nghiệm giả thuyết, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Ước tính và Thử nghiệm giả thuyết Mục tiêu học tập Hiểu cách thức ước tính các thông số, bằng cách sử dụng các dữ liệu mẫu để kiểm tra đặc tính của tập hợp số đông Hiểu được các quy trình để đưa ra quyết định có hay không, việc chấp nhận các giả thuyết, áp dụng cho số đông Ước tính Thử nghiệm giả thuyết Sơ đồ thử nghiệm giả thiết Stat -Tables - Chi-square Test Stat -Basic Stats -2 proportion Stat -Basic Stats -1 proportion Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t select “ assume equal variances” Ho: M1 = M (Target) H 1 : M1 ¹ M (Target) Stat - Nonparametric - 1 Sample-Sign or Stat - Nonparametric - 1 Sample-Wilcoxon Continuous Data Normality Test Hypothesis Testing One-way ANOVA Discrete Data Chi-Square Test Ho: m1 = m2 = m3 = ... H 1 : at least one is different Stat - Anova- One-way Ho: Data is normal. H 1 : Data is not normal. Stat - Basic Stat - Normality Test When significance level  = 0.05 : If P-value >0.05 , cannot reject Ho If P-value <0.05 , reject Ho Normal Data CI for Standard Deviation One population Two or more population 2 Sample t (variance equal ) 2 Sample t (variance not equal) 1 Sample t or 1 Sample Z Ho: m1 = m (target) H 1 : m1 ¹ m (target) Stat - Basic Stats - 1 Sample-t ( s is unknown) 1Sample Z ( s is known) 1 Sample-Sign or 1 Sample-Wilcoxon Mann-Whitney Test Two or more populations Two populations 1-Proportion 2-Proportion One population Two population Two or more population Non Normal Data Equal Variance Yes No Kruskal-Wallis Test One population Two populations Two or more populations Ho: M1 = M2 H 1 : M1 ¹ M2 Stat - Nonparametric - Mann-Whitney Ho: M1 = M2 = M3 = ... H 1 : at least one is different Stat - Nonparametric - Kruskal-Wallis Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t do not select “ assume equal variances” Test for Equal Variances (Levene’s Test) Test for Equal Variances (F Test or Bartlett’s Test) Ho: s1 = s2 = s3 = .. ... H 1 : at least one is different Stat - Anova - Test for Equal Variances Use F-test when comparing two populations only Ho: s 1 = s (Target) H 1 : s 1 ¹ s (Target) Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu. Stat -Basic Statistics - Display Descriptive Stats Định nghĩa sự ước tính Là ước tính những thống kê của một tập hợp dựa trên dữ liệu mẫu Qui trình thống kê ước tính các giá trị (ví dụ như số trung bình của tập hợp, sự cân xứng của tập hợp, biến thiên tập hợp) biểu thị những đặc tính của sự phân bố tập hợp dựa trên thống kê của các mẫu. Kết luận thống kê và ra quyết định liên quan tới tập hợp dựa trên những thống kê của các mẫu. Mục đích của ước tính Mục đích ước lượng là để có được những thông tin về tập hợp qua việc phân tích dữ liệu mẫu và để đưa ra quyết định và có hành động đúng đắn liên quan đến tập hợp này. Ước tính là gì? Tập hợp Trung bình tập hợp: μ biến thiên tập hợp: σ 2 Cân xứng của tập hợp: p Mẫu Mẫu Mẫu Trung bình mẫu: Mẫu biến thiên: σ 2 Mẫu cân xứng: Sự ước tính Các loại ước tính Điểm ước tính : Ước tính một giá trị của thông số. (VD.) Vòng đời của sản phẩm B là 5 năm Số trung bình, độ lệch chuẩn, biến thiên, số trung vị, vv... Giá trị điểm ước tính không bao gồm khái niệm sai số. Nghĩa là, điểm ước tính không chỉ ra giá trị ước tính gần với giá trị thực tế như thế nào. Khoảng ước tính Khoảng ước tính mong đợi thì bao gồm giá trị thật của thông số sử dụng dữ liệu mẫu. Ví dụ: Tỉ lệ khuyết tật trên thị trường của sản phẩm A: (2%, 8%) Tỉ lệ khuyết tật trên thị trường của sản phẩm A là từ 2% đến 8%. Tổng quan về ước tính Điểm ước tính không chỉ ra giá trị ước tính gần với giá trị thực tế như thế nào. Sai sót Mặc dù chúng ta đều hy vọng rằng các giá trị đặc trưng (số trung bình, độ lệch chuẩn, vv...) của mẫu giống như đặc tính thực của tập hợp nhưng trong hầu hết các trường hợp là vẫn tồn tại một vài sự khác biệt. Độ tin cậy vào khoảng ước tính là bao nhiêu? Khoảng ước tính có tầm tin cậy khác nhau dựa vào sai số cho phép. Khoảng ước tính có tầm tin cậy khác nhau dựa vào sai số cho phép. Khoảng ước tính dựa vào sai số cho phép được gọi là khoảng ước tính tin cậy và khoảng giá trị được ước tính này được gọi là khoảng tin cậy. Tập hợp Mẫu 1 Mẫu 3 Mẫu 2 Sai sót của mẫu Sai sót của mẫu là sự khác nhau giữa sự ước tính dựa trên một mẫu và giá trị thực của tập hợp Khoảng tin cậy Khoảng tin cậy Khi giá trị sai hỏng là và mẫu có cùng kích thước được trích ra từ nhiều lần, khoảng giá trị bao gồm các giá trị thực được biểu diễn là gọi là khoảng tin cậy - Ở đây, được biểu diễn như là mức tin cậy. - Mức tin cậy chỉ ra xác suất mà khoảng giá trị được ước tính sẽ bao gồm các thông số. =0.5(50%) =0.1(10%) Mức độ tin cậy Khoảng tin cậy Sai hỏng Khái niệm về khoảng tin cậy Nếu các mẫu riêng (kích cỡ = n) được lấy lặp lại từ một tập hợp và tính khoảng tin cậy cho từng mẫu thì khoảng tin cậy sẽ thay đổi khi mỗi mẫu có giá trị số trung bình khác nhau. Trung bình tập hợp Khoảng tin cậy 90% có nghĩa là gì? Mẫu 1 Mẫu 2 Mẫu 10 Khoảng tin cậy 90% nghĩa là 90% trong tổng số 10 khoảng tin cậy được tính toán lặp lại có chứa số trung bình của tập hợp 130 140 150 160 170 180 190 200 210 220 230 130 140 150 160 170 180 190 200 210 220 230 Có phải mức tin cậy càng lớn thì sẽ càng tốt? Mức tin cậy càng lớn nghĩa là phạm vi khoảng giá trị càng lớn, nghĩa là tăng phạm vi cho các thông số. Vì vậy, mức tin cậy càng lớn thì giá trị thông tin sẽ càng ít. Nhìn chung, mức tin cậy được áp dụng rộng rãi nhất là 0,9; 0,95 và 0,99. Ví dụ: khi ước lượng khoảng chiều cao trung bình của những người đàn ông trưởng thành ở Việt nam, • Trường hợp xác định khoảng giá trị của mức tin cậy từ 1,3m đến 2,3m - Khoảng giá trị này có thể có mức tin cậy cao bởi vì nó chứa tất cả các độ cao xác suất, nhưng không có ý nghĩa thống kê bởi vì khoảng giá trị này quá rộng. Trường hợp xác định khoảng giá trị của mức tin cậy nằm giữa 1,6m tới 1,7m Khoảng giá trị này không bao gồm xác suất của giá trị thực là cao hơn, nghĩa là sai số càng lớn. Vì vậy, mặc dù có ý nghĩa thống kê nhưng mức tin cậy lại giảm. Tính khoảng tin cậy cho dữ liệu liên tục Dùng phần mềm minitab tính khoảng tin cậy (Tên file: Confidence Interval ex1.mtw) Tính khoảng tin cậy sử dụng phần mềm Minitab Stat > Basic Statistics > Graphical Summary Trường hợp có đa biến số thì tính thống kê của mỗi biến số Nhập vào mức tin cậy mà bạn muốn đạt được. 1 2 3 1 2 3 1.Ước tính khoảng tin cậy cho số trung bình. (Khoảng tin cậy 95%): Phân bố t 2. Ước tính khoảng tin cậy cho số trung vị. (Khoảng tin cậy 95%) 3. Ước tính khoảng tin cậy cho độ lệch chuẩn. (miền tin cậy 95%) Biểu đồ kết quả 1 2 4 3 5 Stat > Basic Statistics > 1 Proportion Ví dụ: Một trạm phát sóng truyền hình cáp tiến hành một cuộc khảo sát qua điện thoại, trạm chọn ngẫu nhiên 1.500 khán giả trên toàn quốc để điều tra tỉ lệ phổ biến cho chương trình mới phát. Khi chương trình phát sóng, người khảo sát đã gọi điện và biết rằng có 630 người trong số những khán giả được khảo sát đang xem chương trình. Hãy tính khoảng tin cậy 95% cho tính phổ biến của chương trình được ước tính. Tính khoảng tin cậy cho dữ liệu rời rạc Tính khoảng tin cậy của của tỉ lệ tổng thể của một tập hợp Khi nhập dữ liệu vào cột bảng tính. Test and CI for One Proportion Test of p = 0.5 vs p not = 0.5 Exact Sample X N Sample p 95% CI P-Value 1 630 1500 0.420000 (0.394867, 0.445447) 0.000 Xác nhận kết quả Chúng ta có thể tin cậy 95% rằng tính phổ biến của chương trình nằm trong khoảng 39,5% đến 44,5% Stat > Basic Statistics > 2 Proportions Ví dụ: Chúng ta sẽ so sánh sự khác nhau trong tỉ lệ doanh số bán sản phẩm giữa hai công ty sản xuất, một công ty đã bán được 300 sản phẩm G/Red trên tổng số 1000 sản phẩm và công ty kia đã bán được 200 trên tổng số 1200 sản phẩm. Hãy tính khoảng tin cậy 95% cho sự chênh lệch trong tỉ lệ doanh số bán giữa hai công ty. Tính khoảng tin cậy cho dữ liệu rời rạc Tính khoảng tin cậy của của tỉ lệ tổng thể của hai tập hợp khác nhau 1 2 4 3 5 Xác nhận các kết quả Chúng ta có thể tin cậy 95 % rằng sự chênh lệch khuyết tật giữa các dây chuyền sản xuất của hai công ty là nằm trong khoảng 9,79% đến 16,8% Test and CI for Two Proportions Sample X N Sample p 1 300 1000 0.300000 2 200 1200 0.166667 Difference = p (1) - p (2) Estimate for difference: 0.133333 95% CI for difference: (0.0979593, 0.168707) Test for difference = 0 (vs not = 0): Z = 7.39 P-Value = 0.000 Cách sử dụng và giải thích khoảng tin cậy Cách sử dụng khoảng tin cậy Tính toán khoảng tin cậy là rất hữu ích trong việc chứng minh sự việc đã biết hoặc mong đợi sẽ được biết. Ví dụ: Hãy giả sử rằng số trung bình được xác định của một quá trình đang tồn tại là 10. Nếu khoảng tin cậy 95% của quá trình này có tính đến những sai số mẫu là 9,05 tới 10,34 thì có thể tin cậy giá trị trung bình giả thiết của 10 nằm trong khoảng tin cậy. Nếu giá trị giả thiết không nằm trong khoảng tin cậy, chúng ta có thể nói rằng giá trị đó là sai. Khoảng tin cậy còn được sử dụng để chứng minh có hay không dữ liệu được lấy ra từ cùng một tập hợp. Ví dụ: Trong trường hợp lấy từ 2 hay nhiều nhóm mẫu thì các số trung bình hay độ lệch chuẩn của nhóm mẫu từ cùng một tập hợp nên giống nhau. Vì vậy, nếu khoảng tin cậy cho sự chênh lệch giữa các mẫu bao gồm 0 (số không biểu thị không có sự chênh lệch) thì coi như các mẫu được lấy từ cùng tập hợp. Bất kỳ sự thay đổi tới một quá trình hay một sản phẩm nào sẽ gây ra sự thay đổi trong tập hợp. (Các tập hợp trước và sau khi thay đổi sẽ khác nhau). Trong trường hợp này, hãy thu thập dữ liệu cả trước và sau khi thay đổi và tính khoảng tin cậy cho sự chênh lệch này. Nếu khoảng tin cậy có chứa 0 (số không) thì coi như tập hợp đó vẫn duy trì những đặc tính giống nhau trước và sau khi thay đổi và sau khi thay đổi tập hợp không bị ảnh hưởng gì. Loại phân bố Phân bố Binomial Phân bố Poisson Weibull distribution Phân bố t Phân bố Phân bố F Liên quan tới số trung bình Liên quan tới biến thiên { { Loại rời rạc (Xác suất phân bố rời rạc) Loại liên tục (Xác suất phân bố liên tục) Phân bố thường Sự phân bố của mẫu Một phương pháp chứng minh những khẳng định hay các dữ liệu giả thuyết. Phải xác định rõ ràng những khẳng định hay các dữ liệu giả thuyết. Chứng minh chúng sử dụng các dữ liệu thống kê Thử nghiệm giả thuyết Ví dụ) Sự việc bạn muốn biết là : Sản lượng trung bình của một dây chuyền sản xuất bánh xốp tại công đoạn A là 98.5% hay cao hơn? Tỉ lệ lỗi thị trường của sản phẩm B là 3% hay thấp hơn? Những khẳng định mang tính chất tuyên bố : Máy đóng gói mới vừa được giới thiệu thì có tỉ lệ lỗi thấp hơn những máy đang sử dụng. Nhân tố tiềm năng X ảnh hưởng đến Y. Công cụ nào nên được sử dụng để chứng minh những sự kiện hay những khẳng định? Định nghĩa của giả thuyết thử nghiệm Một phương pháp thống kê dùng để quyết định chấp nhận hay loại bỏ một sự đánh giá, một sự phỏng đoán hay một khẳng định liên quan đến một tham số bằng việc phân tích các mẫu dữ liệu được quan sát Mục đích Để thử nghiệm thống kê có hay không biến số đầu vào X ảnh hưởng đến đầu ra Y. Đó là, thử nghiệm có hay không giá trị đầu ra Y thay đổi, khi biến số đầu vào X thay đổi. Giả thuyết : Giả sử hay khẳng định.. tùy thuộc vào đặc tính của tập hợp Mẫu Mẫu Mẫu Lấy mẫu Thống kê giả thuyết thử nghiệm (Liệu phương pháp đó có ý nghĩa không?) Tập hợp Tổng quan về thử nghiệm giả thuyết Rất khó để quyết định những khẳng định về tham số bằng trực quan. Giả thuyết thử nghiệm khiến những đánh giá chủ quan được kiểm chứng một cách khách quan. Thông qua giả thuyết thử nghiệm, mọi người đều có chung một kết luận!!! Tại sao phải thực hiện giả thuyết thử nghiệm ? Bởi vì phương pháp chứng minh giả thuyết dựa vào những dữ liệu của nhóm mẫu, do đó vẫn luôn tồn tại khả năng sai lỗi. Bởi vậy, trong giả thuyết thử nghiệm thống kê, điều quan trọng nhất là cách quản lý những khả năng của những lỗi có thể mắc phải trước đó. Do đó, phương pháp giả thuyết thử nghiệm xác định trước những khả năng lỗi có thể và quyết định liệu có chấp nhận hay loại giả thuyết đó. Thủ tục giả thuyết thử nghiệm Thiết lập các giả thuyết Xác định mức độ quan trọng của  Tiến hành thử nghiệm thống kê Tính giá trị P Đưa ra kết luận Nếu giá trị P < , khi ấy loại bỏ H o Thuyết minh kết quả Lựa chọn phương pháp thử nghiệm giả thuyết thống kê phù hợp. Thiết lập giả thuyết không khác biệt và giả thuyết thay thế cho vấn đề bạn muốn khẳng định theo thống kê. Chọn phương pháp thử nghiệm phù hợp phụ thuộc vào loại dữ liệu, giả thuyết, v.v Quyết định liệu có chấp nhận hay không những giả thuyết vô hiệu và tiến hành việc đưa ra quyết đinh Giả thuyết không khác biệt H 0 : - giả thuyết chỉ ra rằng không có sự thay đổi hoặc khác biệt nào liên quan đến những khẳng định mới nhất. Nhìn chung những dữ liệu đã được biết, được đặt là giả thuyết không khác biệt Giả thuyết thay thế H 1 : - Giả thuyết mà cố chứng minh việc sử dụng các lý do xác định dựa vào các mẫu - Công thức hóa những điều bạn muốn xem như là một giả thuyết thay thế ( Công thức hóa điều mà bạn thực sự muốn khẳng định như là một giả thuyết thay thế) Công thức hóa giả thuyết Một giả sử, một khẳng định hay chỉ đơn giản là một phỏng đoán về một tham số được xem như một giả thuyết thông kê hoặc một giả thuyết Ví dụ - Liệu doanh thu bán hàng của máy điều hòa nhiệt độ có tăng sau khi áp dụng chiến dịch quảng cáo mới? + giả thuyết không khác biệt: Không có sự thay đổi nào trong doanh thu bán hàng sau chiến dịch quảng cáo mới + giả thuyết thay thế: Doanh thu bán hàng tăng cao sau chiến dịch quảng cáo mới - Có sự khác biệt nào trong thời gian giao hàng trong 3 phương pháp giao hàng khác nhau? + giả thuyết không khác biệt: Không có sự khác biệt nào trong các phương pháp giao hàng khác nhau + giả thuyết thay thế: Có sự khác biệt giữa các phương pháp giao hàng khác nhau - Tỷ lệ bán hàng có tăng sau sự cải tiến không? + giả thuyết không khác biệt: Không có sự thay đổi trong tỷ lệ bán hàng sau cải tiến + giả thuyết thay thế: Tỷ lệ bán hàng giảm xuống sau cải tiến - Liệu các tỷ lệ hỗ trợ cho ứng viên A có vượt 50% không? + giả thuyết không khác biệt: Tỷ lệ hỗ trợ ứng viên A là 50% hoặc dưới mức đó + giả thuyết thay thế: Tỷ lệ hỗ trợ ứng viên A là trên 50% Trước (A) Sau (B) 89.7 84.7 81.4 86.1 84.5 83.2 84.8 91.9 87.3 86.3 79.7 79.3 85.1 82.6 81.7 89.1 83.7 83.7 84.5 88.5 Trước vs. Sau cải tiến Ví dụ của công thức hóa giả thiết Phương pháp giao hàng đã được cải tiến, và chúng tôi muốn kiểm tra xem liệu có hay không sự khác nhau giữa phương pháp giao hàng trước và sau cải tiến. Sau khi làm thí nghiệm và đo lường thời gian các lần giao hàng, làm sao chúng ta có thể đánh giá liệu có sự khác biệt đáng kể nào giữa những lợi nhuận của 2 quá trình ? (Tên file: Hypo_yield.mtw) Những dữ liệu ở phía tay phải là thời gian các lần giao hàng của trước và sau khi cải tiến phương pháp giao hàng. “ Có sự khác biệt thực sự nào giữa trước cải tiến (A) và sau cải tiến (B) hay không ?” (Đơn vị tính :Phút) Câu hỏi thực hành: Bạn có thể nói rằng liệu có sự khác biệt nào về lợi nhuận của qui trình sau cải tiến B và qui trình đang sử dụng A?  Câu hỏi thống kê: Liệu sự khác biệt giữa những giá trị trung bình của qui trình B (85.54) và qui trình A (84.24) có bất kỳ thống kê đáng kể nào không? Hay sự khác biệt này chỉ đơn giản là được gây ra trong một thời gian? Bạn muốn biết điều gì? Làm thế nào để biết? Công cụ nào được sử dụng? Dữ liệu nào được yêu cầu? Làm thế nào để thu thập được dữ liệu? Giả thuyết thay thê ́(H 1 ) Giải thích thống kê : Giá trị trung bình của quá trình A và qui trình B là hoàn toàn khác nhau. Giải thích thực tế : hiệu suất trung bình của qui trình B và qui trình A là khác nhau. Giả thuyết không khác biệt (H o ) Giải thích thống kê: Không có sự khác biệt nào về giá trị trung bình của qui trình A và B Giải thích thực tế : Không có sự khác biệt nào giữa hiệu suất của hai quá trình. Đó là, hiệu suất của quá trình được cải tiến không khác gì hiệu suất của quá trình hiện tại Mục đích: Để đánh giá, sử dụng các mẫu, nếu hiệu suất của quá trình cải tiến B là khác biệt với hiệu suất của quá trình đang sử dụng A. Các loại phương pháp giả thuyết thống kê: Thử nghiệm trung bình Thử nghiệm sự biến thiên Thử nghiệm tỷ lệ của tập hợp Non-parametric Test Loại thử nghiệm 1-Sample t test 2-Sample t test Paired t test ANOVA Equal variance test F test 1 Proportion 2 Proportion Chi-square test 1-Sample Wilcoxon test Mann-Whitney test Kruskal-Wallis test Mục đích sử dụng Được sử dụng khi các mẫu có phân bố thông thường (normal distribution) Được dùng để xác định nếu giá trị trung bình của một hay nhiều mẫu là giống nhau Dùng để xác định nếu các giá trị biến thiên của một hay nhiều mẫu là giống nhau Dùng để xác định nếu giá trị tỷ lệ của một hay nhiều mẫu là giống nhau Dùng khi mẫu là phân bố không bình thường (non-normal distribution) Dùng để xác định nếu các giá trị giữa (Median) của một hay nhiều mẫu là giống nhau. Loại lỗi I: > Lỗi của việc loại bỏ giả thuyết không khác biệt H 0, mặc dù nó đúng > H 0 : Sản lượng sản phẩm được sản xuất ra bởi quá trình A và B là giống nhau → Giả thuyết không khác biệt bị loại kể cả trong trường hợp sản lượng của cả hai quá trình sản xuất là giống nhau. Loại lỗi II: > Lỗi của việc không loại bỏ giả thuyết không khác biệt H 0 mặc dù nó sai (H 1 is true) > H 0 : Sản lượng sản phẩm được sản xuất ra bởi 2 quá trình A và B là giống nhau → Giả thuyết không khác biệt H o không bị loại kể cả trong trường hợp sản lượng của cả hai quá trình là không giống nhau. Hai loại lỗi trong giả thuyết thử nghiệm Sự việc (Giá trị đúng) H 0 H 1 Quyết định Chấp nhận H 0 Quyết định đúng Loại lỗi II Chấp nhận H 1 Loại lỗi I Quyết định đúng Loại bỏ H 0 Không thể loại bỏ H 0 1- H o H 1 -Risk Xác suất liên quan đến lỗi kiể