Bài giảng Six sigma - Chương 12: Ước tính và thử nghiệm giả thuyết

Ước tính là gì? Định nghĩa sự ước tính Là ước tính những thống kê của một tập hợp dựa trên dữ liệu mẫu Qui trình thống kê ước tính các giá trị (ví dụ như số trung bình của tập hợp, sự cân xứng của tập hợp, biến thiên tập hợp) biểu thị những đặc tính của sự phân bố tập hợp dựa trên thống kê của các mẫu. Kết luận thống kê và ra quyết định liên quan tới tập hợp dựa trên những thống kê của các mẫu.

36 trang | Chia sẻ: thuyduongbt11 | Lượt xem: 853 | Lượt tải: 2

Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 12: Ước tính và thử nghiệm giả thuyết, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Ước tính và Thử nghiệm giả thuyết Mục tiêu học tập Hiểu cách thức ước tính các thông số, bằng cách sử dụng các dữ liệu mẫu để kiểm tra đặc tính của tập hợp số đông Hiểu được các quy trình để đưa ra quyết định có hay không, việc chấp nhận các giả thuyết, áp dụng cho số đông Ước tính Thử nghiệm giả thuyết Sơ đồ thử nghiệm giả thiết Stat -Tables - Chi-square Test Stat -Basic Stats -2 proportion Stat -Basic Stats -1 proportion Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t select “ assume equal variances” Ho: M1 = M (Target) H 1 : M1 ¹ M (Target) Stat - Nonparametric - 1 Sample-Sign or Stat - Nonparametric - 1 Sample-Wilcoxon Continuous Data Normality Test Hypothesis Testing One-way ANOVA Discrete Data Chi-Square Test Ho: m1 = m2 = m3 = ... H 1 : at least one is different Stat - Anova- One-way Ho: Data is normal. H 1 : Data is not normal. Stat - Basic Stat - Normality Test When significance level  = 0.05 : If P-value >0.05 , cannot reject Ho If P-value <0.05 , reject Ho Normal Data CI for Standard Deviation One population Two or more population 2 Sample t (variance equal ) 2 Sample t (variance not equal) 1 Sample t or 1 Sample Z Ho: m1 = m (target) H 1 : m1 ¹ m (target) Stat - Basic Stats - 1 Sample-t ( s is unknown) 1Sample Z ( s is known) 1 Sample-Sign or 1 Sample-Wilcoxon Mann-Whitney Test Two or more populations Two populations 1-Proportion 2-Proportion One population Two population Two or more population Non Normal Data Equal Variance Yes No Kruskal-Wallis Test One population Two populations Two or more populations Ho: M1 = M2 H 1 : M1 ¹ M2 Stat - Nonparametric - Mann-Whitney Ho: M1 = M2 = M3 = ... H 1 : at least one is different Stat - Nonparametric - Kruskal-Wallis Ho: m1 = m2 H 1 : m1 ¹ m2 Stat - Basic Stats - 2-Sample t do not select “ assume equal variances” Test for Equal Variances (Levene’s Test) Test for Equal Variances (F Test or Bartlett’s Test) Ho: s1 = s2 = s3 = .. ... H 1 : at least one is different Stat - Anova - Test for Equal Variances Use F-test when comparing two populations only Ho: s 1 = s (Target) H 1 : s 1 ¹ s (Target) Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu. Stat -Basic Statistics - Display Descriptive Stats Định nghĩa sự ước tính Là ước tính những thống kê của một tập hợp dựa trên dữ liệu mẫu Qui trình thống kê ước tính các giá trị (ví dụ như số trung bình của tập hợp, sự cân xứng của tập hợp, biến thiên tập hợp) biểu thị những đặc tính của sự phân bố tập hợp dựa trên thống kê của các mẫu. Kết luận thống kê và ra quyết định liên quan tới tập hợp dựa trên những thống kê của các mẫu. Mục đích của ước tính Mục đích ước lượng là để có được những thông tin về tập hợp qua việc phân tích dữ liệu mẫu và để đưa ra quyết định và có hành động đúng đắn liên quan đến tập hợp này. Ước tính là gì? Tập hợp Trung bình tập hợp: μ biến thiên tập hợp: σ 2 Cân xứng của tập hợp: p Mẫu Mẫu Mẫu Trung bình mẫu: Mẫu biến thiên: σ 2 Mẫu cân xứng: Sự ước tính Các loại ước tính Điểm ước tính : Ước tính một giá trị của thông số. (VD.) Vòng đời của sản phẩm B là 5 năm Số trung bình, độ lệch chuẩn, biến thiên, số trung vị, vv... Giá trị điểm ước tính không bao gồm khái niệm sai số. Nghĩa là, điểm ước tính không chỉ ra giá trị ước tính gần với giá trị thực tế như thế nào. Khoảng ước tính Khoảng ước tính mong đợi thì bao gồm giá trị thật của thông số sử dụng dữ liệu mẫu. Ví dụ: Tỉ lệ khuyết tật trên thị trường của sản phẩm A: (2%, 8%) Tỉ lệ khuyết tật trên thị trường của sản phẩm A là từ 2% đến 8%. Tổng quan về ước tính Điểm ước tính không chỉ ra giá trị ước tính gần với giá trị thực tế như thế nào. Sai sót Mặc dù chúng ta đều hy vọng rằng các giá trị đặc trưng (số trung bình, độ lệch chuẩn, vv...) của mẫu giống như đặc tính thực của tập hợp nhưng trong hầu hết các trường hợp là vẫn tồn tại một vài sự khác biệt. Độ tin cậy vào khoảng ước tính là bao nhiêu? Khoảng ước tính có tầm tin cậy khác nhau dựa vào sai số cho phép. Khoảng ước tính có tầm tin cậy khác nhau dựa vào sai số cho phép. Khoảng ước tính dựa vào sai số cho phép được gọi là khoảng ước tính tin cậy và khoảng giá trị được ước tính này được gọi là khoảng tin cậy. Tập hợp Mẫu 1 Mẫu 3 Mẫu 2 Sai sót của mẫu Sai sót của mẫu là sự khác nhau giữa sự ước tính dựa trên một mẫu và giá trị thực của tập hợp Khoảng tin cậy Khoảng tin cậy Khi giá trị sai hỏng là và mẫu có cùng kích thước được trích ra từ nhiều lần, khoảng giá trị bao gồm các giá trị thực được biểu diễn là gọi là khoảng tin cậy - Ở đây, được biểu diễn như là mức tin cậy. - Mức tin cậy chỉ ra xác suất mà khoảng giá trị được ước tính sẽ bao gồm các thông số. =0.5(50%) =0.1(10%) Mức độ tin cậy Khoảng tin cậy Sai hỏng Khái niệm về khoảng tin cậy Nếu các mẫu riêng (kích cỡ = n) được lấy lặp lại từ một tập hợp và tính khoảng tin cậy cho từng mẫu thì khoảng tin cậy sẽ thay đổi khi mỗi mẫu có giá trị số trung bình khác nhau. Trung bình tập hợp Khoảng tin cậy 90% có nghĩa là gì? Mẫu 1 Mẫu 2 Mẫu 10 Khoảng tin cậy 90% nghĩa là 90% trong tổng số 10 khoảng tin cậy được tính toán lặp lại có chứa số trung bình của tập hợp 130 140 150 160 170 180 190 200 210 220 230 130 140 150 160 170 180 190 200 210 220 230 Có phải mức tin cậy càng lớn thì sẽ càng tốt? Mức tin cậy càng lớn nghĩa là phạm vi khoảng giá trị càng lớn, nghĩa là tăng phạm vi cho các thông số. Vì vậy, mức tin cậy càng lớn thì giá trị thông tin sẽ càng ít. Nhìn chung, mức tin cậy được áp dụng rộng rãi nhất là 0,9; 0,95 và 0,99. Ví dụ: khi ước lượng khoảng chiều cao trung bình của những người đàn ông trưởng thành ở Việt nam, • Trường hợp xác định khoảng giá trị của mức tin cậy từ 1,3m đến 2,3m - Khoảng giá trị này có thể có mức tin cậy cao bởi vì nó chứa tất cả các độ cao xác suất, nhưng không có ý nghĩa thống kê bởi vì khoảng giá trị này quá rộng. Trường hợp xác định khoảng giá trị của mức tin cậy nằm giữa 1,6m tới 1,7m Khoảng giá trị này không bao gồm xác suất của giá trị thực là cao hơn, nghĩa là sai số càng lớn. Vì vậy, mặc dù có ý nghĩa thống kê nhưng mức tin cậy lại giảm. Tính khoảng tin cậy cho dữ liệu liên tục Dùng phần mềm minitab tính khoảng tin cậy (Tên file: Confidence Interval ex1.mtw) Tính khoảng tin cậy sử dụng phần mềm Minitab Stat > Basic Statistics > Graphical Summary Trường hợp có đa biến số thì tính thống kê của mỗi biến số Nhập vào mức tin cậy mà bạn muốn đạt được. 1 2 3 1 2 3 1.Ước tính khoảng tin cậy cho số trung bình. (Khoảng tin cậy 95%): Phân bố t 2. Ước tính khoảng tin cậy cho số trung vị. (Khoảng tin cậy 95%) 3. Ước tính khoảng tin cậy cho độ lệch chuẩn. (miền tin cậy 95%) Biểu đồ kết quả 1 2 4 3 5 Stat > Basic Statistics > 1 Proportion Ví dụ: Một trạm phát sóng truyền hình cáp tiến hành một cuộc khảo sát qua điện thoại, trạm chọn ngẫu nhiên 1.500 khán giả trên toàn quốc để điều tra tỉ lệ phổ biến cho chương trình mới phát. Khi chương trình phát sóng, người khảo sát đã gọi điện và biết rằng có 630 người trong số những khán giả được khảo sát đang xem chương trình. Hãy tính khoảng tin cậy 95% cho tính phổ biến của chương trình được ước tính. Tính khoảng tin cậy cho dữ liệu rời rạc Tính khoảng tin cậy của của tỉ lệ tổng thể của một tập hợp Khi nhập dữ liệu vào cột bảng tính. Test and CI for One Proportion Test of p = 0.5 vs p not = 0.5 Exact Sample X N Sample p 95% CI P-Value 1 630 1500 0.420000 (0.394867, 0.445447) 0.000 Xác nhận kết quả Chúng ta có thể tin cậy 95% rằng tính phổ biến của chương trình nằm trong khoảng 39,5% đến 44,5% Stat > Basic Statistics > 2 Proportions Ví dụ: Chúng ta sẽ so sánh sự khác nhau trong tỉ lệ doanh số bán sản phẩm giữa hai công ty sản xuất, một công ty đã bán được 300 sản phẩm G/Red trên tổng số 1000 sản phẩm và công ty kia đã bán được 200 trên tổng số 1200 sản phẩm. Hãy tính khoảng tin cậy 95% cho sự chênh lệch trong tỉ lệ doanh số bán giữa hai công ty. Tính khoảng tin cậy cho dữ liệu rời rạc Tính khoảng tin cậy của của tỉ lệ tổng thể của hai tập hợp khác nhau 1 2 4 3 5 Xác nhận các kết quả Chúng ta có thể tin cậy 95 % rằng sự chênh lệch khuyết tật giữa các dây chuyền sản xuất của hai công ty là nằm trong khoảng 9,79% đến 16,8% Test and CI for Two Proportions Sample X N Sample p 1 300 1000 0.300000 2 200 1200 0.166667 Difference = p (1) - p (2) Estimate for difference: 0.133333 95% CI for difference: (0.0979593, 0.168707) Test for difference = 0 (vs not = 0): Z = 7.39 P-Value = 0.000 Cách sử dụng và giải thích khoảng tin cậy Cách sử dụng khoảng tin cậy Tính toán khoảng tin cậy là rất hữu ích trong việc chứng minh sự việc đã biết hoặc mong đợi sẽ được biết. Ví dụ: Hãy giả sử rằng số trung bình được xác định của một quá trình đang tồn tại là 10. Nếu khoảng tin cậy 95% của quá trình này có tính đến những sai số mẫu là 9,05 tới 10,34 thì có thể tin cậy giá trị trung bình giả thiết của 10 nằm trong khoảng tin cậy. Nếu giá trị giả thiết không nằm trong khoảng tin cậy, chúng ta có thể nói rằng giá trị đó là sai. Khoảng tin cậy còn được sử dụng để chứng minh có hay không dữ liệu được lấy ra từ cùng một tập hợp. Ví dụ: Trong trường hợp lấy từ 2 hay nhiều nhóm mẫu thì các số trung bình hay độ lệch chuẩn của nhóm mẫu từ cùng một tập hợp nên giống nhau. Vì vậy, nếu khoảng tin cậy cho sự chênh lệch giữa các mẫu bao gồm 0 (số không biểu thị không có sự chênh lệch) thì coi như các mẫu được lấy từ cùng tập hợp. Bất kỳ sự thay đổi tới một quá trình hay một sản phẩm nào sẽ gây ra sự thay đổi trong tập hợp. (Các tập hợp trước và sau khi thay đổi sẽ khác nhau). Trong trường hợp này, hãy thu thập dữ liệu cả trước và sau khi thay đổi và tính khoảng tin cậy cho sự chênh lệch này. Nếu khoảng tin cậy có chứa 0 (số không) thì coi như tập hợp đó vẫn duy trì những đặc tính giống nhau trước và sau khi thay đổi và sau khi thay đổi tập hợp không bị ảnh hưởng gì. Loại phân bố Phân bố Binomial Phân bố Poisson Weibull distribution Phân bố t Phân bố Phân bố F Liên quan tới số trung bình Liên quan tới biến thiên { { Loại rời rạc (Xác suất phân bố rời rạc) Loại liên tục (Xác suất phân bố liên tục) Phân bố thường Sự phân bố của mẫu Một phương pháp chứng minh những khẳng định hay các dữ liệu giả thuyết. Phải xác định rõ ràng những khẳng định hay các dữ liệu giả thuyết. Chứng minh chúng sử dụng các dữ liệu thống kê Thử nghiệm giả thuyết Ví dụ) Sự việc bạn muốn biết là : Sản lượng trung bình của một dây chuyền sản xuất bánh xốp tại công đoạn A là 98.5% hay cao hơn? Tỉ lệ lỗi thị trường của sản phẩm B là 3% hay thấp hơn? Những khẳng định mang tính chất tuyên bố : Máy đóng gói mới vừa được giới thiệu thì có tỉ lệ lỗi thấp hơn những máy đang sử dụng. Nhân tố tiềm năng X ảnh hưởng đến Y. Công cụ nào nên được sử dụng để chứng minh những sự kiện hay những khẳng định? Định nghĩa của giả thuyết thử nghiệm Một phương pháp thống kê dùng để quyết định chấp nhận hay loại bỏ một sự đánh giá, một sự phỏng đoán hay một khẳng định liên quan đến một tham số bằng việc phân tích các mẫu dữ liệu được quan sát Mục đích Để thử nghiệm thống kê có hay không biến số đầu vào X ảnh hưởng đến đầu ra Y. Đó là, thử nghiệm có hay không giá trị đầu ra Y thay đổi, khi biến số đầu vào X thay đổi. Giả thuyết : Giả sử hay khẳng định.. tùy thuộc vào đặc tính của tập hợp Mẫu Mẫu Mẫu Lấy mẫu Thống kê giả thuyết thử nghiệm (Liệu phương pháp đó có ý nghĩa không?) Tập hợp Tổng quan về thử nghiệm giả thuyết Rất khó để quyết định những khẳng định về tham số bằng trực quan. Giả thuyết thử nghiệm khiến những đánh giá chủ quan được kiểm chứng một cách khách quan. Thông qua giả thuyết thử nghiệm, mọi người đều có chung một kết luận!!! Tại sao phải thực hiện giả thuyết thử nghiệm ? Bởi vì phương pháp chứng minh giả thuyết dựa vào những dữ liệu của nhóm mẫu, do đó vẫn luôn tồn tại khả năng sai lỗi. Bởi vậy, trong giả thuyết thử nghiệm thống kê, điều quan trọng nhất là cách quản lý những khả năng của những lỗi có thể mắc phải trước đó. Do đó, phương pháp giả thuyết thử nghiệm xác định trước những khả năng lỗi có thể và quyết định liệu có chấp nhận hay loại giả thuyết đó. Thủ tục giả thuyết thử nghiệm Thiết lập các giả thuyết Xác định mức độ quan trọng của  Tiến hành thử nghiệm thống kê Tính giá trị P Đưa ra kết luận Nếu giá trị P < , khi ấy loại bỏ H o Thuyết minh kết quả Lựa chọn phương pháp thử nghiệm giả thuyết thống kê phù hợp. Thiết lập giả thuyết không khác biệt và giả thuyết thay thế cho vấn đề bạn muốn khẳng định theo thống kê. Chọn phương pháp thử nghiệm phù hợp phụ thuộc vào loại dữ liệu, giả thuyết, v.v Quyết định liệu có chấp nhận hay không những giả thuyết vô hiệu và tiến hành việc đưa ra quyết đinh Giả thuyết không khác biệt H 0 : - giả thuyết chỉ ra rằng không có sự thay đổi hoặc khác biệt nào liên quan đến những khẳng định mới nhất. Nhìn chung những dữ liệu đã được biết, được đặt là giả thuyết không khác biệt Giả thuyết thay thế H 1 : - Giả thuyết mà cố chứng minh việc sử dụng các lý do xác định dựa vào các mẫu - Công thức hóa những điều bạn muốn xem như là một giả thuyết thay thế ( Công thức hóa điều mà bạn thực sự muốn khẳng định như là một giả thuyết thay thế) Công thức hóa giả thuyết Một giả sử, một khẳng định hay chỉ đơn giản là một phỏng đoán về một tham số được xem như một giả thuyết thông kê hoặc một giả thuyết Ví dụ - Liệu doanh thu bán hàng của máy điều hòa nhiệt độ có tăng sau khi áp dụng chiến dịch quảng cáo mới? + giả thuyết không khác biệt: Không có sự thay đổi nào trong doanh thu bán hàng sau chiến dịch quảng cáo mới + giả thuyết thay thế: Doanh thu bán hàng tăng cao sau chiến dịch quảng cáo mới - Có sự khác biệt nào trong thời gian giao hàng trong 3 phương pháp giao hàng khác nhau? + giả thuyết không khác biệt: Không có sự khác biệt nào trong các phương pháp giao hàng khác nhau + giả thuyết thay thế: Có sự khác biệt giữa các phương pháp giao hàng khác nhau - Tỷ lệ bán hàng có tăng sau sự cải tiến không? + giả thuyết không khác biệt: Không có sự thay đổi trong tỷ lệ bán hàng sau cải tiến + giả thuyết thay thế: Tỷ lệ bán hàng giảm xuống sau cải tiến - Liệu các tỷ lệ hỗ trợ cho ứng viên A có vượt 50% không? + giả thuyết không khác biệt: Tỷ lệ hỗ trợ ứng viên A là 50% hoặc dưới mức đó + giả thuyết thay thế: Tỷ lệ hỗ trợ ứng viên A là trên 50% Trước (A) Sau (B) 89.7 84.7 81.4 86.1 84.5 83.2 84.8 91.9 87.3 86.3 79.7 79.3 85.1 82.6 81.7 89.1 83.7 83.7 84.5 88.5 Trước vs. Sau cải tiến Ví dụ của công thức hóa giả thiết Phương pháp giao hàng đã được cải tiến, và chúng tôi muốn kiểm tra xem liệu có hay không sự khác nhau giữa phương pháp giao hàng trước và sau cải tiến. Sau khi làm thí nghiệm và đo lường thời gian các lần giao hàng, làm sao chúng ta có thể đánh giá liệu có sự khác biệt đáng kể nào giữa những lợi nhuận của 2 quá trình ? (Tên file: Hypo_yield.mtw) Những dữ liệu ở phía tay phải là thời gian các lần giao hàng của trước và sau khi cải tiến phương pháp giao hàng. “ Có sự khác biệt thực sự nào giữa trước cải tiến (A) và sau cải tiến (B) hay không ?” (Đơn vị tính :Phút) Câu hỏi thực hành: Bạn có thể nói rằng liệu có sự khác biệt nào về lợi nhuận của qui trình sau cải tiến B và qui trình đang sử dụng A?  Câu hỏi thống kê: Liệu sự khác biệt giữa những giá trị trung bình của qui trình B (85.54) và qui trình A (84.24) có bất kỳ thống kê đáng kể nào không? Hay sự khác biệt này chỉ đơn giản là được gây ra trong một thời gian? Bạn muốn biết điều gì? Làm thế nào để biết? Công cụ nào được sử dụng? Dữ liệu nào được yêu cầu? Làm thế nào để thu thập được dữ liệu? Giả thuyết thay thê ́(H 1 ) Giải thích thống kê : Giá trị trung bình của quá trình A và qui trình B là hoàn toàn khác nhau. Giải thích thực tế : hiệu suất trung bình của qui trình B và qui trình A là khác nhau. Giả thuyết không khác biệt (H o ) Giải thích thống kê: Không có sự khác biệt nào về giá trị trung bình của qui trình A và B Giải thích thực tế : Không có sự khác biệt nào giữa hiệu suất của hai quá trình. Đó là, hiệu suất của quá trình được cải tiến không khác gì hiệu suất của quá trình hiện tại Mục đích: Để đánh giá, sử dụng các mẫu, nếu hiệu suất của quá trình cải tiến B là khác biệt với hiệu suất của quá trình đang sử dụng A. Các loại phương pháp giả thuyết thống kê: Thử nghiệm trung bình Thử nghiệm sự biến thiên Thử nghiệm tỷ lệ của tập hợp Non-parametric Test Loại thử nghiệm 1-Sample t test 2-Sample t test Paired t test ANOVA Equal variance test F test 1 Proportion 2 Proportion Chi-square test 1-Sample Wilcoxon test Mann-Whitney test Kruskal-Wallis test Mục đích sử dụng Được sử dụng khi các mẫu có phân bố thông thường (normal distribution) Được dùng để xác định nếu giá trị trung bình của một hay nhiều mẫu là giống nhau Dùng để xác định nếu các giá trị biến thiên của một hay nhiều mẫu là giống nhau Dùng để xác định nếu giá trị tỷ lệ của một hay nhiều mẫu là giống nhau Dùng khi mẫu là phân bố không bình thường (non-normal distribution) Dùng để xác định nếu các giá trị giữa (Median) của một hay nhiều mẫu là giống nhau. Loại lỗi I: > Lỗi của việc loại bỏ giả thuyết không khác biệt H 0, mặc dù nó đúng > H 0 : Sản lượng sản phẩm được sản xuất ra bởi quá trình A và B là giống nhau → Giả thuyết không khác biệt bị loại kể cả trong trường hợp sản lượng của cả hai quá trình sản xuất là giống nhau. Loại lỗi II: > Lỗi của việc không loại bỏ giả thuyết không khác biệt H 0 mặc dù nó sai (H 1 is true) > H 0 : Sản lượng sản phẩm được sản xuất ra bởi 2 quá trình A và B là giống nhau → Giả thuyết không khác biệt H o không bị loại kể cả trong trường hợp sản lượng của cả hai quá trình là không giống nhau. Hai loại lỗi trong giả thuyết thử nghiệm Sự việc (Giá trị đúng) H 0 H 1 Quyết định Chấp nhận H 0 Quyết định đúng Loại lỗi II Chấp nhận H 1 Loại lỗi I Quyết định đúng Loại bỏ H 0 Không thể loại bỏ H 0 1- H o H 1 -Risk Xác suất liên quan đến lỗi kiể