Ước tính là gì?
Định nghĩa sự ước tính
Là ước tính những thống kê của một tập hợp dựa trên dữ liệu mẫu
Qui trình thống kê ước tính các giá trị (ví dụ như số trung bình của tập hợp, sự cân xứng của tập hợp, biến thiên tập hợp) biểu thị những đặc tính của sự phân bố tập hợp dựa trên thống kê của các mẫu.
Kết luận thống kê và ra quyết định liên quan tới tập hợp dựa trên những thống kê của các mẫu.
36 trang |
Chia sẻ: thuyduongbt11 | Ngày: 09/06/2022 | Lượt xem: 492 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Bài giảng Six sigma - Chương 12: Ước tính và thử nghiệm giả thuyết, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Ước tính và Thử nghiệm giả thuyết
Mục tiêu học tập
Hiểu cách thức ước tính các thông số, bằng cách sử dụng các dữ liệu mẫu để kiểm tra đặc tính của tập hợp số đông
Hiểu được các quy trình để đưa ra quyết định có hay không, việc chấp nhận các giả thuyết, áp dụng cho số đông
Ước tính
Thử nghiệm giả thuyết
Sơ đồ thử nghiệm giả thiết
Stat -Tables - Chi-square Test
Stat -Basic Stats -2 proportion
Stat -Basic Stats -1 proportion
Ho: m1 = m2
H 1 : m1 ¹ m2
Stat - Basic Stats - 2-Sample t
select “ assume equal variances”
Ho: M1 = M (Target)
H 1 : M1 ¹ M (Target)
Stat - Nonparametric - 1 Sample-Sign or
Stat - Nonparametric - 1 Sample-Wilcoxon
Continuous Data
Normality Test
Hypothesis Testing
One-way
ANOVA
Discrete Data
Chi-Square Test
Ho: m1 = m2 = m3 = ...
H 1 : at least one is different
Stat - Anova- One-way
Ho: Data is normal.
H 1 : Data is not normal.
Stat - Basic Stat - Normality Test
When significance level = 0.05 :
If P-value >0.05 , cannot reject Ho
If P-value <0.05 , reject Ho
Normal Data
CI for Standard Deviation
One population
Two or more
population
2 Sample t
(variance equal )
2 Sample t
(variance not equal)
1 Sample t or
1 Sample Z
Ho: m1 = m (target)
H 1 : m1 ¹ m (target)
Stat - Basic Stats - 1 Sample-t ( s is unknown)
1Sample Z ( s is known)
1 Sample-Sign or
1 Sample-Wilcoxon
Mann-Whitney Test
Two or more
populations
Two populations
1-Proportion
2-Proportion
One population
Two population
Two or more
population
Non Normal Data
Equal Variance
Yes
No
Kruskal-Wallis Test
One population
Two
populations
Two or more
populations
Ho: M1 = M2
H 1 : M1 ¹ M2
Stat - Nonparametric - Mann-Whitney
Ho: M1 = M2 = M3 = ...
H 1 : at least one is different
Stat - Nonparametric - Kruskal-Wallis
Ho: m1 = m2
H 1 : m1 ¹ m2
Stat - Basic Stats - 2-Sample t
do not select “ assume equal variances”
Test for Equal Variances
(Levene’s Test)
Test for Equal Variances
(F Test or Bartlett’s Test)
Ho: s1 = s2 = s3 = .. ...
H 1 : at least one is different
Stat - Anova - Test for Equal Variances
Use F-test when comparing two populations only
Ho: s 1 = s (Target)
H 1 : s 1 ¹ s (Target)
Minitab does not support testing to see if standard deviation is equal to a specific value. But, if you want to obtain estimate of standard deviation and its confidence interval, use the following menu.
Stat -Basic Statistics - Display Descriptive Stats
Định nghĩa sự ước tính
Là ước tính những thống kê của một tập hợp dựa trên dữ liệu mẫu
Qui trình thống kê ước tính các giá trị (ví dụ như số trung bình của tập hợp, sự cân xứng của tập hợp, biến thiên tập hợp) biểu thị những đặc tính của sự phân bố tập hợp dựa trên thống kê của các mẫu.
Kết luận thống kê và ra quyết định liên quan tới tập hợp dựa trên những thống kê của các mẫu.
Mục đích của ước tính
Mục đích ước lượng là để có được những thông tin về tập hợp qua việc phân tích dữ liệu mẫu và để đưa ra quyết định và có hành động đúng đắn liên quan đến tập hợp này.
Ước tính là gì?
Tập hợp
Trung bình tập hợp: μ
biến thiên tập hợp: σ 2
Cân xứng của tập hợp: p
Mẫu
Mẫu
Mẫu
Trung bình mẫu:
Mẫu biến thiên: σ 2
Mẫu cân xứng:
Sự ước tính
Các loại ước tính
Điểm ước tính : Ước tính một giá trị của thông số.
(VD.) Vòng đời của sản phẩm B là 5 năm
Số trung bình, độ lệch chuẩn, biến thiên, số trung vị, vv...
Giá trị điểm ước tính không bao gồm khái niệm sai số.
Nghĩa là, điểm ước tính không chỉ ra giá trị ước tính gần với giá trị thực tế như thế nào.
Khoảng ước tính
Khoảng ước tính mong đợi thì bao gồm giá trị thật của thông số sử dụng dữ liệu mẫu.
Ví dụ: Tỉ lệ khuyết tật trên thị trường của sản phẩm A: (2%, 8%)
Tỉ lệ khuyết tật trên thị trường của sản phẩm A là từ 2% đến 8%.
Tổng quan về ước tính
Điểm ước tính không chỉ ra giá trị ước tính gần với giá trị thực tế như thế nào.
Sai sót
Mặc dù chúng ta đều hy vọng rằng các giá trị đặc trưng (số trung bình, độ lệch chuẩn, vv...) của mẫu giống như đặc tính thực của tập hợp nhưng trong hầu hết các trường hợp là vẫn tồn tại một vài sự khác biệt.
Độ tin cậy vào khoảng ước tính là bao nhiêu?
Khoảng ước tính có tầm tin cậy khác nhau dựa vào sai số cho phép. Khoảng ước tính có tầm tin cậy khác nhau dựa vào sai số cho phép. Khoảng ước tính dựa vào sai số cho phép được gọi là khoảng ước tính tin cậy và khoảng giá trị được ước tính này được gọi là khoảng tin cậy.
Tập hợp
Mẫu 1
Mẫu 3
Mẫu 2
Sai sót của mẫu
Sai sót của mẫu là sự khác nhau giữa sự ước tính dựa trên một mẫu và giá trị thực của tập hợp
Khoảng tin cậy
Khoảng tin cậy
Khi giá trị sai hỏng là và mẫu có cùng kích thước được trích ra từ nhiều lần, khoảng giá trị bao gồm các giá trị thực được biểu diễn là
gọi là khoảng tin cậy
- Ở đây, được biểu diễn như là mức tin cậy.
- Mức tin cậy chỉ ra xác suất mà khoảng giá trị được ước tính sẽ bao gồm các thông số.
=0.5(50%)
=0.1(10%)
Mức độ tin cậy
Khoảng tin cậy
Sai hỏng
Khái niệm về khoảng tin cậy
Nếu các mẫu riêng (kích cỡ = n) được lấy lặp lại từ một tập hợp và tính khoảng tin cậy cho từng mẫu thì khoảng tin cậy sẽ thay đổi khi mỗi mẫu có giá trị số trung bình khác nhau.
Trung bình tập hợp
Khoảng tin cậy 90% có nghĩa là gì?
Mẫu 1
Mẫu 2
Mẫu 10
Khoảng tin cậy 90% nghĩa là 90% trong tổng số 10 khoảng tin cậy được tính toán lặp lại có chứa số trung bình của tập hợp
130 140 150 160 170 180 190 200 210 220 230
130 140 150 160 170 180 190 200 210 220 230
Có phải mức tin cậy càng lớn thì sẽ càng tốt?
Mức tin cậy càng lớn nghĩa là phạm vi khoảng giá trị càng lớn, nghĩa là tăng phạm vi cho các thông số. Vì vậy, mức tin cậy càng lớn thì giá trị thông tin sẽ càng ít.
Nhìn chung, mức tin cậy được áp dụng rộng rãi nhất là 0,9; 0,95 và 0,99.
Ví dụ: khi ước lượng khoảng chiều cao trung bình của những người đàn ông trưởng thành ở Việt nam,
• Trường hợp xác định khoảng giá trị của mức tin cậy từ 1,3m đến 2,3m
- Khoảng giá trị này có thể có mức tin cậy cao bởi vì nó chứa tất cả các độ cao xác suất, nhưng không có ý nghĩa thống kê bởi vì khoảng giá trị này quá rộng.
Trường hợp xác định khoảng giá trị của mức tin cậy nằm giữa 1,6m tới 1,7m
Khoảng giá trị này không bao gồm xác suất của giá trị thực là cao hơn, nghĩa là sai số càng lớn. Vì vậy, mặc dù có ý nghĩa thống kê nhưng mức tin cậy lại giảm.
Tính khoảng tin cậy cho dữ liệu liên tục
Dùng phần mềm minitab tính khoảng tin cậy (Tên file: Confidence Interval ex1.mtw)
Tính khoảng tin cậy sử dụng phần mềm Minitab
Stat > Basic Statistics > Graphical Summary
Trường hợp có đa biến số thì tính thống kê của mỗi biến số
Nhập vào mức tin cậy mà bạn muốn đạt được.
1
2
3
1
2
3
1.Ước tính khoảng tin cậy cho số trung bình. (Khoảng tin cậy 95%): Phân bố t
2. Ước tính khoảng tin cậy cho số trung vị. (Khoảng tin cậy 95%)
3. Ước tính khoảng tin cậy cho độ lệch chuẩn. (miền tin cậy 95%)
Biểu đồ kết quả
1
2
4
3
5
Stat > Basic Statistics > 1 Proportion
Ví dụ: Một trạm phát sóng truyền hình cáp tiến hành một cuộc khảo sát qua điện thoại, trạm chọn ngẫu nhiên 1.500 khán giả trên toàn quốc để điều tra tỉ lệ phổ biến cho chương trình mới phát. Khi chương trình phát sóng, người khảo sát đã gọi điện và biết rằng có 630 người trong số những khán giả được khảo sát đang xem chương trình. Hãy tính khoảng tin cậy 95% cho tính phổ biến của chương trình được ước tính.
Tính khoảng tin cậy cho dữ liệu rời rạc
Tính khoảng tin cậy của của tỉ lệ tổng thể của một tập hợp
Khi nhập dữ liệu vào cột bảng tính.
Test and CI for One Proportion
Test of p = 0.5 vs p not = 0.5
Exact
Sample X N Sample p 95% CI P-Value
1 630 1500 0.420000 (0.394867, 0.445447) 0.000
Xác nhận kết quả
Chúng ta có thể tin cậy 95% rằng tính phổ biến của chương trình nằm trong khoảng 39,5% đến 44,5%
Stat > Basic Statistics > 2 Proportions
Ví dụ: Chúng ta sẽ so sánh sự khác nhau trong tỉ lệ doanh số bán sản phẩm giữa hai công ty sản xuất, một công ty đã bán được 300 sản phẩm G/Red trên tổng số 1000 sản phẩm và công ty kia đã bán được 200 trên tổng số 1200 sản phẩm. Hãy tính khoảng tin cậy 95% cho sự chênh lệch trong tỉ lệ doanh số bán giữa hai công ty.
Tính khoảng tin cậy cho dữ liệu rời rạc
Tính khoảng tin cậy của của tỉ lệ tổng thể của hai tập hợp khác nhau
1
2
4
3
5
Xác nhận các kết quả
Chúng ta có thể tin cậy 95 % rằng sự chênh lệch khuyết tật giữa các dây chuyền sản xuất của hai công ty là nằm trong khoảng 9,79% đến 16,8%
Test and CI for Two Proportions
Sample X N Sample p
1 300 1000 0.300000
2 200 1200 0.166667
Difference = p (1) - p (2)
Estimate for difference: 0.133333
95% CI for difference: (0.0979593, 0.168707)
Test for difference = 0 (vs not = 0): Z = 7.39 P-Value = 0.000
Cách sử dụng và giải thích khoảng tin cậy
Cách sử dụng khoảng tin cậy
Tính toán khoảng tin cậy là rất hữu ích trong việc chứng minh sự việc đã biết hoặc mong đợi sẽ được biết.
Ví dụ: Hãy giả sử rằng số trung bình được xác định của một quá trình đang tồn tại là 10. Nếu khoảng tin cậy 95% của quá trình này có tính đến những sai số mẫu là 9,05 tới 10,34 thì có thể tin cậy giá trị trung bình giả thiết của 10 nằm trong khoảng tin cậy.
Nếu giá trị giả thiết không nằm trong khoảng tin cậy, chúng ta có thể nói rằng giá trị đó là sai.
Khoảng tin cậy còn được sử dụng để chứng minh có hay không dữ liệu được lấy ra từ cùng một tập hợp.
Ví dụ: Trong trường hợp lấy từ 2 hay nhiều nhóm mẫu thì các số trung bình hay độ lệch chuẩn của nhóm mẫu từ cùng một tập hợp nên giống nhau. Vì vậy, nếu khoảng tin cậy cho sự chênh lệch giữa các mẫu bao gồm 0 (số không biểu thị không có sự chênh lệch) thì coi như các mẫu được lấy từ cùng tập hợp.
Bất kỳ sự thay đổi tới một quá trình hay một sản phẩm nào sẽ gây ra sự thay đổi trong tập hợp. (Các tập hợp trước và sau khi thay đổi sẽ khác nhau). Trong trường hợp này, hãy thu thập dữ liệu cả trước và sau khi thay đổi và tính khoảng tin cậy cho sự chênh lệch này. Nếu khoảng tin cậy có chứa 0 (số không) thì coi như tập hợp đó vẫn duy trì những đặc tính giống nhau trước và sau khi thay đổi và sau khi thay đổi tập hợp không bị ảnh hưởng gì.
Loại phân bố
Phân bố Binomial
Phân bố Poisson
Weibull distribution
Phân bố t
Phân bố
Phân bố F
Liên quan tới số trung bình
Liên quan tới biến thiên
{
{
Loại rời rạc
(Xác suất phân bố rời rạc)
Loại liên tục
(Xác suất phân bố liên tục)
Phân bố thường
Sự phân bố của mẫu
Một phương pháp chứng minh những khẳng định hay các dữ liệu giả thuyết.
Phải xác định rõ ràng những khẳng định hay các dữ liệu giả thuyết.
Chứng minh chúng sử dụng các dữ liệu thống kê
Thử nghiệm giả thuyết
Ví dụ)
Sự việc bạn muốn biết là :
Sản lượng trung bình của một dây chuyền sản xuất bánh xốp tại công đoạn A là 98.5% hay cao hơn?
Tỉ lệ lỗi thị trường của sản phẩm B là 3% hay thấp hơn?
Những khẳng định mang tính chất tuyên bố :
Máy đóng gói mới vừa được giới thiệu thì có tỉ lệ lỗi thấp hơn những máy đang sử dụng.
Nhân tố tiềm năng X ảnh hưởng đến Y.
Công cụ nào nên được sử dụng để chứng minh những sự kiện hay những khẳng định?
Định nghĩa của giả thuyết thử nghiệm
Một phương pháp thống kê dùng để quyết định chấp nhận hay loại bỏ một sự đánh giá, một sự phỏng đoán hay một khẳng định liên quan đến một tham số bằng việc phân tích các mẫu dữ liệu được quan sát
Mục đích
Để thử nghiệm thống kê có hay không biến số đầu vào X ảnh hưởng đến đầu ra Y.
Đó là, thử nghiệm có hay không giá trị đầu ra Y thay đổi, khi biến số đầu vào X thay đổi.
Giả thuyết :
Giả sử hay khẳng định.. tùy thuộc vào đặc tính của tập hợp
Mẫu
Mẫu
Mẫu
Lấy mẫu
Thống kê giả thuyết thử nghiệm
(Liệu phương pháp đó có ý nghĩa không?)
Tập hợp
Tổng quan về thử nghiệm giả thuyết
Rất khó để quyết định những khẳng định về tham số bằng trực quan.
Giả thuyết thử nghiệm khiến những đánh giá chủ quan được kiểm chứng một cách khách quan.
Thông qua giả thuyết thử nghiệm, mọi người đều có chung một kết luận!!!
Tại sao phải thực hiện giả thuyết thử nghiệm ?
Bởi vì phương pháp chứng minh giả thuyết dựa vào những dữ liệu của nhóm mẫu, do đó vẫn luôn tồn tại khả năng sai lỗi. Bởi vậy, trong giả thuyết thử nghiệm thống kê, điều quan trọng nhất là cách quản lý những khả năng của những lỗi có thể mắc phải trước đó. Do đó, phương pháp giả thuyết thử nghiệm xác định trước những khả năng lỗi có thể và quyết định liệu có chấp nhận hay loại giả thuyết đó.
Thủ tục giả thuyết thử nghiệm
Thiết lập các giả thuyết
Xác định mức độ quan trọng của
Tiến hành thử nghiệm thống kê
Tính giá trị P
Đưa ra kết luận
Nếu giá trị P < , khi ấy loại bỏ H o
Thuyết minh kết quả
Lựa chọn phương pháp thử nghiệm giả thuyết thống kê phù hợp.
Thiết lập giả thuyết không khác biệt và giả thuyết thay thế cho vấn đề bạn muốn khẳng định theo thống kê.
Chọn phương pháp thử nghiệm phù hợp phụ thuộc vào loại dữ liệu, giả thuyết, v.v
Quyết định liệu có chấp nhận hay không những giả thuyết vô hiệu và tiến hành việc đưa ra quyết đinh
Giả thuyết không khác biệt H 0 :
- giả thuyết chỉ ra rằng không có sự thay đổi hoặc khác biệt nào liên quan đến những khẳng định mới nhất.
Nhìn chung những dữ liệu đã được biết, được đặt là giả thuyết không khác biệt
Giả thuyết thay thế H 1 :
- Giả thuyết mà cố chứng minh việc sử dụng các lý do xác định dựa vào các mẫu
- Công thức hóa những điều bạn muốn xem như là một giả thuyết thay thế
( Công thức hóa điều mà bạn thực sự muốn khẳng định như là một giả thuyết thay thế)
Công thức hóa giả thuyết
Một giả sử, một khẳng định hay chỉ đơn giản là một phỏng đoán về một tham số được xem như một giả thuyết thông kê hoặc một giả thuyết
Ví dụ
- Liệu doanh thu bán hàng của máy điều hòa nhiệt độ có tăng sau khi áp dụng chiến dịch quảng cáo mới?
+ giả thuyết không khác biệt: Không có sự thay đổi nào trong doanh thu bán hàng sau chiến dịch quảng cáo mới
+ giả thuyết thay thế: Doanh thu bán hàng tăng cao sau chiến dịch quảng cáo mới
- Có sự khác biệt nào trong thời gian giao hàng trong 3 phương pháp giao hàng khác nhau?
+ giả thuyết không khác biệt: Không có sự khác biệt nào trong các phương pháp giao hàng khác nhau
+ giả thuyết thay thế: Có sự khác biệt giữa các phương pháp giao hàng khác nhau
- Tỷ lệ bán hàng có tăng sau sự cải tiến không?
+ giả thuyết không khác biệt: Không có sự thay đổi trong tỷ lệ bán hàng sau cải tiến
+ giả thuyết thay thế: Tỷ lệ bán hàng giảm xuống sau cải tiến
- Liệu các tỷ lệ hỗ trợ cho ứng viên A có vượt 50% không?
+ giả thuyết không khác biệt: Tỷ lệ hỗ trợ ứng viên A là 50% hoặc dưới mức đó
+ giả thuyết thay thế: Tỷ lệ hỗ trợ ứng viên A là trên 50%
Trước (A) Sau (B)
89.7 84.7
81.4 86.1
84.5 83.2
84.8 91.9
87.3 86.3
79.7 79.3
85.1 82.6
81.7 89.1
83.7 83.7
84.5 88.5
Trước vs. Sau
cải tiến
Ví dụ của công thức hóa giả thiết
Phương pháp giao hàng đã được cải tiến, và chúng tôi muốn kiểm tra xem liệu có hay không sự khác nhau giữa phương pháp giao hàng trước và sau cải tiến. Sau khi làm thí nghiệm và đo lường thời gian các lần giao hàng, làm sao chúng ta có thể đánh giá liệu có sự khác biệt đáng kể nào giữa những lợi nhuận của 2 quá trình ?
(Tên file: Hypo_yield.mtw)
Những dữ liệu ở phía tay phải là thời gian các lần giao hàng của trước và sau khi cải tiến phương pháp giao hàng.
“ Có sự khác biệt thực sự nào giữa trước cải tiến (A) và sau cải tiến (B) hay không ?”
(Đơn vị tính :Phút)
Câu hỏi thực hành:
Bạn có thể nói rằng liệu có sự khác biệt nào về lợi nhuận của qui trình sau cải tiến B và qui trình đang sử dụng A?
Câu hỏi thống kê:
Liệu sự khác biệt giữa những giá trị trung bình của qui trình B (85.54) và qui trình A (84.24) có bất kỳ thống kê đáng kể nào không? Hay sự khác biệt này chỉ đơn giản là được gây ra trong một thời gian?
Bạn muốn biết điều gì?
Làm thế nào để biết?
Công cụ nào được sử dụng?
Dữ liệu nào được yêu cầu?
Làm thế nào để thu thập được dữ liệu?
Giả thuyết thay thê ́(H 1 )
Giải thích thống kê : Giá trị trung bình của quá trình A và qui trình B là hoàn toàn khác nhau.
Giải thích thực tế : hiệu suất trung bình của qui trình B và qui trình A là khác nhau.
Giả thuyết không khác biệt (H o )
Giải thích thống kê: Không có sự khác biệt nào về giá trị trung bình của qui trình A và B
Giải thích thực tế : Không có sự khác biệt nào giữa hiệu suất của hai quá trình. Đó là, hiệu suất của quá trình được cải tiến không khác gì hiệu suất của quá trình hiện tại
Mục đích: Để đánh giá, sử dụng các mẫu, nếu hiệu suất của quá trình cải tiến B là khác biệt với hiệu suất của quá trình đang sử dụng A.
Các loại phương pháp giả thuyết thống kê:
Thử nghiệm trung bình
Thử nghiệm sự biến thiên
Thử nghiệm tỷ lệ của tập hợp
Non-parametric Test
Loại thử nghiệm
1-Sample t test
2-Sample t test
Paired t test
ANOVA
Equal variance test
F test
1 Proportion
2 Proportion
Chi-square test
1-Sample Wilcoxon test
Mann-Whitney test
Kruskal-Wallis test
Mục đích sử dụng
Được sử dụng khi các mẫu có phân bố thông thường (normal distribution)
Được dùng để xác định nếu giá trị trung bình của một hay nhiều mẫu là giống nhau
Dùng để xác định nếu các giá trị biến thiên của một hay nhiều mẫu là giống nhau
Dùng để xác định nếu giá trị tỷ lệ của một hay nhiều mẫu là giống nhau
Dùng khi mẫu là phân bố không bình thường (non-normal distribution)
Dùng để xác định nếu các giá trị giữa (Median) của một hay nhiều mẫu là giống nhau.
Loại lỗi I:
> Lỗi của việc loại bỏ giả thuyết không khác biệt H 0, mặc dù nó đúng
> H 0 : Sản lượng sản phẩm được sản xuất ra bởi quá trình A và B là giống nhau
→ Giả thuyết không khác biệt bị loại kể cả trong trường hợp sản lượng của cả hai quá trình sản xuất là giống nhau.
Loại lỗi II:
> Lỗi của việc không loại bỏ giả thuyết không khác biệt H 0 mặc dù nó sai (H 1 is true)
> H 0 : Sản lượng sản phẩm được sản xuất ra bởi 2 quá trình A và B là giống nhau
→ Giả thuyết không khác biệt H o không bị loại kể cả trong trường hợp sản lượng của cả hai quá trình là không giống nhau.
Hai loại lỗi trong giả thuyết thử nghiệm
Sự việc (Giá trị đúng)
H 0
H 1
Quyết định
Chấp nhận H 0
Quyết định đúng
Loại lỗi II
Chấp nhận H 1
Loại lỗi I
Quyết định đúng
Loại bỏ H 0
Không thể loại bỏ H 0
1-
H o
H 1
-Risk
Xác suất liên quan đến lỗi kiể