Toán học - Chương 8: Kiểm định giả thuyết thống kê

Định nghĩa 1. Một giả thuyết thống kê là một sự xác nhận hay phỏng đoán liên quan đến một hay nhiều tổng thể. Định nghĩa 2. Thủ tục mà qua những thông tin về mẫu ta có thể đưa ra những bằng chứng để chấp nhận hoặc bác bỏ giả thuyết thống kê được gọi là kiểm định giả thuyết (kiểm định thống kê)

pptx61 trang | Chia sẻ: anhquan78 | Lượt xem: 1250 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Toán học - Chương 8: Kiểm định giả thuyết thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ1CHƯƠNG 8Kiểm định giả thuyếtDựa vào mẫu cụ thể và các quy tắc hay thủ tục quyết định để chấp nhận hay bác bỏ một giả thuyết về tổng thể.Giả thuyết thống kêĐịnh nghĩa 1. Một giả thuyết thống kê là một sự xác nhận hay phỏng đoán liên quan đến một hay nhiều tổng thể. Định nghĩa 2. Thủ tục mà qua những thông tin về mẫu ta có thể đưa ra những bằng chứng để chấp nhận hoặc bác bỏ giả thuyết thống kê được gọi là kiểm định giả thuyết (kiểm định thống kê)Giả thuyết thống kêGiả thuyết không: giả thuyết đưa ra kiểm định, ký hiệu là H0Đây là giả thuyết ta muốn bác bỏ hay chấp nhậnGiả thuyết đối: giả thuyết cạnh tranh với giả thuyết H0. Kí hiệu là H1.H1 được chấp nhận khi H0 bị bác bỏ và ngược lại.H1 không nhất thiết là phủ định của H0.Kiểm định một phíaH0 có dạng: = 0H1 có dạng: > 0 (hay  0Kiểm định hai phíaH0 có dạng:  = 0H1 có dạng:  ≠ 0Bài 1Nhà quản lý một cửa hàng thiết bị điện tử đang xem xét một kế hoạch tiếp thị để tăng sản lượng bán ra của cửa hàng. Hiện tại số TV bán được trung bình trong một ngày là 6 TV. Để tiến hành thu thập dữ liệu trước khi tiến hành kế hoạch, một nhóm các nhân viên bán hàng sẽ được bán thử nghiệm theo kế hoạch dự kiến trong vòng 2 tuần.Hãy xây dựng giả thuyết không H0 và giả thuyết thay thế Ha (hay H1) phù hợp cho nghiên cứu nàyCho ý kiến khi H0 bị bác bỏCho ý kiến khi H0 không bị bác bỏBài 2Để áp dụng một phương pháp mới, quản đốc phân xưởng phải tiến hành thử nghiệm trên quy mô nhỏ trước khi áp dụng rộng rãi trong toàn phân xưởng. Chi phí trung bình làm ra một sản phẩm theo phương pháp cũ là 180$/đơn vị. Quản đốc sẽ tiến hành nghiên cứu theo phương pháp mới trong một khoảng thời gian để xem xét.Hãy xây dựng giả thuyết không H0 và giả thuyết thay thế Ha (hay H1) phù hợp cho nghiên cứu nàyKết luận khi H0 bị bác bỏKết luận khi H0 không bị bác bỏBài 3Công ty nước giải khát tuyên bố loại chai nước ngọt có gas được bán trên thị trường có dung tích mỗi chai là 330ml. Hiệp hội người tiêu dùng muốn kiểm tra tính đúng đắn của tuyên bố trên bằng cách kiểm tra mẫu xem giá trị trung bình dung tích trong một chai có đáp ứng tiêu chuẩn phát biểu trên hay khôngHãy xây dựng giả thuyết không H0 và Ha (hay H1) cho nghiên cứu trên?Những kết luận của hiệp hội người tiêu dùng khi bác bỏ hay không bác bỏ H0?Bài 4Một loại đèn chiếu được nhà sản xuất cho biết có tuổi thọ trung bình thấp nhất 65 giờ. Kết quả kiểm tra từ mẫu ngẫu nhiên 21 đèn cho thấy tuổi thọ trung bình là 62,5 giờ, với độ lệch chuẩn hiệu chỉnh là 3. Có thể kết luận gì về lời tuyên bố của nhà sản xuất? Biết tuổi thọ của đèn có pp chuẩn.Hãy xây dựng giả thuyết không H0 và Ha (hay H1)?Những kết luận khi bác bỏ hay không bác bỏ H0?Quy tắc kiểm địnhNguyên lý xác suất nhỏ: nếu một bc có xs rất nhỏ thì trong một hay vài phép thử có thể xem như bc đó không xảy ra.Phương pháp phản chứng: để bác bỏ A ta giả sử A đúng, và sau đó dẫn đến điều vô lý.Tiêu chuẩn kiểm địnhLà một thống kê mẫu có phân phối xác suất hoàn toàn xác định khi giả thuyết H0 đúng.Các bước kiểm địnhGiả sử rằng H0 đúngXây dựng một biến cố A có xác suất bé khi H0 đúng (gọi là mức ý nghĩa của phép kiểm định).Dựa vào các tiêu chuẩn kiểm định Theo nguyên lý xác suất nhỏ thì trong một lần thử biến cố A sẽ không xảy ra.Vì vậy nếu với một mẫu cụ thể nào đó mà:A xảy ra thì giả thiết H0 đúng là vô lý và ta bác bỏ giả thiết H0. A không xảy ra thì ta chưa có cơ sở để bác bỏ H0. Miền bác bỏ giả thiếtLà miền giá trị của thống kê Z. Ký hiệu: WαVới điều kiện H0 đúng, Z nhận giá trị trong miền Wα với xác suất bằng α.với α là mức ý nghĩa của kiểm định. Thông thường là 0,05 hay 0,01. Lưu ý: có vô số miền bác bỏ Wα thỏa mãn.14Sai lầm loại 1 và sai lầm loại 2Sai lầm loại 1: bác bỏ H0 khi H0 đúng. Sai lầm loại 1 sinh ra do kích thước mẫu quá nhỏ, do cách lấy mẫuSai lầm loại 2: chấp nhận H0 khi H0 sai. Vậy xác suất sai lầm loại 2 xác định như sau:15Sai lầm loại 1 và sai lầm loại 216H0 đúngH0 saiBác bỏ H0Sai lầm loại 1Xác suất =αChấp nhận H0Sai lầm loại 2Xác suất=βVới cỡ mẫu cố định thì: Giảm sai lầm loại 1 thì sẽ làm tăng sai lầm loại 2. Giảm sai lầm loại 2 thì sẽ làm tăng sai lầm loại 1.Nếu muốn cả 2 sai lầm này cùng giảm thì chỉ còn cách tăng cỡ mẫu.Sai lầm loại 1 và sai lầm loại 2 Giả thiết H0 là quan trọng do đó sai lầm về nó càng nhỏ càng tốt. Cố định xác suất sai lầm loại 1 ở mức ý nghĩa α. Với mẫu kích thước n xác định, ta chọn miền bác bỏ Wα sao cho xác suất sai lầm loại 2 nhỏ nhất hoặc chấp nhận được. Việc chọn miền bác bỏ tùy thuộc vào từng bài toán cụ thể.17Giá trị quan sát Ký hiệu: Zqs; Tqs; qs. Là giá trị của Z tính trên mẫu cụ thể. Zqs=Z(x1,x2,,xn,θ) Với (x1,x2,,xn) là giá trị cụ thể của mẫu ngẫu nhiên (X1,X2,,Xn) hay mẫu ngẫu nhiên cụ thể.18Qui tắc kiểm định giả thuyếtSo sánh Zqs với Wα: Zqs Wα thì bác bỏ H0; thừa nhận H1. Zqs  Wα chưa có cơ sở để bác bỏ H0 (trên thực tế là thừa nhận H0)Chú ý: không kết luận đúng – sai mà chỉ kết luận bác bỏ – chấp nhận khi kiểm định giả thuyết. Đồng thời phải nêu rõ bác bỏ – chấp nhận ở mức ý nghĩa nào.19Tóm tắt các bước Phát biểu H0 và H1. Lập mẫu ngẫu nhiên kích thước n. Xác định tiêu chuẩn kiểm định Z và phân phối xác suất của Z với điều kiện H0 đúng. Với mức ý nghĩa α, xác định miền bác bỏ tốt nhất tùy theo đối thiết H1. Tính giá trị quan sát của Z từ mẫu cụ thể. So sánh giá trị quan sát với miền bác bỏ và kết luận.20Kiểm định trung bìnhBài toán 2 phíaBài toán 1 phíaSo sánh các trung bìnhPpxs của thống kê TB mẫu22Tổng thểTB mẫuChuẩn hóaChuẩn,đã biết n>30,đã biết  n>30,chưa biết Chuẩn, n30)Tổng thể có tỷ lệ p chưa biết.Ta xét 3 bài toán như sau:40Tiêu chuẩn kiểm địnhKiểm định tỷ lệ tổng thể:Giả sử H0 đúng ta có:Kiểm định hai phíaBài toán kđ: Miền bác bỏ của Z~N(0;1)Mức ý nghĩa: α42Bác bỏBác bỏKiểm định một phíaBài toán kđ: Miền bác bỏ của Z~N(0;1)Mức ý nghĩa: α43Bác bỏKiểm định một phíaBài toán kđ: Miền bác bỏ của Z~N(0;1)Mức ý nghĩa: α44Bác bỏVí dụ 1Một đảng chính trị trong một cuộc bầu cử tổng thống ở nước nọ tuyên bố rằng ít nhất 45% cử tri sẽ bỏ phiếu cho ứng viên A của họ. Chọn ngẫu nhiên 2000 cử tri để cho ý kiến thì thấy 862 cử tri tuyên bố sẽ bỏ phiếu cho A. Với mức ý nghĩa 5% hãy kiểm định xem dự đoán của đảng trên có đúng không?Giải:Gọi p là tỉ lệ cử tri sẽ bỏ phiếu cho ứng viên A.Ta có bài toán kiểm định: 45Ví dụ 2Dự đoán tỉ lệ phế phẩm trong kho lớn hơn 11%. Kiểm tra ngẫu nhiên 100 sản phẩm thì thấy có 13 phế phẩm. Với mức ý nghĩa 5% thì báo cáo trên có đáng tin hay không?46KIỂM ĐỊNH PHƯƠNG SAIĐiều kiện: hoặc cỡ mẫu n>30 hoặc tổng thể có phân phối chuẩn. Xét bài toán này trong 2 trường hợp:1. Đã biết trung bình tổng thể .2. Chưa biết trung bình tổng thể .Ta xét 3 bài toán như sau:47Phân phối của hàm PS mẫu48Tổng thểPS mẫuHàm của PS mẫuChuẩn,đã biết Chuẩnchưa biết Tiêu chuẩn kiểm địnhKiểm định phương sai tổng thể:Hoặc:Kiểm định hai phía_TH2Bài toán kđ: Miền bác bỏ của Z~χ2(n-1)Mức ý nghĩa: α50Kiểm định một phía_TH2Bài toán kđ: Miền bác bỏ của Z~χ2(n-1)Mức ý nghĩa: α51Kiểm định một phía_TH2Bài toán kđ: Miền bác bỏ của Z~χ2(n-1)Mức ý nghĩa: α52Ví dụ 1.Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên kích thước của 15 chi tiết do máy sản xuất và tính được s2=14,6. Với mức ý nghĩa 1% hãy kết luận về hoạt động của máy biết rằng kích thước chi tiết do máy sản xuất ra là biến ngẫu nhiên có phân phối chuẩn và phương sai theo thiết kế là σ02=1253BÀI TẬP TỔNG HỢPTheo một nguồn tin thì tỉ lệ hộ dân thích xem ca nhạc trên tivi là 80%. Thăm dò 49 hộ dân thấy có 25 hộ thích ca nhạc.Với mức ý nghĩa 5%. Kiểm định xem nguồn tin ấy có đáng tin không?Bài 2Tỉ lệ phế phẩm của một nhà máy trước đây là 5%. Năm nay nhà máy áp dụng một biện pháp kĩ thuật mới. Để nghiên cứu tác dụng của biện pháp này người ta lấy một mẫu gồm 800 sản phẩm để kiểm tra và thấy có 24 phế phẩm. Với α = 0,01. a) Hãy cho kết luận về biện pháp kĩ thuật mới này? B) Nếu nhà máy báo cáo tỉ lệ phế phẩm sau khi áp dụng biện pháp kĩ thuật mới này là 2% thì có chấp nhận được không? (với α = 0,05).Bài 3Một cửa hàng tạp hoá nhận thấy thời gian vừa qua trung bình một khách hàng mua 25 ngàn thuốc lá trong ngày. Nay cửa hàng chọn ngẫu nhiên 15 khách hàng thấy trung bình một khách hàng mua 24 ngàn đồng và đlc mẫu điều chỉnh là 2 ngàn đồng.Với mức ý nghĩa 5%, thử xem có phải sức mua của khách hàng hiện nay đã giảm sút?Giả sử số tiền mua thuốc có pp chuẩnBài 4Nếu máy móc hoạt động bình thường thì kích thước của một loại sản phẩm tính theo cm là một đại lượng ngẫu nhiên phân phối theo qui luật chuẩn với phương sai 25 . Nghi ngờ máy hoạt động không bình thường , người ta đo thử 20 sản phẩm và tính được phương sai hiệu chỉnh là 27,5. Với α = 0,02 hãy kết luận về điều nghi ngờ này.Bài 5Biết độ chịu lực X của các mẫu bê tông có phân phối chuẩn, đo độ chịu lực của 200 mẫu bê tông ta có kết quả sau:Với mức ý nghĩa 5% hãy kiểm định giả thuyết thống kê:Độ chịu lực195205215225235245Số mẫu131846743415Bài 6Chiều cao một loại cây là biến ngẫu nhiên có phân phối chuẩn. Trong điều kiện phát triển bình thường thì phương sai của chiều cao loại cây đó là (0,5m)2 . Để điều tra người ta tiến hành đo thử 26 cây thì thấy phương sai mẫu hiệu chỉnh là (0,54m)2. Nếu phương sai cây thay đổi thì do cây phát triển không đều và cần cải tiến kĩ thuật. Với mẫu trên có cần phải cải tiến lại kĩ thuật hay không ở mức ý nghĩa 5%.59Kiểm tra 15’Gọi X là độ bền của một loại dây thép. Trước khi thay đổi công nghệ độ bền trung bình là165, độ lệch chuẩn =15. Sau khi thay đổi công nghệ người ta chọn ngẫu nhiên 25 sợi, đo độ bền ta được trung bình mẫu là 170. Giả sử X có phân phối chuẩn và độ lệch chuẩn vẫn như trước.Kiểm tra 15’A) Với mức ý nghĩa 5%. Xác định miền bác bỏ của bài toán kiểm định:B) Nhìn chung khi tăng mức ý nghĩa lên thì giả thuyết H0 dễ bị bác bỏ hơn hay dễ chấp nhận hơn.C) Với mức ý nghĩa 10%, với trung bình mẫu thế nào ta có thể bác bỏ H0.