Các phương pháp lấy mẫu và xử lý mẫu

Abstract: Trình bày các kết quả của mẫu ngẫu nhiên đơn giản từ một lô gồm hữu hạn phần tử. Các ước lượng, tính chất và phương sai của ước lượng của trung bình tổng thể, tổng thể, tỷ số Ở chương này đưa ra những khái niệm cơ bản mà ta sẽ dùng ở các chương tiếp theo như: khái niệm ước lượng không chệch, tính vững của ước lượng. Đề cập đến lấy mẫu ngẫu nhiên phân tầng và lấy mẫu hệ thống, được trình bày theo mạch chính giống như lấy mẫu ngẫu nhiên đơn giản. Ngoài ra còn có những so sánh giữa mẫu ngẫu nhiên phân tầng và mẫu ngẫu nhiên đơn giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng. Nghiên cứu mẫu chùm với các chùm cùng cỡ, không cùng cỡ và kết hợp giữa mẫu chùm và các mẫu đã đề cập ở hai chương trước. Tiến hành lấy mẫu con, đưa ra các kết quả cho mẫu hai giai đoạn và mẫu ba giai đoạn. Lấy mẫu cặp chỉ đề cập tới mẫu cặp phân tầng và ước lượng hồi quy.

pdf5 trang | Chia sẻ: hongden | Ngày: 01/10/2015 | Lượt xem: 1312 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Các phương pháp lấy mẫu và xử lý mẫu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Các phương pháp lấy mẫu và xử lý mẫu Mai Thị Hương Trường Đại học Khoa học Tự nhiên Luận văn ThS. Chuyên ngành: Lý thuyết xác suất và thống kê toán học Mã số: 60 46 15 Người hướng dẫn: PGS.TS. Đào Hữu Hồ Năm bảo vệ: 2013 Abstract: Trình bày các kết quả của mẫu ngẫu nhiên đơn giản từ một lô gồm hữu hạn phần tử. Các ước lượng, tính chất và phương sai của ước lượng của trung bình tổng thể, tổng thể, tỷ số Ở chương này đưa ra những khái niệm cơ bản mà ta sẽ dùng ở các chương tiếp theo như: khái niệm ước lượng không chệch, tính vững của ước lượng. Đề cập đến lấy mẫu ngẫu nhiên phân tầng và lấy mẫu hệ thống, được trình bày theo mạch chính giống như lấy mẫu ngẫu nhiên đơn giản. Ngoài ra còn có những so sánh giữa mẫu ngẫu nhiên phân tầng và mẫu ngẫu nhiên đơn giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng. Nghiên cứu mẫu chùm với các chùm cùng cỡ, không cùng cỡ và kết hợp giữa mẫu chùm và các mẫu đã đề cập ở hai chương trước. Tiến hành lấy mẫu con, đưa ra các kết quả cho mẫu hai giai đoạn và mẫu ba giai đoạn. Lấy mẫu cặp chỉ đề cập tới mẫu cặp phân tầng và ước lượng hồi quy. Keywords: Toán học; Lý thuyết xác suất; Thống kê toán học; Phương pháp lấy mẫu; Xử lý mẫu. Content: LỜI NÓI ĐẦU Trong nghiên cứu thống kê toán học, mẫu đại diện là thông tin duy nhất mà nhà thống kê có được, trên cơ sở đó chúng ta phân tích, xử lý, rút ra các kết luận cần thiết. Do đó việc lấy mẫu không thể thiếu trong nghiên cứu thống kê. Các điểm chính của lấy mẫu là tạo ra một nhóm nhỏ từ tổng thể mang đầy đủ các thông tin của tổng thể. Tức là, chúng ta muốn có một nhóm nhỏ giống các nhóm lớn. Với ý nghĩ đó, một trong những tính năng chúng ta tìm kiếm trong một mẫu là mức độ đại diện - như thế nào thì rút được mẫu đại diện cho tổng thể ? Mẫu cần có các tính chất chặt chẽ như thế nào để giống tổng thể? Lấy mẫu có ưu điểm nổi bật. Đó là giảm chi phí và số liệu được thu thập nhanh. - Giảm chi phí: Nó rõ ràng là ít tốn kém vì chỉ nghiên cứu dữ liệu của một tập con của tổng thể, chứ không phải là toàn bộ tổng thể. Hơn nữa, dữ liệu được thu thập trong một mẫu được lựa chọn một cách cẩn thận có độ chính xác cao như toàn bộ tổng thể. - Tốc độ: việc quan sát thu thập và tóm tắt của một mẫu dễ dàng hơn và nhanh hơn so với cả tổng thể. Điều tra toàn bộ tổng thể bằng cách liệt kê là không thực tế hoặc không thể. Như vậy, cuộc điều tra dựa trên mẫu có sự linh hoạt hơn về các loại thông tin có thể đạt được. Lấy mẫu được ứng dụng rộng rãi trong tất cả các lĩnh vực khoa học và xã hội mà có sự nghiên cứu và ứng dụng của thống kê toán học. Ở Việt Nam, lấy mẫu cũng được sử dụng trong rất nhiều ngành. Song cũng tồn tại một thực tế rằng không ít trường hợp ở Việt Nam mẫu được lấy ra không đại diện trung thực và khách quan cho tổng thể, chẳng hạn cả vùng trồng rau Thanh Trì Hà Nội người ta chỉ lấy một mẫu gồm 3 quan sát để kiểm tra xem có dư thừa độc tố trong rau hay không, hoặc để kiểm tra an toàn thực phẩm của hoa quả Trung Quốc nhập qua biên giới phía Bắc, bộ phận kiểm tra chỉ lấy ra 8 quả trong số hàng chục ngàn quả, v. . . .; Do đó dẫn đến các kết luận trái ngược nhau giữa 2 cơ quan khoa học của thành phố hoặc kết luận trái ngược với thực tế xảy ra. Bàn về việc lấy mẫu đại diện ở nước ta là việc làm vượt quá tầm và khả năng của tác giả cũng như vượt ra ngoài khuôn khổ của luận văn này. Dựa trên cuốn chuyên khảo “Sampling techniques” của William G. Cochran 4 và một số bài báo, một số bình luận, nhận xét trên trang mạng Bách khoa toàn thư mở (Wikipedia), luận văn “Các phương pháp lấy mẫu và xử lý mẫu” đã trình bày tổng quan về các phương pháp lấy mẫu đối với một lô (một tổng thể) gồm hữu hạn phần tử và xử lý thống kê các đại lượng liên quan của lô. Luận văn gồm 4 chương: - Chương 1 trình bày các kết quả của mẫu ngẫu nhiên đơn giản từ một lô gồm hữu hạn phần tử. Các ước lượng, tính chất và phương sai của ước lượng của trung bình tổng thể, tổng thể, tỷ số. . . Ở chương này đưa ra những khái niệm cơ bản mà ta sẽ dùng ở các chương tiếp theo như: khái niệm ước lượng không chệch, tính vững của ước lượng. - Chương 2 đề cập đến lấy mẫu ngẫu nhiên phân tầng và lấy mẫu hệ thống, được trình bày theo mạch chính giống như lấy mẫu ngẫu nhiên đơn giản. Ngoài ra còn có những so sánh giữa mẫu ngẫu nhiên phân tầng và mẫu ngẫu nhiên đơn giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng. - Chương 3 đề cập đến mẫu chùm với các chùm cùng cỡ, không cùng cỡ và kết hợp giữa mẫu chùm và các mẫu đã đề cập ở hai chương trước. - Chương 4: Lấy mẫu con và lấy mẫu cặp. Lấy mẫu con đưa ra các kết quả cho mẫu hai giai đoạn và mẫu ba giai đoạn. Lấy mẫu cặp chỉ đề cập tới mẫu cặp phân tầng và ước lượng hồi quy. Qua đây, tác giả xin được bày tỏ lời cảm ơn sâu sắc đến người thầy, người hướng dẫn luận văn của mình, PGS.TS Đào Hữu Hồ, người đã đưa ra đề tài và tận tình hướng dẫn trong suốt quá trình làm luận văn của tác giả. Đồng thời tác giả cũng gửi lời cảm ơn tới những đồng nghiệp, những người bạn đã giúp đỡ tác giả trong quá trình hoàn thành luận văn. Do thời gian và trình độ còn hạn chế, chắc chắn bản luận văn không thể tránh khỏi những thiếu sót, tác giả rất mong được sự chỉ bảo tận tình của các thầy cô, đồng nghiệp và các bạn, tác giả xin chân thành cảm ơn! Hà Nội, ngày ... tháng 01 năm 2013 Tác giả Mai Thị Hương 5 TÀI LIỆU THAM KHẢO Tiếng Việt 1. Đào Hữu Hồ (2008), “Xác suất thống kê”, in lần thứ 11, Nhà xuất bản Đại học Quốc Gia Hà Nội. 2. Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), “Thống kê toán học”, Nhà xuất bản Đại học Quốc Gia Hà Nội. 3. Nguyễn Viết Phú, Nguyễn Duy Tiến (2004), “Cơ sở lý thuyết xác suất”, Nhà xuất bản Đại học Quốc Gia Hà Nội. Tiếng Anh 4. Brooks, S. (1955). The estimation of an optimum subsampling number. Jour. Amer. Stat. Assoc, 50, 398 – 415. 5. Cochran, W. G (1942). Sampling theory when the sampling units are of unequal sizes. Jour. Amer. Stat. Assoc. 6. Cornell, F. G (1947). A stratified random sample of a small finite popu- lation. Jour. Amer. Stat. Assoc. 7. Dalenius, T., and Hodges, J. L., Jr (1959). Minimum variance stratifica- tion. Jour. Amer. Stat. Assoc. 8. Das, A. C (1950). Two-dimensional systematic sampling and the associ- ated stratified and random sampling. Sankhya. 9. Evans, W. D. (1951). On stratification and optimum allocations. Jour. Amer. Stat. Assoc, 46, 95 – 104. 10. Finney, D. J (1948). Random and systematic sampling in timber surveys. Forestry. 11. Hansen, M. H., and Hurwitz, W. N (1943). On the theory of sampling from finite populations. Ann. Math. Stat. 96 12. Horvitz, D. G., and Thompson, D. J. (1952). A generalization of sampling without replacement from a finite universe. Jour. Amer. Stat. Assoc, 47, 663 – 685. 13. Lahiri, D. B. (1951). A method for sample selection providing unbiased ratio estimates. Bull. Int. Stat. Inst., 33, 2, 133 – 140. 14. Lohr, SharonL. (1999). Sampling: Design and analysis, Duxbury, ISBN 0 – 534 – 35361 – 4. 15. Rao, J. N. K. (1973). On double sampling for stratification and analytical surveys. Biometrika, 60, 125 – 133. 16. Robert M. Groves, etalia (2010). Survey methodology. ISBN 0 – 471 – 48348 – 6. 17. Stephan, F. F. (1941). Stratification in representative sampling. Jour. Marketing, 6, 38 – 46. 18. Stuart, A. (1954). A simple presentation of optimum sampling results. Jour. Roy. Stat. Soc, B16, 239 – 241. 19. William G. Cochran “Sampling techniques” (1977), third edition. JOHN WILEY & SONS, INC. 20. Yates, F., and Grundy, P. M. (1953). Selection without replacement from withinstrata with probability proportional to size. Jour. Roy. Stat. Soc, B15, 253 – 261. 21. Trang web: Wikipedia, the free encyclopedia: • Sampling (Statistics) (12/2012). • Sampling techniques • Paula Lagapes Barreiro Justo Puerto Albandoz • Population and Sample Sampling Techniques, univ. of Seville. • Jamie Mcentosh (2/2008): Probability sampling techniques. 97