Abstract: Trình bày các kết quả của mẫu ngẫu nhiên đơn giản từ một lô gồm hữu hạn phần tử.
Các ước lượng, tính chất và phương sai của ước lượng của trung bình tổng thể, tổng thể, tỷ số
Ở chương này đưa ra những khái niệm cơ bản mà ta sẽ dùng ở các chương tiếp theo như: khái
niệm ước lượng không chệch, tính vững của ước lượng. Đề cập đến lấy mẫu ngẫu nhiên phân
tầng và lấy mẫu hệ thống, được trình bày theo mạch chính giống như lấy mẫu ngẫu nhiên đơn
giản. Ngoài ra còn có những so sánh giữa mẫu ngẫu nhiên phân tầng và mẫu ngẫu nhiên đơn
giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng. Nghiên cứu mẫu chùm với các chùm cùng cỡ,
không cùng cỡ và kết hợp giữa mẫu chùm và các mẫu đã đề cập ở hai chương trước. Tiến hành
lấy mẫu con, đưa ra các kết quả cho mẫu hai giai đoạn và mẫu ba giai đoạn. Lấy mẫu cặp chỉ đề
cập tới mẫu cặp phân tầng và ước lượng hồi quy.
5 trang |
Chia sẻ: hongden | Lượt xem: 2671 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Các phương pháp lấy mẫu và xử lý mẫu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Các phương pháp lấy mẫu và xử lý mẫu
Mai Thị Hương
Trường Đại học Khoa học Tự nhiên
Luận văn ThS. Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số: 60 46 15
Người hướng dẫn: PGS.TS. Đào Hữu Hồ
Năm bảo vệ: 2013
Abstract: Trình bày các kết quả của mẫu ngẫu nhiên đơn giản từ một lô gồm hữu hạn phần tử.
Các ước lượng, tính chất và phương sai của ước lượng của trung bình tổng thể, tổng thể, tỷ số
Ở chương này đưa ra những khái niệm cơ bản mà ta sẽ dùng ở các chương tiếp theo như: khái
niệm ước lượng không chệch, tính vững của ước lượng. Đề cập đến lấy mẫu ngẫu nhiên phân
tầng và lấy mẫu hệ thống, được trình bày theo mạch chính giống như lấy mẫu ngẫu nhiên đơn
giản. Ngoài ra còn có những so sánh giữa mẫu ngẫu nhiên phân tầng và mẫu ngẫu nhiên đơn
giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng. Nghiên cứu mẫu chùm với các chùm cùng cỡ,
không cùng cỡ và kết hợp giữa mẫu chùm và các mẫu đã đề cập ở hai chương trước. Tiến hành
lấy mẫu con, đưa ra các kết quả cho mẫu hai giai đoạn và mẫu ba giai đoạn. Lấy mẫu cặp chỉ đề
cập tới mẫu cặp phân tầng và ước lượng hồi quy.
Keywords: Toán học; Lý thuyết xác suất; Thống kê toán học; Phương pháp lấy mẫu; Xử lý mẫu.
Content:
LỜI NÓI ĐẦU
Trong nghiên cứu thống kê toán học, mẫu đại diện là thông tin duy nhất
mà nhà thống kê có được, trên cơ sở đó chúng ta phân tích, xử lý, rút ra các kết
luận cần thiết. Do đó việc lấy mẫu không thể thiếu trong nghiên cứu thống kê.
Các điểm chính của lấy mẫu là tạo ra một nhóm nhỏ từ tổng thể mang đầy đủ
các thông tin của tổng thể. Tức là, chúng ta muốn có một nhóm nhỏ giống các
nhóm lớn. Với ý nghĩ đó, một trong những tính năng chúng ta tìm kiếm trong
một mẫu là mức độ đại diện - như thế nào thì rút được mẫu đại diện cho tổng
thể ? Mẫu cần có các tính chất chặt chẽ như thế nào để giống tổng thể?
Lấy mẫu có ưu điểm nổi bật. Đó là giảm chi phí và số liệu được thu thập
nhanh.
- Giảm chi phí: Nó rõ ràng là ít tốn kém vì chỉ nghiên cứu dữ liệu của một
tập con của tổng thể, chứ không phải là toàn bộ tổng thể. Hơn nữa, dữ liệu
được thu thập trong một mẫu được lựa chọn một cách cẩn thận có độ chính
xác cao như toàn bộ tổng thể.
- Tốc độ: việc quan sát thu thập và tóm tắt của một mẫu dễ dàng hơn và
nhanh hơn so với cả tổng thể. Điều tra toàn bộ tổng thể bằng cách liệt kê là
không thực tế hoặc không thể. Như vậy, cuộc điều tra dựa trên mẫu có sự linh
hoạt hơn về các loại thông tin có thể đạt được.
Lấy mẫu được ứng dụng rộng rãi trong tất cả các lĩnh vực khoa học và xã
hội mà có sự nghiên cứu và ứng dụng của thống kê toán học. Ở Việt Nam, lấy
mẫu cũng được sử dụng trong rất nhiều ngành. Song cũng tồn tại một thực tế
rằng không ít trường hợp ở Việt Nam mẫu được lấy ra không đại diện trung
thực và khách quan cho tổng thể, chẳng hạn cả vùng trồng rau Thanh Trì Hà
Nội người ta chỉ lấy một mẫu gồm 3 quan sát để kiểm tra xem có dư thừa độc tố
trong rau hay không, hoặc để kiểm tra an toàn thực phẩm của hoa quả Trung
Quốc nhập qua biên giới phía Bắc, bộ phận kiểm tra chỉ lấy ra 8 quả trong số
hàng chục ngàn quả, v. . . .; Do đó dẫn đến các kết luận trái ngược nhau giữa 2
cơ quan khoa học của thành phố hoặc kết luận trái ngược với thực tế xảy ra.
Bàn về việc lấy mẫu đại diện ở nước ta là việc làm vượt quá tầm và khả
năng của tác giả cũng như vượt ra ngoài khuôn khổ của luận văn này.
Dựa trên cuốn chuyên khảo “Sampling techniques” của William G. Cochran
4
và một số bài báo, một số bình luận, nhận xét trên trang mạng Bách khoa toàn
thư mở (Wikipedia), luận văn “Các phương pháp lấy mẫu và xử lý mẫu”
đã trình bày tổng quan về các phương pháp lấy mẫu đối với một lô (một tổng
thể) gồm hữu hạn phần tử và xử lý thống kê các đại lượng liên quan của lô.
Luận văn gồm 4 chương:
- Chương 1 trình bày các kết quả của mẫu ngẫu nhiên đơn giản từ một lô
gồm hữu hạn phần tử. Các ước lượng, tính chất và phương sai của ước lượng
của trung bình tổng thể, tổng thể, tỷ số. . . Ở chương này đưa ra những khái
niệm cơ bản mà ta sẽ dùng ở các chương tiếp theo như: khái niệm ước lượng
không chệch, tính vững của ước lượng.
- Chương 2 đề cập đến lấy mẫu ngẫu nhiên phân tầng và lấy mẫu hệ thống,
được trình bày theo mạch chính giống như lấy mẫu ngẫu nhiên đơn giản. Ngoài
ra còn có những so sánh giữa mẫu ngẫu nhiên phân tầng và mẫu ngẫu nhiên
đơn giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng.
- Chương 3 đề cập đến mẫu chùm với các chùm cùng cỡ, không cùng cỡ và
kết hợp giữa mẫu chùm và các mẫu đã đề cập ở hai chương trước.
- Chương 4: Lấy mẫu con và lấy mẫu cặp. Lấy mẫu con đưa ra các kết quả
cho mẫu hai giai đoạn và mẫu ba giai đoạn. Lấy mẫu cặp chỉ đề cập tới mẫu
cặp phân tầng và ước lượng hồi quy.
Qua đây, tác giả xin được bày tỏ lời cảm ơn sâu sắc đến người thầy, người
hướng dẫn luận văn của mình, PGS.TS Đào Hữu Hồ, người đã đưa ra đề tài và
tận tình hướng dẫn trong suốt quá trình làm luận văn của tác giả. Đồng thời
tác giả cũng gửi lời cảm ơn tới những đồng nghiệp, những người bạn đã giúp
đỡ tác giả trong quá trình hoàn thành luận văn.
Do thời gian và trình độ còn hạn chế, chắc chắn bản luận văn không thể
tránh khỏi những thiếu sót, tác giả rất mong được sự chỉ bảo tận tình của các
thầy cô, đồng nghiệp và các bạn, tác giả xin chân thành cảm ơn!
Hà Nội, ngày ... tháng 01 năm 2013
Tác giả
Mai Thị Hương
5
TÀI LIỆU THAM KHẢO
Tiếng Việt
1. Đào Hữu Hồ (2008), “Xác suất thống kê”, in lần thứ 11, Nhà xuất bản
Đại học Quốc Gia Hà Nội.
2. Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), “Thống kê toán
học”, Nhà xuất bản Đại học Quốc Gia Hà Nội.
3. Nguyễn Viết Phú, Nguyễn Duy Tiến (2004), “Cơ sở lý thuyết xác suất”,
Nhà xuất bản Đại học Quốc Gia Hà Nội.
Tiếng Anh
4. Brooks, S. (1955). The estimation of an optimum subsampling number.
Jour. Amer. Stat. Assoc, 50, 398 – 415.
5. Cochran, W. G (1942). Sampling theory when the sampling units are of
unequal sizes. Jour. Amer. Stat. Assoc.
6. Cornell, F. G (1947). A stratified random sample of a small finite popu-
lation. Jour. Amer. Stat. Assoc.
7. Dalenius, T., and Hodges, J. L., Jr (1959). Minimum variance stratifica-
tion. Jour. Amer. Stat. Assoc.
8. Das, A. C (1950). Two-dimensional systematic sampling and the associ-
ated stratified and random sampling. Sankhya.
9. Evans, W. D. (1951). On stratification and optimum allocations. Jour.
Amer. Stat. Assoc, 46, 95 – 104.
10. Finney, D. J (1948). Random and systematic sampling in timber surveys.
Forestry.
11. Hansen, M. H., and Hurwitz, W. N (1943). On the theory of sampling
from finite populations. Ann. Math. Stat.
96
12. Horvitz, D. G., and Thompson, D. J. (1952). A generalization of sampling
without replacement from a finite universe. Jour. Amer. Stat. Assoc, 47,
663 – 685.
13. Lahiri, D. B. (1951). A method for sample selection providing unbiased
ratio estimates. Bull. Int. Stat. Inst., 33, 2, 133 – 140.
14. Lohr, SharonL. (1999). Sampling: Design and analysis, Duxbury, ISBN 0
– 534 – 35361 – 4.
15. Rao, J. N. K. (1973). On double sampling for stratification and analytical
surveys. Biometrika, 60, 125 – 133.
16. Robert M. Groves, etalia (2010). Survey methodology. ISBN 0 – 471 –
48348 – 6.
17. Stephan, F. F. (1941). Stratification in representative sampling. Jour.
Marketing, 6, 38 – 46.
18. Stuart, A. (1954). A simple presentation of optimum sampling results.
Jour. Roy. Stat. Soc, B16, 239 – 241.
19. William G. Cochran “Sampling techniques” (1977), third edition. JOHN
WILEY & SONS, INC.
20. Yates, F., and Grundy, P. M. (1953). Selection without replacement from
withinstrata with probability proportional to size. Jour. Roy. Stat. Soc,
B15, 253 – 261.
21. Trang web: Wikipedia, the free encyclopedia:
• Sampling (Statistics) (12/2012).
• Sampling techniques
• Paula Lagapes Barreiro Justo Puerto Albandoz
• Population and Sample Sampling Techniques, univ. of Seville.
• Jamie Mcentosh (2/2008): Probability sampling techniques.
97