Hướng dẫn sử dụng spss cho người mới bắt đầu

SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác phân tích thống kê. SPSS được sử dụng rộng rãi trong công tác thống kê kinh tế- xã hội. Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968 và mới nhất là thế hệ 18 được giới thiệu từ tháng 8 năm 2009, có cả phiên bản cho các hệ điều hành Windows, Mac, vàLinux / Unix

pdf22 trang | Chia sẻ: vietpd | Lượt xem: 6281 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Hướng dẫn sử dụng spss cho người mới bắt đầu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 1 HƯỚNG DẪN SỬ DỤNG SPSS CHO NGƯỜI MỚI BẮT ĐẦU I/ Giới thiệu về SPSS SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác phân tích thống kê. SPSS được sử dụng rộng rãi trong công tác thống kê kinh tế - xã hội. Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968 và mới nhất là thế hệ 18 được giới thiệu từ tháng 8 năm 2009, có cả phiên bản cho các hệ điều hành Windows, Mac, và Linux / Unix. SPSS được sử dụng bởi các nhà nghiên cứu thị trường, nghiên cứu y khoa, công ty điều tra, chính phủ, các nhà nghiên cứu giáo dục và những lĩnh vực khác. Một số phần mềm có chức năng thống kê khác như Microsoft Office Excel, STATA, SAS, Eviews… Các chức năng cơ bản: * Thống kê mô tả (Descriptive statistics): tần số (Frequencies), các loại bảng số liệu tổng hợp (Cross tabulation, Explore, Descriptive Ratio Statistics) * Thống kê 2 biến số (Bivariate statistics): trung bình (Means), T-test, ANOVA, tương quan (bivariate, partial, distances), kiểm định phi tham số (Nonparametric tests) * Dự báo (Prediction): hồi quy (regression), phân tích nhân tố (Factor analysis), cluster analysis (two-step, K-means, hierarchical), biệt thức (Discriminant). Ưu điểm: dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng biểu, báo cáo được trình bày đẹp, linh hoạt. Tập tin nhập liệu SPSS có đuôi mở rộng .sav, tập tin bảng biểu chứa kết quả có đuôi mở rộng .spv. Lưu ý khi cài đặt SPSS đối với bản PASW Statistics 18 (crack) 1) Run Setup/setup.exe 2) Single user license Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 2 3) Enter no serial number and install 4) In the end uncheck "Register with spss.com" Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 3 5) Close License Authorization Wizard 6) Copy content of EQX to install dir Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 4 Choose “Yes” to replace files 7) Run II/ Thang đo, thu thập và mã hóa dữ liệu 1. Thang đo Dữ liệu nghiên cứu có thể phân chia thành 2 loại chính là dữ liệu định tính và dữ liệu định lượng. Các dữ liệu này được thu thập bằng 4 thang đo cơ bản được thể hiện trên sơ đồ như sau: Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 5 Dữ liệu định tính: loại dữ liệu này phản ánh tính chất, sự hơn kém, ta không tính được trị trung bình của dữ liệu dạng định tính. Dữ liệu định lượng: loại dữ liệu này phản ánh mức độ, mức độ hơn kém, tính được trị trung bình. Cần chú ý rằng các phép toán thống kê dùng cho dữ liệu định tính có những đặc điểm khác với phép toán dùng cho dữ liệu định lượng. i) Thang đo danh nghĩa (còn gọi là thang đo định danh hoặc thang đo phân loại) – nominal scale: trong thang đo này các con số chỉ dùng để phân loại các đối tượng, không mang ý nghĩa nào khác. Những phép toán thống kê bạn có thể sử dụng được cho dạng thang đo danh nghĩa là: đếm, tính tần suất của một biểu hiện nào đó, xác định giá trị mode, thực hiện một số phép kiểm định. ii) Thang đo thứ bậc – ordinal scale: lúc này các con số ở thang đo danh nghĩa được sắp xếp theo một quy ước nào đó về thứ bậc hay sự hơn kém, nhưng ta không biết được khoảng cách giữa chúng. Điều này có nghĩa là bất cứ thang đo thứ bậc nào cũng là thang đo danh nghĩa nhưng rõ ràng bạn không thể suy ngược lại được. iii) Thang đo khoảng – interval scale: là một dạng đặc biệt của thang đo thứ bậc vì nó cho biết được khoảng cách giữa các thứ bậc. Thông thường thang đo khoảng có dạng là một dãy các chữ số liên tục và đều đặn từ 1 đến 5, hay từ 1 đến 10… Những phép toán thống kê có thể sử dụng thêm cho loại thang đo này so với 2 loại thang đo trước là: tính khoảng biến thiên, số trung bình, độ lệch chuẩn… Cần chú ý là thang đo khoảng tự nó không có điểm 0 được xác định trước, do đó bạn chỉ có thể thực hiện được phép tính cộng trừ chứ phép chia không có ý nghĩa. iv) Thang đo tỉ lệ - ratio scale: thang đo tỉ lệ có tất cả các đặc tính khoảng cách và thứ tự của thang đo khoảng, ngoài ra điểm 0 trong thang đo khoảng là một trị số “thật” nên ta có thể thực hiện được phép toán chia để tính tỉ lệ nhằm mục đich so sánh. Nói chung với các biến thu thập bằng thang đo khoảng và thang đo tỉ lệ ta có thể đo lường xu hướng trung tâm bằng trung bình số học. Còn xu hướng phân tán đo bằng độ lệch chuẩn, phương sai (khoảng và tứ trung vị ít được sử dụng đến do Dữ liệu Dữ liệu định tính Dữ liệu định lượng Thang đo danh nghĩa Thang đo thứ bậc Thang đo khoảng cách Thang đo tỉ lệ Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 6 kém hữu ích hơn). Vì vậy, SPSS gộp chung hai loại thang đo này thành một gọi là Scale Measures. 2. Thu thập dữ liệu * Các phương pháp thu thập số liệu a. Phỏng vấn trực tiếp (Face to face interview) - Phỏng vấn tại nhà (Door to door interview) - Phỏng vấn tại một địa điểm cụ thể (Central location interview) - Phỏng vấn chặng (Mall – Intercept interview) b. Phỏng vấn qua điện thoại c. Phỏng vấn qua thư d. Phỏng vấn qua internet e. Quan sát (Observation) * Dạng câu hỏi a. Câu hỏi mở b. Câu hỏi đóng - Câu hỏi phân đôi (Dichotomous) Anh/chị có sử dụng điện thoại di động không? 1.  Có 2.  Không - Câu hỏi liệt kê một lựa chọn (Single response) Trong số các nhãn hiệu nước ngọt có gaz dưới đây bạn sử dụng thường xuyên nhất nhãn hiệu nào? Coca-Cola 1 Pepsi-Cola 2 7-Up 3 Fanta 4 - Câu hỏi liệt kê nhiều lựa chọn (Multiple responses) Bạn đã từng viếng thăm địa điểm nào trong các thành phố dưới đây ở nước Lào? Viêng Chăn 1 Luang Prabang 2 Luang Namtha 3 Savanakhet 4 - Câu hỏi sắp hạng (Ranking) Trong các yếu tố sau đây anh/chị hãy cho biết mức độ quan trọng nhất, nhì, ba trong việc lựa chọn mua một máy điện thoại? Chất lượng bắt sóng ______ Kiểu dáng thời trang ______ … ______ Nguồn gốc xuất xứ ______ - Câu hỏi phân mức (Scale) Theo ý bạn, trong những câu nói sau đây câu nào mô tả đúng nhất về màu sắc của bao bì sản phẩm này? Quá tối 1 Hơi tối 2 Vừa 3 Hơi sáng 4 Quá sáng 5 - Câu hỏi chấm điểm. Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 7 Hãy cho điểm các sản phẩm sau từ 1 đến 10 điểm theo mức độ ưa thích của bạn Điểm Nhãn hiệu A ____ Nhãn hiệu B ____ Nhãn hiệu C ____ Nhãn hiệu D ____ * Lưu ý: Thông thường, đối với biến Ordinal, ta có thể định dạng thành Scale. 3. Mã hóa dữ liệu Ví dụ: Nguyên tắc là chúng ta cần chuyển các thông tin từ dạng “chữ” sang dạng “số” để tiến hành nhập liệu vào SPSS. 4. Xử lý dữ liệu Quy trình xử lý dữ liệu - Bước 1: kiểm tra, hiệu chỉnh bảng câu hỏi - Bước 2: mã hóa dữ liệu trên bảng câu hỏi Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 8 - Bước 3: nhập dữ liệu vào máy tính - Bước 4: làm sạch dữ liệu trên máy tính III/ Khai báo biến và nhập liệu trong SPSS 1. Giao diện 1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến 4- Số thứ tự các dòng 5- Data View (cửa sổ nhập liệu và thể hiện dữ liệu), Variable View (cửa sổ khai báo biến) 2. Khai báo biến Bảng phỏng vấn đơn giản 1. Loại điện thoại di động mà bạn sử dụng chính?  Nokia  Samsung  Motorola  Khác 2. Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại trên? Rất không hài lòng 1 2 3 4 5 Rất hài lòng 3. Chi tiêu trung bình một tháng cho việc gọi điện thoại di động ……….ngàn đ 4. Bạn theo dõi thông tin về các loại điện thoại mới như thế nào?  Không bao giờ  Ít khi  Thỉnh thoảng  Thường xuyên 5. Bạn thường sử dụng tính năng nào Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 9  Nghe - gọi  Tin nhắn  Nghe nhạc  Quay phim, chụp hình  Games  Khác 6. Giới tính: Nam Nữ Khai báo biến i) Name: tên biến, ký tự liên tục, không có khoảng trắng ii) Type: kiểu dữ liệu, số (numeric), chữ (string)… iii) Width: độ rộng kiểu dữ liệu, nếu type là string thì width là số ký tự tối đa iv) Decimals: lượng số thập phân v) Label: nhãn biến (chú thích cho tên biến) vi) Values: giá trị mã hóa dữ liệu vii) Missing: khai báo giá trị khuyết viii) Columns: độ rộng cột tên biến ix) Align: vị trí dữ liệu nhập trong cột x) Measure: loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc), Nominal (thang đo danh nghĩa), Scale (gồm cả Interval và Ratio). xi) Role: vai trò của biến Nhập liệu Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 10 * Lưu ý: có thể dùng chức năng Copy/Paste để sao chép dữ liệu từ chương trình Excel sang SPSS. Ngoài ra, SPSS cũng có thể import dữ liệu từ file .xls có sẵn bằng cách vào File > Open > Data…> Chọn tập tin đuôi *.xls. 3. Một số xử lý trên biến Mã hóa lại biến (Recode) Vào Transform > Recode into Same Variables… hoặc Recode into Different Variables… Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 11 1- Chọn biến cần mã hóa và đưa sang vùng lựa chọn 2- Chuyển giá trị cũ sang giá trị mới 3- Điều kiện lọc giá trị (nếu có) Công cụ tính toán giữa các biến (Compute) Transform > Compute Variable… được sử dụng để tính toán các giá trị mới từ các biến đã có sẵn trong tập dữ liệu, kết quả tính toán thường chứa trong một biến mới hoặc chồng lên một biến khác sẵn có tùy vào thao tác của bạn. Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 12 1- Đặt tên biến mới 2- Vùng tính toán IV/ Phân tích dữ liệu 1. Thống kê mô tả a. Thống kê mô tả (Descriptive Statistics): sử dụng bảng biểu, biểu đồ - đồ thị để tóm tắt, diễn đạt dữ liệu nghiên cứu. Tạo bảng tần số Từ thanh Menu chọn Analyze Descriptive Statistics Frequencies Hộp thoại Frequencies xuất hiện, Chọn các biến cần tính và đưa vào khung Variable(s) Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 13 * Có thể copy bảng tần số sang word hoặc xuất kết quả sang file word/excel. Tạo bảng thống kê mô tả Cách 1. Descriptive Statistics N Minimum Maximum Mean Std. Deviation chi tieu trung binh mot thang cho viec goi dien thoai (ngan dong) 92 120.00 410.00 246.6304 92.77501 Valid N (listwise) 92 Cửa sổ hiện thị kết quả (đuôi .spo) Cây thư mục bảng biểu Vùng hiện thị Bảng tần số Từ thanh Menu chọn Analyze Descriptive Statistics Descriptives Hộp thoại Descriptive xuất hiện, Chọn các biến cần tính và đưa vào khung Variable(s) Nhấp nút Option nếu muốn tính thêm các thống kê khác Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 14 Cách 2. Bạn cũng có thể tính thống kê mô tả bằng cách Chọn Analyze\ Descriptive Statistics\ Frequencies - Đưa biến định lượng cần tính thống kê mô tả vào khung Variable(s) - Nhấp Statistics và đánh dấu chọn các chỉ tiêu cần tính Đổ bảng chéo (phân tích hai biến): bảng Crosstabs Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 15 loai dien thoai di dong ma ban su dung chinh * gioi tinh Crosstabulation Count gioi tinh Nu Nam Total Nokia 0 25 25 Samsung 22 6 28 Motorola 27 0 27 loai dien thoai di dong ma ban su dung chinh khac 6 6 12 Total 55 37 92 loai dien thoai di dong ma ban su dung chinh * gioi tinh Crosstabulation % within loai dien thoai di dong ma ban su dung chinh gioi tinh Nu Nam Total Nokia 100.0% 100.0% Samsung 78.6% 21.4% 100.0% Motorola 100.0% 100.0% loai dien thoai di dong ma ban su dung chinh khac 50.0% 50.0% 100.0% Total 59.8% 40.2% 100.0% Từ thanh Menu chọn Analyze Descriptive Statistics Crosstabs Hộp thoại Crosstabs xuất hiện, Chọn các biến cần tính đưa vào khung Row(s) và Column(s) Nhấp nút Cells nếu muốn tính theo đơn vị phần trăm. Lựa chọn Display clustered bar charts nếu muốn có thêm đồ thị dạng cột Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 16 * Lưu ý: biến có nhiều thuộc tính nên đưa vào khung Column(s). Tính giá trị trung bình của 1 biến định lượng phân theo 1 biến định tính Từ thanh Menu chọn Analyze Compare Means Means Đưa biến định lượng vào Dependent list Đưa biến định tính vào Independent List Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 17 Report muc do hai long loai dien thoai di dong ma ban su dung chinh Mean N Std. Deviation Nokia 3.92 25 1.187 Samsung 2.18 28 .476 Motorola 1.00 27 .000 khac 2.50 12 .905 dimension1 Total 2.35 92 1.330 Bảng tần số cho câu hỏi nhiều lựa chọn Đối với biến nhiều trả lời: trước khi đổ bảng ta phải tiến hành nhóm các biến chứa đựng các giá trị trả lời có được (multiple responses). Bước 1. Khai báo cho biến nhiều lựa chọn Từ thanh Menu chọn Analyze Multiple Response Define Variable Sets Đưa các biến mô tả các thuộc tính của biến định tính vào Variables in Set Chọn Dichotomies nếu câu hỏi nhiều lựa chọn được nhập theo cách này, nhập giá trị 1 vào ô Counted value (nếu 1 là có chọn) Khai báo Name cho biến, bấm Add Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 18 Bước 2. Tạo bảng tần số cho biến nhiều lựa chọn Case Summary Cases Valid Missing Total N Percent N Percent N Percent $tinhnanga 92 98.9% 1 1.1% 93 100.0% a. Dichotomy group tabulated at value 1. $tinhnang Frequencies Responses N Percent Percent of Cases nghe _ goi 59 22.3% 64.1% tin nhan 56 21.2% 60.9% nghe nhac 64 24.2% 69.6% quay phim, chup hinh 43 16.3% 46.7% games 37 14.0% 40.2% tinh nang thuong su dunga khac 5 1.9% 5.4% Total 264 100.0% 287.0% a. Dichotomy group tabulated at value 1. Đổ bảng chéo đối với biến nhiều câu trả lời Từ thanh Menu chọn Analyze Multiple Response Frequencies Chọn biến đã được khai báo và đưa vào khung Table(s) for Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 19 $tinhnang*gioi Crosstabulation gioi tinh Nu Nam Total nghe _ goi Count 34 25 59 tin nhan Count 37 19 56 nghe nhac Count 43 21 64 quay phim, chup hinh Count 25 18 43 games Count 1 36 37 tinh nang thuong su dunga khac Count 3 2 5 Total Count 55 37 92 Percentages and totals are based on respondents. a. Dichotomy group tabulated at value 1. * Lưu ý: SPSS còn hỗ trợ xử lý đối với biến có nhiều câu trả lời trong menu Analyze > Tables > Multiple Response Sets. Thủ tục khởi tạo tương tự như ở trên. Mặc dù bạn đã khởi tạo biến có nhiều câu trả lời bằng cách này thì chức năng Multiple Response Frequencies và Crosstabs ở trên không thể sử dụng được, thay vào đó Analyze > Tables > Custom Tables sẽ hỗ trợ và nó được xem như một variable. b. Mô tả dữ liệu bằng đồ thị Đồ thị Bar dùng để thể hiện thông tin như trung bình, trung vị, tần số tích lũy, tần suất tích lũy, số quan sát… của biến. Nó được sử dụng cho các dữ liệu thu thập bằng các thước đo định danh, thứ tự, khoảng cách hoặc tỉ lệ với ít giá trị rời rạc. Từ thanh Menu chọn Analyze Multiple Response Crosstabs Chọn biến nhiều câu trả lời đưa vào khung Row(s), biến phân loại đưa vào khung Column(s), chú ý khai báo Define Ranges cho biến phân loại. Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 20 Để tạo đồ thị bạn vào menu Graphs > Legacy Dialogs > Bar. Ngoài ra còn nhiều dạng đồ thị khác mà bạn có thể lựa chọn, khám phá. Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 21 Để hiệu chỉnh đồ thị và các bảng biểu chúng ta có thể nhấp đúp chuột trên vùng đồ thị, một cửa sổ Editor sẽ mở ra cho phép bạn thao tác chỉnh sửa, lựa chọn màu sắc, kích thước… Nếu bạn muốn tự mình xây dựng dạng đồ thị từ mẫu có sẵn thì có thể sử dụng chức năng Graphs > Chart Builder * Lưu ý: bạn có thể vẽ đồ thị trong phần tạo bảng tần số (Frequencies) với nút Charts. 2. Thống kê suy diễn * Thống kê suy diễn (Statistical Inference): sử dụng các thông số của mẫu để ước lượng và kiểm nghiệm các giả thuyết về tổng thể. Phương pháp: dùng các phương pháp kiểm định thống kê để kiểm nghiệm các giả thuyết về tổng thể. - Kiểm định các mối quan hệ - tương quan có ý nghĩa giữa các biến khảo sát. - Kiểm nghiệm sự khác biệt có ý nghĩa giữa các giá trị trung bình. + Kiểm định trung bình tổng thể Bài toán Quy trình kiểm định  B1: Ñaët hai giaû thieát H 0 vaø H 1 ▪ H 0 : Giaû thieát ñuùng µ = µ0 ▪ H 1 : µ µ0: Hướng dẫn sử dụng SPSS cho người mới bắt đầu Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 22 Giaû thieáùt sai  B2: Tìm möùc yù nghóa cuûa toång theå maãu (.sig)  B3: tìm mieàn baùc boû H 0 (α)  B4: Ra quyeát ñònh H 0 neáu sig > α vaø ngöôïc laïi Hệ số ý nghĩa (P-value hay Significant level) Thao tác + Kiểm định trung bình hai tổng thể Bài toán Kiểm định trung bình hai mẫu độc lập (1 biến định lượng, 1 biến định tính) Thao tác  Quy trình kieåm ñònh: 1. B1: Kieåm ñònh phöông sai choïn höôùng kieåm ñònh (Levene’s test). 2. B2: Kieåm ñònh giaû thieát của bài toán Kết quả Kiểm định 2 mẫu độc lập Kiểm định ANOVA V/ Phụ lục Một số video trực tuyến về SPSS tại youtube.com 1) Introduction to SPSS (part I - part II - ) Tài liệu tham khảo 1) 2) &forum=17&topic=66&Itemid=474 3) Phân tích dữ liệu nghiên cứu với SPSS, Hoàng Trọng, Chu Nguyễn Mộng Ngọc, NXB Thống kê 2005. 4) Xử lý data với SPSS, Nguyễn Duy Tâm. Và các tài nguyên trực tuyến khác
Tài liệu liên quan