Bài giảng Phương pháp nghiên cứu kinh tế - Chương 4: Xử lý và phân tích thông tin - Ngô Thị Thuận

1. Xử lý dữ liệu 1.1.Hiệu chỉnh và mã hóa dữ liệu 1.2. Đánh giá chất lượng số liệu 1.3. Xác đinh các mối liên hệ a). Khái niệm và lợi ích hiệu chỉnh và mã hóa dữ liệu Tại sao? Hiệu chỉnh: Kiểm tra dữ liệu và thông tin theo 3 yêu cầu Mã hóa: là thay đổi số liệu ‘nguyên thủy’ về một dạng ngắn gọn hơn để có thể lưu trong máy tính và xử lý được dễ dàng bằng các mã số hoặc ký hiệu thích hợp (Xây dựng bộ mã hóa). Các lợi ích của mã hóa dữ liệu - Giảm công suất, không gian lưu trữ - So sánh giảm nhẹ và như vậy sẽ nhanh hơn - Nếu mã hóa số lượng vừa phải có thể giúp nâng cao giá trị của số liệu - Giúp cho các phương pháp phân tích định lượng

ppt108 trang | Chia sẻ: candy98 | Lượt xem: 468 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Phương pháp nghiên cứu kinh tế - Chương 4: Xử lý và phân tích thông tin - Ngô Thị Thuận, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRƯỜNG ĐẠI HỌC NÔNG NGHIỆP I – HÀ NỘI BỘ MÔN PHÂN TÍCH ĐỊNH LƯỢNGCHƯƠNG 4:XỬ LÝ VÀ PHÂN TÍCH THÔNG TIN 2Nội dungXử lý dữ liệuCác phương pháp phân tích thông tinTrình bày kết quả xử lý và phân tích thông tin331. Xử lý dữ liệu 1.1.Hiệu chỉnh và mã hóa dữ liệu 1.2. Đánh giá chất lượng số liệu1.3. Xác đinh các mối liên hệ41.1. Hiệu chỉnh và mã hóa dữ liệu5a). Khái niệm và lợi ích hiệu chỉnh và mã hóa dữ liệuTại sao?Hiệu chỉnh: Kiểm tra dữ liệu và thông tin theo 3 yêu cầuMã hóa: là thay đổi số liệu ‘nguyên thủy’ về một dạng ngắn gọn hơn để có thể lưu trong máy tính và xử lý được dễ dàng bằng các mã số hoặc ký hiệu thích hợp (Xây dựng bộ mã hóa).Các lợi ích của mã hóa dữ liệu- Giảm công suất, không gian lưu trữ- So sánh giảm nhẹ và như vậy sẽ nhanh hơn- Nếu mã hóa số lượng vừa phải có thể giúp nâng cao giá trị của số liệu- Giúp cho các phương pháp phân tích định lượng6Lựa chọn mã hóa, thang đo gắn cho từng dữ liệu * C¸c lo¹i thang ®o+ Thang ®o ®Þnh danh (Norminal+ Thang ®o thø bËc (Ordinal): lµ thang ®o ®Þnh danh nh­ng cã ph©n ra thø bËc cao thÊp. VÝ dô Hu©n ch­¬ng h¹ng 1, 2, 3.+ Thang ®o kho¶ng (interval): Lµ thang ®o thø bËc cã kho¶ng c¸ch ®Òu nhau, cã thÓ ®¸nh gi¸ sù kh¸c biÖt gi÷a c¸c biÕn.+ Thang ®o tû lÖ (Ratio- Scale): §Ó ®o l­êng c¸c biÓu hiÖn cña tiªu thøc nh­ c¸c ®¬n vÞ vËt lý th«ng th­êng* Các mã số: Đánh dấu, ký hiệu, cho điểm * Lựa chọn số lượng và giới hạn của từng hành vi của thông tin.Thí dụ: Các nguyên nhân, Các khó khăn, * Gắn thang đo, mã số cho từng hành vi của thông tinb). Kỹ thuật mã hóa dữ liệu7c) Những chú ý khi mã hóa dữ liệuNgười sử dụng cần phải biết mã của dữ liệuNếu người sử dụng không biết mã của số liệu thì không thể phân tích đượcThí dụ Mã hóa thông tin về giới: 1 là nam; 2 là nữMức độ chính xác của dữ liệu mã hóaVí dụ: Mã hóa thông tin về mức độ kinh tếHộ giàu: thu nhập/1 người >500 ngàn đ/tháng; Hộ nghèo: T (n-1, /2) ta b¸c bá gi¶ thuyÕt Ho vµ khi ®ã:- NÕu Ď > Do th× (x - y) >0- NÕu Ď Tn-1,/2 hoÆc T T(n-1,/2)+ ThÝ dô: C«ng ty VINAMILK ¸p dông c«ng nghÖ míi trong chÕ biÕn s÷a chua. H·y kiÓm ®Þnh xem n¨ng suÊt lao ®éng cña c«ng nh©n sau khi sö dông c«ng nghÖ míi víi c«ng nghÖ cò cã kh¸c nhau kh«ng víi møc ý nghÜa lµ 5% ?x Trung binh cña 10 c«ng nh©n theo c«ng nghÖ cò = 56,30y Trung binh cña 10 c«ng nh©n theo c«ng nghÖ míi = 61,20Ď lµ trung binh cña tæng thÓ sai lÖch X – Y = - 4,9Sd lµ ®é lÖch chuÈn cña tæng thÓ X-Y = 4,4833Ta cÇn kiÓm ®Þnh gia thuyÕt sau:Ho: x - y = Do =0H1: x - y  Do  0Thø tù c«ng nh©n quan s¸tNSLD (kg/ngµy)X-YTr­íc khi XSau khiY15052-224846234550-546065-557078-866261175558-386270-895867-9105365-12Trung b×nh56.3061.20-4.90Ph­­¬ng sai57.5797.0720.10§é lÖch chuÈn7.599.854.4833TÝnh T kiÓm ®Þnh Ď - Do 4,9 - 0 4,9T = ------------ = --------------- = ---------------- = 3,456 Sd 4,4833 1,4177 --------- ---------------- n 10 Tim T lý thuyÕt víi bËc tù do lµ 9;  = 0,025: Ta t×m hµm TINV(9, 0,05)= 2,262;Nh­ vËy, T  kiÓm ®Þnh = 3,456 >T lý thuyÕt = 2,262 ta b¸c bá Ho, nghÜa lµ n¨ng suÊt lao ®éng cña c«ng nh©n sau khi ¸p dông c«ng nghÖ míi kh¸c víi c«ng nghÖ cò.Vi Ď = 4,9 > Do nªn x - y > 0, nghÜa lµ ë møc ý nghÜa 5% ¸p dông c«ng nghÖ míi ®· lµm t¨ng n¨ng suÊt so víi c«ng nghÖ cò.b. Tr­êng hîp lÊy mÉu ®éc lËp+ Bµi to¸n:Gia sö ta cã nx vµ ny lµ sè ®¬n vÞ mÉu ®­îc chän ngÉu nhiªn, ®éc lËp tõ hai tæng thÓ X vµ Y cã ph©n phèi chuÈn , thÓ hiÖn ë bang sau:x Trung b×nh cña tæng thÓ Xy Trung b×nh cña tæng thÓ Y x , ŷ lµ trung b×nh cña 2 mÉu chän ngÉu nhiªn tõ 2 tæng thÓ X ; Y2 x vµ 2y lµ ph­¬ng sai cña tæng thÓ X vµ YVíi møc ý nghÜa  Ta cÇn kiÓm ®Þnh gia thuyÕt sau:Ho: x - y = Do (Do lµ gi¸ trÞ cho tr­íc Do=0)H1: x - y  DoHay:Ho: x - y = 0 ; H1: x - y  0Quan s¸tXY1X1Y12X2Y23X3Y3......nXnYnSè quan s¸tnxny Trung b×nh mÉuxŷTrung b×nhxyPh­¬ng sai2x2y§é lÖch chuÈn xy+ Nguyªn t¾c kiÓm ®Þnh: cã 2 tr­êng hîp x¶y ra Trong ®ã: Do : gi¸ trÞ cô thÓ cho tr­íc (Do =0) x – ŷ - Do Z = -------------------- x,, ŷ lµ trung b×nh cña 2 mÉu 2 x vµ 2y lµ ph­¬ng sai cña tæng thÓ 2x 2y X vµ Y ------ + ------ nx ,ny : sè ®¬n vÞ mÉu quan s¸t cña táng nx ny thÓ X vµ Y Z: Tiªu chuÈn kiÓm ®Þnh (Z thùc nghiÖm) 1). NÕu nx ,ny  30 , víi X, Y tu©n theo ph©n phèi chuÈn vµ 2 x  2y. TÝnh tiªu chuÈn kiÓm ®Þnh Z (Z thùc nghiÖm)- T×m Z lý thuyÕt: T×m Z/2 b»ng c¸ch tra b¶ng hoÆc dïng hµm NORMSINV víi /2 trong EXCEL + NÕu Z  Z/2 ta chÊp nhËn gi¶ thuyÕt Ho, coi x - y = Do + NÕu Z > Z/2 ta b¸c bá gi¶ thuyÕt Ho, coi x - y  Do vµ khi ®ã :NÕu x > ŷ ta xem x > y NÕu x Z/2 = 1,96 ta b¸c bá gia thuyÕt Ho, coi x - y  0.V× x =2,2 kg/con > ŷ = 1,2 kg/con nªn ta xem x > y, chøng tá khèi l­îng trung b×nh 1 con nu«i b»ng thøc ¨n A lín h¬n nu«i b»ng thøc an B.2). NÕu nx ,ny T nx + ny –2; /2 ta b¸c bá gi¶ thuyÕt Ho vµ khi ®ã:- NÕu x > ŷ ta xem x > y - NÕu x T nx + ny –2; /2 = 2,03 ta b¸c bá gi¶ thuyÕt Ho,V× x =2,2 kg/con > ŷ = 1,2 kg/con nªn ta xem x > y, chøng tá khèi l­îng trung b×nh 1 con nu«i b»ng thøc ¨n A lín h¬n nu«i b»ng thøc ¨n B.a. Bµi to¸nGia sö ta cã nx vµ ny lµ sè ®¬n vÞ mÉu ®­îc chän ngÉu nhiªn, ®éc lËp tõ hai tæng thÓ X vµ Y cã ph©n phèi chuÈn , thÓ hiÖn ë bang sau:x Trung b×nh cña tæng thÓ Xy Trung b×nh cña tæng thÓ Y x , ŷ lµ trung b×nh cña 2 mÉu chän ngÉu nhiªn tõ 2 tæng thÓ X ; Y2x vµ 2y lµ ph­¬ng sai cña tæng thÓ X vµ Ys2x vµ s2y lµ ph­¬ng sai cña 2 mÉu nx vµ nyVíi møc ý nghÜa  ta cÇn kiÓm ®Þnh gi¶ thuyÕt sau:Ho : 2x = 2y H1 : 2x  2y Quan s¸tXY1X1Y12X2Y23X3Y3......nXnYnSè quan s¸tnxny Trung b×nh mÉuxŷTrung b×nhxyPh­¬ng sai2x2yPh­¬ng sai mÉus2xs2y1.2. KiÓm ®Þnh gi¶ thuyÕt vÒ sù b»ng nhau gi÷a 2 ph­¬ng sai cña 2 tæng thÓb. Nguyªn t¾c kiÓm ®Þnh- TÝnh tiªu chuÈn kiÓm ®Þnh F (F kiÓm ®Þnh) s2xF = -------- Víi gia thiÕt s2x > s2y hoÆc ng­îc l¹i s2y- TÝm F lý thuyÕt: Ta tra bang FISHER – SNEDECOR víi nx-1 vµ ny-1 bËc tù do ; /2 (F nx-1; ny-1; /2); hoÆc tim hµm FINV (nx-1 ; ny-1; /2)- So s¸nh F thùc nghiÖm víi F lý thuyÕt:NÕu F  > F nx-1; ny-1; /2 ta b¸c bá gi¶ thuyÕt Ho,NÕu F   F nx-1; ny-1; /2 ta chÊp nhËn gi¶ thuyÕt Ho.Trong tr­êng hîp b¸c bá gi¶ thuyÕt Ho:- NÕu s2x > s2y ta xem 2x > 2y - NÕu s2x s2x) s2x 17Ho : 2x = 2y H1 : 2x  2yThÝ dô: C«ng ty chÌ Phó §a sö dông 2 m¸y ®ãng gãi chÌ ®en xu¸t khÈu. §Ó kiÓm tra møc ®é chÝnh x¸c cña 2 m¸y nµy, ng­êi ta chän ra tõ m¸y thø nhÊt 20 tói s¶n phÈm, tõ m¸y thø 2 15 tói s¶n phÈm. TÝnh to¸n ph­¬ng sai vÒ khèi l­îng trung b×nh 1 tói cho thÊy ë m¸y 1 lµ 17 gam/tói, m¸y 2 lµ 26 gam/tói. Víi møc ý nghÜa lµ 5% h·y cho biÕt ®é chÝnh x¸c cña 2 m¸y cã nh­ nhau kh«ng?Gi¶i:Gäi 2x lµ ph­¬ng sai ®o sù biÕn ®éng vÒ khèi l­îng s¶n phÈm trung b×nh 1 tói ®ãng gãi tõ m¸y 1; 2y lµ ph­¬ng sai ®o sù biÕn ®éng vÒ khèi l­îng s¶n phÈm trung b×nh 1 tói ®ãng gãi tõ m¸y 2.- TÝnh tiªu chuÈn kiÓm ®Þnh F : - T×m F lý thuyÕt: ta t×m hµm FINV (nx-1 ; ny-1; /2) = FINV (14,19,0.025) = 2,65- Do F = 1,529  F nx-1; ny-1; /2 = 2,65 ta chÊp nhËn gi¶ thuyÕt Ho, nghÜa lµ møc ®é chÝnh x¸c cña 2 m¸y ®ãng gãi lµ nh­ nhau. 60c). Phân tích phương saic. Ph©n tÝch ph­¬ng saiMôc tiªu: so s¸nh trung b×nh cña nhiÒu nhãm dùa trªn c¸c sè trung b×nh mÉu, th«ng qua kiÓm ®Þnh gi¶ thuyÕt ®Ó kÕt luËn vÒ sù b»ng nhau cña c¸c sè trung b×nh nµy.lµ mét c«ng cô ®Ó xem xÐt ¶nh h­ëng cña mét hay mét sè yÕu tè nguyªn nh©n (®Þnh tÝnh) ®Õn mét yÕu tè kÕt qu¶ kia (®Þnh l­îng).ThÝ dô: PP chÊm ®iÓm ®Õn KÕt qu¶; Lo¹i lß ®Õn chi phÝ chÊt ®ètCã 2 d¹ng: ph©n tÝch ph­¬ng sai 1 yÕu tè vµ nhiÒu yÕu tèC¸c b­íc:1). LÊy mÉu, tÝnh c¸c sè TB mÉu, TB chung cña c¸c mÉu2). TÝnh tæng c¸c ®é lÖch b×nh ph­¬ng3). TÝnh c¸c ph­¬ng sai4). KiÓm ®Þnh gi¶ thuyÕt §Ó kiÓm ®Þnh ta ®­a ra 2 gi¶ thiÕt sau: 1) Mçi mÉu tu©n theo ph©n phèi chuÈn N(, 2) 2) Ta lÊy k mÉu ®éc lËp tõ k tæng thÓ. Mçi mÉu ®­îc quan s¸t nj lÇn.2.1. Ph©n tÝch ph­¬ng sai 1 yÕu tèSST: - BiÕn thiªn do yÕu tè nguyªn nh©n ®ang nghiªn cøu (SSW) - BiÕn thiªn cßn l¹i do yÕu tè kh¸c kh«ng nghiªn cøu (SSB)2.2. Ph©n tÝch ph­¬ng sai 2 yÕu tèHµng (khèi)Cét (nhãm )12...K1X11X21X31XK12X12X22X32XK2..............................HX1HX2HX3HXKH72d). Phân tích tương quan73Quan hệ tương quanLà quan hệ tuyến tính giữa 2 biến độc lậpCó thể dự báo giá trị 1 biến khi biết giá trị của biến kiaHệ số tương quan nằm trong khoảng -1 đến 1Giá trị -1 và 1 là tương quan hoàn hảo, rất chặt, tuyến tính giữa 2 biếnGiá trị 0 là không có tương quan, không có mối quan hệ74Tương quan – mức độ và xu hướngPh©n tÝch t­¬ng quan76Ưu và nhược điểm của tương quanCó thể đo được mối quan hệ giữa các biến mà rất khó làm thực nghiệm (chỉ số IQ và tình trạng việc làm/nghề nghiệp)Không xác định được mối quan hệ nhân – quảCó thể biến thứ 3 có ảnh hưởngHướng có thể chưa rõ ràngR mang tính định tính77e). Phân tích hồi qui83Mô hình hóa (kết hợp KTL + Toán + các môn khác)Toán kinh tế (môn toán KT)Mô phỏngPhân tích ngành hàng, Phân tích ma trận chính sách (PAM)Phân tích lợi thế so sánhPhân tích tài chínhXem lại các môn học liên quan và sẽ vận dụng ở chương sauCác phương pháp phân tích định lượng khác84Sử dung số liệu hay thông tin thứ cấp trong phân tích85Số liệu thứ cấpSố liệu được thu thập không phải cho mục đích của NC hiện tạiPhân tích số liệu thông tin đã cóSố liệu thu thập cho sử dụng chungNhà NC có ảnh hưởng nhỏ đến dạng số liệu (làm thế nào điều tra,...)Không nên nhầm với : Phân tích “thứ cấp” – là phân tích một phân tích khác – như kiểm tra tính chính xác86Số liệu thứ cấpLợi íchChi phí và thời gianSự sẵn cóĐỡ tốn kémKhông đòi hỏi thời gian nhiều87Số liệu thứ cấpBất lợi: Có thể không đáp ứng nhu cầu của NC hiện tại vềĐơn vị tínhCác khái niệm, định nghĩa khácThời gianHạn chế: Tính chính xácAi thu thập?Tại sao lại thu thập?Thu thập thế nào?DiÖn tÝch, n¨ng suÊt vµ s¶n l­îng lóa cña ViÖt namn¨mDT (1000 ha)SL (1000 tÊn)%DT vô mïaNS (tÊn/ha)19906.627,7019.225,20452,9019916.302,7019.621,90403,1119926.475,4021.590,30463,3319936.559,4022.836,50583,4819946.598,6023.528,20323,5719956.765,6024.963,70473,6919967.003,8026396,70413,7719977.099,7027.523,90563,8819987.362,7029.145,50373,9619997.653,6031.393,80614,1020007.666,3032.529,50464,2420017.492,7032.108,40554,2920027.485,4034.063,50534,55Nguån: Niªn gi¸53m thèng kª ViÖt Nam 2002, NXB Thèng kª, Hµ Néi 2003 Khối lượng xi măng tiêu thụ của công ty XN Bỉm Sơn Khối lượng xi măng tiêu thụ của công ty XN Bỉm Sơn Tốc độ phát triển vềKhối lượng xi măng tiêu thụ của công ty XN Bỉm SơnĐVT: %924. Trình bày kết quả xử lý & phân tích thông tin93Trình bày dữ liệu Các loại 4 kiểu trình bày kết quả xử lý và phân tíchSố liệu độc lậpBảng số liệuSơ đồ, hìnhĐồ thịMục đích Tất cả các kiểu trình bày đều nhằm mục đích giúp người đọc dễ hiểu kết quả phân tích Đây chỉ là cách khác nhau – mục đích như nhau94Yêu cầu khi trình bày két quả xử lý và phân tích thông tinMỗi hình thức trình bày đều có: Bao gồm tiêu đề mô tảTên của tất cả các biến và đơn vị đoCác biến độc lập ở trục hoànhBiến phụ thuộc ở trục tungNguồn số liệu trong ghi chúChỉ rõ kiểm định thống kê ở cuối bảngLuôn có số quan sát, số mẫuChỉ rõ nếu dùng phần trăm95BảngTiêu đề bảng: Xác định một nội dung cụ thể Sử dụng tên trong tiêu đề và các tiêu đề cột trong bảng cũng giống như trong phân tích Cố gắng ngắn gọn96BảngGhi chú: Sử dụng các chỉ số trên cho ghi chú: Ví dụ: *, †,‡,¶,#,**,††, v.v. Sử dụng ghi chú cho mức ý nghĩa thống kê ví dụ: *** cho mức  < 0,01 trong các kiểm định (T và F) Sử dụng ghi chú giải thích cách tính chi tiết trong bảng, các mức số liệu khác nhau97Dạng bảngHình thức:Tốt nhất là theo các dạng bảng đã được công bố - trong sách, bài báo!! Đường kẻ trong bảng tùy theo yêu cầu (hiện VN chưa có yêu cầu chi tiết) Các tạp chí trên thế giới thường có qui định chi tiết về bảng98Theo tạp chí nước ngoàiYêu cầu có 3 đường kẻ99Ví dụ: Ước lượng mô hình100101Đồ thị, hình, sơ đồMinh chứng Ảnh, phim, v.vPhản ánh chất lượng số liệuĐồ thịĐồ thị dạng đường, cột, phân bố, tỷ lệ XY, v.v.Hình vẽ và biểu đồPhản ánh thiết kế thực nghiệmPhản ánh các “dòng” thí nghiệm hay đối tác tham giaPhản ánh quan hệ, chu trình nguyên nhân – kết quảĐưa ra mô hình giả thuyết102Đồ thị, hình, sơ đồGồm:1. Tiêu đề/tên (ngắn gọn)2. Chi tiết về thực nghiệm3. Định nghĩa các kí hiệu hay đường/cột4. Các tiêu chí thống kê103Đồ thị Đường Phân bố Cột Đồ thị cột, có giá trị Hình tròn Theo diện tích ô ..................104104Biểu đồ hình cộtBiểu đồ hình quạtTrình bày dữ liệu105105Biểu đồ tuyến tính: Quan sát động tháiĐồ thị hàm số: Quan sát động tháiTrình bày dữ liệu106107Đồthị .: Mô phỏng sự thay đổi giá lương thực108Câu hỏi
Tài liệu liên quan