PHẦN BỐN PHÂN TÍCH VÀ TRÌNH BÀY DỮ LIỆU
1-1
CHƯƠNG 15 CHUẨN BỊ VÀ MÔ TẢ DỮ LIỆU
Nhóm báo cáo: nhóm H 1-2
DANH SÁCH NHÓM H Nguyễn Thị Trần Nhân Đặng Thị Hương Huỳnh Đăng Hương Nguyễn Thị Thúy Nguyễn Thị Thanh Đỗ Ngọc Hoàng Lê Thụy Thục Luân Thị Xuân Trần Văn Nguyễn Thương 1-3
Ái Giang Giang Hằng Trúc Yến Đoan Đào Nhị Giang
CHUẨN BỊ DỮ LIỆU Mục đích: * Có dữ liệu chính xác phù hợp với mục đích nghiên cứu. * Phân lọai dữ liệu thành nhóm để phân tích.
1-4
CHUẨN BỊ DỮ LIỆU Chuẩn bị dữ liệu và mô tả bao gồm: • Chỉnh sửa dữ liệu • Mã hóa dữ liệu • Nhập liệu • Thống kê mô tả
1-5
CHUẨN BỊ DỮ LIỆU Vai trò của chuẩn bị dữ liệu là: • Kiểm tra lỗi và thiếu sót. • Sửa sai nếu có thể • Đảm bảo chất lượng tối thiểu cần có của dữ liệu
1-6
CHUẨN BỊ DỮ LIỆU Tiêu chuẩn tối thiếu về chất lượng dữ liệu là: • Chính xác • Không mâu thuẫn với các thông tin khác • Được đưa vào đồng nhất • Đơn giản. • Sắp xếp để đơn giản hóa việc mã hóa và lập bảng 1-7
CHUẨN BỊ DỮ LIỆU Các bước chỉnh sửa dữ liệu: • Sắp xếp dữ liệu - Diễn giải các ký hiệu và chữ ký viết tắt trong quá trình thu thập. - Xác nhận giá trị các kết quả đã sắp xếp bằng cách phỏng vấn lại vài % mẫu đã phỏng vấn. • Thống nhất dữ liệu
1-8
Mã hóa dữ liệu (Coding) • Mã hóa dữ liệu là gì?
1-9
Mã hóa dữ liệu là việc gán các con số hoặc ký hiệu cho các câu trả lời thực của người trả lời để có thể gom chúng thành từng nhóm nhằm làm cho quá trình tóm tắt, phân tích và nhập liệu dễ dàng và hiệu quả. Vd: Giới tính: Nam = 1, Nữ= 0 Anh/chị có thường đi siêu thị không? 1. Thường xuyên 2. Thỉnh thoảng 3. Không đi.
Mã hóa dữ liệu (Coding) (tt) • Nguyên tắc mã hóa Việc mã hóa dữ liệu phải tuân thủ 4 nguyên tắc: 1/ Phù hợp với vấn đề và mục đích nghiên cứu 2/ Bao quát hết mọi khía cạnh 3/ Loại trừ lẫn nhau, không trùng lắp 4/ Xuất phát từ 1 nguyên tắc phân loại
1-10
Mã hóa dữ liệu (Coding) (tt) • Mã hóa cho câu hỏi đóng (Coding closed questions) 1/ Câu hỏi đóng là gì? Là những câu hỏi có sẵn phương án trả lời, người được hỏi sẽ lựa chọn và đánh dấu vào các phương án thích hợp Vd: Tình trạng hôn nhân của anh, chị như thế nào? (1) Đã kết hôn (4) Ly thân (2) Góa phụ (5) Chưa kết hôn 1-11 (3) Ly dị
Mã hóa dữ liệu (Coding) (tt)
1-12
2/ Ưu / nhược điểm câu hỏi đóng Ưu điểm: + Các câu trả lời đã được chuẩn bị trước và có tác dụng làm rõ nghĩa thêm nội dung câu hỏi, tạo điều kiện cho mọi người cùng hiểu câu hỏi đó theo cùng 1 nghĩa. + Dễ trả lời. + Mất ít thời gian, không bị căng thẳng. + Đều nhận được sự trả lời. + Thuận lợi cho sự xử lý dữ liệu.
Mã hóa dữ liệu (Coding) (tt) Nhược
điểm: + Làm bó hẹp tư duy, suy nghĩ của người trả lời. + Hạn chế khả năng sáng tạo.
1-13
Mã hóa dữ liệu (Coding) (tt) 3/ Mã hóa câu hỏi đóng như thế nào? Do đặc điểm của loại câu hỏi này là nhà nghiên cứu có sẵn câu trả lời từ trước, do đó việc mã hóa cho các câu hỏi này thường được tiến hành từ giai đoạn thiết kế bảng câu hỏi, bằng cách gán các con số cho các câu trả lời. Nên còn được gọi là Tiền mã hóa (Precode) 1-14
Mã hóa dữ liệu (Coding) (tt) • Mã hóa cho câu hỏi mở (Coding open - ended questions) 1/ Câu hỏi mở là gì? Là những câu hỏi không có sẵn phương án trả lời, người được hỏi tự đưa ra câu trả lời thích hợp với họ. Vd: Điều gì khiến bạn quyết định mua bảo hiểm nhâm thọ? 1-15
Mã hóa dữ liệu (Coding) (tt) • Câu hỏi mở thường được sử dụng trong các nghiên cứu tìm kiếm, phát hiện hiện tượng mới nảy sinh trong đời sống xã hội mà chúng ta hiểu biết về nó còn chưa đầy đủ hoặc nó được sử dụng trong nghiên cứu thử để kiểm tra tính đầy đủ và chất lượng của câu hỏi đóng vì với các câu hỏi mở, người được hỏi không bị ảnh hưởng của các câu trả lời đã được chuẩn bị trước, họ tự do trả lời theo những gì mà họ suy nghĩ. 1-16
Mã hóa dữ liệu (Coding) (tt) Tuy nhiên, câu hỏi mở có nhiều hạn chế do các câu trả lời nhận được sẽ có rất nhiều nghĩa khác nhau do: • Những người trả lời đã không xem xét hiện tượng được hỏi dưới cùng một góc độ. • Các câu trả lời thường được sử dụng với từ, thuật ngữ khác nhau và có nhiều từ, nhiều thuật ngữ mang tính đa nghĩa. • Ngay bản thân câu hỏi mở cũng ít khả năng để tạo cho mọi người hiểu về nó một cách như nhau. 1-17
Mã hóa dữ liệu (Coding) (tt)
1-18
2/ Mã hóa câu hỏi mở như thế nào? Sử dụng kỹ thuật phân tích nội dung để mã hóa cho loại câu hỏi này. Do các câu trả lời không được liệt kê trước, nên rất khó xác định được các câu trả lời thực của người trả lời. Các bảng câu hỏi nhận về thường có những câu trả lời rất khác nhau, rất đa dạng. Như vậy việc mã hóa diễn ra sau khi thu thập thông tin nên còn được gọi là post code
Phân tích nộ dung để mã hóa 1. Đo lường nội dung ngữ nghĩa của thông điệp. 2. Nghiên cứu mô tả định lượng, hệ thống và khách quan của nội dung truyền đạt. - Những nội dung mang tính cấu trúc: là những nội dung nhỏ nhất và đáng tin cậy. - Những nội dung mang tính tham khảo: đồ vật, con người, sự kiện,… - Những nội dung mang tính gợi ý: sử dụng một vài từ then chốt. - Những nội dung riêng về một chủ đề. 1-19
Nhập dữ liệu (Data Entry) • Nhập dữ liệu: là việc chuyển tải dữ liệu thu thập được từ các nguồn sơ cấp: bảng câu hỏi; bài test; checklist; phiếu khảo sát; kết quả phỏng vấn, quan sát... thành dữ liệu trên máy tính phục vụ cho mục đích phân tích, thống kê miêu tả.
• Các phương pháp nhập liệu: • Nhập liệu bằng bàn phím • Sử dụng máy quét quang học (optional Scanner) • Thiết bị nhận dạng giọng nói.
1-20
Định dạng Nhập dữ liệu (Data Entry Format) • Cơ sở dữ liệu Lưu trữ những thông tin đã được sắp xếp khi được nhập vào máy tính • Bảng tính. Thông tin được lưu trên bảng tính có thể sắp xếp, lập bảng, thống kê đơn giản để dễ dàng hiểu khái quát • Trình soạn thảo toàn cục. Giúp lưu trữ một lượng lớn thông tin theo các mục để
dễ dàng lưu trữ, giải thích hoặc xếp loại
1-21
Định dạng Nhập dữ liệu (Data Entry Format): Cách thức vận dụng Ø %ҧng câu Kӓi Ø Checklist Nhұp liӋu bҵ ng Ej n SKtm
Ø %j i kiӇm tra Ø %ҧng ghi FK~ khi quan Vi t Ø KӃt TXҧSKӓng vҩn Ø ... Ø %ҧng câu Kӓi
Sӱ Gөng P i y Scanner
Ø Checklist Ø %j i kiӇm tra Ø &i c W j i liӋu đѭӧc in sҹn
Upload tӯ files
Nhұn dang JLӑng Qyi (Voice recognition
1-22
%j n SKtm điӋn W KRҥi
Ø Email, internet... Ø Tin nhҳn điӋn W KRҥi
Ø 3 Kӓng vҩn trӵc tiӃp Ø 3 Kӓng vҩn qua điӋn W KRҥi
Ø . Kҧo Vi t qua điӋn W KRҥi Ø Tin nhҳn điӋn W KRҥi
THỐNG KÊ MÔ TẢ • Tóm tắt và mô tả các dữ liệu thông qua tìm hiểu định nghĩa, ứng dụng và công thức của các phương pháp thống kê. • Tìm ra các lỗi, các dữ liệu thiếu sót, làm sạch dữ liệu, giải quyết các vấn đề.
1-23
THỐNG KÊ MÔ TẢ Các đặc trưng của phân phối: • Định vị • Phân tán • Dạng
1-24
THỐNG KÊ MÔ TẢ Phương pháp định vị: xu hướng tập trung • Trung bình (mean) • Trung vị (median) • Mode
1-25
THỐNG KÊ MÔ TẢ Phương pháp phân tán: • Phương sai • Độ lệch chuẩn (standard deviation) • Tầm (range) • Tầm tứ phân vị (interquartile range)
1-26
THỐNG KÊ MÔ TẢ Phương pháp xác định dạng: • Độ lệch (skewness) • Độ nhọn (kurtosis)
1-27