PHÂN TÍCH THỐNG KÊ MÔ TẢ
1. Thống kÍ mô tả Sử dụng dữ liệu igfdata để minh hoạ cho việc áp dụng R vào thống kÍ mô tả. Nhập dữ liệu
> igf > Mean (age)
> Summary (age) > Sd (age)
> Var (age)
- R không cung cấp độ lệch chuẩn nÍn ta phải tự viết hàm desc desc
<- function (x)
{ Ví dụ: tính biến als av <- mean (x) > desc( als) sd <- sd (x) MEAN SD SE se <- sd/ sqrt (length (x)) 301.841120 58.987189 c ( MEAN=av, SD=sd, SE=se) 5.898719 }
- Để có thống kÍ đầy đủ về dữ liệu igf ta dùng lệnh summary (igf) - Nếu muốn kết quả cho nam và nữ riÍng biệt, dùng hàm by
- Vẽ đồ thị
Nhập hàm: > op <- par(mfrow=c(2,3)) > hist (igfi) > hist (igfbp3) > hist (als) > hist (pinp) > hist (ictp) > hist (p3np)
2. Thống kÍ mô tả - Để tính trung bình cho một biến số, ta dùng hàm: tapply (igfi, list(sex), mean)
- Nếu muốn thêm các tính trạng khác để thống kê thì ta chỉ cần thêm một biến số trong hàm list: tapply(igfi, list(ethnicity, sex), mean)
3. Kiểm định t (t.test) 3.1 Kiểm định t một mẫu • VD: Tuổi TB của mẫu= 17.57 tuổi Quần thể này trước đây có tuổi TB = 30 tuổi => Mẫu có đại diện cho quần thể hay không? => Dùng hàm t.test trong R KQ: 30 nằm ngoài (15.69;19.45) KL: Độ tuổi trung bình trong mẫu thật sự thấp hơn độ tuổi trung bình của quần thể
3.2 Kiểm định t hai mẫu Vd: Xét igfi : Female: 167.97 ( hàm summary trong R) Male: 160.29 => Đây là khác biệt có hệ thống hay ngẫu nhiÍn? => Dùng hàm t.test trong R KQ: độ igf ở nữ có thể thấp hơn nam 28.9ng/L hoặc cao hơn nam 64.5ng/L KL: không có ý nghĩa thống kÍ giữa hai nhóm
- Giả sử 2 nhóm có cùng phương sai,chúng ta chỉ thay đổi 1 thông số trong hàm t với var.equal=true
Kết luận: Độ khác biệt giữa 2 nhóm không có ý nghĩa thống kÍ
4. Kiểm định Wilcoxon cho 2 mẫu (wilcox.test) - Để kiểm định phân phối của igfi, dùng hàm shapiro.test(igfi)
KQ: p-value = 0.9715 > α = 0.05 KL: phân phối igfi không tuân theo phân phối chuẩn => dùng phương pháp phi tham số (non-parametric): Wilcoxon
p=0.456 cho thấy độ khác biệt về igfi giữa hai nhóm nam và nữ không có ý nghĩa thống kÍ (giống với kết quả kiểm định t)
5. Kiểm định t cho các biến số theo cặp (paired t-test,t.test) Vd: Một nhóm bệnh nhân gồm 10 người được điều trị bằng một thuốc nhằm giảm huyết áp. Trước điều trị (x0)
180
140
160
160
220
185
145
160
160
170
Sau điều trị (x1)
170
145
145
125
205
185
150
150
145
155
Vậy thuốc điều trị có hiệu quả giảm huyết áp hay không?
NhKiậểpmdữ liệut định
KQ:
Sau điều trị áp suất máu giảm 10.5 mmHg Khoảng tin cậy (2.0;19) mmHg ở 95% p = 0.02 KL: Mức độ giảm huyết áp có ý nghĩa thống kÍ
- TH phân tích sai bằng kiểm định thống kÍ cho 2 nhóm độc lập
- KQ: p=0.32 - KL: độ giảm áp suất không có ý nghĩa thống kÍ
6. Kiểm định Wilcoxon cho các biến số theo cặp (wilcox.test)
- Có thể dùng hàm wilcox.test thay cho kiểm định t từng cặp
KQ: p=0.023 KL: Độ giảm áp suất máu có ý nghĩa thống kÍ với p=0.023
• Hết rùi