Skip to content

Module 1: Hypothesis Testing 🧪

📝 Stats

  • Số lượng: 8 câu hỏi
  • Độ khó: Trung bình
  • Mục tiêu: Hiểu đúng P-value và không quên Power Analysis.

MCQ

Q1. Một kết quả P-value = 0.03 có nghĩa là gì?

  • [ ] Có 97% xác suất là giả thuyết Null sai.
  • [ ] Có 3% xác suất là giả thuyết Null đúng.
  • [ ] Nếu giả thuyết Null đúng, chỉ có 3% xác suất quan sát được dữ liệu cực đoan như thế này (hoặc hơn).
  • [ ] Giả thuyết đối (Alternative) chắc chắn đúng.

Đáp án: Nếu giả thuyết Null đúng, chỉ có 3% xác suất quan sát được dữ liệu cực đoan như thế này. (Định nghĩa chuẩn xác nhất).

Q2. Type II Error (Beta) là gì?

  • [ ] Bác bỏ Null khi Null đúng (Oan sai).
  • [ ] Chấp nhận Null khi Null sai (Bỏ sót tội phạm).
  • [ ] Lỗi sai số tính toán.
  • [ ] Lỗi do dữ liệu nhập sai.

Đáp án: Chấp nhận Null khi Null sai (False Negative).

Q3. Để giảm khả năng mắc Type II Error (tăng Power), bạn có thể làm gì?

  • [ ] Tăng kích thước mẫu (Sample size).
  • [ ] Tăng mức ý nghĩa Alpha (từ 0.05 lên 0.10).
  • [ ] Tăng Effect Size (nhìn vào sự khác biệt lớn hơn).
  • [ ] Tất cả các phương án trên.

Đáp án: Tất cả.


Coding Challenge

Challenge: Power Calculation

Bạn muốn chạy A/B Test cho nút "Mua ngay". Tỷ lệ chuyển đổi hiện tại (Baseline): 10%. Bạn kỳ vọng nút mới tăng lên 12% (Effect size: h = ES.h(0.12, 0.10)). Bạn muốn Power = 80%, Alpha = 0.05. Hỏi cần bao nhiêu mẫu cho mỗi nhóm?

r
library(pwr)

# 1. Tính Effect Size (Cohen's h cho tỷ lệ)
h <- ES.h(0.12, 0.10)

# 2. Tính mẫu
res <- pwr.2p.test(h = h, sig.level = 0.05, power = 0.8)

print(res$n) 
# Khoảng 3873 mẫu mỗi nhóm.