Skip to content

Module 2: Regression & Diagnostics 📈

📝 Stats

  • Số lượng: 8 câu hỏi
  • Độ khó: Trung bình
  • Mục tiêu: Diễn giải hệ số hồi quy và kiểm tra giả định mô hình.

MCQ

Q1. Trong mô hình lm(y ~ x), nếu hệ số của x là 2.5, điều này có nghĩa là gì?

  • [ ] Khi x tăng 1 đơn vị, y tăng trung bình 2.5 đơn vị.
  • [ ] Khi x tăng 1%, y tăng 2.5%.
  • [ ] Mối tương quan giữa x và y là 2.5.
  • [ ] y luôn gấp 2.5 lần x.

Đáp án: Khi x tăng 1 đơn vị, y tăng trung bình 2.5 đơn vị.

Q2. Đồ thị "Residuals vs Fitted" dùng để kiểm tra điều gì?

  • [ ] Tính chuẩn của phần dư (Normality).
  • [ ] Tính tuyến tính (Linearity) và phương sai đồng nhất (Homoscedasticity).
  • [ ] Outliers.
  • [ ] Đa cộng tuyến.

Đáp án: Tính tuyến tính và phương sai đồng nhất. (Nên là đám mây ngẫu nhiên quanh trục 0).

Q3. Trong Logistic Regression, hệ số β trả về là ở dạng nào?

  • [ ] Probability (Xác suất).
  • [ ] Odds (Tỷ số chênh).
  • [ ] Log-Odds (Logarit cơ số tự nhiên của tỷ số chênh).
  • [ ] Category dự đoán.

Đáp án: Log-Odds. (Cần dùng hàm exp() để chuyển về Odds).


Coding Challenge

Challenge: Model Interpretation

Dùng bộ dữ liệu mtcars.

  1. Fit model dự đoán mpg dựa trên wt (trọng lượng) và hp (mã lực).
  2. In ra summary và lấy ra hệ số của wt.
  3. Diễn giải hệ số đó: "Nếu xe nặng thêm 1000 lbs, mpg thay đổi thế nào?"
r
fit <- lm(mpg ~ wt + hp, data = mtcars)

# Lấy hệ số
coef(fit)["wt"]
# ~ -3.87 

# Diễn giải:
# wt đơn vị là 1000 lbs.
# Hệ số -3.87 nghĩa là: Giữ nguyên mã lực, nếu xe nặng thêm 1000 lbs, 
# hiệu suất nhiên liệu giảm trung bình 3.87 dặm/gallon.