Giao diện
Module 2: Regression & Diagnostics 📈
📝 Stats
- Số lượng: 8 câu hỏi
- Độ khó: Trung bình
- Mục tiêu: Diễn giải hệ số hồi quy và kiểm tra giả định mô hình.
MCQ
Q1. Trong mô hình lm(y ~ x), nếu hệ số của x là 2.5, điều này có nghĩa là gì?
- [ ] Khi x tăng 1 đơn vị, y tăng trung bình 2.5 đơn vị.
- [ ] Khi x tăng 1%, y tăng 2.5%.
- [ ] Mối tương quan giữa x và y là 2.5.
- [ ] y luôn gấp 2.5 lần x.
Đáp án: Khi x tăng 1 đơn vị, y tăng trung bình 2.5 đơn vị.
Q2. Đồ thị "Residuals vs Fitted" dùng để kiểm tra điều gì?
- [ ] Tính chuẩn của phần dư (Normality).
- [ ] Tính tuyến tính (Linearity) và phương sai đồng nhất (Homoscedasticity).
- [ ] Outliers.
- [ ] Đa cộng tuyến.
Đáp án: Tính tuyến tính và phương sai đồng nhất. (Nên là đám mây ngẫu nhiên quanh trục 0).
Q3. Trong Logistic Regression, hệ số trả về là ở dạng nào?
- [ ] Probability (Xác suất).
- [ ] Odds (Tỷ số chênh).
- [ ] Log-Odds (Logarit cơ số tự nhiên của tỷ số chênh).
- [ ] Category dự đoán.
Đáp án: Log-Odds. (Cần dùng hàm
exp()để chuyển về Odds).
Coding Challenge
Challenge: Model Interpretation
Dùng bộ dữ liệu mtcars.
- Fit model dự đoán
mpgdựa trênwt(trọng lượng) vàhp(mã lực). - In ra summary và lấy ra hệ số của
wt. - Diễn giải hệ số đó: "Nếu xe nặng thêm 1000 lbs, mpg thay đổi thế nào?"
r
fit <- lm(mpg ~ wt + hp, data = mtcars)
# Lấy hệ số
coef(fit)["wt"]
# ~ -3.87
# Diễn giải:
# wt đơn vị là 1000 lbs.
# Hệ số -3.87 nghĩa là: Giữ nguyên mã lực, nếu xe nặng thêm 1000 lbs,
# hiệu suất nhiên liệu giảm trung bình 3.87 dặm/gallon.