top of page

Thông báo lớp học "Xây dựng mô hình tiên lượng"

Tôi hân hạnh giới thiệu đến các bạn xa gần một lớp học về mô hình tiên lượng (predictive models) sẽ được Đại học Dược Hà Nội tổ chức từ ngày 12/6 đến 17/6 tới đây. Đây là một lớp học rất có ích cho các bạn làm nghiên cứu liên quan đến dự báo trong y học, sinh học, khoa học xã hội, v.v.

1. Mục tiêu và kì vọng

Mục tiêu chính của khoá học là trang bị cho các học viên những kiến thức cơ bản và kĩ năng cần thiết về xây dựng và kiểm định các mô hình tiên lượng. Học viên còn học kĩ năng ngôn ngữ R để thực hiện những phương pháp phân tích hiện đại. Khoá học sẽ tập trung vào quá trình hình thành ý tưởng nghiên cứu, chọn mô hình nghiên cứu, phương pháp thu thập dữ liệu, lên kế hoạch phân tích, cách thực hiện phân tích bằng R, và quan trọng hơn hết là diễn giải kết quả phân tích. Sau khi xong khoá học, chúng tôi kì vọng học viên sẽ có khả năng:

• Hiểu và dùng ngôn ngữ R cho phân tích tiên lượng; • Hiểu và dùng các mô hình hiển thị dữ liệu (data visualization) ở cả trình độ cơ bản và nâng cao; • Biết cách ứng dụng các mô hình hồi qui tuyến tính và hồi qui logistic; • Hiểu phương pháp tìm mô hình tối ưu; • Biết cách đánh giá mô hình tiên lượng như ROC curve, AUC, calibration, reclassification, v.v.

2. Đối tượng

Lớp học được thiết kế dành cho các sinh viên sau đại học, nghiên cứu sinh, giảng viên, nhà khoa học có nhu cầu phân tích dữ liệu và học về mô hình tiên lượng. Học viên cần có kiến thức cơ bản về thống kê học và phân tích dữ liệu.

3. Chương trình gồm 16 bài giảng và thực hành với nghiên cứu thực tế.

12/6 Bài giảng 1: Giới thiệu R Bài giảng 2: RStudio và R Markdown Bài giảng 3: Phương pháp phân tích mô tả: t-test, z-test

13/6 Bài giảng 4: Giới thiệu "ggplot2" cho biểu đồ chất lượng cao Bài giảng 5: Hiển thị dữ liệu với ggplot2 (data visualization using ggplot2)

14/6 Bài giảng 6: Giới thiệu mô hình hồi qui tuyến tính: mô hình, diễn giải kết quả Bài giảng 7: Kiểm tra giả định, ảnh hưởng tương tác, hoán chuyển dữ liệu

15/6 Bài giảng 8: Mô hình tiên lượng I: hồi qui tuyến tính đa biến Bài giảng 9: Phương pháp tìm mô hình "tối ưu" (tìm các yếu tố liên quan)

16/6 Bài giảng 10: Mô hình tiên lượng II: hồi qui logistic Bài giảng 11: Phương pháp tìm mô hình "tối ưu" (tìm các yếu tố liên quan) Bài giảng 12: Phương pháp xây dựng nomogram

17/6 Bài giảng 13: Chiến lược xây dựng mô hình tiên lượng Bài giảng 14: Phương pháp đánh giá mô hình: AUC, calibration Bài giảng 15: Phương pháp kiểm định: training và testing Bài giảng 16: Vấn đề cỡ mẫu

4. Giảng viên: tôi và Ts Trần Sơn Thạch.

5. Tài liệu tham khảo

"Phân tích dữ liệu với R: Hỏi và Đáp", tác giả Nguyễn Văn Tuấn, Nxb Tổng Hợp TPHCM 2018.

"Cẩm nang nghiên cứu khoa học: từ ý tưởng đến công bố", tác giả Nguyễn Văn Tuấn, Nxb Tổng Hợp TPHCM 2019.

Bonnett, et al. Guide to presenting clinical prediction models for use in clinical settings. BMJ 2019;365:l737.

E Steyerberg, et al. Towards better clinical predictionmodels: seven steps for development and anABCDfor validation. European Heart Journal (2014) 35, 1925–1931

5. Đăng kí và liên lạc

Mọi thông tin vui lòng liên lạc: Phòng Sau Đại học, 13-15 Lê Thánh Tông, Hoàn Kiếm, Hà Nội. Phone: 024.38267480. Ths Bảo (phone: 0983.032.589), Ts Giang (0979.630.372).

Download thông báo ở đây:

Ghi thêm

Lớp học này (ở ĐH Dược) sẽ tập trung vào predictive analytics, và tôi sẽ tập trung vào 3 lĩnh vực chính: data visualization (hiển thị dữ liệu), mô hình hồi qui tuyến tính, và mô hình hồi qui logistic. Mỗi mô hình có 3 ứng dụng:

• phân tích liên quan (association analysis) • hiệu chỉnh cho yếu tố nhiễu (adjustment analysis) • phân tích tiên lượng (prediction analysis). Thông thường, các chương trình dạy về mô hình hồi qui tuyến tính và hồi qui logistic dừng ở mức độ ý nghĩa thống kê, tức association analysis và adjustment analysis. Chương trình lần này mở rộng sang prediction analysis. Vì vậy, một số phương pháp mới được giới thiệu. Chẳng hạn như chúng ta hay dùng phương pháp least square hay maximum likelihood để ước tính tham số, và điều này rất ok. Nhưng nó có thể không ok khi dữ liệu ít, số biến cố ít, hay số biến tiên lượng quá nhiều. Do đó, chúng tôi sẽ giới thiệu phương pháp LASSO và cách ứng dụng trong phân tích tiên lượng. Chúng tôi sẽ có 3 dữ liệu thực tế để thực hành. Một dữ liệu về bệnh tiểu đường, một dữ liệu về béo phì (cả hai là nghiên cứu của tôi), và một dữ liệu về gian lận về thẻ tín dụng. Chúng ta sẽ học cách xây dựng mô hình tiên lượng để nhận dạng ai có nguy cơ tiểu đường hay ai có xu hướng gian lận thẻ tín dụng.

Tôi nghĩ nghiên cứu y học ở VN thường đơn giản, nên workshop này hi vọng sẽ đem lại một cách suy nghĩ mới để làm cho nghiên cứu phong phú hơn và có ý nghĩa hơn.

Featured Posts
Recent Posts
Archive
Search By Tags
Follow Us
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square
bottom of page