Thông báo khóa học về 'Phân tích tiên lượng và nguyên nhân' (Chợ Rẫy 4/8-9/82019).

Jul 12, 2019
8 min read

Tôi hân hạnh thông báo đến các bạn quan tâm về khóa học hè CME 6 ngày sẽ do Bệnh viện Chợ Rẫy và ĐHYDTPHCM tổ chức từ ngày 4/8 đến 9/8/2019. Chủ đề lần này là "Phân tích tiên lượng và nguyên nhân" (Predictive and Causal Analyses). Đây là khóa học được thiết kế theo nhu cầu của học viên năm ngoái.

1. Bối cảnh

Các mô hình tiên lượng (prediction model) ngày càng phổ biến trong y khoa và các ngành ngoài y khoa. Chỉ trong vòng 10 năm gần đây, có rất nhiều nghiên cứu mang tính tiên lượng dùng 'dữ liệu lớn' và genomics công bố trên các tập san y khoa và ngoài y khoa. Nhiều mô hình được đưa vào ứng dụng trong thực tế, nhưng đa số các mô hình này chỉ là những 'exercises' mang tính hàn lâm. Tuy nhiên, việc xây dựng, kiểm định, và đánh giá các mô hình này vẫn còn tương đối mới đối với nhiều người trong giới khoa học.

Ngoài ra, có nhiều nghiên cứu khai thác các dữ liệu từ các nghiên cứu cắt ngang và nghiên cứu đoàn hệ để tiến tới một suy luận nhân quả (cause-effect inference). Các nghiên cứu này dựa vào phương pháp "bắt cặp" có tên là "Propensity Score Analysis" (PSA) do Rosenbaum và Rubin đề xướng vào thập niên 1980s. Phương pháp PSA càng ngày càng phổ biến trong các nghiên cứu ngoài y khoa vì ý tưởng đằng sau của nó rất hấp dẫn (thay thế cho mô hình nghiên cứu RCT). Tuy nhiên, việc ứng dụng vẫn còn nhiều vấn đề, và thỉnh thoảng dẫn đến nhiều suy luận sai trong khoa học.

Đối tượng học viên: Khoá học này thích hợp cho các bạn đang làm nghiên cứu sinh hay đang nghiên cứu và muốn có một 'cái gì mới' cho nghiên cứu của mình. Khoá học không chỉ dành cho các học viên trong ngành y, mà còn thích hợp cho các chuyên ngành ngoài ngành y nhưng có nhu cầu về tiên lượng và dự báo. Mỗi khoá học đem lại một vài ý tưởng và phương pháp mới giúp cho nghiên cứu của học viên (trong hay ngoài ngành) phong phú hơn và dễ công bố hơn.

2. Mục đích và kì vọng

Khóa học này được thiết kế nhằm trang bị những kiến thức và kĩ năng cơ bản liên quan đến việc xây dựng và kiểm định các mô hình tiên lượng và phương pháp phân tích PSA. Khóa học sẽ tập trung vào 3 nhóm phương pháp chính:

• Mô hình hồi qui tuyến tính; • Mô hình hồi qui logistic; • Phương pháp Propensity Score Analysis.

Chúng tôi kì vọng rằng sau khi hoàn tất khóa học, học viên sẽ:

• Hiểu được ý nghĩa và giả định đằng sau mô hình hồi qui tuyến tính và hồi qui logistic;

• Biết được 3 ứng dụng quan trọng của mỗi mô hình là định lượng mối liên quan, hiệu chỉnh cho các yếu tố nhiễu, và tiên lượng;

• Có khả năng xây dựng và kiểm tra mô hình tiên lượng dựa vào phương pháp hồi qui tuyến tính và logistic;

• Có thể dùng các package trong R để triển khai các bước xây dựng và kiểm định mô hình tiên lượng;

• Biết cách dùng phương pháp Bayes để tìm các biến tiên lượng (feature selection) và hiểu tại sao phương pháp phổ biến như stepwise là sai;

• Biết cách đánh giá tầm quan trọng của các biến tiên lượng;

• Hiểu ý nghĩa và triển khai một phân tích PSA cho các nghiên cứu quan sát.

3. Chương trình

Bài giảng 1: Giới thiệu R. Ngày nay, học về phương pháp phân tích đòi hỏi phải biết R. (Hãy

quên đi mấy software thương mại vì mắc tiền quá). Học viên sẽ học về các hàm/lệnh căn bản trong R để đọc dữ liệu, biên tập dữ liệu, và làm các phân tích đơn giản. Quan trọng nhất là R hoàn toàn miễn phía.

Bài giảng 2: RStudio và R Markdown. Trong phần này học viên sẽ làm quen với RStudio và RMarkdown, hai phần rất quan trọng trong các công cụ phân tích dữ liệu. RStudio là một 'add on' nhằm giúp người sử dụng R quản lí file tốt hơn. RMarkdown là một sáng kiến tuyệt vời nhằm giúp cho việc lưu trữ các mã phân tích và chia xẻ files với nhau. Với RMardown, người dùng có thể tạo ra một trang web cá nhân trên Rpubs.com và 'báo cáo' kết quả phân tích ngay trên đó.

Bài giảng 3: Giới thiệu "ggplot2" cho biểu đồ chất lượng cao. Ngày nay, bài báo khoa học với biểu đồ phẩm chất cao là vô cùng quan trọng, vì nó thể hiện tính chuyên nghiệp và tinh tế của nhà khoa học. Nhu liệu 'ggplot2' (do H Wickham viết) là một chương trình tuyệt vời để cho nhà khoa học soạn các biểu đồ giàu thông tin và có tính thẩm mĩ cao. Học về ggplot2 không dễ, nhưng chúng tôi đã tìm ra một cách giới thiệu mà học viên có thể học rất nhanh.

Bài giảng 4: Hiển thị dữ liệu với ggplot2. Phần này học viên sẽ học cách dùng ggplot2 để biểu hiện những dữ liệu phức tạp như biểu đồ phân bố (histogram), biểu đồ thanh (barplot), biểu đồ hộp (boxplot), biểu đồ tương quan (scatterplot), và các tham số mô hình kèm theo biểu đồ.

Bài giảng 5: Thiết kế nghiên cứu cho mô hình tiên lượng. Trong bài này chúng tôi sẽ bàn về thiết kế nghiên cứu (mô hình thiết kế, cỡ mẫu, outcome, predictors, v.v.) để phục vụ cho việc xây dựng và kiểm định mô hình tiên lượng. Chúng tôi sẽ dùng nghiên cứu mới nhất ở Bệnh viện Đa khoa Trung ương Cần Thơ làm ví dụ minh họa cho quá trình thiết kế và triển khai mô hình tiên lượng.

Bài giảng 6: Mô hình hồi qui tuyến tính. Bài giảng sẽ bắt đầu bằng phân tích tương quan, và sau đó là giới thiệu về mô hình hồi qui tuyến tính. Các khía cạnh của mô hình như giả định, ước tính tham số, và cách triển khai mô hình bằng R. Bài này sẽ nhấn mạnh đến diễn gỉải kết quả của mô hình hồi qui tuyến tính.

Bài giảng 7: Ứng dụng mô hình hồi qui tuyến tính 1 - định lượng mối liên quan. Bài này sẽ bàn về việc ứng dụng mô hình hồi qui tuyến tính định lượng các mối liên quan giữa biến độc lập (X) và biến phụ thuộc (Y). Học viên sẽ thấy mối liên quan giữa t-test và mô hình hồi qui tuyến tính; sẽ học về cách xử lí các tình huống khi biến Y không tuân theo luật phân bố chuẩn; sẽ học cách phân tích khi có outliers (giá trị ngoại vi); sẽ học về các mô hình đa thức (polynomial model); và cách đánh giá tầm quan trọng của mỗi biến số trong việc định lượng hoá các mối liên quan và ảnh hưởng của các yếu tố.

Bài giảng 8: Ứng dụng mô hình hồi qui tuyến tính 2 - hiệu chỉnh cho yếu tố nhiễu. Ứng dụng thứ 2 của mô hình hồi qui tuyến tính là hiệu chỉnh cho các yếu tố nhiễu. Trong bài này, học viên sẽ học về khái niệm 'confounding' và các xử lí hay hiệu chỉnh cho các yếu tố confounding trong các nghiên cứu quan sát. Ngoài ra, học viên cũng sẽ học về khái niệm tương tác (interaction) và cách diễn giải khi có sự tương tác giữa các yếu tố tiên lượng trong mô hình hồi qui tuyến tính.

Bài giảng 9: Ứng dụng mô hình hồi qui tuyến tính 3 - tiên lượng. Mô hình hồi qui tuyến tính thường được ứng dụng cho việc tiên lượng (dự báo) cho tương lai. Trong bài này học viên sẽ học một số kĩ năng như sau: (i) cách tìm các biến độc lập có giá trị tiên lượng; (ii) cách chia dữ liệu thành 2 nhóm dành cho xây dựng và kiểm định mô hình tiên lượng; (iii) cách xây dựng mô hình; và (iv) cách kiểm định và đánh giá mô hình tiên lượng. Học viên cũng sẽ học cách triển khai mô hình tiên lượng bằng nomogram hay một trang web trực tuyến.

Bài giảng 10: Mô hình hồi qui logistic. Bài này sẽ giới thiệu khái niệm odds, logit, và phát biểu của mô hình hồi qui logistic. Học viên sẽ học phân biệt ứng dụng của mô hình hồi qui tuyến tính và mô hình hồi qui logistic, cách triển khai và ước tính tham số của mô hình bằng hàm 'glm' và 'lrm' trong R. Bài này sẽ nhấn mạnh đến cách diễn giải và ý nghĩa của kết quả hơn là kĩ thuật.

Bài giảng 11: Ứng dụng mô hình hồi qui logistic 1 - định lượng mối liên quan. Bài này chủ yếu tập trung vào mô hình hồi qui logistic đa biến, phương pháp tìm "mô hình tối ưu", và phương pháp đánh giá tầm quan trọng của các biến tiên lượng.

Bài giảng 12: Ứng dụng mô hình hồi qui logistic 2 - hiệu chỉnh cho yếu tố nhiễu. Bài này sẽ tập trung đến việc xử lí các yếu tố nhiễu (confounding factors) để có kết luận chính xác hơn. Học viên cũng sẽ học về phân tích ảnh hưởng tương tác trong mô hình hồi qui logistic.

Bài giảng 13: Đánh giá mô hình hồi qui logistic. Bài này sẽ bàn qua ý nghĩa của 3 chỉ số chính: discrimination, calibration, và reclassification. Học viên sẽ học cách dùng các hàm quan trọng trong R để ước tính và hiển thị 3 chỉ số quan trọng đó cho một mô hình hồi qui logistic.

Bài giảng 14: Ứng dụng mô hình hồi qui logistic 3 - tiên lượng. Mô hình hồi qui logistic thường được ứng dụng để xây dựng các mô hình tiên lượng bệnh và các biến nhị phân, và trong bài này, học viên sẽ học những bước cần thiết trong việc xây dựng và kiểm định mô hình tiên lượng.

Bài giảng 15: Suy luận nguyên nhân-hệ quả trong nghiên cứu quan sát. Đây là một bài giảng mang tính 'clinical epidemiology' hơn là phân tích. Bài giảng này sẽ điểm qua triết lí của mối liên hệ nhân quả, và cách mà nghiên cứu khoa học giải quyết câu hỏi nhân quả. Chúng tôi sẽ bàn về 9 tiêu chuẩn do B. Hill đề xướng trước đây, kèm theo những thảo luận về điểm mạnh và điểm yếu của bộ tiêu chuẩn.

Bài giảng 16: Phương pháp propensity score analysis (PSA). Bài này sẽ nói về phương pháp PSA cho các nghiên cứu quan sát. Đây là một phương pháp rất có ích và có nhiều ứng dụng trong thực tế, và sẽ được minh hoạ bằng những dữ liệu thực tế.

Cũng như các lớp khác, lớp này cũng có phần thực hành vào buổi chiều. Sáng 8:30 - 12' chiều 2 - 5 pm (dự kiến). Nhưng thay vì để cho học viên làm, kì này chúng tôi thử nghiệm mô hình học viên và trợ giảng cùng làm. Dữ liệu thực tế sẽ được cung cấp cho mỗi học viên.

Học phí: 2 triệu đồng. Bệnh viện Chợ Rẫy và Đại học Y Dược TPHCM cấp giấy chứng nhận CME. Chuyển khoản: số tài khoản 0071000077458 Vietcombank Chi Nhánh Quận 5, TPHCM.

Liên lạc ghi danh: Văn phòng trung tâm đào tạo: Lầu 11, Tòa nhà D, Trung tâm Ung Bướu. ĐT 08 38 55 41 37, số nội bộ 2406. Email vpttdtbvcr@gmail.com.

Xin cám ơn các bạn.