Một chút lịch sử 'randomization'

Oct 31, 2019
6 min read

Hôm nọ đọc trên Nature thấy tin tức về 3 khôi nguyên Nobel kinh tế (Abhijit Banerjee, Esther Duflo và Michael Kremer) và phương pháp "randomistas" [mà họ được trao giải] làm tôi tò mò tìm hiểu. Hoá ra, họ áp dụng khái niệm 'randomization' (ngẫu nhiên hoá) trong khoa học thống kê. Nhưng người có công lớn nhứt về khái niệm này phải nói là Ronald Fisher và Bradford Hill. Nhân dịp này, xin kể các bạn nghe về lịch sử của ngẫu nhiên hoá ...

Ba nhà kinh tế được giải Nobel năm nay: Abhijit Banerjee, Esther Duflo và Michael Kremer. Họ được ghi nhận là những người đi tiên phong trong trào lưu "randomistas".

Theo Nature, Kremer, Banerjee và Duflo ứng dụng các phương pháp trong thử nghiệm lâm sàng y khoa vào các nghiên cứu can thiệp qui mô xã hội nhằm giảm nghèo và cải thiện trình độ học vấn (1). Chẳng hạn như họ thực hiện một nghiên cứu trên 10,000 hộ ở 6 nước có thu nhập thấp hay trung bình, và kết luận rằng cung cấp cho những người nghèo một 'gói hỗ trợ' (bao gồm tiền mặt, thực phẩm, dịch vụ y tế, huấn luyện nghề và tư vấn) trong 2 năm có hiệu quả cải thiện cuộc sống sau đó.

Ngẫu nhiên hoá trong y khoa: mô hình RCT

Phương pháp thử nghiệm mà họ gọi là 'randomistas' đó thật ra bên y khoa gọi là 'randomized controlled trial' (hay RCT). Theo phương pháp RCT, để đánh giá hiệu quả và an toàn của một thuốc điều trị [chẳng hạn như] ung thư, bệnh nhân được chia thành 2 nhóm một cách hoàn toàn ngẫu nhiên: một nhóm được cho dùng thuốc và một nhóm chỉ chi uống nước đường (chỉ là ví dụ). Sau đó, theo dõi một thời gian [có thể là 3 năm], ghi nhận số ca tử vong của mỗi nhóm, và dùng phương pháp thống kê so sánh xác suất tử vong giữa 2 nhóm. Bởi vì bệnh nhân được phân nhóm ngẫu nhiên, nên tất cả các yếu tố ảnh hưởng đến tử vong đều tương đương nhau giữa 2 nhóm, và sự khác biệt về nguy cơ tử vong [nếu có] chỉ có thể là do thuốc điều trị. Phương pháp RCT được xem là chuẩn vàng để giúp nhà nghiên cứu suy luận nhân quả.

Mô hình RCT như cách tôi mô tả rất đơn giản, nhưng trong thực tế thì rất khó thực hiện và đắt tiền. Trong nghiên cứu y khoa ngày nay, một công trình RCT phải tuyển chừng 10,000 bệnh nhân từ hàng chục nước trên thế giới. Mỗi bệnh nhân phải được theo dõi và cho thuốc thử nghiệm, rất đắt tiền. Tính trung bình, chuyên ngành loãng xương, để làm một RCT trong 3 năm, nhà nghiên cứu phải mất chừng 15,000 USD cho mỗi bệnh nhân! Nếu nghiên cứu trên 10,000 bệnh nhân thì chi phí sẽ là 150 triệu USD! Không có nhà nước nào tài trợ cho nghiên cứu như thế, chỉ có ... công ti dược mà thôi. Do đó, ý tưởng thì đơn giản, nhưng thực hiện thì vô cùng khó khăn.

Ronald Fisher và khái niệm ngẫu nhiên hoá

Người đề xướng khái niệm ngẫu nhiên hoá là nhà thống kê học thiên tài Ronald A. Fisher, và một nhà thống kê tài ba và trẻ hơn Fisher tên là A. Bradford Hill. Vào năm 1919, sau một thời gian 7 năm lang thang, Fisher được nhận vào làm việc cho trung tâm thí nghiệm Rothamsted, và trong vòng 15 năm sau đó, ông làm nên một cuộc cách mạng trong thống kê học và cho ra đời bộ môn khoa học thống kê (statistical science) như chúng ta biết ngày nay. Năm 1925, ông viết cuốn sách "Statistical Methods for Research Workers" và khái niệm "thiết kế thí nghiệm" ra đời. Khái niệm đó sau này được hoàn chỉnh trong cuốn "The Design of Experiments" vào năm 1935.

Ronald Fisher, một thiên tài thống kê học, được xem là 'cha đẻ' của khoa học thống kê hiện đại. Những công trình nghiên cứu của ông có số trích dẫn cao nhứt trong lịch sử khoa học.

Lúc đó, Rothamsted chủ yếu làm thí nghiệm liên quan đến nông nghiệp. Fisher đề nghị phân chia các giống cây vào các mẩu đất bằng phương pháp ngẫu nhiên hoá, và dùng phương pháp ông gọi là "test of significance" (Kiểm định Thống kê) để so sánh năng suất của các giống cây. Ông lí giải rằng chỉ có ngẫu nhiên hoá thì dữ liệu mới thích hợp cho phương pháp kiểm định thống kê và trị số P mới có ý nghĩa. Phương pháp ngẫu nhiên hoá và kiểm định thống kê sau này được áp dụng trong nghiên cứu y khoa.

Bradford Hill và RCT

Người đầu tiên áp dụng phương pháp ngẫu nhiên hoá trong y khoa là Bradford Hill, trẻ hơn Fisher 7 tuổi. Nhưng Hill không bao giờ trích dẫn khái niệm ngẫu nhiên hoá của Fisher, dù hai người chẳng có thù oán gì với nhau (Fisher có rất nhiều "kẻ thù"). Bradford Hill lúc đó là một phi công trong quân đội Anh, và ông chẳng may mắc bệnh lao phổi. Ông do đó không theo đuổi sự nghiệp y khoa như thân phụ, nhưng chọn học về kinh tế. Tuy học về kinh tế, nhưng ông rất đam mê ngành y tế và nghiên cứu y khoa. Sau khi tốt nghiệp (1930s) ông được nhận vào làm việc cho một trung tâm nghiên cứu y học ở Anh.

Vào thập niên 1930s, ông đề ra ý tưởng chia bệnh nhân thành 2 nhóm một cách ngẫu nhiên (như chúng ta làm ngày nay) để đánh giá hiệu quả của can thiệp. Nhưng ý tưởng đó bị giới y khoa cười mỉa mai vì họ cho rằng chỉ có người điên rồ mới làm như Hill đề xương, do bác sĩ điều trị bệnh nhân theo các yếu tố liên quan đến cá nhân. Năm 1946, Hill và đồng nghiệp y khoa thuyết phục giới chức có thẩm quyền để thực hiện công trình RCT về điều trị lao phổi bằng streptomycin (2). Đó là công trình RCT đầu tiên trong lịch sử y khoa.

Bradford Hill (1897-1991), người đầu tiên đề xướng phương pháp ngẫu nhiên hoá trong nghiên cứu y khoa, dẫn đến mô hình mà chúng ta dùng ngày nay.

Sau này, phương pháp RCT trở nên chuẩn vàng để đánh giá chứng cứ y học lâm sàng. Hầu như bất cứ loại thuốc nào trước khi đưa ra dùng cho bệnh nhân đều phải qua nghiên cứu RCT. Có thể nói rằng phương pháp RCT đã không chỉ là một cách mạng khoa học, mà còn giúp cứu sống biết bao nhiêu triệu người trên thế giới. Do đó, khoảng 20 năm trước, có người đề cử ông nhận giải Nobel Y sinh học, nhưng ông đã qua đời năm 1991, và Hội đồng giải Nobel không có qui định trao giải thưởng cho người đã chết. (Chuyện này tôi chỉ nghe trong hội nghị, chứ chưa thấy bài báo nào trong y văn nói đến). Thế là ông "lỡ chuyến đò". Bradford Hill là người có nhiều đóng góp quan trọng cho y khoa, như tiêu chuẩn để suy luận nhân quả và nghiên cứu bệnh chứng (3).

Phương pháp hay mô hình RCT ngày nay không chỉ ứng dụng trong y khoa, mà còn cho rất nhiều lĩnh vực khác ngoài y khoa. Làm sao để biết sách giáo khoa mới là tốt hơn bộ sách cũ, làm thế nào để biết đánh giá mối liên quan giữa học đại học và trầm cảm, làm sao để biết gen A là nguyên nhân của bệnh X trong điều kiện thiếu thông tin sinh học, v.v. tất cả đều có thể trả lời bằng mô hình RCT. Bây giờ thì chúng ta cũng được biết rằng mô hình RCT đã đem đến 3 nhà kinh tế học giải Nobel. Có lẽ 3 nhà kinh tế này nhớ đến Ronald Fisher và nhất là nhà kinh tế Bradford Hill, hai người đã 'champion' phương pháp ngẫu nhiên hoá trong suy luận nhân quả chừng 100 năm trước.

Khái niệm và phương pháp thống kê đã giúp cho các nhà kinh tế được giải Nobel, nhưng những người đề ra hay đi đầu trong các phương pháp đó có khi không được giải. Trước đây, Daniel McFadden và James Heckman được trao giải Nobel năm 2000, nhờ các công trình về "selection bias", một khái niệm được sử dụng trong nghiên cứu y khoa rất lâu trước đó (điển hình là mô hình "case control"). Hai người đi tiên phong về case-control model là Richard Doll và Bradford Hill, và công trình của họ giúp cứu hàng triệu người, nhưng họ không được giải Nobel dù nghe nói đã từng được đề cử nhiều lần. Tương tự, phương pháp "Cox's regression" (Gs David R Cox đề xướng) cũng có ảnh hưởng vô cùng to lớn trong khoa học, nhưng ông cũng không được giải Nobel. Ở đời đúng là có khi thiếu công bằng.

===

(1) https://www.nature.com/articles/d41586-019-03125-y

(2) Medical Research Council Streptomycin in Tuberculosis Trials Committee. Streptomycin treatment for pulmonary tuberculosis. BMJ 1948;ii:769-82.

(3) Bradford Hill và Richard Doll là hai người đầu tiên trên thế giới chỉ ra mối liên quan giữa hút thuốc lá và ung thư phổi bằng một thí nghiệm mà ngày nay chúng ta gọi là "nghiên cứu bệnh chứng".