ỨNG DỤNG ĐƯỜNG CONG ROC VỚI CÁC PHẦN MỀM STATA, SPSS và R (PHẦN I)

07:06:00 06/02/2017

Qua theo dõi 25 bệnh nhân, có 13 bệnh nhân viêm phổi bệnh viện được xác định từ chụp chụp cắt lớp vi tính (CT scanner). Trong những bệnh nhân viêm phổi thấy có xu hướng bạch cầu (BC) tăng cao hơn bệnh nhân không viêm phổi. Xác định viêm phổi bệnh viện bằng CT là phương pháp tốt nhưng đắt tiền, do đó câu hỏi là dùng BC để tiên lượng chẩn đoán có “tốt” không?. Có thể thể ứng dụng đường cong ROC (Receiver Operating Characteristic) để trả lời câu hỏi này.

BC ≥10.000/mm3

CT scanner

Có viêm phối

Không viêm phối

10 (a)

3 (b)

Không

3 (c)

9 (d)

Tổng

13 (n1)

12 (n2)

Từ bảng trên có 4 tình huống xảy ra:

1. Độ nhạy: Bệnh nhân mắc bệnh và có kết quả xét nghiệm dương tính. Trường hợp này có 13 bệnh nhân viêm phổi bệnh viện xác định bằng chụp CT phổi (tiêu chuẩn vàng) có 10 bệnh nhân có BC ≥ 10.000/mm3. Do đó độ nhạy được tính bằng:

 

2. Độ đặc hiệu: Bệnh nhân không mắc bệnh và có kết quả xét nghiệm âm tính. Trường hợp này có 12 bệnh nhân không viêm phổi, trong số này có 9 bệnh nhân có BC <10.000/mm3. Do đó độ đặc hiệu tính bằng:

3. Dương tính giả: Bệnh nhân không có bệnh nhưng kết quả xét nghiệm dương tính. Trường hợp này có 12 bệnh nhân không có bệnh nhưng có 3 bệnh nhân xét nghiệm BC ≥ 10.000/mm3. Do đó

4. Âm tính giả: Là bệnh nhân có bệnh nhưng kết quả xét nghiệm âm tính. Trường hợp này có 13 bệnh nhân viêm phổi nhưng xét nghiệm có 3 bệnh nhân có BC < 10.000/mm3.

            Một xét nghiệm tin cậy khi có độ nhạy cao và độ đặc hiệu cao, vì khi đó hạn chế đến mức tối thiểu các trường hợp dương tính giả và âm tính giả. Nhưng thực tế độ nhạy và độ đặc hiệu biến thiên ngược nhau như hình dưới đây (nếu độ nhạy 100% thì độ đặc hiệu 0% và ngược lại độ đặc hiệu 100% thì độ nhạy 0%. Do đó để dung hòa giữa độ nhạy và độ đặc hiệu, một phương pháp mới được ứng dụng đó là diện tích dưới đường cong ROC.

          Một xét nghiệm có độ nhạy cao rất hữu hiệu khi ứng dụng chẩn đoán cho các bệnh nghiêm trọng.

  1. Phần mềm STATA.

Bước 1: Đưa 02 biến trên vào mô hình phân tích hồi quy logistic để phân tích bằng cách: Statistics/Binary outcomes/Logistic regression

Xuất hiện hộp thoại dưới đây

Tại Dependent variable (biến đốc lập) đưa vào biến vpbv, tại Independent variable (biến phụ thuộc/tiên lượng) đưa vào biên bc sau đó OK

Xuất hiện kết quả phương trình hồi quy logistic

      Có sự khác biệt về BC 02 nhóm có ý nghĩa thống kê (p=0,0014)

 

Bước 2: Tính độ nhạy và độ đặc hiệu.

          Statistics/Binary outcomes/Postestimation/Classfication statistics atter ligistic/logit/probit/ivprobit.

Xuất hiện hộp thoại hình dưới đây

          Có thể thay đổi nhưng thông thường chọn xác suất chẩn đoán theo mặc định (50/50), bấm OK.

 

Bước 3: Vẽ đường cong ROC

          Thao tác như bước 02 nhưng chọn ROC curve after logistic/logit/probit/ivprobit.

Xuất hiện hộp thoại

 

               Bấm OK.

 

Và kết quả

          Biểu đồ này còn cung cấp diện tích dưới đường cong (AUC=0,8462)

Bước 4: Chọn ngưỡng chẩn đoán (điểm cắt):

          Statistics/Epidemiology and lelated/ROC analysis/Nonparametric ROC analysis Without covariates.

 

 Xuất hiện hộp thoại và chọn các vị trí như hình dưới đây và có kết quả.

 

Kết quả ngưỡng chẩn đoán theo từng đối tượng.

              Kết quả này còn cung cấp thông tin KTC 95% AUC (0,69-0,99). Chọn ngưỡng nào thì còn tùy thuốc vào bệnh cảnh cụ thể đế ưu tiên cho độ nhạy cao hay độ đặc hiệu cao. Nhưng thông thường chọn điểm cắt sau cho dung hòa giữa độ nhạy và độ đặc hiệu, trường hợp này nên chọn điểm cắt BC ≥ 9500/m3. Tại điểm này xét nghiệm có độ nhạy 84,6% và độ đặc hiệu 75%.

 

BS: Bùi Văn Dủ