Mục lục trang:
phân tích đa tầng hay còn gọi với nhiều tên khác như phân tích hỗn hợp, phân tích đa cấp, hồi quy hỗn hợp, hồi quy đa cấp … hay Muitilevel Analysis hoặc Multilevel Regress. Đây là một phân tích hỗn hợp kết hợp 2 phần FEM với REM vào trong mô hình. Chúng ta dễ dàng nhầm lẫn với hồi quy panel ( OLS + FEM + REM), với hồi quy panel chúng ta lựa chọn phương thức hồi quy phù hợp nhất, còn với hồi quy đa tầng thì chúng ta kết hợp giữa 2 ước lượng FEM với REM vào mô hình.
Phân tích Mutilevel Analysis
Mô hình đa cấp (hay còn gọi là mô hình tuyến tính thứ bậc , tuyến tính mô hình hỗn hợp hiệu quả , mô hình hỗn hợp , mô hình dữ liệu lồng nhau , hệ số ngẫu nhiên , ngẫu nhiên tác dụng mô hình , mô hình tham số ngẫu nhiên , hoặc chia lô thiết kế ) là mô hình thống kê của các thông số đó khác nhau tại hơn Hơn một cấp độ. Một ví dụ có thể là một mô hình về hiệu suất của học sinh có chứa các biện pháp cho từng học sinh cũng như các biện pháp cho các lớp học trong đó các học sinh được nhóm lại. Những mô hình này có thể được xem như là sự khái quát của các mô hình tuyến tính(đặc biệt là hồi quy tuyến tính ), mặc dù chúng cũng có thể mở rộng sang các mô hình phi tuyến tính. Những mô hình này trở nên phổ biến hơn nhiều sau khi có đủ sức mạnh tính toán và phần mềm.
Các mô hình đa cấp đặc biệt thích hợp cho các thiết kế nghiên cứu trong đó dữ liệu cho người tham gia được tổ chức ở nhiều cấp độ (nghĩa là dữ liệu lồng nhau ). Các đơn vị phân tích thường là các cá nhân (ở cấp độ thấp hơn) được lồng trong các đơn vị ngữ cảnh / tổng hợp (ở cấp độ cao hơn). Mặc dù mức dữ liệu thấp nhất trong các mô hình đa cấp thường là một cá nhân, các phép đo lặp lại của các cá nhân cũng có thể được kiểm tra. Như vậy, các mô hình đa cấp cung cấp một loại phân tích thay thế cho phân tích đơn biến hoặc đa biến của các biện pháp lặp lại . Sự khác biệt cá nhân trong các đường cong tăng trưởng có thể được kiểm tra. [2]Hơn nữa, các mô hình đa cấp có thể được sử dụng thay thế cho ANCOVA , trong đó điểm số trên biến phụ thuộc được điều chỉnh cho hiệp phương sai (ví dụ: sự khác biệt cá nhân) trước khi kiểm tra sự khác biệt trong điều trị. Các mô hình đa cấp có thể phân tích các thí nghiệm này mà không cần các giả định về độ dốc hồi quy đồng nhất được yêu cầu bởi ANCOVA.
Các mô hình đa cấp có thể được sử dụng trên dữ liệu với nhiều cấp độ, mặc dù các mô hình 2 cấp là phổ biến nhất và phần còn lại của bài viết này chỉ đề cập đến các mức này. Biến phụ thuộc phải được kiểm tra ở mức phân tích thấp nhất.
Các loại mô hình đa tầng
Trước khi tiến hành phân tích mô hình đa cấp, một nhà nghiên cứu phải quyết định một số khía cạnh, bao gồm cả những yếu tố dự đoán nào sẽ được đưa vào phân tích, nếu có. Thứ hai, nhà nghiên cứu phải quyết định xem các giá trị tham số (nghĩa là các yếu tố sẽ được ước tính) sẽ được cố định hay ngẫu nhiên. Các tham số cố định được tạo thành từ một hằng số trên tất cả các nhóm, trong khi một tham số ngẫu nhiên có một giá trị khác nhau cho mỗi nhóm. Ngoài ra, nhà nghiên cứu phải quyết định nên sử dụng ước tính khả năng tối đa hoặc loại ước tính khả năng tối đa bị hạn chế.
Mô hình đa tầng chặn ngẫu nhiên ( Random Intercept)
Một mô hình chặn ngẫu nhiên là một mô hình trong đó các can thiệp được phép thay đổi, và do đó, điểm số trên biến phụ thuộc cho từng quan sát riêng lẻ được dự đoán bởi các giao thoa khác nhau giữa các nhóm. Mô hình này giả định rằng độ dốc được cố định (giống nhau trên các bối cảnh khác nhau). Ngoài ra, mô hình này cung cấp thông tin về tương quan nội hàm , rất hữu ích trong việc xác định liệu các mô hình đa cấp có được yêu cầu ngay từ đầu không.
Mô hình đa cấp độ dốc ngẫu nhiên ( Random Slope)
Một mô hình độ dốc ngẫu nhiên là một mô hình trong đó độ dốc được phép thay đổi, và do đó, các độ dốc khác nhau giữa các nhóm. Mô hình này giả định rằng các lệnh chặn được cố định (giống nhau trên các bối cảnh khác nhau).
Mô hình hỗn hợp chặn ngẫu nhiên và độ dốc ( Random Intercept and Slope)
Một mô hình bao gồm cả chặn ngẫu nhiên và độ dốc ngẫu nhiên có thể là loại mô hình thực tế nhất, mặc dù nó cũng phức tạp nhất. Trong mô hình này, cả phần chặn và độ dốc đều được phép thay đổi giữa các nhóm, nghĩa là chúng khác nhau trong các bối cảnh khác nhau.
Mô hình phân tích đa tầng cấp 1
Y = a + b.X + e
- Y: Biến phụ thuộc
- X: Biến độc lập
- a: Hằng số chặn
- b: Hệ số
- e: sai số ngẫu nhiên
Ở Cấp độ 1, cả hai phần chặn và độ dốc trong các nhóm đều có thể được cố định (có nghĩa là tất cả các nhóm có cùng giá trị, mặc dù trong thế giới thực, điều này sẽ hiếm khi xảy ra), không thay đổi ngẫu nhiên (có nghĩa là các phần chặn và / hoặc độ dốc có thể dự đoán được từ một biến độc lập ở Cấp độ 2) hoặc thay đổi ngẫu nhiên (có nghĩa là các điểm chặn và / hoặc độ dốc khác nhau trong các nhóm khác nhau và mỗi nhóm có ý nghĩa và phương sai tổng thể riêng).
Khi có nhiều biến độc lập cấp 1, mô hình có thể được mở rộng bằng cách thay thế các vectơ và ma trận trong phương trình.
Mô hình phân tích đa tầng cấp 2
Y = i + t.X + u1 + u2 + e
- Y: Biến phụ thuộc
- X: Biến độc lập
- i: Hằng số chặn
- t: Hệ số hồi quy
- u1: Sai số ngẫu nhiên của hệ số
- u: Sai số ngẫu nhiên của hằng số
- e: sai số của mô hình
Phân tích đa tầng Multilevel Analysis trên R
Ước lượng mô hình đa cấp Varying-intercept model
Đây là phương pháp để ước lượng IC (interclass correlation), nhằm mục đích ta xem xét mô hình nào phù hợp.
- Nếu IC -> 0, thì ta chọn mô hình hồi quy đơn giản, ví dụ như hồi quy ol hay hồi quy panel
- Nếu IC – > 1 Tức là phương sai của các cá thể điều bằng nhau.
Trên thực tế thì IC lúc nào cũng thuộc trong khoảng (0,1), không thể nào tiến về cực được.
Ước lượng phân tích đa tầng Random Intercept
Ta cũng được IC_ri thuộc ( 0,1)
Ước lượng phân tích đa tầng Random Intercept và Slope
Ta cũng được IC_rc thuộc (0,1)
Chúng ta có 2 mô hình điều có thể thể sử dụng được, vì vậy chúng ta kiểm định LR test để lựa chọn mô hình phù hợp với nhất
LR test
- H0: Hai mô hình RI và RC là giống nhau
- H1: Mô hình RC khác mô hình RI
LR = 2 *( -14024.8 + 14004.6 ) = 40.4
dchisq(40.4, 6) = 0.00
Ta có Pvalue < 0.05, Nên ta bác bỏ H0 chấp nhận H1, tức là mô hình Random Intercept and Slope là tố ưu hơn.
Ước lượng giá trị u1 và u2
Đây là 2 giá trị chúng ta cần tìm, để chúng ta hiệu chỉnh mô hình nghiên cứu theo phương pháp phân tích đa tầng
Kết luận,
Với phân tích đa tầng, vừa mới nhìn qua thì chúng ta thấy không cần thiết, ta ta có thể lước lượng cho từng nhóm . Tuy là vẫn ra kết quả nhưng lại thiếu đi yếu tố quan trọng là ngẫu nhiên (RE), chúng ta mới có được yếu tố cố định (FE) mà thôi. Vì vậy khi ước lượng da tầng chúng ta bổ sung thêm yếu tố ngẫu nhiên vào mô hình.
Nó vẫn hoàn toàn khác biệt với mô hình REM, REM nó tính chung cho tất cả nhóm, mỗi nhóm đều hiệu ứng ngẫu nhiên như nhau; Còn trong mô hình Multilevel Analysis sẽ có hiệu ứng ngẫu nhiên khác nhau./.