Mục lục trang:
Cách lựa chọn FEM REM OLS trong hồi quy dữ liệu bảng PANEL, c ách lựa chọn mô hình định lượng nào phù hợp nhất. Mô hình hồi quy dữ liệu bảng là một mô hình định lượng căn bảng, được dùng rộng rãi trong ngành kinh tế – tài chính.
Cách lựa chọn FEM REM OLS là phù hợp nhất
Hồi quy dữ liệu bảng là gì ?
Kinh tế lượng dữ liệu bảng là một lĩnh vực liên tục phát triển. Sự sẵn có ngày càng tăng của dữ liệu được quan sát trên các mặt cắt của các đơn vị (như hộ gia đình, doanh nghiệp, quốc gia, v.v.) và theo thời gian đã làm phát sinh một số phương pháp ước tính khai thác tính hai chiều này để đối phó với một số vấn đề điển hình liên quan đến dữ liệu kinh tế , trước hết là tính không đồng nhất chưa được quan sát.
Việc quan sát theo chiều thời gian dữ liệu từ các đơn vị quan sát khác nhau từ lâu đã trở nên phổ biến trong các lĩnh vực thống kê khác (nơi chúng thường được gọi là dữ liệu theo chiều dọc ). Trong lĩnh vực dữ liệu bảng cũng như trong các lĩnh vực khác, tuy nhiên, cách tiếp cận kinh tế lượng là đặc biệt đối với bối cảnh thực nghiệm, vì nó nhấn mạnh vào đặc tả mô hình và thử nghiệm và giải quyết một số vấn đề phát sinh từ các vấn đề thống kê cụ thể liên quan đến dữ liệu kinh tế.
Ưu điểm của hồi quy panel data
Hồi quy sử dụng dữ liệu bảng có thể giảm thiểu sai lệch biến bị bỏ qua khi không có thông tin về các biến tương quan với cả hai biến hồi quy quan tâm và sống độc lập biến và nếu các biến này không đổi trong thứ nguyên thời gian hoặc trên các thực thể. Miễn là có sẵn dữ liệu bảng điều khiển các phương pháp hồi quy bảng có thể cải thiện dựa trên nhiều mô hình hồi quy, tạo ra các kết quả không hợp lệ nội bộ trong một cài đặt như vậy.
Chương này bao gồm các chủ đề sau:
- ký hiệu cho dữ liệu bảng điều khiển
- hồi quy hiệu ứng cố định sử dụng thời gian và / hoặc tác động cố định thực thể
- tính toán các sai số tiêu chuẩn trong các mô hình hồi quy hiệu ứng cố định
Các loại hồi quy
Trong thống kê và kinh tế lượng , dữ liệu bảng và dữ liệu dọc đều là dữ liệu đa chiều liên quan đến các phép đo theo thời gian. Dữ liệu bảng là một tập hợp con của dữ liệu theo chiều dọc, nơi các quan sát dành cho cùng một đối tượng mỗi lần.
Dữ liệu chuỗi thời gian và dữ liệu mặt cắt có thể được coi là các trường hợp đặc biệt của dữ liệu bảng chỉ ở một thứ nguyên (một thành viên hoặc cá nhân của ban hội thẩm cho cái trước, một mốc thời gian cho cái sau).
Một nghiên cứu sử dụng dữ liệu bảng được gọi là nghiên cứu dọc hoặc nghiên cứu bảng.
Ước lượng bình phương nhỏ nhất OLS
Trong thống kê , bình phương nhỏ nhất thông thường ( OLS – ordinary least squares ) là một loại phương pháp bình phương nhỏ nhất tuyến tính để ước tính các tham số chưa biết trong mô hình hồi quy tuyến tính . OLS chọn các tham số của một hàm tuyến tính của một tập hợp các biến giải thích theo nguyên tắc bình phương nhỏ nhất : tối thiểu hóa tổng bình phương của sự khác biệt giữa biến phụ thuộc quan sát (các giá trị của biến được quan sát) trong tập dữ liệu đã cho và những giá trị được dự đoán bởi hàm tuyến tính của biến độc lập .
Về mặt hình học, đây được coi là tổng các khoảng cách bình phương, song song với trục của biến phụ thuộc, giữa mỗi điểm dữ liệu trong tập hợp và điểm tương ứng trên bề mặt hồi quy — chênh lệch càng nhỏ, mô hình càng phù hợp với dữ liệu . Kết quả ước lượng có thể được thể hiện bằng một công thức đơn giản, đặc biệt là trong trường hợp hồi quy tuyến tính đơn giản , trong đó có một công cụ hồi quy duy nhất ở phía bên phải của phương trình hồi quy.
Công cụ ước lượng OLS nhất quán khi các biến hồi quy là ngoại sinh , và – theo định lý Gauss – Markov – tối ưu trong loại ước lượng không chệch tuyến tính khi các lỗi là đồng biến và không tương quan theo chuỗi . Trong các điều kiện này, phương pháp OLS cung cấp ước lượng phương sai trung bình tối thiểu-không chệch khi các sai số có phương sai hữu hạn . Theo giả định bổ sung rằng các lỗi được phân phối bình thường , OLS là công cụ ước tính khả năng xảy ra tối đa .
Ước lượng hiệu ứng cố định FEM
Trong thống kê , mô hình tác động cố định (fixed effects model) là mô hình thống kê trong đó các tham số của mô hình là các đại lượng cố định hoặc không ngẫu nhiên. Điều này trái ngược với các mô hình tác động ngẫu nhiên và mô hình hỗn hợp trong đó tất cả hoặc một số tham số của mô hình là các biến ngẫu nhiên. Trong nhiều ứng dụng bao gồm kinh tế lượng và thống kê sinh học , một mô hình hiệu ứng cố định đề cập đến một mô hình hồi quy trong đó nhóm phương tiện là cố định (không ngẫu nhiên) trái ngược với mô hình tác động ngẫu nhiên trong đó nhóm có nghĩa là một mẫu ngẫu nhiên từ một quần thể. Nói chung, dữ liệu có thể được nhóm theo một số yếu tố quan sát được. Các phương tiện nhóm có thể được mô hình hóa thành các hiệu ứng cố định hoặc ngẫu nhiên cho mỗi nhóm. Trong một mô hình tác động cố định, mỗi trung bình của nhóm là một đại lượng cố định dành riêng cho nhóm.
Trong dữ liệu bảng nơi tồn tại các quan sát dọc cho cùng một đối tượng, các hiệu ứng cố định thể hiện các phương tiện cụ thể cho đối tượng. Trong phân tích dữ liệu bảng , thuật ngữ ước tính tác động cố định (còn được gọi là công cụ ước lượng bên trong ) được sử dụng để chỉ một công cụ ước tính cho các hệ số trong mô hình hồi quy bao gồm cả những ảnh hưởng cố định đó (một thời gian bất biến cho mỗi đối tượng).
Ước lượng hiệu ứng ngẫu nhiên REM
Trong thống kê , mô hình tác động ngẫu nhiên (random effects model) , còn được gọi là mô hình thành phần phương sai , là một mô hình thống kê trong đó các tham số của mô hình là các biến ngẫu nhiên . Đây là một loại mô hình tuyến tính phân cấp , giả định rằng dữ liệu đang được phân tích được rút ra từ một hệ thống phân cấp của các quần thể khác nhau có sự khác biệt liên quan đến hệ thống phân cấp đó. Mô hình hiệu ứng ngẫu nhiên là một trường hợp đặc biệt của mô hình hỗn hợp .
Đối lập điều này với các định nghĩa thống kê sinh học, vì các nhà thống kê sinh học sử dụng các hiệu ứng “cố định” và “ngẫu nhiên” để lần lượt đề cập đến các hiệu ứng trung bình dân số và đối tượng cụ thể (và trong đó sau này thường được giả định là các biến tiềm ẩn , không xác định ).
Cách lựa chọn mô hình tốt
Lựa chọn FEM với OLS
Để lựa chọn mô hình nào phù hợp nhất, hay nói cách khác là có hiệu ứng cố định xuất hiện hay không, chúng ta dùng kiểm định Fu-i , xem có tồn tại phần hiệu ứng này không?
Ta đặt giả định như sau:
- H0: Mô hình không có hiệu ứng cố định
- H1: Mô hình có hiệu ứng cố định
Khi P-value < 0.05 ta bác bỏ H0, chấp nhận H1, tức là có hiệu ứng cố định trong mô hình, hay nói cách khác là mô hình FEM phù hợp hơn OLS
Lựa chọn FEM REM
Còn để lựa chọn mô hình FEM hay REM là phù hợp, hay nói cách khác là trong mô hình thì tồn tại hiệu ứng cố định nhiều hơn, hay là hiệu ứng ngẫu nhiên nhiều hơn, chúng ta dùng kiểm định Hausman
Ta đặt giả định như sau:
- H0: Mô hình có hiệu ứng ngẫu nhiên tốt hơn hiệu ứng cố định
- H1: Mô hình có hiệu ứng cố định tốt hơn hiệu ứng ngẫu nhiên
Cũng giống như trên khi P-value < 0.05 ta được mô hình FEM là tốt hơn.
Lựa chọn REM với OLS
Còn để lựa chọn giữ mô hình REM với OLS thì chúng ta dùng kiểm định Breusch-Pagan, với giả thuyết như sau:
Ta đặt giả định như sau:
- H0: Mô hình không có hiệu ứng ngẫu nhiên
- H1: Mô hình có hiệu ứng cố định
Khi P-value < 0.05 thì mô hình có hiệu ứng ngẫu nhiên, hay nói cách khác là mô hình FEM tốt hơn mô hình OLS.
Video hướng dẫn chi tiết lựa chọn FEM REM OLS:
Dưới đây là video hướng dẫn hồi quy dữ liệu bảng, hồi quy panel data, hồi quy fem rem đơn giản và cách lụa chọn mô hình định lượng phù hợp.