Mục lục trang:
Hồi quy lựa chọn mẫu keckman, cách lựa chọn mẫu để hồi quy, phương pháp hồi quy hiện đại cách hồi quy có điều kiện để làm đẹp data, cách xử lý dữ liệu an toàn và hiệu quả cao. Cách áp dụng hồi quy heckman vào thực tế, tại sao phải áp dụng mô hình lựa chọn mẫu …..
Thế nào là hồi quy lựa chọn mẫu heckman
Sai lệch lựa chọn mẫu trong hồi quy OLS phát sinh khi quá trình theo đó các quan sát được chọn vào mẫu phụ thuộc vào biến phụ thuộc theo cách tạo ra mối tương quan giữa thuật ngữ lỗi và biến hồi quy, đó là một trong những lý do gây ra tính nội sinh. Phần này là để thực hành mô hình tự chọn Heckman. Dữ liệu được sử dụng ở đây là Mroz87, là dữ liệu năm 1975 về phụ nữ đã kết hôn và sự tham gia của lực lượng lao động, từ một bài báo nổi tiếng của Thomas Mroz (1987).
Trong dữ liệu này, người ta tin rằng mọi người chỉ chọn làm việc để trả lương nếu mức lương dự kiến của họ vượt quá một số giá trị ngưỡng không đổi, nếu không, không đáng để họ làm việc và họ có thể không chọn làm việc. Sau đó, mẫu công nhân trong lực lượng lao động, người mà chúng tôi quan sát thu nhập, được chọn từ những người trong dân số được trả cao hơn ngưỡng đó. Trong số những người lao động có trình độ học vấn cao, hầu hết sẽ kiếm được trên ngưỡng và vì vậy họ được đại diện tốt trong mẫu. Tuy nhiên, trong số những người lao động ít học, họ thường được trả lương thấp hơn. Trong trường hợp này, giáo dục sẽ tương quan với thuật ngữ lỗi, điều này làm sai lệch hệ số OLS về giáo dục.
Để làm rõ cái định nhĩa khó hiểu ở trên, chúng ta hãy khảo sát sự phụ thuộc của tiền lương người phụ nữ gồm những gì? vào những nghiên cứu trước chúng ta có nó phụ thuộc vào giáo dục, độ tuổi. Và họ quan sát thấy có mối quan hệ nội sinh thêm đó là tình trạng hôn nhân và số lượng con.
Hồi quy OLS
Để nhận thấy sự phụ thuộc của các biến độc lập gồm: edu age married children điều đồng biến với wage. Để nhận định cái này chúng ta có thể vẽ đồ thị để dễ dàng nhận biết được. Và sử dụng hồi quy bình phương nhỏ nhất ols.
Chúng ta sử dụng dữ liệu sau:
use https://solieu.vip/data/womenwk.dta, clear
Bây giờ chúng ta hồi quy OLS để xem kết quả:

Khi hồi quy ta các có hai biến married và children ngịch biến với wage. Điều này nó khác biệt với sự khảo sát sự biến thiên của dữ liệu bằng đồ thị ở trên.
Ngoài sự khác biệt quá rõ rệch mà kết quả hồi quy mang lại, chúng ta còn thấy một vấn đề sai phạm trong dữ liệu của khảo sát, nó là những người wage có nhận 0, tức là họ không có đi làm. Trong khi đó chúng ta làm muốn khảo sát những giáo dục, độ tuổi, tình trạng hôn nhân, số lượng con cái … ảnh hưởng như thế nào đến mức lương. Nếu ta nhận những người không đi làm thì tức là giúp mô hình ra kết quả sai lệch.
Hồi quy tobit
Để khắc phục những vấn đề những người phụ nữ không đi làm, hay nói cách khác là loại bỏ những phụ nữ đi làm ra khỏi mô hình chúng ta sử dụng hồi quy tobit.

Tuy là chúng ta đã loại bỏ những khác biệt những người không đi làm vào mô hình nhưng vẫn không đúng như kỳ vọng ban đầu. Để giải quyết những vấn đề trên chúng ta có một phương pháp hồi quy. Đó là hồi quy lựa chọn mẫu heckman
Hồi quy lựa chọn mẫu heckman
Bây giờ chúng ta để khắc phục tình trạng các kỳ vọng dấu ban đầu cũng như loại bỏ những quan sát là những phụ nữ không đi làm chúng ta sử dụng heckman selection model để ứng dụng.
Chúng ta vẫn sử dụng cơ sở sữ liệu trên. Và tạo ra biến vieclam để ghi ra dữ liệu những người không đi làm thì vieclam = 0, và ngược lại
gen vieclam = (wage < .)
Và chúng ta hồi quy lựa chọn mẫu heckman,
heckman wage education age, select ( vieclam = education age married children)
ta được kết quả như sau:

Từ kết quả hồi quy như trên chúng ta dễ dàng nhận thấy rằng, tất cả các biến đưa vào điều có ý nghĩa thống, đồng thời dấu của 2 kỳ vọng maried và children là +, nó đúng như kỳ vọng ban đầu của chúng ta.
Ta có chỉ số rho = 0.7 tức là mức độ tương quan với ols 70%, chỉ số này (altrho) là có ý nghĩa thống kê; Kèm theo đó chỉ số phần dư sigma cũng có lnsigma cũng có ý nghĩa thống kê.
Kết luận:
Từ một giả thuyết ban đầu chúng ta sử dụng nhiều phương pháp hồi quy cho cùng một mục đích, chúng ta dễ dàng nhận thấy rằng, tất cả kết quả cho ra hoàn toàn khác nhau với những phương pháp khác nhau, Vì vậy trước khi hồi quy chúng ta phải suy nghĩ rất kỹ lưỡng về áp dụng mô hình kinh tế lượng cho phù hợp, vì khi áp dụng sai thì kết quả của chúng ta sẽ không còn chính xác nữa.
Để nắm rõ nội dung cũng như hiểu biết chính xác về hồi quy lựa chọn mẫu heckman, các bạn nên nắm rõ kỹ thuật phân tích hồi quy bình phương nhỏ nhất và hồi quy tobit.