Mục lục trang:
Chỉnh sửa số liệu stata biến công cụ, dịch vụ xử lý số liệu theo yêu cầu của khách hàng gồm nhiều mô hình kinh tế lượng, giúp mô hình có ý nghĩa thống kê, nhân chỉnh sửa số liệu trên nhiều mô hình kinh tế như hồi quy, hồi quy 2sls, hồi quy ngưỡng, hồi quy panel, hồi quy fem rem, hồi quy pooled ols …. đảm bảo đúng tuyến độ và yêu cầu của khách hàng với giá phải chăng.
CHỈNH SỬA SỐ LIỆU STATA
Thế nào là chỉnh sửa số liệu stata ?
Dịch vụ chỉnh sửa số liệu không còn là mới mẻ nữa, chúng tôi cũng không biết nói gì nhiều hơn, khi quý khách hàng chạy mô hinh kinh tế lượng ở bộ môn thống kê, nếu dữ liệu không có ý nghĩa thống kê, thì đừng ngần ngại hãy liên hệ ngay với chúng tôi để được tư vấn về dịch vụ chỉnh sửa số liệu stata. Nói là stata nhưng thật ra cho tất cả các phần mềm kinh tế lượng thông dụng.
Biến công cụ là gì ?
Trong thống kê , kinh tế lượng , dịch tễ học và các ngành liên quan, phương pháp biến công cụ ( IV ) được sử dụng để ước tính mối quan hệ nhân quả khi các thí nghiệm được kiểm soát là không khả thi hoặc khi điều trị không được giao thành công cho mọi đơn vị trong một thí nghiệm ngẫu nhiên. [1] Theo trực giác, IV được sử dụng khi một biến quan tâm giải thích có tương quan với thuật ngữ lỗi, trong trường hợp đó bình phương nhỏ nhất bình thường và ANOVA cho sai lệchcác kết quả. Một công cụ hợp lệ gây ra những thay đổi trong biến giải thích nhưng không có tác động độc lập đến biến phụ thuộc, cho phép nhà nghiên cứu khám phá tác động nhân quả của biến giải thích lên biến phụ thuộc.
Các phương thức biến công cụ cho phép ước lượng nhất quán khi các biến giải thích (hiệp phương sai) tương quan với các thuật ngữ lỗi trong mô hình hồi quy . Mối tương quan như vậy có thể xảy ra 1) khi các thay đổi trong biến phụ thuộc thay đổi giá trị của ít nhất một trong các hiệp phương sai (nhân quả “đảo ngược”), 2) khi có các biến bị bỏ qua ảnh hưởng đến cả hai biến phụ thuộc và biến độc lập hoặc 3) khi hiệp phương sai có thể xảy ra lỗi đo không ngẫu nhiên . Các biến giải thích bị một hoặc nhiều trong số các vấn đề này trong bối cảnh hồi quy đôi khi được gọi là nội sinh. Trong tình huống này, bình phương tối thiểu thông thường tạo ra các ước tính sai lệch và không nhất quán. [2] Tuy nhiên, nếu có sẵn một công cụ , vẫn có thể thu được các ước tính phù hợp. Một công cụ là một biến không thuộc về phương trình giải thích nhưng có tương quan với các biến giải thích nội sinh , có điều kiện dựa trên giá trị của các hiệp phương sai khác.
Trong các mô hình tuyến tính, có hai yêu cầu chính để sử dụng IV:
Các công cụ phải được tương quan với các biến giải thích nội sinh, điều kiện trên các hiệp phương sai khác. Nếu mối tương quan này là mạnh, thì nhạc cụ được cho là có giai đoạn đầu tiên mạnh mẽ . Một mối tương quan yếu có thể cung cấp những suy luận sai lệch về ước tính tham số và lỗi tiêu chuẩn. [3]
Công cụ không thể tương quan với thuật ngữ lỗi trong phương trình giải thích, có điều kiện trên các hiệp phương sai khác. Nói cách khác, công cụ không thể gặp vấn đề tương tự như biến dự đoán ban đầu. Nếu điều kiện này được đáp ứng, thì công cụ được cho là thỏa mãn hạn chế loại trừ .
Chọn biến công cụ phù hợp
Do U không quan sát được, nên yêu cầu Z độc lập với U không thể được suy ra từ dữ liệu và thay vào đó phải được xác định từ cấu trúc mô hình, tức là quá trình tạo dữ liệu. Đồ thị nhân quả là một đại diện của cấu trúc này và định nghĩa đồ họa được đưa ra ở trên có thể được sử dụng để nhanh chóng xác định xem một biến Z có đủ điều kiện là một biến công cụ được cung cấp một tập hợp W không . Để xem làm thế nào, hãy xem xét ví dụ sau đây.
Hình 1: Vùng lân cận đủ điều kiện là một biến công cụ cho Giờ thư viện
Hình 2: {\ displaystyle G _ {\ overline {X}}} G _ {\ overline {X}}, được sử dụng để xác định xem Proighbor có phải là biến công cụ hay không.
Hình 3: Sự gần gũi không đủ điều kiện là một biến công cụ cho Giờ thư viện
Hình 4: Sự gần gũi đủ điều kiện là một biến công cụ, miễn là chúng ta không bao gồm Giờ thư viện như là một đồng biến.
Giả sử rằng chúng tôi muốn ước tính hiệu quả của chương trình dạy kèm đại học trên điểm trung bình ( GPA ). Mối quan hệ giữa việc tham dự chương trình dạy kèm và GPA có thể bị nhầm lẫn bởi một số yếu tố. Học sinh tham gia chương trình dạy kèm có thể quan tâm nhiều hơn đến điểm số của họ hoặc có thể đang vật lộn với công việc của họ. Sự bối rối này được mô tả trong các Hình 1-3 bên phải thông qua vòng cung đấu giá giữa Chương trình dạy kèm và GPA. Nếu sinh viên được chỉ định vào ký túc xá một cách ngẫu nhiên, thì sự gần gũi của ký túc xá của sinh viên với chương trình dạy kèm là một ứng cử viên tự nhiên để trở thành một biến công cụ.
Tuy nhiên, nếu chương trình dạy kèm được đặt trong thư viện đại học thì sao? Trong trường hợp đó, Sự gần gũi cũng có thể khiến sinh viên dành nhiều thời gian hơn ở thư viện, từ đó cải thiện điểm trung bình của họ (xem Hình 1). Sử dụng biểu đồ nhân quả được mô tả trong Hình 2, chúng ta thấy rằng Độ lân cận không đủ điều kiện là biến công cụ vì nó được kết nối với GPA thông qua đường dẫn Khoảng cách {\ displaystyle \ rightarrow} \mũi tên bên phải Giờ thư viện {\ displaystyle \ rightarrow} \mũi tên bên phải Điểm trung bình {\ displaystyle G _ {\ overline {X}}} G _ {\ overline {X}}. Tuy nhiên, nếu chúng ta kiểm soát Giờ thư viện bằng cách thêm nó dưới dạng đồng biến thì Độ gần sẽ trở thành một biến công cụ, vì Độ lân cận được tách ra khỏi GPA cho Giờ thư viện trong {\ displaystyle G _ {\ overline {X}}} G _ {\ overline {X}}[ cần dẫn nguồn ] .
Bây giờ, giả sử rằng chúng tôi nhận thấy rằng “khả năng tự nhiên” của học sinh ảnh hưởng đến số giờ trong thư viện cũng như điểm trung bình của anh ấy hoặc cô ấy. Sử dụng biểu đồ nhân quả, chúng tôi thấy rằng Giờ thư viện là một máy va chạm và điều hòa trên nó mở ra sự gần gũi {\ displaystyle \ rightarrow} \mũi tên bên phải Giờ thư viện {\ displaystyle \ leftrightarrow} trái phải Điểm trung bình Kết quả là, tiệm cận không thể được sử dụng như một biến công cụ.
Cuối cùng, giả sử rằng Giờ Thư viện không thực sự ảnh hưởng đến GPA vì những sinh viên không học trong thư viện chỉ đơn giản là học ở nơi khác, như trong Hình 4. Trong trường hợp này, việc kiểm soát Giờ Thư viện vẫn mở ra một con đường giả từ Khoảng cách đến GPA. Tuy nhiên, nếu chúng ta không kiểm soát Giờ thư viện và xóa nó dưới dạng đồng biến thì Proighbor có thể lại được sử dụng một biến công cụ.
Giải thích về cách ước tính IV (biến công cụ)
Giải trình trên cho rằng hiệu ứng nhân quả của lãi suất không thay đổi theo các quan sát, nghĩa là {\ displaystyle \ beta} \ beta là một hằng số. Nói chung, các đối tượng khác nhau sẽ phản ứng theo những cách khác nhau để thay đổi trong “điều trị” x . Khi khả năng này được công nhận, hiệu ứng trung bình trong dân số của một thay đổi trong x trên y có thể khác với hiệu ứng trong một quần thể phụ nhất định. Ví dụ, hiệu quả trung bình của một chương trình đào tạo nghề có thể khác nhau đáng kể giữa các nhóm người thực sự được đào tạo và nhóm chọn không được đào tạo. Vì những lý do này, các phương pháp IV gọi các giả định ngầm về phản ứng hành vi, hoặc nói chung là các giả định về mối tương quan giữa đáp ứng với điều trị và xu hướng điều trị.
Công cụ ước tính IV tiêu chuẩn có thể phục hồi hiệu quả điều trị trung bình tại địa phương (LATE) thay vì hiệu quả điều trị trung bình (ATE). Imbens và Angrist (1994) chứng minh rằng dự toán tuyến tính IV có thể được giải thích trong điều kiện yếu như một bình quân gia quyền của hiệu quả điều trị trung bình của địa phương, trong đó các trọng phụ thuộc vào tính đàn hồi của regressor nội sinh với những thay đổi trong các biến công cụ. Roughly, điều đó có nghĩa là tác động của một biến chỉ được tiết lộ cho các quần thể bị ảnh hưởng bởi những thay đổi quan sát được trong các công cụ và các quần thể đó phản ứng nhiều nhất với những thay đổi trong các công cụ sẽ có tác động lớn nhất đến độ lớn của ước tính IV.
Ví dụ, nếu một nhà nghiên cứu sử dụng sự hiện diện của một trường đại học cấp đất làm công cụ cho giáo dục đại học trong hồi quy thu nhập, cô ấy xác định ảnh hưởng của đại học đối với thu nhập trong dân số sẽ có bằng đại học nếu có trường đại học nhưng sẽ có bằng đại học không có được bằng cấp nếu không có trường đại học Cách tiếp cận theo kinh nghiệm này, không, không cần giả định thêm, cho nhà nghiên cứu biết bất cứ điều gì về ảnh hưởng của đại học giữa những người sẽ luôn luôn hoặc không bao giờ có được bằng đại học bất kể trường đại học địa phương có tồn tại hay không.
Vấn đề còn tồn đọng
Ước tính các biến công cụ thường không nhất quán nếu các công cụ tương quan với thuật ngữ lỗi trong phương trình quan tâm. Như Bound, Jaeger và Baker (1995) lưu ý, một vấn đề khác là do việc lựa chọn các công cụ “yếu”, các công cụ là yếu tố dự đoán kém của công cụ dự đoán câu hỏi nội sinh trong phương trình giai đoạn đầu. Trong trường hợp này, dự đoán của người dự đoán câu hỏi của công cụ sẽ kém và các giá trị dự đoán sẽ có rất ít biến thể. Do đó, họ khó có thể có nhiều thành công trong việc dự đoán kết quả cuối cùng khi chúng được sử dụng để thay thế bộ dự đoán câu hỏi trong phương trình giai đoạn hai.
Trong bối cảnh của ví dụ về hút thuốc và sức khỏe được thảo luận ở trên, thuế thuốc lá là công cụ yếu để hút thuốc nếu tình trạng hút thuốc phần lớn không đáp ứng với những thay đổi về thuế. Nếu thuế cao hơn không khiến mọi người bỏ thuốc lá (hoặc không bắt đầu hút thuốc), thì sự khác biệt về thuế suất cho chúng ta không biết gì về ảnh hưởng của việc hút thuốc đối với sức khỏe. Nếu thuế ảnh hưởng đến sức khỏe thông qua các kênh khác ngoài tác động của chúng đối với việc hút thuốc, thì các công cụ này không hợp lệ và phương pháp biến công cụ có thể mang lại kết quả sai lệch. Ví dụ, các địa điểm và thời gian có dân số tương đối có ý thức về sức khỏe có thể vừa thực hiện thuế thuốc lá cao vừa có sức khỏe tốt hơn thậm chí giữ tỷ lệ hút thuốc không đổi, vì vậy chúng tôi sẽ quan sát mối tương quan giữa thuế y tế và thuốc lá ngay cả khi đó là trường hợp hút thuốc không có hiệu quả về sức khỏe. Trong trường hợp này./.