Mục lục trang:
Cách tính giá trị các chỉ số AIC BIC MAE MAPE MSE RMSE
Trong một mô hình hồi quy bất kỳ, chúng ta sử dụng nhiều chỉ số để đo lường hoặc những kiểm định để khẳng định rằng mô hình đang nghiên cứu được xem là tốt hay không tốt. Bằng nhiều cách đánh giá kiểm tra ta có thể biết được mô hình đang nghiên cứu có thực sự là có ý nghĩa, mang nhiều lợi ích cũng như đánh giá tương quan về chuỗi sự kiện, hiện tượng khoa học có thể lý giải được. Để chúng ta có thể đánh giá tiêu cực cũng như về mặt tích cực của một sự việc tương quan với thực tế vi mô hay là vĩ mô. Song không phải như kiểm định, từ những mô hình đưa ra được tốt hay không tốt nói đúng hơn là mô hình có đạt được độ tin cậy cao hay không. Không phải chúng ta dựa vào 1 yếu tố nào đó không tốt về mô hình, mà đánh giá mô hình có được độ tin cậy cao hay không mà chúng ta phải căn cứ vào nhiều yếu tố khác nhau cũng như tính cấp thiết của đề tài mà mình đang nghiên cứu. Ở đây, mỗi chúng ta căn sau khi chạy mô hình xong đều căn cứ vào chỉ số R bình phương (R-squared) để xét xem mô hình chúng ta đang ngâm cứu nó có tính xác thực là bao nhiêu %. Đều có là gần chính xác cho đến hiện tại, tương lai sau này 1 mình nó vẫn chưa có thể đánh giá được yêu cầu mà mọi người, cũng như các chuyên gia có thể tin cậy vào 1 mình nó. Và sau khi chúng ta nghiên cứu thật sâu về mô hình nghiên cứu, về thật nhiều mô hình định lượng thì chúng ta sẽ biêt thật nhiều các kiểm định thì chúng ta căn cứ vào nó để xác định mô hình có sự tin cậy hay không.
Và sau đây là một số chỉ số nói cũng có phần là đúng là 1 số kiểm định thay cho R bình phương trong một số mô hình, cũng như ta phải áp dụng nó đúng vào chỗ đúng nơi thì nó sẽ phát huy tác dụng. Nó sẽ giúp mô hình nghiên cứu của chúng ta đạt được độ tin cậy cao nhất và nó có thể áp dụng vào thực tiễn, thực tế, thực tại và cả thực lực.
Đầu tiên hôm nay chúng ta sẽ nghiên cứu về AIC (akaike information criterion)
AIC là một tiêu chí để lựa chọn giữa các mô hình thống kê hoặc kinh tế lượng lồng nhau. Giả sử bạn tạo một số mô hình hồi quy cho các yếu tố khác nhau như giáo dục, quy mô gia đình hoặc tình trạng khuyết tật; AIC sẽ lấy từng mô hình và xếp hạng chúng từ tốt nhất đến kém nhất. Mô hình tốt nhất sẽ là mô hình không phù hợp cũng không quá phù hợp.
Ở đây chúng ta sẽ đi vào cách tính AIC bằng công thức cũng như tính nó như thế nào, tiêu chí như thế nào cần những thông tin gì. Thì bây giờ chúng ta đến với công thức và tính toán nó trên STATA.
AIC= -2*ln(likelihood)+2*k
- Ln (Likehood) là một chỉ tiêu đánh giá gọi là hợp lí cực đại.
- k là số biến quan sát ta có trong hồi quy
Và bây giờ chúng ta tính toán nó trên STATA, ở đây mình sử dụng STATA version 16. CÁC bạn có thể download STATA tại đây.
Trước khi chúng ta tính toán AIC thì chúng ta phải có 1 data ở đây chúng ta sử dụng bộ data của mình bạn có thể tham khảo hoặc sử dụng bộ data của mình để test.
Nếu các bạn sử dụng data của mình thì copy và paste nó vào STATA:
use https://solieu.vip/data/quyetdinh.dta
Sau khi nó hiện được được như trong hình các biến mà mình đưa vào mô hình thì chúng ta bắt đầu hồi quy. Ở đây mình sử dụng hồi quy căn bản nhất là hồi quy OLS.
Sau khi hồi quy chúng ta hồi quy xong chúng ta thường nhận xét sự uy tín của mô hình là căn cứ vào R-squared. Nó là đúng khi chúng ta hồi quy mô hình làm 1 hồi quy tuyến tính. Bây giờ chúng ta sẽ tính AIC bằng STATA.
Đầu tiên chúng ta phải xem thử AIC nó là bao nhiêu, ở hồi quy OLS thì nó dấu trong modul chúng ta phải hiện nó ra. Còn ở những hồi quy khác bằng phương pháp hợp lí cực đại thì nó dựa vào AIC và BIC để xác định độ tin cậy thì nó sẽ hiện ra cho chúng ta biết, còn đây là OLS nên nó chỉ dựa vào R-squared.
Chúng ta nhập code: estat ic
Và chúng ta thấy STATA tính được AIC bằng 170.732.Ở AIC thì càng dần về 0 thì độ tin cậy sẽ càng được tin tưởng cao
Sau khi chúng ta dùng lệnh “estat ic” thì nó cũng cho BIC hiện ra là 192.9547. Vậy BIC là gì?
BIC là ước tính về chức năng xác suất sau của mô hình là đúng, theo một thiết lập Bayes nhất định, do đó BIC thấp hơn có nghĩa là một mô hình được coi là có khả năng là mô hình thực sự. Cả hai tiêu chí đều dựa trên các giả định khác nhau và các xấp xỉ tiệm cận. Mỗi, mặc dù tính hữu dụng heuristic của nó, do đó đã bị chỉ trích là có tính hợp lệ đáng ngờ cho dữ liệu trong thế giới thực. Nhưng mặc dù có nhiều khác biệt về lý thuyết, sự khác biệt duy nhất của chúng trong thực tế là quy mô của hình phạt; BIC xử phạt mô hình phức tạp nặng nề hơn.
Mặc dù hai biện pháp này có nguồn gốc từ một quan điểm khác nhau, nhưng chúng có mối liên hệ chặt chẽ với nhau. BIC luôn luôn lớn hơn AIC nhưng giá trị của cả 2 càng nhỏ thì mô hình càng có độ tin cậy. Điểm khác nhau giữa BIC và AIC là BIC có thêm vào lượng quan sát mà AIC lại không có.
Chúng ta dùng câu lệnh tương tự như cách tìm AIC để tìm BIC
Tiếp theo 2 chỉ số AIC và BIC thì chúng ta bắt đầu với MAE
MAE là gì Sai số trung bình tuyệt đối (Mean absolute error). MAE đo lường mức độ trung bình của các lỗi trong một tập hợp các dự đoán, mà không xem xét hướng của chúng. Đó là trung bình trên mẫu thử nghiệm về sự khác biết tuyệt đối giữa dự đoán và lượng quan sát thực tế, trong đó tất cả các khác biệt với trọng số bằng nhau.
Bây giờ chúng ta bắt đầu tính toán MAE
Đây là công thức:
Với yi là giá trị ước lượng
Xi là giá trị phụ thuộc
Ta bắt đầu tính MAE trên STATA
Giá trị MAE của chúng ta là 0.0993834
Vậy là chúng ta đã tính được MAE và bây giờ chúng ta tính tiếp MAPE
MAPE là gì?
MAPE (Mean absolute percentage error) là phần trăm sai số trung bình tuyệt đối. Lỗi phần trăm tuyệt đối trung bình (MAPE) là thước đo thống kê mức độ chính xác của một hệ thống dự báo. Nó đo độ chính xác này theo phần trăm và có thể được tính là sai số phần trăm tuyệt đối trung bình cho mỗi khoảng thời gian trừ đi các giá trị thực chia cho các giá trị thực. Lỗi phần trăm tuyệt đối trung bình (MAPE) là biện pháp phổ biến nhất được sử dụng để dự báo lỗi và hoạt động tốt nhất nếu không có cực trị đối với dữ liệu (và không có số không).
Chúng ta sẽ tính MAPE trên STATA.
Mape bằng 0.2905607 đó là giá trị MAPE mà chúng ta cần tìm.
Sau khi chúng ta tính toán và kiểm định được 4 giá trị trên thì chúng ta còn MSE và RMSE thì mình sẽ nói rõ hơn về nó ở bài sau. Bài này đến đây cũng dài rồi, ngâm cứu 4 chỉ số đã mệt. Hẹn các bạn ở bài sau mình sẽ nói rõ hơn về 2 chỉ số còn lại. 2 chỉ số đó nó có thể sánh ngang với R-squared.
Mọi thắc mắc bạn có thể bình luận ở đây hoặc liên hệ solieu.vip
Trân trọng.