Yếu tố lạm phát phương sai (VIF) - Tổng quan, Công thức, Sử dụng

Hệ số lạm phát phương sai (VIF) đo lường mức độ nghiêm trọng của đa cộng tuyến trong phân tích hồi quy Phân tích hồi quy Phân tích hồi quy là một tập hợp các phương pháp thống kê được sử dụng để ước tính mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập. Nó có thể được sử dụng để đánh giá sức mạnh của mối quan hệ giữa các biến và để mô hình hóa mối quan hệ trong tương lai giữa chúng. . Đó là một khái niệm thống kê chỉ ra sự gia tăng phương sai của hệ số hồi quy do tính thẳng hàng.

Yếu tố lạm phát phương sai

Tóm lược

  • Hệ số lạm phát phương sai (VIF) được sử dụng để phát hiện mức độ nghiêm trọng của đa cộng tuyến trong phân tích hồi quy bình phương nhỏ nhất (OLS) thông thường.
  • Đa cộng tuyến làm tăng phương sai và lỗi loại II. Nó làm cho hệ số của một biến nhất quán nhưng không đáng tin cậy.
  • VIF đo lường số lượng các phương sai tăng cao do đa cộng tuyến gây ra.

Yếu tố lạm phát phương sai và đa cộng tuyến

Trong phân tích hồi quy bình phương nhỏ nhất (OLS) thông thường, đa cộng tuyến tồn tại khi hai hoặc nhiều biến độc lập Biến độc lập Biến độc lập là một đầu vào, giả định hoặc trình điều khiển được thay đổi để đánh giá tác động của nó lên một biến phụ thuộc (kết quả) . chứng minh mối quan hệ tuyến tính giữa chúng. Ví dụ, để phân tích mối quan hệ của quy mô công ty và doanh thu với giá cổ phiếu trong mô hình hồi quy, vốn hóa thị trường và doanh thu là các biến độc lập.

Giá trị vốn hóa thị trường của một công ty Thị trường Vốn hóa Thị trường Vốn hóa (Vốn hóa thị trường) là giá trị thị trường gần đây nhất của các cổ phiếu đang lưu hành của một công ty. Vốn hóa thị trường bằng giá cổ phiếu hiện tại nhân với số lượng cổ phiếu đang lưu hành. Cộng đồng đầu tư thường sử dụng giá trị vốn hóa thị trường để xếp hạng các công ty và tổng doanh thu của nó có mối tương quan chặt chẽ. Khi một công ty kiếm được doanh thu ngày càng tăng, nó cũng phát triển về quy mô. Nó dẫn đến một vấn đề đa cộng tuyến trong phân tích hồi quy OLS. Nếu các biến độc lập trong mô hình hồi quy thể hiện mối quan hệ tuyến tính hoàn toàn có thể dự đoán được, thì nó được gọi là đa cộng tuyến hoàn hảo.

Với đa cộng tuyến, các hệ số hồi quy vẫn nhất quán nhưng không còn đáng tin cậy nữa vì các sai số chuẩn bị thổi phồng. Có nghĩa là khả năng dự đoán của mô hình không bị giảm, nhưng các hệ số có thể không có ý nghĩa thống kê với lỗi loại II Lỗi loại II Trong kiểm định giả thuyết thống kê, lỗi loại II là tình huống trong đó kiểm định giả thuyết không bác bỏ giả thuyết không. là sai. Trong khác.

Do đó, nếu hệ số của các biến không có ý nghĩa riêng lẻ - không thể bị bác bỏ trong phép thử t - nhưng có thể cùng giải thích phương sai của biến phụ thuộc với sự bác bỏ trong phép thử F và hệ số xác định cao (R2), có thể tồn tại đa cộng tuyến. Đó là một trong những phương pháp để phát hiện đa cộng tuyến.

VIF là một công cụ thường được sử dụng khác để phát hiện xem có tồn tại đa cộng tuyến trong mô hình hồi quy hay không. Nó đo lường mức độ phương sai (hoặc sai số chuẩn) của hệ số hồi quy ước tính bị thổi phồng lên do tính thẳng hàng.

Sử dụng yếu tố lạm phát phương sai

VIF có thể được tính theo công thức dưới đây:

Yếu tố lạm phát phương sai - Công thức

Trong đó R i 2 đại diện cho hệ số xác định chưa điều chỉnh để hồi quy biến độc lập thứ i trên các biến còn lại. Tương hỗ của VIF được gọi là dung sai . Có thể sử dụng VIF hoặc dung sai để phát hiện đa cộng tuyến, tùy thuộc vào sở thích cá nhân.

Nếu R i 2 bằng 0 thì không thể dự đoán phương sai của các biến độc lập còn lại từ biến độc lập thứ i. Do đó, khi VIF hoặc dung sai bằng 1, biến độc lập thứ i không tương quan với các biến còn lại, có nghĩa là không tồn tại đa cộng tuyến trong mô hình hồi quy này. Trong trường hợp này, phương sai của hệ số hồi quy thứ i không bị thổi phồng.

Nói chung, VIF trên 4 hoặc dung sai dưới 0,25 cho thấy có thể tồn tại đa cộng tuyến và cần phải điều tra thêm. Khi VIF cao hơn 10 hoặc dung sai thấp hơn 0,1, có đa cộng tuyến đáng kể cần được hiệu chỉnh.

Tuy nhiên, cũng có những tình huống VFIs cao có thể được bỏ qua một cách an toàn mà không bị đa cộng tuyến. Sau đây là ba tình huống như vậy:

1. VIF cao chỉ tồn tại trong các biến kiểm soát, nhưng không tồn tại trong các biến quan tâm. Trong trường hợp này, các biến quan tâm không thẳng hàng với nhau hoặc các biến kiểm soát. Các hệ số hồi quy không bị ảnh hưởng.

2. Khi VIFs cao được gây ra do bao gồm các sản phẩm hoặc quyền hạn của các biến khác, đa cộng tuyến không gây ra tác động tiêu cực. Ví dụ, một mô hình hồi quy bao gồm cả x và x2 là các biến độc lập của nó.

3. Khi một biến giả đại diện cho nhiều hơn hai danh mục có VIF cao, đa cộng tuyến không nhất thiết tồn tại. Các biến sẽ luôn có VIF cao nếu có một phần nhỏ các trường hợp trong danh mục, bất kể các biến phân loại có tương quan với các biến khác hay không.

Hiệu chỉnh Đa cộng tuyến

Vì đa cộng tuyến làm tăng phương sai của các hệ số và gây ra sai số loại II, nên điều cần thiết là phải phát hiện và sửa chữa nó. Có hai cách đơn giản và thường được sử dụng để điều chỉnh đa cộng tuyến, như được liệt kê dưới đây:

1. Cách đầu tiên là loại bỏ một (hoặc nhiều) các biến có tương quan cao. Vì thông tin được cung cấp bởi các biến là dư thừa, hệ số xác định sẽ không bị ảnh hưởng nhiều bởi việc loại bỏ.

2. Phương pháp thứ hai là sử dụng phân tích các thành phần chính (PCA) hoặc hồi quy bình phương một phần nhỏ nhất (PLS) thay vì hồi quy OLS. Hồi quy PLS có thể giảm các biến xuống một tập hợp nhỏ hơn mà không có mối tương quan giữa chúng. Trong PCA, các biến không tương quan mới được tạo. Nó giảm thiểu mất mát thông tin và cải thiện khả năng dự đoán của một mô hình.

Nhiêu tai nguyên hơn

Finance là nhà cung cấp chính thức của Chứng nhận CBCA ™ Ngân hàng & Tín dụng được Chứng nhận toàn cầu (CBCA) ™ Chứng chỉ CBCA ™ được Chứng nhận về Ngân hàng & Nhà phân tích Tín dụng (CBCA) ™ là tiêu chuẩn toàn cầu dành cho các nhà phân tích tín dụng bao gồm tài chính, kế toán, phân tích tín dụng, phân tích dòng tiền , lập mô hình giao ước, hoàn trả khoản vay và hơn thế nữa. chương trình chứng nhận, được thiết kế để giúp bất kỳ ai trở thành nhà phân tích tài chính đẳng cấp thế giới. Để tiếp tục thăng tiến sự nghiệp của bạn, các tài nguyên bổ sung bên dưới sẽ hữu ích:

  • Các khái niệm cơ bản về thống kê trong tài chính Các khái niệm cơ bản về thống kê cho tài chính Sự hiểu biết vững chắc về thống kê là rất quan trọng trong việc giúp chúng ta hiểu rõ hơn về tài chính. Hơn nữa, các khái niệm thống kê có thể giúp các nhà đầu tư theo dõi
  • Các phương pháp dự báo Phương pháp dự báo Các phương pháp dự báo hàng đầu. Trong bài viết này, chúng tôi sẽ giải thích bốn loại phương pháp dự báo doanh thu mà các nhà phân tích tài chính sử dụng để dự đoán doanh thu trong tương lai.
  • Hồi quy nhiều tuyến tính Hồi quy nhiều tuyến tính Hồi quy nhiều tuyến tính đề cập đến một kỹ thuật thống kê được sử dụng để dự đoán kết quả của một biến phụ thuộc dựa trên giá trị của các biến độc lập
  • Biến ngẫu nhiên Biến ngẫu nhiên Biến ngẫu nhiên (biến ngẫu nhiên) là một loại biến trong thống kê mà các giá trị có thể có của nó phụ thuộc vào kết quả của một hiện tượng ngẫu nhiên nhất định