Multicolinealidad en R. ¿Cómo detectarla?

💎 La multicolinealidad se da cuando, entre las variables del modelo que estamos desarrollando hay una alta correlación.

Quiero recalcar que la correlación debe ser muy alta ya que es muy normal,sobre todo en variables financieras que exista algún tipo de relación en sus movimientos.

Además, cuando creamos modelos econométricos la existencia de multicolinealidad en sí no debe ser problema, el problema viene cuando esta es ya muy fuerte y entonces puede que el modelo deje de ser fiable.

La multicolinealidad puede dar lugar a la aparición de algunos efectos perjudiciales para nuestros modelos. Los más importantes son:

  1.  Aumento de las varianzas de los estimadores de los coeficientes de regresión
  2. Estimaciones sensibles al tamaño de la muestra .

Pruebas para detectar la multicolinealidad

Existen muchas formas de analizar si hay colinealidad en los modelos.Algunas de ellas son:

  • Coeficiente de Correlación alto entre variables
  • Coeficientes t’s no significativos y R2 elevada
  • Factor de Influencia de la Varianza
  • Regla y Efecto R2 de Theil
  • Índice de la condición de número

🧐 En el siguiente video amplio esta información, incluyendo el desarrollo de manera práctica de un modelo de regresión en R y luego comprobando la existencia de multicolinealidad con algunas de las pruebas nombradas. También dejo aquí el código usado para que puedas copiarlo y practicar por tí mismo si lo deseas.

 

CÓDIGO EN R DEL VÍDEO

 

#VIDEO MULTICOLINEALIDAD

## variables altamente correlacionadas
## problema sólo cuando la correlación es muy fuerte
## Caso extremo — Multicolinealidad Perfecta
## coef de 1 — *rango completo de la matriz de regresores
## — y matri X’X tenga determinante 0

### + colinealidad – Disminuye determinante y + varianza estimad

#EFECTOS DE MULTICOLINEALIDAD APROX

#1. Sensibilidad a la muestra
#2. Aumentos de las varianzas

##Pruebas para detectarla

# 1. Correlación entre variables — > 0.8
# 2. Coeficientes t’s no significativos y R2 elevada
# 3. Factor de Influencia de la Varianza (VIF)

# 4. Efecto y Regla de Klein
# 5 .Indice de condición de número … matrices

####

## PARTE 1 — CREACIÓN DEL MODELO LINEAL

#install.packages(«quantmod»)
library(quantmod)
#install.packages(«tseries»)
library(tseries)
#install.packages(«forecast»)
library(forecast)
#install.packages(«TSA»)
library(TSA)
#install.packages(«Quandl»)
library(Quandl)

#1. Descargamos las variables que vamos a usar

getSymbols(«INDPRO»,src=»FRED») #Industrial Production Index
getSymbols(«UMCSENT»,src=»FRED») #University of Michigan: Consumer Sentiment
getSymbols(«FEDFUNDS»,src=»FRED») #tasa interes fondos federales
getSymbols(«CCRETT01USM661N»,src=»FRED») #Tipo de cambio efectivo IPC
getSymbols(«M2NS»,src=»FRED») #Stock de dinero M2
getSymbols(«PAYEMS»,src=»FRED») # Des trabajadores no rurales
getSymbols(«BOPGSTB»,src=»FRED») #Balance cuenta, Diferencia entre exp e imp
getSymbols(«EXUSUK»,src=»FRED») #GBP mensual

## Predecir GBPUSD — 1 mes

###2. Dividimos lso datos en 2 muestras
## IN SAMPLE y OUT SAMPLE

prod= INDPRO[«2001-01::2019-12»]
sent= UMCSENT[«2001-01::2019-12»]
Fedfunds=FEDFUNDS[«2001-01::2019-12»]
GBP=EXUSUK[«2001-01::2019-12»]
credit=CCRETT01USM661N[«2001-01::2019-12»]
pay=PAYEMS[«2001-01::2019-12»]
money=M2NS[«2001-01::2019-12»]
trade=BOPGSTB[«2001-01::2019-12»]

#creamos una tabla

t_varibles=data.frame(merge(sent,Fedfunds,GBP,credit,pay,money,trade))

#creamos el modelo

Mod_Macro = lm(EXUSUK~UMCSENT+FEDFUNDS+CCRETT01USM661N+PAYEMS+M2NS+BOPGSTB,data=t_varibles)

summary(Mod_Macro)

####

# 1 Correlación

cor(t_varibles)

### Modelo 2 —

t_varibles_2=data.frame(merge(GBP,pay,money,trade))

Mod_Macro_2 = lm(EXUSUK~PAYEMS+M2NS+BOPGSTB,data=t_varibles_2)

summary(Mod_Macro_2)

#1.correlacion

cor(t_varibles_2)

# Mira Pr(>|t|) y Adjusted R-squared

# 3 Factor de Influencia de Varianza

#♣install.packages(«car»)
library(car)

#2. Factor de Influencia de la Varianza

#fiv <- 1/1-R2

vif(Mod_Macro_2)

#5– >0.8
#10 > 0.9

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio