4.1.2.2 Regresión polinomial
REGRESIÓN POLINOMIAL
El procedimiento Regresión Polinomial está diseñado para construir una modelo estadístico que
describa el impacto de un solo factor cuantitativo X en una variable dependiente Y. Se ajusta a
los datos un modelo polinomial que involucra a X y potencias de X. Se realizan pruebas para
determinar el orden apropiado del polinomio. Se puede graficar el modelo ajustado con
intervalos de confianza y/o predicción. También se pueden grafican residuos e identificar
observaciones influyentes.
* Variables y modelo: identificación de las variables de entrada y el modelo que se ajustó. Por
omisión, se ajusta un modelo cuadrático de la forma
Y = β0 + β1X + β2X2 (1)
aunque se puede seleccionar un polinomio de diferente orden usando las Opciones de
Análisis.
* Coeficientes: los coeficientes estimados, errores estándar, estadístico t, y valor P. Las
estimaciones de los coeficientes del modelo se pueden usar para escribir la ecuación ajustada,
que en el ejemplo es
MPG Highway = 73.8491 - 0.0225792*Weight + 0.00000251567*Weight2 (2)
El estadístico t prueba la hipótesis nula de que el parámetro del modelo correspondiente es
igual a 0, contra la hipótesis alterna de que no es igual a 0. Valores de P pequeños (menor de
0.05 si se trabaja con un nivel de significancia del 5%) indican que un coeficiente del modelo
es significativamente diferente de 0. De particular interés cuando se ajusta un polinomio es el
valor de P para el término de mayor orden. Si este término no es significativo, entonces el
modelo puede simplificarse razonablemente disminuyendo el orden del polinomio. En los
datos de muestra, el valor de P para Weight2
(peso2
) es pequeño, así que se necesita un
modelo de al menos orden 2 para describir adecuadamente la relación entre Y y X.
* Análisis de Varianza: descomposición de la variabilidad de la variable dependiente Y en
una suma de cuadrados del modelo y una suma de cuadrados residual o del error. De
particular interés es la prueba de F y su valor de P asociado, que prueban la significancia
estadística del modelo ajustado. Un Valor de P pequeño (menor de 0.05 si se trabaja con un
nivel de significancia del 5%) indica que existe una relación significativa de la forma
especificada entre Y y X. En los datos de muestra, el modelo es altamente significativo.
* Estadísticas: estadísticas de resumen para el modelo ajustado, incluyendo:
R-cuadrada - representa el porcentaje de la variabilidad en Y que ha sido explicado por el
modelo de regresión ajustado, que va de 0% a 100%. Para los datos del ejemplo, la regresión
ha dado cuenta de alrededor del 68.5% de la variabilidad en las millas por galón. El restante
31.5% es atribuible a la desviación alrededor de la línea, que puede deberse a otros factores,
a errores de medición, o a una falla del modelo polinomial actual para ajustar los datos
adecuadamente.
CÓDIGO DE REGRESIÓN POLINOMIAL EN MATLAB
function[]=regp(z,n)
[r,c]=size(z);
a=1;
plot(z(1:r,1),z(1:r,2),’.’,’LineWidth’,2)
hold on;
for i=1:n+1
for j=1:n+1
m(i,j)=0;
end
end
for i=1:n+1
k=i;
for j=1:n+1
for h=1:r
if i==1 && j==1
m(j,i)=r;
else
m(j,i)=m(j,i)+(z(h,1)^(k-1));
end
end
k=k+1;
end
end
for i=1:n+1
v(i,1)=0;
for j=1:r
v(i)=v(i,1)+(((z(j,1))^(i-1)) *z(j,2));
end
end
x=m\v;
i=n+1;
while i>=1
y(1,a)=x(i);
a=a+1;
i=i-1;
end
x=polyval(y,z(1:r,1));
plot(z(1:r,1),x,’r’);
[r,c]=size(z);
a=1;
plot(z(1:r,1),z(1:r,2),’.’,’LineWidth’,2)
hold on;
for i=1:n+1
for j=1:n+1
m(i,j)=0;
end
end
for i=1:n+1
k=i;
for j=1:n+1
for h=1:r
if i==1 && j==1
m(j,i)=r;
else
m(j,i)=m(j,i)+(z(h,1)^(k-1));
end
end
k=k+1;
end
end
for i=1:n+1
v(i,1)=0;
for j=1:r
v(i)=v(i,1)+(((z(j,1))^(i-1)) *z(j,2));
end
end
x=m\v;
i=n+1;
while i>=1
y(1,a)=x(i);
a=a+1;
i=i-1;
end
x=polyval(y,z(1:r,1));
plot(z(1:r,1),x,’r’);
Comentarios
Publicar un comentario