4.1.2.2 Regresión polinomial

REGRESIÓN POLINOMIAL

El procedimiento Regresión Polinomial está diseñado para construir una modelo estadístico que describa el impacto de un solo factor cuantitativo X en una variable dependiente Y. Se ajusta a los datos un modelo polinomial que involucra a X y potencias de X. Se realizan pruebas para determinar el orden apropiado del polinomio. Se puede graficar el modelo ajustado con intervalos de confianza y/o predicción. También se pueden grafican residuos e identificar observaciones influyentes.

* Variables y modelo: identificación de las variables de entrada y el modelo que se ajustó. Por omisión, se ajusta un modelo cuadrático de la forma Y = β0 + β1X + β2X2 (1) aunque se puede seleccionar un polinomio de diferente orden usando las Opciones de Análisis. 
* Coeficientes: los coeficientes estimados, errores estándar, estadístico t, y valor P. Las estimaciones de los coeficientes del modelo se pueden usar para escribir la ecuación ajustada, que en el ejemplo es MPG Highway = 73.8491 - 0.0225792*Weight + 0.00000251567*Weight2 (2) El estadístico t prueba la hipótesis nula de que el parámetro del modelo correspondiente es igual a 0, contra la hipótesis alterna de que no es igual a 0. Valores de P pequeños (menor de 0.05 si se trabaja con un nivel de significancia del 5%) indican que un coeficiente del modelo es significativamente diferente de 0. De particular interés cuando se ajusta un polinomio es el valor de P para el término de mayor orden. Si este término no es significativo, entonces el modelo puede simplificarse razonablemente disminuyendo el orden del polinomio. En los datos de muestra, el valor de P para Weight2 (peso2 ) es pequeño, así que se necesita un modelo de al menos orden 2 para describir adecuadamente la relación entre Y y X.
* Análisis de Varianza: descomposición de la variabilidad de la variable dependiente Y en una suma de cuadrados del modelo y una suma de cuadrados residual o del error. De particular interés es la prueba de F y su valor de P asociado, que prueban la significancia estadística del modelo ajustado. Un Valor de P pequeño (menor de 0.05 si se trabaja con un nivel de significancia del 5%) indica que existe una relación significativa de la forma especificada entre Y y X. En los datos de muestra, el modelo es altamente significativo. 
* Estadísticas: estadísticas de resumen para el modelo ajustado, incluyendo: R-cuadrada - representa el porcentaje de la variabilidad en Y que ha sido explicado por el modelo de regresión ajustado, que va de 0% a 100%. Para los datos del ejemplo, la regresión ha dado cuenta de alrededor del 68.5% de la variabilidad en las millas por galón. El restante 31.5% es atribuible a la desviación alrededor de la línea, que puede deberse a otros factores, a errores de medición, o a una falla del modelo polinomial actual para ajustar los datos adecuadamente.
CÓDIGO DE REGRESIÓN POLINOMIAL EN MATLAB
function[]=regp(z,n)
[r,c]=size(z);
a=1;
plot(z(1:r,1),z(1:r,2),’.’,’LineWidth’,2)
hold on;
for i=1:n+1
for j=1:n+1
m(i,j)=0;
end
end
for i=1:n+1
k=i;
for j=1:n+1
for h=1:r
if i==1 && j==1
m(j,i)=r;
else
m(j,i)=m(j,i)+(z(h,1)^(k-1));
end
end
k=k+1;
end
end
for i=1:n+1
v(i,1)=0;
for j=1:r
v(i)=v(i,1)+(((z(j,1))^(i-1)) *z(j,2));
end
end
x=m\v;
i=n+1;
while i>=1
y(1,a)=x(i);
a=a+1;
i=i-1;
end
x=polyval(y,z(1:r,1));
plot(z(1:r,1),x,’r’);

Comentarios

Entradas populares de este blog

4.1.2 Método de mínimos cuadrados

4.2.1 Polinomio de interpolacion con diferencias divididas de newton

4.1.2.3 Regresión lineal multiple