4.1.2.1 Regrecion lineal simple

REGRECION LINEAL SIMPLE

El objeto de un análisis de regresión es investigar la relación estadística que existe entre una variable dependiente (Y) y una o más variables independientes ( , ... ). Para poder realizar esta investigación, se debe postular una relación funcional entre las variables. Debido a su simplicidad analítica, la forma funcional que más se utiliza en la práctica es la relación lineal.  Cuando solo existe una variable independiente, esto se reduce a una línea recta:
donde los coeficientes b0 y b1 son parámetros que definen la posición e inclinación de la recta.  (Nótese que hemos usado el símbolo especial  para representar el valor de Y calculado por la recta.  Como veremos, el valor real de rara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distinción.)
El parámetro b0, conocido como la “ordenada en el origen,” nos indica cuánto es Y cuando X = 0.  El parámetro b1, conocido como la “pendiente,” nos indica cuánto aumenta Y por cada aumento de una unidad en X.  Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables Y y X. En el análisis de regresión, estas estimaciones se obtienen por medio del método de mínimos cuadrados.
 Cuando varios caracteres son explicativos se puede aún realizar una regresión sobre una familia de polinomios en los diferentes caracteres, con grado fijo. Los términos que hacen intervenir productos del tipo serán interpretados como términos de interacción entre los caracteres explicativos. En la práctica, uno se limita a polinomios .

REGRESIÓN LINEAL SIMPLE EN MATLAB

En el siguiente ejemplo, para hacer el análisis de regresión simple, se carga el archivo de datos llamado "carsmall" que contiene algunas características de 100 autos. A cargar el archivo, el sistema crea la variable de tipo matriz X con las variables Horsepower (potencia o caballos de fuerza) y Cylinders (el numero de cilindros). Se trata entonces de explicar el rendimiento de vehículo (MPG) por medio del potencia del vehículo.

Primero queremos visualizar gráficamente la relación entre estas variables:

load carsmall
X = Horsepower
Y = MPG
plot(X,Y,'o') -- la o entre comillas simple sirve para que el diagrama no muestre lineas entre los puntos

Cuando damos el ultimo comando se abre la interfaz de la figura 1. En ella vemos que existe una relación inversa entre la potencia con el rendimiento de los autos. Esto significa que a medida que aumenta la potencia, disminuye el rendimiento o las millas por galón. Para el ajuste de los datos a un modelo particular, del menú "Tools" se escoge la opción "Basic fitting".  


Comentarios

Entradas populares de este blog

4.1.2 Método de mínimos cuadrados

4.2.1 Polinomio de interpolacion con diferencias divididas de newton

4.1.2.3 Regresión lineal multiple