jueves, 16 de abril de 2015

Diagrama de dispersión

Es útil cuando deseamos conocer la relación que puede existir entre dos variables; es decir, conocer qué sucede con una variable si la otra aumenta o disminuye.

Luego de ver la tendencia del diagrama de dispersión, se procede a realizar una regresión.

Típicamente la primera regresión intentada es la lineal. La mediada estadística utilizada para validar la relación entre las variables se conoce como el coeficiente de correlación.

martes, 14 de abril de 2015

QUE ES?

Regresión

Es el método que permite estudiar la relación entre dos o más variables, buscando un objetivo final de predecir o estimar el valor de una variable con base en el valor de otra variable conocida. Por ejemplo, la relación entre costos y producción; salarios y horas de trabajo; oferta y demanda; salarios y productividad; variación de la población y años, ventas y meses; etc.
  • Diagrama de dispersión
    Los valores de las variables se pueden representar gráficamente en un plano cartesiano, ubicando en el eje horizontal o abscisa los valores de la variable X y en el eje vertical u ordenada, los valores de la variable, Y.

    A este conjunto de puntos se le denomina diagrama de dispersión, dado que los puntos se ubican de forma dispersa en el plano cartesiano.

    El diagrama de dispersión generalmente nos indica una tendencia de la agrupación de los puntos, que puede ser lineal (hacia arriba o hacia abajo), exponencial, curvilínea o poligonal.

    La importancia de elaborar el diagrama de puntos es que nos permite determinar cuál es la mejor línea o curva que representa a ese conjunto de datos.
Gráficas de dispersión
(a) línea(b) curvilínea(c) sin relación


  • Regresión lineal
    La regresión lineal es una técnica empleada para desarrollar una ecuación que permita expresar la relación entre dos variables. Es decir, permite pronosticar o predecir el valor de una variable en función de los valores dados de la otra.
    Se trata pues de una dependencia funcional entre las dos variables. Una (la X) será la variable independiente mientras que la otra (la Y) será la variable dependiente. Se habla así de una regresión de Y sobre (o en función de) X. Al método que se utiliza regularmente para obtener la recta de regresión se le conoce como método de los mínimos cuadrados. La ecuación de la recta estimada está dada por:


    Donde:
    Se lee "Ye estimado". Variable dependiente (la que se va a predecir)
    Intercepción del eje Y, el punto donde la línea de regresión intercepta al eje Y cuando X = 0
    Variable independiente
    Pendiente de la línea de regresión (llamada coeficiente de regresión)

    En esta ecuación hay dos valores desconocidas: a y b, que deben determinarse aplicando el método de los mínimos cuadrados, buscando así la mejor recta que se ajuste a los datos. Se tiene entonces:



    Donde:
    Pendiente de la recta
    Intercepto de la variable Y
    Valores de la variable independiente
    :Valores de la variable dependiente
    :Tamaño de la muestra

    Pasos

    1. Elaborar el diagrama de dispersión para obsrvar la tendencia de los datos
    2. Obtener la ecuación de la recta que se ajuste mejor a los datos ( )
    3. Evaluar la ecuación por medio del índice de correlación para determinar el grado de relación entre las variables y así definir cuál es la utilidad de la ecuación para predecir y estimar.
    4. Si los datos están ajustados al modelo lineal, entonces se utiliza la ecuación obtenida de los datos para predecir y estimar.