Diagrama de dispersión y correlación at a Glance

Diagrama de dispersión y correlación

Los diagramas de dispersión son una forma fenomenal de expresar datos de dos variables, y hacer predicciones basadas en los datos. Al contrario de los histogramas y los diagramas de caja, los de dispersión muestran valores de datos individuales.

Este es el diagrama de dispersión que expresa la cantidad de dinero que se ganó Mateo cada semana trabajando en la tienda de su padre.

Las semanas están diagramadas en el eje x, y la cantidad de dinero que se ganó en esa semana en el eje y. En general, la variable independiente (la variable que no está influenciada por nada) está en el eje x y la variable dependiente (la que es modificada por la variable independiente) está en el eje y.

En este diagrama podemos ver que en la semana 2 Mateo se ganó alrededor de $125, y en la semana 18 estuvo cerca de los $165. Pero más importante aún es la tendencia. Por ejemplo, con estos datos podemos ver que Mateo gana cada vez más según pasan las semanas. Quizá su padre le da más horas a la semana o más responsabilidades.

Correlación

Con los diagramas de dispersión podemos ver cómo se relacionan ambas variables entre sí. Esto es lo que se conoce como correlación. Hay tres tipos de correlación: positiva, negativa y nula (sin correlación).

  • Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por ejemplo, la altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie también.
     
  • Correlación negativa: es cuando una variable aumenta y la otra disminuye. El tiempo de estudio y el tiempo que pasas jugando videojuegos, tienen una correlación negativa, ya que cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar videojuegos.
     
  • Sin correlación: no hay una relación aparente entre las variables. Los puntos en tus videojuegos y tu talla de zapato no parece tener ninguna correlación; mientras una aumenta, la otra no tiene ningún efecto.

El diagrama de dispersión que analizamos tiene una fuerte correlación positiva: a medida que las semanas aumentan, su pago también.

Línea de ajuste

Usamos la "línea de ajuste" para hacer predicciones basándonos en datos pasados. Hay muchas y muy complicadas fórmulas para encontrar esta recta, pero por ahora solo la dibujaremos a través de los puntos en la gráfica para que se ajuste a la tendencia que nos marcan los datos. Cuando dibujes la recta, asegúrate de que encaje con la mayor parte de los datos. Si hay un punto que está muy por encima o muy por debajo con respecto al resto (los atípicos) déjalo fuera de la recta.

Usando esta recta podemos predecir cuánto dinero se ganará Mateo en 20 semanas de trabajo (asumiendo que el patrón continúa).

Basándonos en estos ejemplos, Mateo se ganará, aproximadamente, $157 en la semana 20.

Diagrama de dispersión y correlación. Ejemplo 1

El siguiente diagrama de dispersión nos muestra la cantidad de sueño que se necesita al día dependiendo de la edad.

Como podrás ver, mientras más viejo eres, menos sueño necesitas (aunque creas que siempre es necesario dormir más).


Diagrama de dispersión y correlación. Ejemplo 2

Los siguientes diagramas de dispersión nos muestran el ingreso promedio para adultos basado en el número de años de educación (para el año 2006). 16 años de educación significa graduarte de un instituto universitario. 21 años sería obtener un doctorado.


Diagrama de dispersión y correlación. Ejercicio 1

Clasifica cada par de variables como positiva, negativa o no correlacionadas.

La cantidad de tiempo de estudio y el promedio de notas.


Diagrama de dispersión y correlación. Ejercicio 2

El tamaño del pie y la cantidad de zapatos en tu closet.


Diagrama de dispersión y correlación. Ejercicio 3

¿Qué tipo de correlación se muestra en la gráfica (positiva, negativa o sin relación)?


Diagrama de dispersión y correlación. Ejercicio 4

Si Frankie y Lucy venden la aplicación a $2.50 ¿cuántas aplicaciones podrían esperar vender y cuánto dinero podrían hacer?


Diagrama de dispersión y correlación. Ejercicio 5

Si el precio de la aplicación es de $3.00 ¿cuántas aplicaciones pueden esperar vender y cuánto dinero podrían hacer?