Administración de empresas/Estadística para los negocios/Regresión y correlación

De testwiki
Ir a la navegación Ir a la búsqueda

Plantilla:Cursos

Correlación

Es una técnica estadística que permite medir el nivel de relación de dos variables, basándose en valores cuantitativos.

Medición

Para determinar el grado de relación entre variables, se usa la siguiente fórmula (coeficiente de Pearson):

r=n(Σxy)(Σx)(Σy)[n(Σx2)(Σx)2][n(Σy2)(Σy)2]

Donde:

Σxy = Suma total de los valores multiplicados entre X e Y
Σx = Suma total de solamente los valores de X
Σx2 = Suma total de los valores de X al cuadrado
Σy = Suma total de solamente los valores de Y
Σy2 = Suma total de los valores de Y al cuadrado
n = Número de valores tomados (en pares). Se puede determinar mediante
el número de filas cuando los datos se ordenan verticalmente y en pares.

  • Dependiendo del resultado obtenido a través de la fórmula, se le asigna un grado de relación:


Valores Relación
dePlantilla:Espacio± 0.80Plantilla:EspacioaPlantilla:Espacio± 0.99 Muy alta
dePlantilla:Espacio± 0.60Plantilla:EspacioaPlantilla:Espacio± 0.79 Alta
dePlantilla:Espacio± 0.40Plantilla:EspacioaPlantilla:Espacio± 0.59 Moderada
dePlantilla:Espacio± 0.20Plantilla:EspacioaPlantilla:Espacio± 0.39 Baja
dePlantilla:Espacio± 0.01Plantilla:EspacioaPlantilla:Espacio± 0.19 Muy baja

Ejemplo

Un establecimiento desea ampliar el número de cajas que posee.

Se ha recolectado información del tiempo de espera de sus clientes y el número de cajas, los datos se muestran a continuación:

Tiempo de espera Número de cajas
17.1 5
21.3 4
10.2 8
19.4 4

Desarrollo

1.Plantilla:EspacioSe determina qué variable depende de otra.
Se puede usar la pregunta "¿Si Variable 1 aumenta, Variable 2 también lo hace?", si es correcto entonces Variable 1 es la variable independiente o la variable X.


2.Plantilla:EspacioSe realiza un cuadro para determinar los valores que se usarán en la fórmula.


Tiempo de espera (Y) Número de cajas (X) XY
17.1 5 85.5 25 292.41
21.3 4 63.9 9 453.69
10.2 8 81.6 64 104.04
19.4 4 77.6 16 376.36
_____________ _____________ _____________ _____________ _____________
68 20 308.6 114 1226.5


3.Plantilla:EspacioCon los datos, reemplazar en la fórmula y determinar la correlación.


r=4(308.6)(20)(68)[4(114)(20)2][4(1226.5)(68)2]


r=1234.41360[456400][49064624]


r=125.6[56][282]


r=125.615792


r=125.6125.66


r=0.99


La relación entre el Número de Cajas y el Tiempo de Espera es muy alta

Regresión

Es una técnica estadística que permite estimar nuevos valores mediante la creación y uso de modelos matemáticos.

Regresión lineal simple

Modelo de estimación:

y^=Bo+B1(x^)


B1=n(Σxy)(Σx)(Σy)[n(Σx2)(Σx)2] Bo=y¯B1(x¯)
Donde:

Σxy = Suma total de los valores multiplicados entre X e Y
Σx = Suma total de solamente los valores de X
Σx2 = Suma total de los valores de X al cuadrado
Σy = Suma total de solamente los valores de Y
n = Número de valores tomados (en pares). Se puede determinar mediante
el número de filas cuando los datos se ordenan verticalmente y en pares.

Donde:

B1 = Valor obtenido en la fórmula B1
y¯ = Promedio de todos los valores de la variable Y
x¯ = Promedio de todos los valores de la variable X


Ejemplo

Se toman los datos del ejemplo anterior

Un establecimiento desea ampliar el número de cajas que posee.

Se ha recolectado información del tiempo de espera de sus clientes y el número de cajas, los datos se muestran a continuación:

Tiempo de espera (Y) Número de cajas (X) XY
17.1 5 85.5 25
21.3 4 63.9 9
10.2 8 81.6 64
19.4 4 77.6 16
_____________ _____________ _____________ _____________
68 20 308.6 114

Desarrollo

y^=Bo+B1(x^)


B1=4(308.6)(20)(68)[4(114)(20)2]


B1=2.24

Bo=172.24(5¯)


Bo=28.2

    • Por lo que se tiene que el modelo de estimación es...


Tiempodeespera=28.2+[2.24(Nu´merodecajas)]