Tablas y Fórmulas Estadísticas
TABLAS Y FORMULAS ESTADISTICAS
Carlo Magno Araya Profesor de Estadística Sede de Occidente Universidad de Costa Rica
1
Tablas y Fórmulas Estadísticas MEDIDAS DE POSICION Datos sin agrupar
Datos agrupados
Promedio aritmético de muestras k n
∑ xi fi
∑ xi
x=
x =
i =1
∑ fi
n
i =1
Promedio ponderado n
Mediana
∑ x i wi
x=
i=1 k
i =1 n
∑ wi
n - F i-1 2 *c M e = Li + f i
i =1
Mediana para n impar
M e = X n +1 2
Moda
d1 *c M o = Li + d 1+ d 2 d 1 = f i − f i −1 d 2 = f i − f i +1
Mediana para n par
Percentiles
X n + X n Me =
+1 2
2
2
m.n - F i-1 100 *c P m = Li + fi
Percentiles
Pm = X
m 100 ( n + 1)
Media geométrico
n x g = x 1 . x 2 .... x n
Media armónica xa =
n n
∑ i=1
1 xi
2
Tablas y Fórmulas Estadísticas MEDIDAS DE VARIABILIDAD Datos sin agrupar Datos agrupados Variancia de una muestra 1 k 1 n 2 2 ∑ ( xi − x ) 2 . f i s = sx2 = x − x ∑( i ) x n − 1 i =1 n − 1 i =1 2 n x n ∑ 1 2 i =1 i 2 sx = ∑ xi − n − 1 i =1 n
2 k ∑ xi f i k i=1 1 sx2 = . ∑ x2 f n - 1 i=1 i i n
Variancia de la población
1 N 2 σ x2 = ∑ ( xi − µ ) N i =1 2 N N ∑ xi 1 σ x2 = . ∑ xi2 - i=1 N i=1 N
Coeficiente de variación de una población
CV x =
σx * 100 µ
σ 2x =
2 1 k ∑ xi − µ . f i N i =1
(
)
2 k ∑ xi f i k i=1 1 σ 2x = . ∑ xi2 f i N i=1 N
Coeficiente de variación de una muestra sx CV x = * 100 x
Desviación media k
n
∑ | xi - x|. f i
∑ | xi - x| D. M.=
i=1
D. M.=
n
i=1
k
∑ fi
i=1
Medida de variabilidad para muestras pareadas s2d =
1 n 2 . ∑ di n -1 i=1
di = X 1i - X 2i
Variancia para variables dicotómicas σ 2 = PQ
$$ s 2 = pq
3
Tablas y Fórmulas Estadísticas INDICE DE PRECIOS Relativo simple de precios p I = n ⋅ 100 p0
Agregado simple de precios k
∑ pn
i =1 k
I=
⋅ 100
∑ p0
i =1
Promedio de los relativos simples de precios k p ∑ n i =1 p 0 I = ⋅ 100 k
Laspeyres
I PL =
Laspeyres
I QL =
Índices de precios ponderados Paasche
∑ pn q o ⋅ 100 ∑ po q o
I PP =
∑ pn q n ⋅ 100 ∑ po q n
Índices de cantidades ponderados Paasche
∑ po q n ⋅ 100 ∑ po q o
I QP =
∑ pn q n ⋅ 100 ∑ pn q o
Indice de precio de Fischer
∑ pn q0 ∑ pn qn ⋅ 100 I PF = ∑ p0 q0 ∑ p0qn
4
Tablas y Fórmulas Estadísticas MUESTREO ALEATORIO SIMPLE Población finita Población infinita Variancia del promedio
N - n s 2x . N -1 n N - n σ 2x 2 = . σx N -1 n
s2x =
s2x =
σ 2x =
s2x n
σ 2x n
Variancia de una proporción
s 2p$ =
$$ N - n pq . N -1 n
s2p$ =
$$ pq n
PQ N - n PQ . σ 2p$ = n N -1 n Tamaño de muestra para la estimación De un promedio y una proporción poblacional
σ 2p$ =
n1 n= n 1+ 1 N n1 n= n 1+ 1 N
Zα / 2 σ donde n1 = d
2
Z α / 2 PQ donde n1 = d
Z σ n = α/2 d
2
2
Z α / 2 PQ n = d
2
Intervalos de confianza para el promedio cuando la variancia de la población es conocida
σx N -n σx * Li = x ± Zα /2* N -1 n n Intervalos de confianza para el promedio cuando la variancia de la población es desconocida y n≤ ≤30 N - n sx sx * Li = x ± t α / 2(n-1)gl * Li = x ± t α / 2(n-1)gl * N -1 n n Li = x ± Z α / 2 *
Intervalos de confianza para una proporción si np>5 y nq>5 $$ N -n pq $$ pq * Li = p$ ± Z α / 2 * $ ± Zα / 2* = p L i N -1 n n
5
Tablas y Fórmulas Estadísticas ESTADISTICO PARA PRUEBA DE HIPOTESIS Promedios Para un promedio: variancia conocida
Proporciones Para una proporción
x-µ
Zc =
Zc =
σ
p$ - P PQ n
n
Para un promedio: variancia desconocida x-µ tc =
Diferencia de proporciones p$ 1 − p$ 2 p$ 1 q$1 p$ 2 q$ 2 + n1 n2
Zc =
s n
Diferencia de dos promedios: variancia Otra alternativa de cálculo: x1 x 2 conocida − x1 - x 2
Zc =
σ 12 n1
+
Zc =
σ 22 n2
n1
1 1 p(1 − p) − n1 n 2
p=
Diferencia de dos promedios: variancia desconocida x1 - x 2 *k k= tc = donde ( n1 - 1) S 12 + ( n2 - 1) S 22 Estadístico de prueba de independencia y de homogeneidad Ji-Cuadrada 2
r
(Oij - E ij )2
c
χ =∑ ∑ i=1 j=1
E ij =
E ij
Ni N j N
n2
x1 + x 2 n1 + n2
n1 n2 ( n1 + n2 - 2) n1 + n 2
Estadístico de prueba para muestras pareadas
tc =
d Sd / n
6
Tablas y Fórmulas Estadísticas ANALISIS DE REGRESION LINEAL SIMPLE Constante de regresión
Coeficiente regresión lineal n
n
a = y − bx
b=
i=1
i=1
Intervalos de confianza para el promedio de y dado un x0
(
n
n
i=1
i=1
i=1
n
Intervalos de confianza para una observación de y dado un x0
x0 - x 1 + Li = y$ ± t α / 2(n-2)gl * S e n SC x Error estándar de estimación n
i=1 2
n ∑ xi2 - ∑ xi i=1 i=1 n
)
2
(
x0 - x 1 1+ + n SC x
Li = y$ ± tα / 2(n-2)gl * S e
Suma de cuadrados de x
2 ∑ yi - a ∑ y i - b ∑ xi yi
Se =
n
n ∑ xi yi - ∑ xi ∑ yi
n
SC x = ∑ xi2 -
n ∑ xi i=1
2
n i=1 n-2 Inferencia sobre la constante y coeficiente de regresión Intervalos de confianza Estadístico de prueba de hipótesis a 1 x2 tc = a ± t ( n− 2 ) gl S e + 1 x2 n SCx + Se n SC x
Se
b ± t ( n−2 ) gl
tc =
SC x
b Se /
SC x
ANALISIS DE CORRELACION LINEAL SIMPLE Coeficiente de correlación lineal n
n
n
i=1
i=1
i=1
n ∑ xi yi - ∑ xi ∑ y i r=
2 n n n ∑ xi2 - ∑ x i i=1 i=1
2 n n * n ∑ y i2 - ∑ yi i=1 i=1
Estadístico para prueba de hipótesis sobre Coeficiente de correlación parcial r12 − r13 r23 el coeficiente de correlación tc =
r−ρ 2
1− r n−2
r12.3 =
(1 − r )(1 − r ) 2 13
2 23
)
2
7
Tablas y Fórmulas Estadísticas MUESTREO ALEATORIO ESTRATIFICADO Afijación de la muestra proporcional
Afijación de la muestra óptima o Neyman Nhσh = n ⋅ nh L ∑ Nhσ h h=1
Nh
nh = n ⋅
L
∑ Nh h=1
Promedio aritmético estratificado
y st =
Proporción estratificada
L 1 L ∑ N h yh = ∑ Wh xh N h=1 h =1 N Wh = h N
Variancia del promedio estratificada
p$ st =
Variancia de la proporción estratificada
l
l
Var ( y st ) = ∑ Wh2 ⋅Var ( yh )
y =1
Tamaño de la muestra para proporciones
Tamaño de la muestra para la estimación de la media de la población
1 Wh2 sh2 1 V = ∑ − ∑ Wh sh2 n wh N
( )
Var ( p$ st ) = ∑ Wh2 ⋅Var p$ h
y =1
Wh2 sh2 ∑ wh n= 1 W 2 s2 V+ ∑ h h N wh
L 1 L ∑ N h p$ h = ∑ Wh p$ h N h=1 h =1
Proporcional: n=
∑ Wh ph qh n0 n0 = donde n V 1+ 0 N
Optimo supuesto:
n0
n= 1+
n0
1 ∑ Wh ph qh NV
(∑ W =
h
ph qh V
)
2
8
Tablas y Fórmulas Estadísticas MUESTREO POR CONGLOMERADOS Estimación del promedio
Estimación de una proporción
A
A
∑ yi
y =
∑ ai
i=1 A
i =1 A
p$ =
∑ mi
∑ mi
i=1
i =1
MODELOS DE CRECIMIENTO Modelo aritmético
Modelo geométrico
N t = N 0 (1 + rt )
N t = N 0 (1+ r )
t
1 N - N0 r= ⋅ t t N0
N r= t No
1/ t
-1
Modelo exponencial N t = N 0 e rt
1 r = ln N t t N0
DISTRIBUCIONES DE PROBABILIDADES Distribución binomial n f ( x ) = p x q n − x x=0, 1,..., n x
Distribución de Poisson x −λ
f ( x) =
Distribución hipergeométrica D N − D x n − x f ( x) = N n
x=0, 1, 2,..., min(n,D)
f
λe
x!
x=0, 1,...
Distribución geométrica ( x ) = q x −1 p x=1, 2,...
TEOREMA DE BAYES P( A) P( D / A) P( A D ) = P( A) P( D / A) + P( B) P( D / A) TECNICAS DE CONTEO Combinaciones
Permutaciones
n Pr =
n! (n − x)!
nCr =
n! r!(n − x)!
9
Tablas y Fórmulas Estadísticas 10 ANALISIS DE VARIANCIA A UNA VIA: DISEÑO COMPLETAMENTE ALEATORIZADO Media total
Suma de cuadrados total
r
r
c
SCT = ∑ ∑ ( xij − x ) 2
∑ ∑ xij
x=
c
i =1 j =1
i =1 j =1
n
Suma de cuadrados de los tratamientos
c
SCTR = ∑ rj ( x j − x ) j =1
2
Suma del cuadrado de error
r
c
SCE = ∑ ∑ ( xij − x j ) 2 i =1 j =1
Prueba para diferencias entre pares de medias Diseños balanceados Diseños no balanceados Criterio de Tukey
Diferencia mínima significativa
T = qα , c , n − c
CME R
DMS J , K =
1 1 + (CME ) Fα , c −1,n − c rj rk
Diferencia mínima significativa
DMS =
2( CME ) Fα ,1,n − c r ANALISIS DE VARIANCIA A DOS VÍAS: DISEÑO ALEATORIZADO EN BLOQUES
Suma de cuadrados de bloques r
SCBL = ∑ ci ( xi − x ) 2 i =1
Suma de cuadrados del error
SCE = SCT − SCTR − SCBL
Tablas y Fórmulas Estadísticas 11 PRUEBAS NO PARAMETRICAS Prueba U de Mann-Whitney
n1 ( n1 + 1) − ∑ R1 2
U1 = n1n2 +
Media y desviación estándar de la distribución muestral para la prueba U de Mann-Whitney
µu =
n2 ( n2 + 1) − ∑ R2 2
U 2 = n1n2 +
n1n2 ( n1 + n2 + 1)
σu = Valor Z para normalizar la prueba U de Mann-Whitney
Z=
n1n2 2
12
Prueba de independencia ChiCuadrada
U i − µu
2 χ obs
σu
rc
( Oi − E i ) 2
i =1
Ei
=∑
Coeficiente de correlación de Spearman Desviación normal para la prueba de rangos de Spearman
rs = 1 −
6∑ di2
(
Z = rs n − 1
)
n n2 − 1
Prueba de Kruskal-Wallis
12 Ri2 K= ∑ − 3( n + 1) n( n + 1) ni Valor crítico para la prueba de Kruskal-Wallis
Ck =
n( n + 1) χα , k −1 12 2
1 1 + ni n j