Estadística descriptiva
Medidas de tendencia central
Media (
donde:
= número total de datos = cada dato
Media (
donde:
= número de datos en la muestra
Mediana
- Si
es impar:
- Si
es par:
Moda
- Valor que aparece con más frecuencia en el conjunto de datos.
Medidas de dispersión
Varianza (
Desviación estándar (
Varianza (
Desviación estándar (
Rango
Probabilidades
Conceptos básicos
Probabilidad de un evento
Probabilidad complementaria
Reglas de probabilidad
Regla de la suma (para eventos mutuamente excluyentes)
Regla de la suma (para eventos no mutuamente excluyentes)
Regla del producto (para eventos independientes)
Regla del producto (para eventos dependientes)
donde
Teorema de los grandes numeros
A medida que el tamaño de una muestra aumenta, la media de la muestra se acercará a la media esperada de la población.
Forma Débil
Para una secuencia de variables aleatorias independientes e identicamente distribuidas (i.i.d.) con una media
para cualquier
Esto significa que la media muestral tiende a acercarse a la media poblacional, pero no hay garantía de que eso suceda en cada caso.
Forma Fuerte
Establece que la media muestral converge casi seguramente (con probabilidad 1) a la media de la población, cuando el tamaño de la muestra tienda a infinito
Esto Lsignifica que media muestral definitivamente se igualará a la media poblacional cuando el número de ensayos sea infinito.
Ejemplo
Tiramos un dado 1000 veces y calculamos la media de los resultados. A medida que el número de lanzamientos (n) aumenta, la media de los resultados se acercará a la esperanza matemática (
Si lanzamos el dado una vez, podemos obtener cualquier número del 1 al 6, pero a medida que aumentamos el número de lanzamientos, la media de esos lanzamientos se acercará a 3.5.
Combinatoria
Principio Fundamental de Conteo
Si una tarea puede realizarse de
Permutaciones
Permutaciones de
Permutaciones de
Combinaciones
Combinaciones de
Combinaciones con repetición
Teorema del Binomio
Expansión del binomio
Ensayos de Bernoulli
Un ensayo de Bernoulli es un experimento aleatorio que cumple con las siguientes características:
Resultados Discretos: Tiene solo dos resultados posibles, que se suelen denominar éxito (generalmente representado por 1) y fracaso (representado por 0).
Probabilidad Constante: La probabilidad de éxito pp es constante en cada ensayo. Por consiguiente, la probabilidad de fracaso es q=1−pq=1−p.
Independencia: Los ensayos son independientes, lo que significa que el resultado de un ensayo no afecta el resultado de otro.
Ejemplos
- Lanzar una moneda, donde “cara” puede considerarse un éxito y “cruz” un fracaso
- Realizar un examen, donde se considera “aprobado” como éxito y “no aprobado” como fracaso
- Medir la efectividad de un tratamiento médico en el que el resultado puede ser “efectivo” (éxito) o “inefectivo” (fracaso)
Distribuciones de probabilidad
Distribución discreta
Las distribuciones discretas son aquellas que describen probabilidades de variables que solo pueden tomar valores específicos y finitos, como enteros
Distribución Binomial
Modela el número de éxitos en una secuencia de ensayos independientes, cada uno con la misma probabilidad de éxito
donde:
= número de ensayos = número de éxitos = probabilidad de éxito en un solo ensayo = coeficiente binomial
Distribución Binomial Negativa
Modela el número de fracasos antes de alcanzar un número fijo de éxitos en ensayos de Bernoulli
donde:
es el número de éxitos requeridos es la probabilidad de éxito es el número de fracasos
Distribución Geométrica
Modela el número de ensayos hasta el primer éxito en una secuencia de ensayos de Bernoulli
donde:
es la probabilidad de éxito es el número de ensayos hasta el primer éxito
Distribución Hipergeométrica
Modela el número de éxitos en una muestra de tamaño fijo extraída sin reemplazo de una población finita
donde:
es el tamaño de la población es el número de éxitos en la población es el tamaño de la muestra
Distribución de Poisson
Modela el número de eventos que ocurren en un intervalo de tiempo fijo o en una región espacial, cuando los eventos ocurren con una tasa promedio constante
donde:
es la tasa promedio de ocurrencia de los eventos es el número de eventos
Distribución continua
Distribución Normal (Gaussiana)
Modela muchas variables en la naturaleza y la sociedad. Es simétrica y tiene forma de campana.
donde:
es la media es la varianza
Función de distribución acumulativa de la normal (CDF)
Distribución Exponencial
Modela el tiempo entre eventos en un proceso de Poisson. Es usada en la teoría de la fiabilidad y tiempos de espera
donde:
es la tasa de ocurrencia de los eventos.
Distribución Uniforme
Modela una variable que tiene la misma probabilidad de tomar cualquier valor dentro de un intervalo definido
donde:
y son los límites del intervalo
Distribución Gamma
Generaliza la distribución exponencial. Modela el tiempo hasta que ocurren
donde:
es un parámetro de forma es un parámetro de tasa
Distribución Beta
Se usa principalmente en estadística bayesiana para modelar distribuciones de probabilidad en proporciones o probabilidades
donde:
y son parámetros de forma es la función beta
Distribución Cauchy
Modela fenómenos en los que la media y la varianza no están definidas o son infinitas
donde:
es la localización es el parámetro de escala
Distribución t de Student
Se utiliza para estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño y la varianza es desconocida
donde:
son los grados de libertad, que determinan la forma de la distribución. A medida que aumenta, la distribución converge a una distribución normal estándar.
Correlación y regresión
Correlación
Coeficiente de correlación de Pearson (
Regresión lineal
Ecuación de la recta de regresión
donde:
= pendiente = intercepto
Pendiente
donde:
y son las desviaciones estándar de e , respectivamente.
Inferencia estadística
Estimación de parámetros
Estimación puntual (media muestral)
Intervalos de confianza
Intervalo de confianza para la media
donde
Pruebas de hipótesis
Prueba de hipótesis (valor p)
- Si
es la hipótesis nula y es la hipótesis alternativa:
Estadístico de prueba para la media
Correlación y regresión
Correlación
Coeficiente de correlación de Pearson (
Regresión lineal
Ecuación de la recta de regresión
donde:
= pendiente = intercepto
Pendiente
donde:
y son las desviaciones estándar de e , respectivamente.