Distribución Geométrica: Guía completa para entender la Distribución Geométrica y sus aplicaciones

Pre

Introducción a la Distribución Geométrica

La Distribución Geométrica es una de las herramientas más útiles en estadística y probabilidad para modelar situaciones de ensayo con resultados binarios (éxito o fracaso) que se repiten de forma independiente hasta obtener la primera ocurrencia de éxito. Esta familia de distribuciones captura cuántos intentos se requieren para lograr el primer éxito, y sus variantes se adaptan a diferentes enunciados prácticos. En este artículo exploramos en detalle qué es la Distribución Geométrica, sus parámetros, versiones, propiedades, aplicaciones y métodos de estimación.

Qué es la Distribución Geométrica

La Distribución Geométrica describe la distribución de una variable aleatoria que cuenta el número de ensayos de Bernoulli necesarios para obtener el primer éxito. Cada ensayo es independiente y tiene la misma probabilidad de éxito p. En palabras simples, si repetimos un experimento binario con probabilidad de acierto p hasta que ocurra el primer acierto, la cantidad de intentos que necesitamos está gobernada por la Distribución Geométrica.

Parámetros y definiciones

El único parámetro de la Distribución Geométrica es la probabilidad de éxito p, con 0 < p ≤ 1. La forma en que definimos la variable aleatoria determina su soporte y sus fórmulas de probabilidad. Existen dos convenciones comunes, que son equivalentes en interpretación pero difieren en el número de fracasos o ensayos que cuentan.

Versiones de la Distribución Geométrica

  • Versión A (número de ensayos hasta el primer éxito): X toma valores en {1, 2, 3, …} y la función de masa de probabilidad (P.M.F.) es P(X = k) = (1 – p)^(k-1) p para k = 1, 2, 3, …
  • Versión B (número de fracasos antes del primer éxito): X toma valores en {0, 1, 2, …} y P(X = k) = (1 – p)^k p para k = 0, 1, 2, …

Funciones de distribución y de masa

En la versión A, la P.M.F. es P(X = k) = (1 – p)^(k-1) p para k ≥ 1, y la Función de Distribución Acumulada (CDF) es F(k) = P(X ≤ k) = 1 – (1 – p)^k para k = 1, 2, 3, …. En la versión B, la P.M.F. es P(X = k) = (1 – p)^k p para k ≥ 0, y la CDF es F(k) = P(X ≤ k) = 1 – (1 – p)^(k+1) para k = 0, 1, 2, ….

Momentos y características clave

Los momentos y las características de la Distribución Geométrica dependen de la convención que usemos. A continuación se muestran las fórmulas más comunes para cada versión.

Medias y varianzas

  • Versión A (número de ensayos hasta el primer éxito): Media E[X] = 1/p; Varianza Var(X) = (1 – p)/p^2.
  • Versión B (número de fracasos antes del primer éxito): Media E[X] = (1 – p)/p; Varianza Var(X) = (1 – p)/p^2.

Observación: ambas versiones comparten la misma varianza, pero sus medias difieren por la naturaleza del conteo (ensayos hasta el primer éxito vs. fracasos antes del primer éxito).

Función generadora de momentos y función generadora de probabilidad

La MGF (función generadora de momentos) de la Distribución Geométrica con la versión A es M_X(t) = p e^t / [1 – (1 – p) e^t], para t < -ln(1 – p). La PGF (función generadora de probabilidades) es G(s) = E[s^X] = p s / [1 – (1 – p) s], para |s| < 1/(1 – p). Estas herramientas son útiles para derivar momentos y estudiar sumas de variables geométricas.

Propiedades destacadas

La Distribución Geométrica posee propiedades interesantes que la hacen atractiva para modelar procesos de ensayo repetido. A continuación, las más relevantes.

Propiedad memoryless

La Distribución Geométrica es la única distribución discreta que posee la propiedad memoryless. En términos prácticos, para cualquier m, n ≥ 1 se cumple P(X > m + n | X > m) = P(X > n). Esta característica simplifica el análisis de procesos de repetición independiente y aporta una intuición fuerte sobre la naturaleza del primer éxito.

Relación con otras distribuciones

La Distribución Geométrica es un caso particular de la distribución binomial negativa cuando el número de éxitos deseados es 1. También es la distribución límite en algunas situaciones de Bernoulli para eventos raros. Además, la geometría de sus probabilidades convierte a la distribución geométrica en una pieza clave de modelos de renovación y de procesos de Poisson en ciertos contextos discretos.

Distribución Geométrica en la práctica: ejemplos y aplicaciones

Modelar con la Distribución Geométrica es especialmente útil en escenarios donde cada intento es independiente y la probabilidad de éxito no cambia entre intentos. A continuación, casos prácticos y ejemplos para comprender su utilidad en la vida real.

Aplicaciones en calidad y manufactura

En control de calidad, la Distribución Geométrica se usa para modelar el número de artículos examinados hasta encontrar el primero defectuoso. Si cada artículo tiene una probabilidad constante de ser defectuoso, la distribución de la posición del primer defecto sigue una Forma geométrica. Este enfoque facilita estimaciones de inventario, tiempos de inspección y costos asociados al muestreo.

Aplicaciones en marketing y ventas

En entornos digitales y ventas, puede emplearse para modelar el número de visitas o interacciones necesarias hasta que se logre una conversión, suscripción o compra. Si cada interacción tiene una probabilidad constante de conversión, el conteo de intentos necesarios para lograr la primera conversión sigue la Distribución Geométrica.

Aplicaciones en fiabilidad y mantenimiento

En sistemas de componentes que fallan de forma binaria, la Distribución Geométrica ayuda a estimar cuántos ciclos de operación son necesarios hasta la primera falla. Aunque en la práctica muchos sistemas muestran dependencias temporales, la geometría de este modelo sirve como una aproximación inicial para entender la duración hasta el primer fallo y planificar mantenimientos preventivos.

Estimación de p y métodos de ajuste

Para aplicar la Distribución Geométrica es necesario estimar el parámetro p a partir de datos observados. Existen diferentes enfoques dependiendo de la convención utilizada.

Estimación por máxima verosimilitud (MLE)

Si se usa la versión A (número de ensayos hasta el primer éxito) y se tienen observations X1, X2, …, Xn, la verosimilitud es L(p) = ∏_{i=1}^n (1 – p)^(X_i – 1) p. Al maximizar, se obtiene p̂ = n / (∑_{i=1}^n X_i) = 1 / X̄, donde X̄ es la media muestral. Para la versión B (número de fracasos antes del primer éxito), la verosimilitud es L(p) = ∏ (1 – p)^{X_i} p, y la estimación por MLE es p̂ = 1 / (1 + X̄), ya que E[X] = (1 – p)/p en esa convención.

Intervalos de confianza y pruebas

Con muestras grandes, se pueden construir intervalos de confianza para p utilizando aproximaciones normales de la estimación p̂. También se pueden usar enfoques exactos basados en la binomial para intervalos discretos, especialmente cuando la muestra es pequeña. En la práctica, la elección entre las dos convenciones de la Distribución Geométrica depende del contexto del problema y de cómo se mide el conteo de intentos.

Errores comunes y malentendidos

Al trabajar con la Distribución Geométrica, es fácil cometer confusiones. Aquí algunos puntos clave para evitar errores:

  • Confundir la convención A y la convención B. Aunque comparten la misma varianza, las medias difieren y eso impacta la interpretación de p y las estimaciones.
  • Asumir que la probabilidad de éxito cambia entre intentos. En la distribución geométrica, p es constante entre experimentos; si p cambia, se debe usar un modelo diferente (por ejemplo, una distribución binomial con p cambiante o modelos de Bernoulli no idénticamente distribuidos).
  • Ignorar la dependencia de los eventos. La Distribución Geométrica asume ensayos independientes; si hay dependencia, la adecuación del modelo disminuye.

Comparaciones rápidas y guías de uso

Para decidir si la Distribución Geométrica es adecuada a su problema, considere estas preguntas:

  • ¿Se repiten ensayos independientes con la misma probabilidad de éxito en cada intento?
  • ¿Estoy interesado en cuántos intentos se requieren para obtener el primer éxito?
  • ¿La variable de interés comienza en 1 (número de ensayos) o en 0 (número de fracasos)?

Relación entre la Distribución Geométrica y la distribución negativa binomial

La distribución geométrica puede verse como un caso particular de la distribución negativa binomial con r = 1, ya que describe el conteo de ensayos hasta el primer éxito. Esta relación ayuda a comprender la transición entre conteos de ensayos hasta ciertos hitos y configuraciones más generales donde se requieren varios éxitos antes de detenerse.

Conclusiones sobre la Distribución Geométrica

La Distribución Geométrica es una herramienta fundamental para modelar procesos de ensayo repetido con una probabilidad constante de éxito hasta lograr el primer encuentro exitoso. Sus dos convenciones de parametrización permiten adaptar el modelo a diferentes preguntas de investigación y contextos prácticos. Con su clara interpretación, fórmulas de probabilidad, momentos característicos y propiedades memoristas, la Distribución Geométrica continúa siendo una base sólida en estadística para el análisis de secuencias de Bernoulli y para la toma de decisiones basada en conteos de intentos requeridos para lograr un resultado deseado.

Recursos prácticos y consejos finales

  • Cuando informes resultados, especifica claramente qué convención estás usando (versión A: número de ensayos; versión B: número de fracasos).
  • Utiliza la media muestral para estimar p mediante p̂ = 1 / X̄ (versión A) o p̂ = 1 / (1 + X̄) (versión B).
  • Considera la memoria de los procesos: si tu fenómeno muestra dependencia entre ensayos, la Distribución Geométrica podría no ser adecuada y convendría explorar modelos alternativos.
  • Combina la Distribución Geométrica con otras herramientas estadísticas para construir modelos más ricos, por ejemplo en procesos de renovación o en cadenas de Markov discretas.