viernes, 27 de junio de 2014

El problema de los aniversarios

Enunciado: El problema de los aniversarios
Cierto número $n$ de personas se encuentran reunidas en una sala de fiestas. El animador escoge a una de ellas y le pregunta si cree muy probable que entre los presentes haya por lo menos dos personas que cumplan años el mismo día del año. ¿ Si fuese usted el espectador al que se le pregunta qué respondería ?

Solución:
Muchas personas tienden a dar una probabilidad muy pequeña como respuesta a dicha pregunta, pues engañados por su intuición, les parece que así debería ser, lo cual es un error. Resolvamos el problema, que, por cierto, fue popularizado a raiz de la publicación de un trabajo de Zoe Emiliy Schnabel, en 1938, en el American Mathematical Monthly que trataba sobre un problema de estimación: [ The Estimation of Total Fish Population of a Lake ].


Por la propiedad del contrario se cumple que P("por lo menos dos personas de entre un número n de personas reunidas coincidan en la fecha de su aniversario") = 1-P("no haya ninguna coincidencia). Veamos un ejemplo, suponiendo que el número de personas en la sala es $25$ y que partiendo del supuesto de que las fechas de nacimiento de cada una de ellas son independientes ( esto es, no hay mellizos o gemelos, y no se da ninguna circunstancia que invalide dicha independencia ), entonces, como la probabilidad que no haya ninguna coincidencia es $$\dfrac{365}{365}\cdot \dfrac{364}{365} \cdot \dfrac{363}{365} \cdot \ldots \cdot \dfrac{365-25+1}{365}$$
la probabilidad de que al menos haya una coincidencia es
$$1-\dfrac{365}{365}\cdot \dfrac{364}{365} \cdot \dfrac{363}{365} \cdot \ldots \cdot \dfrac{365-25+1}{365} \approx 0,57$$
que es más del $50\,\%$, en contra de la intuición por la que, en un principio, sin reflexionar demasiado, uno podría dejarse llevar a la hora de responder; evidentemente, para encontrar por lo menos dos personas que cumplan años el mismo día del año, de forma segura (probabilidad igual a $1$, esto es del $100\,\%$ ), debería haber en la sala un mínimo de $365+1$ personas, de acuerdo con el principio de recuento del palomar o de las cajas de Dirichlet, lo cual es ciertamente correcto, pero de lo que se trata es de calcular la probabilidad para el caso en que $n \le 365$, que es lo interesante. Vamos a arrojar un poco de luz sobre este asunto.

Podemos expresar el cálculo que hemos realizado de manera adecuada, para poder hacer algunos cálculos que nos permitan acabar de esclarecer qué es lo que realmente se obtiene para un número arbitrario de personas, $n$: $$P(\text{al menos dos personas coincidan en su aniversario})=\displaystyle 1-\dfrac{\prod_{i=365-n+1}^{365}\,i}{365^n} $$

Comprobemos, primero, que la probabilidad de que al menos dos coincidan en la fecha de su aniversario para un número pequeño de personas es -- tal como nos podría parecer sin hacer ningún cálculo -- pequeña; en efecto, si en la sala sólo hay dos personas, se obtiene una probabilidad muy pequeña, como debe ser:
$$\displaystyle 1-\dfrac{\prod_{i=365-2+1}^{365}\,i}{365^2} = 0,00274 \approx 0,27 \,\%$$
En este caso, podemos hacer un cálculo más sencillo, razonando de la siguiente manera: si sólo hay dos personas en la sala, habiendo seleccionado una, la probabilidad que la otra cumpla años el mismo día que los cumple la primera es, por el principio de Laplace, igual a $\dfrac{1}{365}$, que es igual, evidentemente al
resultado que se obtiene a partir de la fórmula deducida para el caso general, esto es, $0,00274$.

Hemos visto antes que, para $n=25$ la probabilidad es ya mucho mayor, lo cual debería habernos causado ya una cierta sorpresa. Veamos qué ocurre para $n=30$
$$P(\text{al menos dos personas coincidan})=\displaystyle 1-\dfrac{\prod_{i=365-30+1}^{365}\,i}{365^{30}} \approx 71\,\%$$
y para $n=40$:
$$P(\text{al menos dos personas coincidan})=\displaystyle 1-\dfrac{\prod_{i=365-40+1}^{365}\,i}{365^{40}} \approx 90\,\%$$
Así que, para valores de $n$ "no muy grandes" ( una sala de fiestas tiene un aforo mucho mayor que $40$, que es el valor para el que acabamos de ver que la probabilidad es ya muy alta ) enseguida rozamos el $99\,\%$ de probabilidad; en efecto, para $n=55$ obtenemos
$$P(\text{al menos dos personas coincidan})=\displaystyle 1-\dfrac{\prod_{i=365-55+1}^{365}\,i}{365^{55}} \approx 99\,\%$$
por lo que la persona a la cual preguntaba el animador podría responder a su pregunta dando una probabilidad superior al $99\,\%$ para un número de personas superior a $55$.

En resumen, la probabilidad de que se den muchas coincidencias es mucho más alta de lo que, aparentemente, nos pueda parecer; el problema del aniversario es un ejemplo de ello y se inspiró en su en las conclusiones a las que llegó Zoe Emily Schnabel en su trabajo sobre estimación de la población de peces en un lago, que fue, en su momento, un hallazgo muy importante en estadística aplicada a la ecología.

-oOo-
Observaciones:
Los cálculos, que son demasiado costosos para hacerlos con una calculadora científica básica, se han realizado con una calculadora TI Voyage 200 ( alternativamente, con MAXIMA ).

-oOo-

Comentarios:

(1) Pero, cuidado, el animador, habiendo dado respuesta a su pregunta, podría hacer otra más, aparentemente muy parecida, pero muy distinta a la que ya hemos dado respuesta:
  "-- Entonces, ¿ cree usted ( refiriéndose a una determinada persona ) que la probabilidad de encontrar en la sala exactamente una persona que cumpla años el mismo día que usted, ronda ese valor tan alto, como ha dicho antes ? ( en la sala hay $55$ personas, incluido usted )

Cabe, ahora, no caer en la respuesta fácil de contestar afirmativamente -- lo cual , aparentemente, se seguiría de la respuesta a la primera pregunta --, pues sería un error: la pregunta que se hace ahora no es la misma. Fijémonos en el hecho de que al preguntar a una persona, fijamos como dato su fecha de nacimiento lo cual no hacíamos al responder a la primera pregunta, y esto, claro, hace que la probabilidad pedida ahora sea mucho menor. Hagamos el cálculo para darnos cuenta de ello; en este caso debemos entender este segundo problema como un problema de distribución binomial de una variable aleatoria $X$ ( número de personas de la cuyo aniversario coincide con el de una de ellas, a la que se le hace la pregunta ), y, por tanto, los valores que puede tomar son $\{0,1,2,\ldots,54\}$ ( lógicamente, debemos descontar del total a la persona preguntada ). Entonces, por la función de cuantía de dicha distribución de probabilidad sabemos que $\displaystyle P\{X=i\}=\binom{n}{i}\,p^{i}\,(1-p)^{n-i}$, donde $i \le n$

Así, pues, la respuesta a la pregunta vendrá dada por
$\displaystyle P\{X=1\}=\binom{54}{1}\,(\dfrac{1}{365})^{1}\,(1-\dfrac{1}{365})^{54-1} \approx 13\,\%$, que evidentemente es más bien, pequeña. Fijémonos que ésto no contradice lo encontrado antes, pues la pregunta es distinta ahora, por referirse a una persona en concreto (a la persona preguntada), cuyo aniversario pueda coincidir con alguna de las otras personas de la sala.

(2) Incluso si la pregunta hubiese sido
  "-- ¿ cree usted que la probabilidad de encontrar alguna de las otras personas del público que cumpla años el mismo día que usted, es tan alta como ha dicho antes ? ( en la sala hay $55$ personas, incluido usted )
la probabilidad que se encuentra es bastante pequeña; en efecto
$\displaystyle P\{X \le 54\}=P\sum_{i=1}^{54}\,P\{X=i\}=\sum_{i=1}^{54}\,\binom{54}{i}\,(\dfrac{1}{365})^{i}\,(1-\dfrac{1}{365})^{54-i} \approx 14\,\%$

$\square$

[nota del autor]