Independencia
Es una desgracia que tenemos los humanos: nos es muy difícil estimar probabilidades. Somos capaces de habilidades casi milagrosas, que compartimos con el resto de los mamíferos en mayor o menor grado: podemos calcular la velocidad y dirección en la que debe salir un proyectil de nuestra mano para alcanzar un blanco móvil, cuestión no sólo no trivial, sino muy complicada. Y lo hacemos instintivamente. Podemos reconocer los tonos de voz de múltiples personas, para lo cual hemos tenido que realizar previamente un análisis de Fourier complicadísimo de las ondas sonoras, extrayendo la información relevante no sólo del contenido de los mensajes, sino de las características propias que nos hacen identificar cada voz con su dueño. Esto es una proeza casi inconcebible, y la realizamos sin esfuerzo alguno.
Sin embargo, por alguna razón la evolución no nos ha dotado de la capacidad para estimar probabilidades de forma automática, y debemos recurrir al esfuerzo, la concentración en el problema y la metodología matemática. Sin duda es una pena: el tema no es en absoluto baladí, sino que presenta una interés evidente con enorme implicación en la vida real.
La teoría de la probabilidad hunde sus cimientos en la teoría de la medida, que es el estudio de unas funciones de conjunto con unas determinadas buenas propiedades, pero es mucho más que teoría de la medida. Uno de los conceptos que la enriquecen es el de independencia, concepto ausente en teoría de la medida.
Para andar por casa, diremos que una variable aleatoria es la materialización numérica de un suceso debido al azar. Por ejemplo: el número de puntos conseguidos al lanzar un dado, el número de hijos de cualquier pareja, el número de coches de color verde que me cruzo cada vez que vuelvo a casa desde el trabajo.
Dos variables aleatorias son independientes cuando la realización de una no influye en la de la otra. En dicho caso, las probabilidades se pueden multilicar sin ningún problema. Si la probabilidad de un suceso es p y la de otro indepeniente es q, la probabilidad de que se den los dos es pq.
Vamos a proponer un ejemplo enormemente sencillo para ver lo que nos cuesta estimar probabilidades:
En un matrimonio con dos hijos, si uno de ellos es chica, ¿qué probabilidad hay de que el otro también sea chica?
Es un buen ejemplo de dos sucesos independientes: el sexo de uno de los hijos no influye para nada en el sexo del otro. En un razonamiento ingenuo diríamos que no hay duda: el otro puede ser tanto chico como chica con igual probabilidad, luego la respuesta es el 50%.
Veámoslo un poco más en profundidad.
Sea X1 el sexo del primer hijo, y X2 el del segundo, que daremos arbitrariamente el valor de 0 para varón y 1 para hembra. Las probabilidades de ocurrencia de ambas variables aleatorias son:
P(X1=0)=P(X1=1)=0,5
P(X2=0)=P(X2=1)=0,5
Como ambos sucesos son independientes, tenemos que las probabilidades de ambos sucesos se pueden multiplicar, obteniendo:
P(X1=0,X2=0)=P(X1=0,X2=1)=P(X2=1,X2=0)=P(X2=1,X2=1)=0,25
Tenemos cuatro posibilidades equiprobables: chico-chico (0,0); chico-chica (0,1),chica-chico(1,0) y chica-chica(1,1); cada una con una probabilidad del 25%.
Hasta aquí ningún problema, ¿verdad?
Ahora el enunciado del problema nos indica que de las cuatro posibilidades a priori, sólo tenemos tres, dado que al menos una hembra hay.
Podemos tener chico-chica, chica-chico y chica-chica, con igual probabilidad. Tres posibilidades, de las cuales sólo una cumple que la otra también es chica, luego la probabilidad pedida es 1/3, o el 33,33%.
Hemos demostrado que en un matrimonio con dos hijos en el que al menos uno de los cuales es chica, es el doble de probable que el otro sea chico (2/3 frente a 1/3). Dada la simetría de sexos, podemos generalizar:
Si sabemos que al menos uno de los dos hermanos es de un sexo dado, es el doble de probable que el otro sea de sexo contrario .
¿Cómo es posible que ocurra esto, y que sigamos defendiendo que el sexo del primero y del segundo son independientes?
La comprensión de este asunto es de importancia capital para entender la independencia entre variables aleatorias, y queda pendiente para otro post. Como siempre, si ustedes quieren.
Sin embargo, por alguna razón la evolución no nos ha dotado de la capacidad para estimar probabilidades de forma automática, y debemos recurrir al esfuerzo, la concentración en el problema y la metodología matemática. Sin duda es una pena: el tema no es en absoluto baladí, sino que presenta una interés evidente con enorme implicación en la vida real.
La teoría de la probabilidad hunde sus cimientos en la teoría de la medida, que es el estudio de unas funciones de conjunto con unas determinadas buenas propiedades, pero es mucho más que teoría de la medida. Uno de los conceptos que la enriquecen es el de independencia, concepto ausente en teoría de la medida.
Para andar por casa, diremos que una variable aleatoria es la materialización numérica de un suceso debido al azar. Por ejemplo: el número de puntos conseguidos al lanzar un dado, el número de hijos de cualquier pareja, el número de coches de color verde que me cruzo cada vez que vuelvo a casa desde el trabajo.
Dos variables aleatorias son independientes cuando la realización de una no influye en la de la otra. En dicho caso, las probabilidades se pueden multilicar sin ningún problema. Si la probabilidad de un suceso es p y la de otro indepeniente es q, la probabilidad de que se den los dos es pq.
Vamos a proponer un ejemplo enormemente sencillo para ver lo que nos cuesta estimar probabilidades:
En un matrimonio con dos hijos, si uno de ellos es chica, ¿qué probabilidad hay de que el otro también sea chica?
Es un buen ejemplo de dos sucesos independientes: el sexo de uno de los hijos no influye para nada en el sexo del otro. En un razonamiento ingenuo diríamos que no hay duda: el otro puede ser tanto chico como chica con igual probabilidad, luego la respuesta es el 50%.
Veámoslo un poco más en profundidad.
Sea X1 el sexo del primer hijo, y X2 el del segundo, que daremos arbitrariamente el valor de 0 para varón y 1 para hembra. Las probabilidades de ocurrencia de ambas variables aleatorias son:
P(X1=0)=P(X1=1)=0,5
P(X2=0)=P(X2=1)=0,5
Como ambos sucesos son independientes, tenemos que las probabilidades de ambos sucesos se pueden multiplicar, obteniendo:
P(X1=0,X2=0)=P(X1=0,X2=1)=P(X2=1,X2=0)=P(X2=1,X2=1)=0,25
Tenemos cuatro posibilidades equiprobables: chico-chico (0,0); chico-chica (0,1),chica-chico(1,0) y chica-chica(1,1); cada una con una probabilidad del 25%.
Hasta aquí ningún problema, ¿verdad?
Ahora el enunciado del problema nos indica que de las cuatro posibilidades a priori, sólo tenemos tres, dado que al menos una hembra hay.
Podemos tener chico-chica, chica-chico y chica-chica, con igual probabilidad. Tres posibilidades, de las cuales sólo una cumple que la otra también es chica, luego la probabilidad pedida es 1/3, o el 33,33%.
Hemos demostrado que en un matrimonio con dos hijos en el que al menos uno de los cuales es chica, es el doble de probable que el otro sea chico (2/3 frente a 1/3). Dada la simetría de sexos, podemos generalizar:
Si sabemos que al menos uno de los dos hermanos es de un sexo dado, es el doble de probable que el otro sea de sexo contrario .
¿Cómo es posible que ocurra esto, y que sigamos defendiendo que el sexo del primero y del segundo son independientes?
La comprensión de este asunto es de importancia capital para entender la independencia entre variables aleatorias, y queda pendiente para otro post. Como siempre, si ustedes quieren.
5 comentarios
opqa -
"Podemos reconocer los tonos de voz de múltiples personas, para lo cual hemos tenido que realizar previamente un análisis de Fourier complicadísimo de las ondas sonoras," ... "Esto es una proeza casi inconcebible, y la realizamos sin esfuerzo alguno."
Eso no es del todo correcto, no es nuestro cerebro el que realiza el análisis de Fourier, éste se produce de forma mecánica en el caracol del oído interno. A nuestro cerebro ya llega la información en el espectro de frecuencias. No deja de tener mérito, pues procesar esa información y extraer de ella las características de cada tono de voz e identificar las palabras (separándolas del ruido) sigue siendo una tarea muy complicada, pero no tanto como si recibiéramos directamente la onda pura (como en un micrófono) y tuviéramos que procesarla en esa forma.
Tio petros -
Te iba a responder, pero creo que el el siguiente post queda claro. Un saludo.
jose -
Hay dos cosas separadas:
1º) Miramos la probabilidad del sexo del primer hijo. Luego, aparte y sin tener nada que ver, miramos la probabilidad del sexo de otro hijo, haciendo como que el hijo que ya ha nacido no existe. Aquí hay 50% y 50%
2º) Miramos la probabilidad de que salgan los dos hijos del mismo sexo, o de sexos distintos. Pero esta vez los dos, no uno y luego el otro. Hay 50% de distintos sexos y 25% los dos hombres y 25% las dos mujeres
¿si?
Tio Petros -
Dices "una vez que has tenido el primero volvemos al 50%"
A pesar de que tienes toda la razón, eso no contradice para nada mi afirmación anterior.
Es importante comprender que es muy distito afirmar que "el primero ha sido chica" que afirmar que "al menos uno de los dos es chica". La primera afirmación se refiere a la variable X1, que sabemos que es independiente de X2, pero la segunda afirmación no se refiere a variable aleatoria alguna que hayamos definido aún. Mañana más.
manufirun -
Hace unos años le tocó el gordo, igual tiene un don para desafiar a las leyes de la probabilidad.