Tio Petros |
![]() Este blog es una invitación a dar un paseo por la matemática. Intentaré comentar los aspectos más bellos y si es posible menos tópicos de la misma. En todo caso, es tan sólo un paseo que debe darse como se hace en una soleada tarde de verano: con placer.
|
|
|
Se muestran los artículos pertenecientes a Noviembre de 2005.
Si lanzamos una moneda y anotamos el número de caras y cruces, progresivamente la razón de los dos números tiende a la unidad; y sin embargo la probabilidad de conseguir el mismo número de caras que de cruces tiende a cero. (Paradoja de De Moivre) Pocos resultados hay en la teoría de la probabilidad tan globales, importantes y fáciles de entender (en su enunciado) como las Leyes de los grandes números. Sin embargo es muy corriente encontrar comentarios, razonamientos y anumerismos varios que demuestran que esta facilidad es engañosa. Las leyes de los grandes numeros vienen a ser la justificación de la interpretación frecuentista de la probabilidad: si se realiza n veces un experimento y r representa el número de veces que se ha dado un determinado resultado, el cociente r/n tiende a estabilizarse alrededor de un punto p según va creciendo el número de pruebas,, que no es sino la probabilidad de dicho suceso. Ilustraremos esto con el lanzamiento de una moneda, suceso simple donde los haya: Los sucesivos resultados del experimento repetido n veces se pueden expresar mediante una colección de n variables aleatorias X1,..., Xn. Si no existe relación entre un experimento y los siguientes diremos que son independientes (sacar una cara a la cuarta tirada no influye en los resultados de las siguientes tiradas). En estas condiciones, las variables X1,..., Xn tienen la misma distribución. Cada una de las Xi tiene, como variable aleatoria que es, una media y una varianza. Llamaremos E[Xi] a la media o esperanza de la variable Xi. En estas condiciones, llamaremos en un alarde de imaginación media muestral a Yn= 1/n · (X1+...+ Xn) Es evidente que Y es también una variable aleatoria, que tendrá su media y su varianza. Llamaremos an = E [Yn] al valor esperado de la media muestral. Diremos que una sucesión de variables aleatorias X1,..., Xn cumple la ley fuerte de los grandes números cuando Yn - an → 0 casi seguro. Dicho en lenguaje coloquial: la probabilidad de que Yn diste de an un valor e tiende a cero al crecer n, por pequeño que sea e. Los sucesivos teoremas sobre la ley de los grandes números no hacen sino investigar las propiedades (muy generales) que deben cumplir las variables aleatorias para que cumplan efectivamente la ley. Es importante resaltar que el enunciado anterior es un enunciado probabilístico sobre teoría de la probabilidad. Nos está hablando de una probabilidad asintóticamente nula para un suceso muy concreto relacionado con la media muestral de una colección de observaciones. Esta ley es cumplida por la mayoría de las variables aleatorias usuales, “de buen comportamiento”, y nuestro experimento de lanzamiento de monedas la cumple, entre otros, por el llamado Teorema de Kintchine que dice que: Si Xn es una sucesión de variables aleatorias independientes e igualmente distribuidas con media finita, entonces se cumple la ley fuerte para dicha sucesión de variables aleatorias . El nivel de exigencia del teorema de Kintchine es realmente bajo: las variables deben ser independientes (un lanzamiento no influye en los siguientes), y las variables deben tener media finita. Hay versiones incluso más generales, que hacen que la ley se cumpla en casi todos los casos no patológicos. En nuestro caso, dado que cada experimento tiene dos posibles resultados (cara o cruz, que asimilaremos a los valores 0 y 1 de las variables) con idéntica probabilidad, cualquiera de las Xi tiene una distribución de Bernoulli, con P{ Xi = 0 } = 0.5 P{ Xi = 1 } = 0.5 Y por tanto E[Xi ] = 0.5 an = E[Yn] = 1/n.( E[X1 ]+ ... + E[Xn ] = (1/n) . (n/2) = 0.5 Luego en nuestro caso la ley fuerte de los grandes números nos indica que para n suficientemente grande, la probabilidad de que la media muestral se desvíe de 0.5 en una cantidad no nula es menor que cualquier infinitésimo e. No importa lo ínfimo de la desviación, si el número de pruebas es suficientemente grande, la media muestral caerá dentro del intervalo (0’5 - e , 0’5 + e ) . Dado que estamos evaluando la esperanza de la variable [Yn], media muestral; este resultado nos indica que la fracción de caras será el 50% del total, y cruces el otro 50% del total. Otra forma de decir lo mismo es que el cociente del número de los resultados “cara” por el número de los resultados “cruz” se separe de la unidad tan poco como queramos, con sólo aumentar el número de pruebas. ¿Quiere esto decir que el número de caras y de cruces va a ser exactamente el mismo si tiramos un número enorme de veces (enorme y par)? Pues no. No sólo no quiere decir esto, sino que la realidad es que la probabilidad de que los lanzamientos empaten decrece hacia cero con n. Demostrar esto y comentar las implicaciones de la paradoja de De Moivre será objeto del próximo post. En el post anterior vimos que cuando tiramos una moneda repetidas veces el cociente entre las caras y las cruces obtenidas tiende a la unidad. Más exactamente: dado un número ε , tan pequeño como queramos, la probabilidad de que dicho cociente diste de la unidad más de ε tiende a cero al crecer n. Lo vimos en el entorno de las leyes de los grandes números, y dijimos que en unas condiciones muy generales, las sucesiones de variables aleatorias cumplen dicha ley, que por otro lado es la que une la interpretación axiomática de Kolmogorov de la toería de la probabilidad, nacida de la teoría de la medida, con la interpretación frecuentista más intuitiva y universal. A demás de ser la Teoría de la Probabilidad una parte importante y muy técnica de la matemática, existe una obvia cotidianeidad de sus aspectos más fundamentales con la vida actual de cada uno de nosotros. Todo el mundo entiende qué quiere decrie que un suceso tiene una probabilidadd dada, o al menos todo el mundo cree entenderlo. Lo que ocurre es que el anumerismo acecha detrás de muchas de las afirmaciones que se oyen en la calle, y éste es un terreno especialmente abonado para la proliferación de ideas anuméricas. El teorema de Kintchine mencionado en el post anterior exige que una sucesión de variables aleatorias sea idénticamente distribuida (además de tener media finita). En estas condiciones se cumple la ley de los grandes números, y el cociente de resultados tiende con probabilidad uno a la probabilidad. Es importante entender que la condición resaltada es la usada en el teormea para la demostración, y que significa que todas las variables (todos los lanzamientos) son esencialmente idénticos. La moneda no tiene memoria, no sabe qué resultados se han obtenido anteriormente, ni existe ninguna ley de compensación que haga que tras diez caras sea más sencillo obtener una cruz. No hace falta en absoluto que tal ley de compensación exista para que las frecuencias de aparición se estabilicen alrededor de la probabilidad del suceso cuando aumenta el número de tiradas. Ya lo he comentado en alguna ocasión: dos años de discusiones no fueron suficientes para convencer de ello a un jugador de lotería anumérico con el que compartía trabajo. Este pensaba que, ya que todas las terminaciones son igualmente probables y en media saldrán el mismo número de veces, si llevamos muchos sorteos sin que el número premiado acabe en cinco (por poner un ejemplo), la probablidad de que salga en el próximo es mucho mayor. Fruto de este tipo de creencias es la consideración de paradoja para la llamada "padadoja de De Moivre", que en realidad de paradoja no tiene nada, porque es extactamente lo esperable en ausencia de creencias anuméricas. Repetimos el enunciado de la "paradoja": Si lanzamos una moneda y anotamos el número de caras y cruces, progresivamente la razón de los dos números tiende a la unidad; y sin embargo la probabilidad de conseguir el mismo número de caras que de cruces tiende a cero. Conseguir el mismo número de caras que de cruces (suponemos el núemro de lanzamientos n=2k par ) es un suceso cuya probabilidad no es muy difícil de hallar: Para empezar, con n lanzamientos tenemos 2n resultados posibles, al tener cada suceso dos posibilidades. Este es el número de ristras de n valores consecutivos "cara" o "cruz" posibles. Cuántos de estos tienen el mismo número de "caras" que de "cruces"? Tenemos n=2k resultados individuales, que nos dan (2k)! permutaciones posibles. De los 2k resultados individuales k son iguales entre sí (caras), y los otros k restantes también (cruces). Cualquier permutación de los primeros k valores entre sí deja invariante el resultado, y lo mismo entre los k restantes. Dichas permutaciones lo son en número de (k!), luego el número total de resultados con igual número de caras y de cruces es (2k)!/(k!)(k!). (2k!) es un número que crece muy rápido con k, pero si lo dividimos dos veces por (k!) la cosa crece más despacito. Dado que el número total de resultados es, como hemos dicho 2n = 22k, el cociente de ambas cantidades (2k)!/[22k(k!)(k!)] tiende a cero. Demostrar esto no es difícil, si bien exige cierto cálculo de límites que no haremos aquí. Así pues, la igualdad estricta de resultados es cada vez más difícil, mientras que el cociente entre ellos tiende a la unidad. De hecho, la tendencia a la unidad del cociente no implica la igualdad de resultados, ni ésta es condición necesaria para aquella, a pesar de las apariencias. No es que de la definición de esperanza de una variable aleatoria lleguemos al concepto de integral de Lebesgue, sino que nos apoyamos en el concepto de esperanza matemática que hemos visto varias veces en el blog, y lo utilizamos como escusa para explicar un concepto de integral que supera al tradicional de Riemann. Hemos definido varias veces la esperanza de una variable aleatoria como la suma de los productos de los posibles valores de la misma por las probabilidades de que adopten esos valores. Si X es una V.A. que puede tomar valores x1,...,xn con probabilidades p1,..,pn, (p1+...+pn = 1 ) entonces la esperanza de la variable X es: E[X] = x1p1 + ... + xnpn Cuando la variable es continua y toma valores en un intervalo [a,b], no podemos hablar de probabilidad de que tome un valor concreto, pues en el caso genérico, cada valor concreto tiene probabilidad nula de ocurrir (son infinitos los posibles). Hablaremos de densidad de probabilidad, entendiendo la densidad de probabilidad de un punto como el límite del cociente entre la probabilidad de un segmento que contenga a dicho punto y la longitud de dicho segmento, cuando ésta tiende a cero. El operador esperanza se ha convertido en una integral . Sin embargo tenemos un problema: la integral habitual que se usa en ingeniería es la integral de Riemann, y se muestra absolutamente incapaz de hacer frente a problemas probabilísticos, incluso a algunos muy sencillos, como el siguiente: ¿Si escogemos un número en el intervalo [0,1] al azar cuál es la probabilidad de que el número escogido sea irracional? La solución a este problema, casi trivial, muestra que la integral de Riemann es incapaz de afrontar contajes (pues una integral no es sino una forma de contar) en espacios abstractos como los espacios probabilísticos. Por ello hace falta una herramienta conceptual más elaborada que vendrá de la mano de Lebesgue. Todo ello lo veremos en los próximos días. Daremos un repaso al concepto de Integral de Riemann, y veremos porqué en los casos más generales no es satisfactoria. Hablar de integrales es hablar de maneras de contar. La combinatoria se puede definir como el arte de contar. Así lo hemos hecho en muchos posts precedentes. Sin embargo habría que hacer alguna precisión. No es lo mismo contar el número de ordenaciones de un conjunto finito de elementos que cumpla una propiedad concreta que contar los metros cuadrados que ocupa una superficie. La diferencia básica es que en el primer caso estamos en el dominio de los números enteros (o de los racionales si establecemos cocientes entre las cantidades previamente halladas), y en el segundo estamos en el dominio del continuo de los reales. La integral de Riemann está basada en la llamada Medida de Jordan, y se expresa como el límite de una suma de Riemann. Vayamos por partes para entender esto. El concepto de medida en matemáticas generaliza los conceptos habituales de longitud, área y volumen; y trata de conseguir que clases cada vez más generales de conjuntos tengan asociada una medida. Dichos conjuntos se llamarán conjuntos medibles. Nos limitaremos al cálculo de áreas de figuras planas, si bien la extrapolación a dimensiones superiores no aporta dificultad conceptual alguna, sino merametne operativa. La idea de la medida de Jordan consiste en atrapar la figura a medir en enlosados de rectángulos (el valor de las áreas de estos últimos son fáciles de hallar). Cuanto más fino sea el enlosado más fielmente se adaptará alas posibles anfractuosidades de la figura, de forma que es esperable que el límite del enlosado sea exactamente la medida de la figura. A modo de test, para que dicho límite sea unívocamente determinado, se efectuarán enlosados exteriores e interiores. Los primeros cubren el conjunto de partida, y los segundos son cubiertos por él. Si el límite de las áreas por enlosados exteriores e interiores son iguales, entonces decimos que la figura es medible- Jordan, y que su medida es el valor de dichos límites coincidentes. Las sumas de los rectángulos interiores las llamaremos sumas inferiores de Riemann, y las de los extreriores sumas superiores de Riemann. Para cualquier tipo de división finita en rectángulos, la suma inferior será menor que la superior, de ahí la nomenclatura. Es comprensible esperar que en el límite, cuando el número de rectángulos tienda a infinito porque la partición realizada en en intervalo de integración sea extremadamente fino, tanto la suma inferior como la exterior se acercarán, una por arriba y otra por abajo a la cantidad buscada. Esa es al menos la esperanza, y las funciones que así lo cumplen serán denominadas funciones Riemann-integrables. En la mayor parte de las matemáticas que se necesitan en la física y en la ingeniería este sistema de integral es suficiente porque las figuras a tratar (planas o no) son medibles en el sentido de Jordan. Podemos ver la idea en la siguiente imagen: Veamos detenidamente el proceso con el cálculo de la medida bajo una parábola. Sea la parábola f(x) = x2 . Una partición P del intervalo cerrado [a, b] es un conjunto finito de puntos P = { x1, x1, x2, ..., xn+1} tal que: a = x1 < x2 < x3 < ... < xn < xn+1 = b El proceso comienza efectuando una partición de este tipo. Fijémonos en los rectángulos interiores de la figura. La base de todos ellos mide ΔX = a/n, cantidad que llamaremos h. Comenzaremos hallando la La suma inferiores de f respecto de la partición P Las alturas son función de la gráfica que queremos integrar. Dado que los estamos preocupando de los rectángulos interiores las alturas serán las correspondientes al valor más pequeño de la función entre ambos extremos (en realidad estamos interesados en el ínfimo de la función en el intervalo. En nuestro caso, y dado que la función es creciente en el intervalo considerado, el extremo a considerar será el izquierdo. Debemos hallar los siguientes valores: f(X1)=f(0)=0 f(x2) = f(ΔX) = f(h) = h2 f(x3) = f(2ΔX) = f(2h) = (2h)2 y por inducción: f(xk) = f[(k-1)ΔX] = [[(k-1)h]2 = h2(k-1)2 Ahora no tenemos más que sumar las áreas de todos los rectángulos, quedando algo como esto: A este valor lo llamaremos suma inferior de Riemann para la función f y la partición P, I(f,p). Ahora no tenemos más que tomar límites cuando n tiende a infinito, obteniendo el valor de la integral inferior de Riemann I*(f). La integral inferior de Riemann no depende de la partición considerada por ser el límite cuando ésta es infinitametne fina. Fácilmente teniendo en cuenta que h=a/n, obtenemos: No lo haremos aquí, pero si repetimos el mismo cálculo para las suma superiores de f respecto de la partición P , que denotaremos S(f,P) y volvemos a calcular límites, obtendremos el valor I*(f), integral superior de Riemann para la función f. Obtendríamos igualmente el valor de a3/3, lo que indica que las áreas limitadas con las sumas inferiores y superiores convergen a un mismo valor, que es la llamada integral de Riemann de la función en el intervalo considerado. Así pues, la condición de integrabilidad en el sentido de Riemann es que se de la igualdad I*(f) = I*(f) ¿Cómo serán las funciones que no cumplan esto último? Mostrar que las funciónes no Riemann-integrables aparecen incluso en sencillos problemas de probabilidad es el propósitop del próximo post. Una vez detectada la insuficiencia de la integral de Riemann, tenemos el camino abierto para generalizar el concepto y encontrar una herramienta que coincida con la de Riemann en las funciones Riemann-integrables, y que además sea válida para un mayor número de funciones. La solución vendrá de la mano del francés Henry Lebesgue y será válida para todas las funciones que se puedan definir de manera constructiva. Pero no adelantemos acontecimientos. Trataremos en este post de ver cómo existen situaciones relativamente sencillas para las cuales la integral de Riemann no es aplicable. Adelantamos que en ciertas situaciones aparecen funciones que no son riemann-integrables, y pusimos como ejemplo un problema de cálculo de probabilidades: Sea una función real de variable real definida en el intervalo [0,1], de la manera siguiente: Esta función recibe el nombre de función de Dirichlet. La función vale la unidad para todo punto de [0,1] irracional, y cero para todo punto racional de dicho intervalo. Por lo tanto, la función está definida para todo punto de [0,1]. La representación gráfica de esta función es un poco difícil: entre dos puntos racionales cualesquiera de [0,1] hay infinitos puntos irracionales, y la recíproca también es cierta, así que la gráfica de la función consta de una nube lineal de puntos de ordenada unidad y otra nube lineal de puntos de ordenada nula. Cuál es el valor esperado de dicho experimento? Un uno es que hemos obtenido un irracional y un cero lo contrario. Cuando hablamos de la insoportable levedad del conjunto Q explicamos que a pesar de la aparente reciprocidad entre Q y R-Q (entre dos irracionales siempre hay infinitos racionales y viceversa), ambos tenían propiedades cardinales muy diferentes: Q es numerable y R-Q tiene la potencia del continuo. Los irracionales contenidos en [0,1] forman un conjunto incomparablemente mayor que los racionales, y esto nos legitima "de alguna manera" a concluir que la probabilidad de que resulte elegido un racional es nula. Este "de alguna manera" es una vaga invocación a la ley de Laplace de casos favorables entre casos posibles, si bien entre dos conjuntos infinitos la cosa deja mucho de estar clara aunque la intuición resulta (esta vez) ser correcta. Veamos que la integral de Riemann no nos sirve de gran ayuda en este aspecto. Intentemos integrar la función de Dirichlet por medio de las sumas superiores e inferiores definidas en el post anterior. A poco que pensemos, vemos que en cualquier elemento de una partición del intervalo [0,1], por muy fina que sea habrá dos clases de puntos: los que tienen la función igual a uno y los que la tienen igual a cero. Por lo tanto las sumas superiores suman la unidad, mientras que las inferiores son una suma de sumandos nulos, que es nula. No hay por tanto convergencia de las I(f,P) con las S(f,P) del post anterior. Tenemos que I(f,P)=0 y S(f,P)=1 para cualquier partición P. Por ello I*(f) = 1 ≠ 0 = I*(f) y por lo tanto la función no es Riemann integrable. Como intuimos, la solución a este inconveniente vendrá desde la teoría de la medida... Vistos los problemas que tenemos con ciertas funciones, relativamente sencillas de definir y de muy mal comportamiento, la estrategia de Lebesgue es bien diferente de la estrategia de Riemann. Cuando integramos en el sentido de Riemann, definimos una operación de conteo en gran medida de forma independiente de los valores que adopta la función, y así pasa lo que hemos visto con funciones como la de Dirichlet. Las sumas que aproximan la integral de Riemann provienen de partir el intervalo de integración en particiones sucesivamente más finas, y aproximar el área bajo la gráfica por exceso y por defecto mediante rectángulos, como hemos visto hace dos posts. Si tenemos una función de buen comportamiento , la diferencia entre las medidas por exceso y por defecto tenderán a cero cuando aumentamos la finura de la partición, en cuyo caso la función es Riemann-integrable. Es importante comprender que en este método las particiones se realizan de forma independiente de los valores de la función. Lebesgue, intentando extrapolar el concepto de integral a todas la funciones construibles, partió de un punto totalmente diferente. Fijándose precisamente en qué trozos del intervalo de integración la función tomaba ciertos valores. Dado que en la generalidad más absoluta tendremos funciones que varíen continuamente, se trataba de aproximar cualquier función mediante lo que se llamaron funciones simples. Así pues, al definir la integral de Lebesgue la propia función es la que determinará los conjuntos sobre los que se definen las funciones simples que sirven para definir la función que queremos integrar. Es un proceso constructivo que se puede aplicar a toda función constructiva, y que requiere una cierta tranquilidad para ser visto convenientemente, por lo que lo haremos sin prisas, deteniéndonos donde sea necesario. El proceso que seguiremos será más o menos el siguiente: 1.- Definiremos qué es una función medible en un espacio de medida. 2.- Definiremos qué es una función simple, y veremos que es un tipo de funciones medibles. 3.- Definiremos la integra de Lebesgue de funciones simples. 4.- Veremos cómo cualquier función medible se puede expresar como llímite de una función simple, y definiremos la integral de Lebesgue de funciones simples. Será entonces cuando, en virtud de las buenas propiedades en el límite de esta integral, podremos extrapolar el concepto de integral de Lebesgue a toda función medible, construible mediante el paso al límite de funciones simples. Nos llevaremos la sorpresa de que una función diabólica como la de Dirichlet cae en el paso tres, sin siquiera necesidad de pasos al límite. De momento, ese es el guión; pero vaya por delante un comentario coloquial sobre la diferencia de las integraciones en el sentido de Riemann y de Legesgue que encontré en un libro sobre el tema: Sobre una mesa hay esparcidas una serie de monedas. Para contar la cantidad de dinero que hay sobre la mesa Riemann dividiría la misma en una serie de bandas, calculando el dinero que cae dentro de cada banda para sumar después. Lebesgue sin embargo agruparía las monedas de valores iguales en montones, calcularía fácilmente el valor de cada montón y luego sumaría los montones. Volveremos a este símil una vez explicado todo el asunto. En la imagen que encabeza el post, tienen a Henry León Lebesgue (1875-1941) , matemático francés que dió su nombre (entre otras cosas) a esta nueva manera de entender la integración. Viene de aquí. Vamos a fijar un poco la nomenclatura para entendernos. Hemos afirmado que la integral de Lebesgue es aplicable a un mayor número de funciones que la de Riemann. Este conjunto de funciones es el de las funciones medibles. Una función medible está definida en un espacio de medida, en el que "todos" los subconjuntos tienen asociado un número, que es la medida del mismo. La palabra todos aparece entrecomillada porque en realidad no son todos , sino un número muy grande de ellos, que forman una estructura denominada sigma-algebra de los conjuntos medibles del espacio dado. Una sigma-algebra no es sino una colección de subconjuntos tales que toda unión, intersección o paso al complementario así como uniones numerables de subconjuntos es un nuevo subconjunto que también de la misma pertenece a ella, . Cuando estuvimos hablando de variables aleatorias mencionamos el concepto, que no vendrá mal recordar aquí. Allí venía a cuento porque los espacios probabilísticos son espacios medibles, y las variables aleatorias son precisamente funciones medibles en dichos espacios. Ahora hablaremos con toda generalidad, sin mencionar qué tipo de espacio medible es en el que estamos trabajando. Un espacio de medida, recordamos, es una tríada (X,A,M), donde X es un conjunto cualquiera, A es una sigma-álgebra (la de los subconjuntos medibles) subre X y M es una medida definida en A. Fijémonos en la figura: un punto p del espacio de partida tiene su imagen por la función f en el punto f(p) del espacio imagen. Dado un sunconjunto medible (con la medible definida en la imagen), existe otro medible en el origen (ahora con la medida definida en el espacio de origen) tal que es la contraimagen por la función f del primero. El tipo más sencillo de funciones medibles es el de las funciones indicatrices. Una función indicatriz de un subconjunto no es sino una función que vale uno para todos los puntos de un subconjunto dado, valiendo cero para el resto. Es indicatriz de este subconjunto dado. Es importante señalar que la función no está definida sólo en dicho conjunto, sino en todo el espacio de partida. Dado un subconjunto medible A de un conjunto medible X, la función indicatriz de A es: IA(x)= 1 si x pertenece a A IA(x)= 0 si x no pertenece a A Demostremos que toda función indicatriz es medible: La función indicatriz sólo toma dos valores, uno o cero. Dado un subconjunto B medible de R , que es el espacio de llegada, sólo pueden darse tres casos: 1.- que B contenga al uno y no al cero, 2.- que contenga al cero y no al uno, 3.- que contenga a ambos y 4.- que no contenga a ninguno. En el primer caso, la contraimagen de B es precisamente A, porque por definición la contraimagen de B será el conjunto de todos aquellos puntos que toman valores en B, y de todos los posibles valores de B, sólo el uno tiene posibilidad de ser el valor asignado a puntos del origen. Como por definicion de la función indicatriz, los puntos que tienen asociado el valor unidad son los pertenecientes a A, tenemos el resultado. Razonando de la misma manera llegaremos a la conclusión de que en el segundo caso, la contraimagen de B es el complementario de A, en el tercero es el conjunto de origen entero y en el cuarto es el conjunto vacío. Todos ellos son conjuntos medibles por ser medible A, por lo que ya tenemos demostrado el resultado. Continuaremos construyendo funciones más complicadas a partir de las indicatrices manteniendo la medibilidad de las mismas y definiendo la integral de Lebesgue enseguida. Seguimos en breve. Viene de aquí. Seguimos en nuestra intención de difinir un número cada vez más amplio de funciones que caigan dentro de lo que hemos definido como funciones medibles. Hemos visto que las funciones indicatrices son funciones medibles. Ahora utilizaremos aquellas para definir unas funciones, también medibles, que serán un poco más complejas que las indicatrices: las funciones simples. Llamaremos función simple a toda función que tome un número finito de valores diferentes. Es fácil de comprender que las funciones simples se pueden expresar como combinación lineal de funciones indicatrices, por lo que adoptarán la siguiente forma general: En la definición anterior no hemos especificado que los conjuntos Ai deban ser disjuntos, pero aunque no lo sean, toda función simple se puede poner como combinación lineal de funciones indicatrices de subconjuntos disjuntos, de modo que supondremos que lo son, sin pérdida de generalidad, y que forman un recubrimiento del espacio origen en su totalidad. No demostraremos aquí, pero un resultado crucial que atañe a funciones medibles es que si f y g son dos funciones medibles, y c es una constante, entonces las funciones c.f, f+c, f+g, f.g, 1/f, max(f,g), min(f,g) y /f/ también son medibles. En función de este resultado, las funciones simples serán medibles. Será para estas funciones para las que definamos en primer lugar la integral de Legesgue, de la forma siguiente: Así pues, definimos la integral de una función como una suma de productos. Cada producto está formado por el coeficiente correspondiente a cada subconjunto en la definición de la función y por la medida del mismo. Esto tiene enormes consecuencias: cualquier conjunto de medida cero, que influirá en las propiedades topológicas de la función y que incordiará mucho a la hora de integrar en el sentido de Riemann, aquí tiene un peso nulo en la integral, por lo que simplemente no será considerado. ¿Para qué íbamos a considerarlo, si está definido sobre un conjunto de medida nula? Estaría bien reflexionar un poco sobre esta definición. Para empezar, la función de Dirichlet se convierte en integrable con ella, sin necesidad de mayor aparato matemático. Lo veremos en el siguiente post. Posteriormente, como habíamos anunciado, veremos las excelentes propiedades de las funciones medibles, y la forma en que la definicion de la integral de Lebesgue se extiende a todas ellas. La Sociedad para el avance del Pensamiento Crítico, ARP-SAPC ha propuesto un manifiesto a favor de una cultura veraz, que será enviado a numerosos medios de comunicación. El motivo de tal lanzamiento coincide con el estreno de un nuevo canal de televisión en España, Canal Cuatro y concretamente con la puesta en marcha de un programa sobre supercherías paranormales dirigido por Iker Jiménez, conocido divulgador de lo paranormal en España, plagados de mentiras, datos falsos o especulaciones surrealistas que se cuentan como ciertas. En realidad, pienso yo, ese no es el motivo, sino el detonante. El citado manifiesto es una reflexión sobre el papel de los medios de comunicación en una sociedad libre y democrática, sobre el tratamiento informativo de la verdad, y sobre la calidad de la información científica que llega a las personas de nuestro país. Las paraciencias en sus vertientes más populacheras, ya sea ufología, ya sea astrología, ya sea proctomancia no son sino lo más vistoso y quizás inofensivo del fenómeno. La necesidad de reivindicar una cultura respetuosa con la verdad nace de la facilidad de manipulación de las personas mal informadas, engañadas o radicalizadas en esquemas mentales irracionales o alienadas con basura televisiva. Favorecer una cultura veraz, entre otras cosas es luchar por que no lleguen al ciudadano versiones sesgadas de los hechos, historias creativas de acontecimientos históricos o mentiras descaradas que hagan aumentar la share de un programa televisivo a base de vomitar mierda sobre las sinapsis de los televidentes. Como no podía ser de otra forma, se han levantado voces contra este manifiesto explicando que es un atentado contra la libertad de expresión. Yo pudiera estar perfectamente equivocado, pero me parece que este argumento no se sostiene. No se pide nada que no esté implícito en la ética deontológica periodística. Solicitar, o exigir veracidad en las informaciones y pedir o exigir que se controlen las emisiones mentirosas es una utopía perfectamente lícita. De mínimos, diría yo. Lo que ocurre es que, a lo mejor, nos estamos centrando en las tonterías paranormales, como si estas fueran el compendio de todos los males informativos españoles. Pero no debemos olvidar que mala divulgación científica puede hacer más daño que paraciencia, y que Rappel, Paco Porras o Carlos Jesús no son sino iconos visibles del cutrerío patrio, relativamente intrascendentes, e inofensivos . La manipulación de la verdad y su puesta en escena mediática al interés de corrientes, partidos e ideologías es más preocupante, y la reivindicación dura y exigente de una cultura veraz no es sino una llamada de atención sobre este punto. Cualquier lector que quiera añadir su firma a la ya larga lista de firmantes puede hacerlo cliqueando en la imagen inferior. Yo ya lo he hecho. Viene de aquí. Según hemos visto aquí existe una definición muy clara de le integral de Lebesgue para las funciones simples. Tanto que parece muy poca cosa después de tanta introducción. Sin embargo, es notable el hecho de que tan poca cosa consigue vencer a la indomable función de Dirichlet. Repetiremos aquí que la idea de Lebesgue es dividir el dominio de integración en particiones relativas a los valores de la propia función. En las siguientes ilustraciones veremos una vez más la diferencia entre la integral de Riemann y la de Lebesgue para una función simple general Sea la función simple: f= 2 · I(0,1]U(6,8] + 3 · I(1,6)] Espero que la nomenclatura esté clara: la función vale 2 para los puntos del conjunto (0,1]U(6,8] y vale tres para los del conjunto (1,6] , valiendo cero en el resto. La tenemos aquí: La integración de Riemann dividirá el intervalo de intergración en rectángulos cada ver más finos, evaluando el área de cada uno, de la siguiente forma: La integraciónde Legesgue, en cambio dividirá el intervalo de integración en sólo dos partes, una para los puntos en los que la función vale 2 y otra para los puntos en los que la función vale 3, sumando los productos de las medidas respectivas de los dos trozos por 2 y por 3 respectivamente: Es obvio que en ambos casos la integral va a a valer 21: el área bajo la función. En el caso de la función de Dirichlet (circunscrita al intervalo [0,1], por muy complicada que nos pareciera desde el punto de vista de la continuidad o de cualquier propiedad topológica, a la luz de "lo que verdaderamente importa" para Lebesgue, es una función muy sencilla: es una función simple. Más aún: es una sencilla función indicatriz que toma valor uno para los puntos irracionales y valor cero para los racionales. Así pues, la integral valdrá: I=1·m(R-Q) + 0.m(Q) Dado que el conjunto de los racionales del intervalo [0,1] tiene medida cero, el conjunto de los irracionales del mismo intervalo tendrá medida uno, y la integral valdrá I = 1·1+0·0 = 1. El valor de la integral es el mismo que para la función unidad, de lo que se deduce que para la integración de Lebesgue, todo conjunto de medida nula no aporta absolutamente nada al valor de la integral. Esto es una simplificación extraordinaria, porque de un plumazo evitamos todos los comportamientos patológicos de funciones extrañas cuyas irregularidades no nos hacen más que molestar. Aunque esto parece cosa de niños, las buenísimas propiedades en el límite de esta integral así definida nos habilitarán extrapolarla sin demasiados problemas a toda función medible. Entonces comprenderemos la potencia de la nueva herramienta, y lo que más nos importa: el porqué de la misma. Lo haremos lentamente porque no tenemos prisa. |