24.11.07

1344.- Por que se utiliza la distribucion normal

Es bastante conocida la historia: en estadística se estudia mucho la distribución normal (la campanita de Gauss) porque es la más utilizada en la práctica.

Y en la práctica se la utiliza... porque está muy estudiada por la gente de estadística.

Por suerte, en el libro Probabilidad y Estadística Elementales para Estudiantes de Ciencias, de Maronna, le dedican una sección al tema, y explican la posta. La copio acá porque no es usual encontrar el tema tan bien explicado:

Muy tarde por la noche el Mulá Nasrudin se encuentra en la calle dando vueltas alrededor de una farola, mirando hacia abajo. Pasa por allí un vecino.

-¿Qué estás haciendo Nasrudín, has perdido alguna cosa?- le pregunta.
-Sí, estoy buscando mi llave.

El vecino se queda con él para ayudarle a buscar. Habiendo buscado durante un largo rato acaban por cansarse, y el vecino pregunta:

-Nasrudín, ¿dónde estabas cuando la perdiste?
-Dentro de mi casa.
-Entonces, ¿por qué la estamos buscando aquí?
-Pues porque aquí hay más luz.

13 comentarios:

Anónimo dijo...

profesor, no lo he entendido

Eixe dijo...

Ese es uno de los chistes favoritos di director de tesis, aplicado en general para cualquier tema donde uno busca una explicación dentro de lo que uno ya conoce. Me gusta más la versión de la lay de Murphy que dice "si lo único que tenés es un martillo, vas a ver clavos por todos lados".

Avern0s dijo...

De hecho en algún sitio, no Matemático, ya se están considerando otras Distribuciones que las hay. Por ejemplo en Telecomunicaciones de la mano de matemáticos y físicos se está empezando a utilizar distribuciones Logonormales para modelar el tiempo de ocupación en un Canal de Telefonía Celular ( J. Jordán y F Barceló) o en la modelización del trafico de Voz sobre redes IP ( E. Casilari,H. Montes y F. Sandoval).
Ciao
P.D : Me gustan tus post.

JuanPablo dijo...

anonimo, no te preocupes, es normal :)

eixe, esa es otra buena variante!

JuanPablo dijo...

gracias avern0s, me gusta uno de tus blogs, también [el otro me va a llevar más tiempo revisarlo :P]

Pedro Terán dijo...

Lo has clavao.

Aunque dentro de la secta hemos jurado no revelar estas cosas (como unos pitagóricos cualesquiera), la distribución normal cada vez tiene menos importancia.

Te dejo un enlace a un artículo muy majo que puede que te interese:

http://www.springerlink.com/content/k511283207636207/fulltext.pdf

Creo que es de acceso gratuito, por lo menos lo era antes.

El tema es: ¿cómo puedo estimar el tiempo de retorno de una catástrofe cuando en los datos históricos nunca se han registrado condiciones ni remotamente parecidas a las que son necesarias para que la catástrofe se produzca?

En estos problemas de "valores extremos", la distribución normal no sirve de nada.

(La catástrofe es que una tormenta provoque la ruptura de uno de los diques que protegen Holanda del mar)

hjg dijo...
Este comentario ha sido eliminado por el autor.
hjg dijo...

Un poco de vocación de abogado del diablo que uno tiene...
Digamos algo, no tanto el punto de vista de la estadística, donde (sobre todo la estadística aplicada a ciencias no muy 'duras') seguramente se cometen abusos por ignorancia y pereza, sino más bien de lo que uno ha tocado, probabilidad, aplicada a la ingeniería y al procesamiento de señales.

Digo que, sin conocer el contexto, despreciar a la gaussiana (normal) como cosa anticuada ('ahora hay cosas mejores') bien puede ser tan o más ingenuo como usarla a lo bruto. Es como el estudiante
de música que se resiste a estudiar armonía "clásica" (porque ahora hay otras cosas...) o el aspirante a poeta que no le importa saber contar sílabas... El que no sabe caminar, que no intente correr, o bailar.

Lo que hay que entender es que, en MUCHOS casos, la gaussiana es la alternativa más simple, más elemental y por lo tanto más natural. Es como optar por usar un modelo-ajuste-sistema lineal con preferencia a uno alineal: uno sabe que lo lineal es más sencillo y facil de trabajar, por lo tanto arranca con eso, como
la aproximación de orden uno; si después ve que necesita algo más complejo (alineal), pues se lamenta y a ello. Por el contrario, algunos han visto a la gaussiana como una distribución más entre tantas,
cuya fórmula matemática no parece especialmente sencilla (unosobreraizcuadradade2pipordesvioy...) y
que encima no tiene integral (función de distribución) 'cerrada'...
No parece algo simple y elemental en frente del resto (por ej: una uniforme) como sí lo parecen los sistemas lineales frente a los alineales. Y peor en el caso multidimensional (y ahí es donde las cosas se ponen interesantes).
Entonces algunos se han quedado con la idea de que eso se usa por una tradición anticuada, porque "está muy tabulada" o idioteces así. O sólo por el teorema del límite central (suma de infinitas v.a independientes) que no se ve que se aplique tanto...

Me gustaría insistir en la idea: la gaussiana es, a la hora de elegir un modelo probabilístico, la opción más básica. Hay una analogía estrecha entre:

1. Elegir un tipo de sistema o modelo [*] : sistema lineal
2. Elegir una medida de error o desviación : error cuadrático
3. Elegir una función de probabilidad : gaussiana


[*] En el sentido general de "modelo matemático" con una entrada que produce un resultado, o sea, una función (generalmente en los reales, tal vez multidimensionales, tal vez complejos)

Ya que estamos: algo parecido pasa con el error cuadrático. Incluso cuando uno aprende la definición de la varianza (muestral), y nos enseñan que "elevamos al cuadrado la diferencia del valor con el promedio", nos surge la pregunta "por qué cuernos elevar al cuadrado?". Algunos profesores (bueno...
ayudantes) dan la espantosa respuesta: para que de positivo. Más adelante uno se entera de que, por ejemplo, usar el error L1 (tomar el módulo, derecho viejo) es mejor para algunas aplicaciones, y se siente algo estafado, porque parece más natural y más simple; y puede llegar a creer que usa el error cuadrático es una tradición anticuada que convendría tirar al diablo, o al menos bajar
de su pedestal. No es así. Su razón de privilegio es más profunda; y el hecho de que esta medida de error resulte después matemáticamente mucho más tratable que las otras puede verse como parte de esa razón, o como un signo.

De hecho, en varias áreas (procesamiento de señales, teoría de detección, etc) esa especie de tríada que nombré, es, si no sagrada, básica y fundamental. Se corresponden a lo que sería el procesamiento de señales "clásico" (basado en estadísticas -momentos- de segundo orden). La estrechez de la relación surge por muchos lados. Pero sobre todo por esto:
- si buscamos el modelo que minimiza el error cuadrático obtenemos un sistema lineal
- la esperanza condicionada (que minimiza el error cuadrático de predicción para un conjunto de variables aleatorias en función de otras), lo que un estadista llama "curva de regresión", es una función lineal sólo para el caso de la gaussiana

Por eso, cuando un paper arranca diciéndonos "asumimos una señal gaussiana, y buscaremos el procedimiento o filtro) que minimice el error cuadrático", podemos creernos muy astutos al objetar "Eh, pero esa señal en la práctica no creo que sea gaussiana; vas a ver que encuentro un ajuste mejor a otra funcion de probabilidad, y te reviento".
Pero probablemente no seamos tan astutos. Porque, en ese contexto, el filtro que estamos planteando es seguramente lineal, y (según puede demostarse) si el paper hubiera arrancado "asumimos una señal (arbitraria) y buscaremos el filtro LINEAL que minimice el error cuadrático", habría sido exactamente equivalente. Es justamente la esencia de esos métodos, sólo les importan los momentos de segundo orden. Demodoqué, si vos querés usar un modelo no gaussiano, para lograr algo mejor vas a tener que minimizar usando otra función de error no cuadrática o un filtro no lineal. Adelante, suerte.

Por poner un ejemplo entre mil: la compresión de la imágen JPEG de ese popup que acabás de cerrar, se basa en la transformada coseno, aproximación de la transformada KL (lineal!), la cual minimiza el error (cuadrático!) al comprimir; y que, por lo dicho, sería óptima si la señal -las componentes de color de los pixels!- fuera gaussiana. Ahora bien, ni los pixels son gaussianos, ni el error cuadrático es buena medida de la distorsión visual de una imagen. Eso lo sabe todo el mundo. Pero, como el más cínico podrá sospechar, sería algo ingenuo suponer fue lo diseñaron así por pereza, porque habían visto la gaussiana en el CBC, y sólo sabían de error cuadrático.
Si alguien quiere inventar algo mejor, adelante (de hecho, todo el tiempo se están proponiendo); pero, por favor, que se asegure de haber aprendido a caminar antes.

Para terminar con la gaussiana: digo que su carácter de función de probabilidad "elemental" puede chocar contra su fórmula matemática, que se ve algo complicada. Y más en el caso multidimensional (y ahí es donde las cosas se ponen interesantes). Pero eso es accidental.
Citemos sólo dos propiedades ("conceptualmente grossas") de la gaussiana que pueden ayudar a ver su carácter "fundamental".

- Para la gaussiana "NO CORRELACION" equivale a "INDEPENDENCIA". Para (casi todas) las otras, no.

- Fijadas media y varianza, la gaussiana es la función de probabilidad de MAXIMA ENTROPIA.
("media y varianza" son "valor promedio" y "dispersión (cuadrática)" en términos muestrales,
"componente de continua" y "potencia" en términos de ingeniería electrónica).

JuanPablo dijo...

hernán, ni hablar. obvio que la gaussiana se ganó un lugar entre las distribuciones que no es para descartar así como así; y también hay otros factores (como que la norma L2 genera un Hilbert y las normas Lp -elevar el módulo a la p con p entre 1 e infinito- dan un Banach, aunque en algunos casos, el error que corresponde es el Linfinito -ninguna coordenada o valor en un punto se tiene que alejar mucho-).

pero, justamente, por eso muchas veces se cae en ese círculo vicioso: las comodidades matemáticas justifican su uso, y esas comodidades se tienen por el tiempo invertido en estudiarla... porque se usa!

JuanPablo dijo...

pedro, no tengo acceso al artículo!! si me lo podés enviar, te lo agradecería.

M Strogoff dijo...

Al margen del motivo por el el patrón de este blog ha colocado la historia del Mula Nasrudin, considero es aplicable como crítica de la "comodidad" de una parte de la humanidad, alejada de la cultura del esfuerzo, transitando como autómatas exclusivamente por ámbitos conocidos aunque en la inmensa mayoria de los casos no lleve a ninguna parte.
Anclandose, en definitiva en un entorno del que se teme salir, lo desconocido asusta.
De esa manera conformamos una sociedad facilmente manipulable, desgraciadamente manipuladores no escasean.
¿Como lo ven ustedes?

Anónimo dijo...

QUE GONORREA NO SABEN EXPLICAR NADA SON UNA MANADA DE HIJUEPUTAS
MALPARIDOS CHUPA CULO

JuanPablo dijo...

eso es claridad! hasta yo lo he entendido, pese a que me cuesta cuando no hay signos de puntuación.