Vous êtes sur la page 1sur 12

Materia: matemticas Unidad 1

ESTADISTICA Y PROBABILIDAD. La estadstica es una ciencia que estudia la recoleccin, anlisis e interpretacin de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadstica es ms que eso, en otras palabras es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales. La estadstica se divide en dos grandes reas:

La estadstica descriptiva, se dedica a los mtodos de recoleccin, descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, clsters, entre otros. La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases tericas de la materia. La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en estadsticas econmicas, estadsticas criminales, entre otros Estadstica: La estadstica es comnmente considerada como una coleccin de hechos numricos expresados en trminos de una relacin sumisa, y que han sido recopilado a partir de otros datos numricos. Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de determinada poblacin; es decir, una funcin de valores de muestra.

"La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares". (Gini, 1953. Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis. "La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954). Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la estadstica, debido al gran campo de aplicacin que posee.

Probabilidad
La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica, la matemtica, la ciencia y la filosofa para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecnica subyacente de sistemas complejos.

La teora de la probabilidad es la parte de las matemticas que estudia los fenmenos aleatorios. Estos deben contraponerse a los fenmenos determinsticos, los cuales son resultados nicos y/o previsibles de experimentos realizados bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 grados Celsius a nivel del mar se obtendr vapor. Los fenmenos aleatorios, por el contrario, son aquellos que se obtienen como resultado de experimentos realizados, otra vez, bajo las mismas condiciones determinadas pero como resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento de un dado o de un dardo. Muchos fenmenos naturales son aleatorios, pero existen algunos como el lanzamiento de un dado, donde el fenmeno no se repite en las mismas condiciones, debido a que la caractersticas del material hace que no exista una simetra del mismo, as las repeticiones no garantizan una probabilidad definida. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parmetros que intervienen; sta es una de las razones por las cuales la estadstica, que busca determinar estos parmetros, no se reduce inmediatamente a la teora de la probabilidad en s. En 1933, el matemtico sovitico Andri Kolmogrov propuso un sistema de axiomas para la teora de la probabilidad, basado en la teora de conjuntos y en la teora de la medida, desarrollada pocos aos antes por Lebesgue, Borel y Frechet entre otros. Esta aproximacin axiomtica que generaliza el marco clsico de la probabilidad, la cual obedece a la regla de clculo de casos favorables sobre casos posibles, permiti la rigorizacin de muchos argumentos ya utilizados, as como el estudio de problemas fuera de los marcos clsicos. Actualmente, la teora de la probabilidad encuentra aplicacin en las

ms variadas ramas del conocimiento, como puede ser la fsica (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuacin de acciones).

==Introduccin

Desarrollo histrico de la estadstica


La historia de la estadstica est resumida en tres grandes etapas o fases. 1.Primera Fase: Los Censos: Desde el momento en que se constituye una autoridad poltica, la idea de inventariar de una forma ms o menos regular la poblacin y las riquezas existentes en el territorio est ligada a la conciencia de soberana y a los primeros esfuerzos administrativos. 2.- Segunda Fase: De la Descripcin de los Conjuntos a la Aritmtica Poltica: Las ideas mercantilistas extraan una intensificacin de este tipo de investigacin. Colbert multiplica las encuestas sobre artculos manufacturados, el comercio y la poblacin: los intendentes del Reino envan a Pars sus memorias. Vauban, ms conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta de un impuesto sobre los ingresos, se seala como el verdadero precursor de los sondeos. Ms tarde, Bufn se preocupa de esos problemas antes de dedicarse a la historia natural. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus tres principales representantes son Graunt, Petty y Halley. El penltimo es autor de la famosa Aritmtica Poltica. Chaptal, ministro del interior francs, publica en 1801 el primer censo general de poblacin, desarrolla los estudios industriales, de las producciones y los cambios, hacindose sistemticos durantes las dos terceras partes del siglo XIX. 3.- Tercera Fase: Estadstica y Clculo de Probabilidades: El clculo de probabilidades se incorpora rpidamente como un instrumento de anlisis extremadamente poderoso para el estudio de los fenmenos econmicos y sociales y en general para el estudio de fenmenos cuyas causas son demasiados complejas para conocerlos totalmente y hacer posible su anlisis.

Divisin de la estadstica
La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica Descriptiva y la Inferencial. Estadstica Descriptiva: consiste sobre todo en la presentacin de datos en forma de

tablas y grficas. Esta comprende cualquier actividad relacionada con los datos y est diseada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como tales. Estadstica Inferencial: se deriva de muestras, de observaciones hechas slo acerca de una parte de un conjunto numeroso de elementos y esto implica que su anlisis requiere de generalizaciones que van ms all de los datos. Como consecuencia, la caracterstica ms importante del reciente crecimiento de la estadstica ha sido un cambio en el nfasis de los mtodos que describen a mtodos que sirven para hacer generalizaciones. La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra tomada.

==Elementos de la estadstica

Unidad 2
Estadstica descriptiva La estadstica descriptiva es una parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es muy bsico, pero fundamental en todo estudio. Aunque hay tendencia a generalizar a toda la poblacin las primeras conclusiones obtenidas tras un anlisis descriptivo, su poder inferencial es mnimo y debera evitarse tal proceder. Otras ramas de la estadstica se centran en el contraste de hiptesis y su generalizacin a la poblacin. Algunas de las tcnicas empleadas en este primer anlisis de los datos se enumeran ms abajo en el listado de conceptos bsicos. Bsicamente, se lleva a cabo un estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central.

La estadstica descriptiva es una gran parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es muy bsico. Aunque hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central. esto es lo que podria ser un concepto aproximado.

LA ESTADSTICA DESCRIPTIVA: ES LA CIENCIA ENCARGADA DE ANALIZAR, ESTUDIAR Y DESCRIBIR A LA TOTALIDAD DE INDIVIDUOS DE UNA POBLACIN. ESTA INCLUYE LAS TCNICAS QUE SE

RELACIONAN CON EL RESUMEN Y LA DESCRIPCIN DE DATOS NUMERICOS, ESTOS PUEDEN SER GRAFICOS O PUEDEN INCLUIR ANLISIS MEDIANTE CALCULOS (SUS FUNCIONES SON DE DAR REGLAS Y NORMAS PARA DECIR COMO HAY QUE RECOPILAR DATOS, ORDENARLOS EN TABLAS, REPRESENTARLOS GRFICAMENTE Y REDUCIRLOS, ES DECIR, DAR MEDIDAS QUE PERMITAN MANEJARLOS). POR EJEMPLO: CIERTA ESPECIE DE ANIMALES TIENE CADA AO UN NUMERO VARIABLE DE HIJOS. DURANTE UN AO SE OBSERVA UN CONJUNTO DE FAMILIAS ANOTNDOSE EL NUMERO DE HIJOS QUE HAN TENIDO:
ASI TAMBIEN: SU FINALIDAD ES OBTENER INFORMACIN, ANALIZARLA, ELABORARLA Y SIMPLIFICARLA LO NECESARIO PARA QUE PUEDA SER INTERPRETADA CMODA Y RPIDAMENTE Y, POR TANTO, PUEDA UTILIZARSE EFICAZMENTE PARA EL FIN QUE SE DESEE (TOMA DE DESICIONES). EL PROCESO QUE SIGUE LA ESTADSTICA DESCRIPTIVA PARA EL ESTUDIO DE UNA CIERTA POBLACIN CONSTA DE LOS SIGUIENTES PASOS: SELECCIN DE CARACTERES DIGNOS DE SER ESTUDIADOS. MEDIANTE ENCUESTA O MEDICIN, OBTENCIN DEL VALOR DE CADA INDIVIDUO EN LOS CARACTERES SELECCIONADOS. ELABORACIN DE TABLAS DE FRECUENCIAS, MEDIANTE LA ADECUADA CLASIFICACIN DE LOS INDIVIDUOS DENTRO DE CADA CARCTER. REPRESENTACIN GRFICA DE LOS RESULTADOS (ELABORACIN DE GRFICAS ESTADSTICAS). OBTENCIN DE PARMETROS ESTADSTICOS, NMEROS QUE SINTETIZAN LOS ASPECTOS MS RELEVANTES DE UNA DISTRIBUCIN ESTADSTICA.

Toma, ordenacin y distribucin de frecuencias de datos


Toma de datos
La toma de datos es la obtencin de una coleccin de los mismos que no han sido ordenados numricamente. Un ejemplo es el conjunto de alturas de 100 estudiantes, sacados de una lista alfabtica de una universidad. ORDENACIN Una ordenacin es una colocacin de los datos numricos tomados, en orden creciente o decreciente de magnitud. La diferencia entre el mayor y el menor de los nmeros se llama recorrido o rango de los datos. Por ejemplo, si la altura mayor de los 100 estudiantes es 74 pulgadas y la menor es de 60 pulgadas, el rango es 74 - 60 = 14 pulgadas.

Distribuciones de frecuencia
Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con as frecuencias correspondientes a cada una, se conoce como una distribucin de frecuencias o tabla de frecuencias. La Tabla 1 es una distribucin de

frecuencias de alturas (registradas con aproximacin de pulgada) de 100 estudiantes de la Universidad XYZ. La primera clase o categora, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el smbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5. Los datos ordenados y resumidos como en la distribucin de frecuencia anterior, se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas as de manifiesto.

Medidas de centralizacin
Habitualmente necesitamos disponer de un valor numrico que represente la disparidad de datos de una distribucin de frecuencias. Estos valores son los llamados parmetros centrales o medidas de centralizacin, ya que son valores "intermedios" que se situan alrededor del centro de la distribucin.

Se trata de la media, la moda y la mediana.


La media aritmtica
Para calcular la media se suman todos los valores de los datos y se divide por el nmero total. Cuando los datos se repiten, es ms fcil formar la tabla de frecuencias y sumar los productos de cada valor por las veces que se repite, despus dividimos por el n total de datos.

En el caso de variables agrupadas en intervalos, como en el ejemplo que vemos aqu, xi es la marca de clase o punto medio de cada intervalo.

Si sumamos a todos los valores un mismo nmero, la media aumenta en esa cantidad. Si multiplicamos todos los valores por un mismo nmero la media queda multiplicada por el mismo nmero.

La moda
La moda de una variable estadstica es el valor ms repetido, el que tiene mayor frecuencia absoluta. Si la variable es discreta se busca el valor de mayor frecuencia. Si los datos estn agrupados, la clase de mayor frecuencia se llama clase modal. A veces se toma la marca de clase de la clase modal como valor de la moda, pero es ms preciso utilizar la frmula:

Donde: i es la clase modal, i-1 e i+1 la anterior y posterior respectivamente, ai es el extremo inferior,

ci la amplitud del intervalo, ni la frecuencia absoluta.

La mediana y los cuartiles


Suponiendo que todos los datos estn ordenados la mediana es el valor que ocupa la posicin central, de modo que la mitad de los datos son menores y la otra mitad son mayores. Cuando la variable es discreta la mediana es el primer valor cuya frecuencia acumulada es mayor que n/2. Cuando los datos estn agrupados, buscaremos la clase mediana que es la que su frecuencia absoluta acumulada sobrepasa la mitad de los datos (n/2). En ocasiones basta tomar como valor de la mediana la marca de clase de sta pero obtenemos ms precisin calculando:

As como la mediana divide la distribucin en dos partes con el mismo nmero de datos, los cuartiles son los valores de la variable que la dividen en cuatro partes. El primer cuartil, Q1, deja a la izquierda el 25% de los datos, el segundo es la mediana y el tercero, Q 3, deja el 75% de los datos a la izquierda. El clculo se hace de forma anloga al de la mediana:

MEDIDAS DE CENTRALIZACION Una medida de centralizacin es un valor, que es representativo de un conjunto de datos y que tiende a situarse en el centro del conjunto de datos, ordenados segn su magnitud. Mediana Es el valor de la variable estadstica que divide en dos partes iguales a los individuos de una poblacin, supuestos ordenados en orden creciente. En general, es el valor donde la funcin de distribucin F(x) toma el valor 1/2, pero as definida puede no ser nica en cuyo caso se toma la media aritmtica de los valores de mediana, o no existir en cuyo caso se toma como mediana el valor de la poblacin ms cercano a esa mediana 'ideal'. Moda Es el valor ms frecuente de la variable estadstica; valor que se corresponde al mximo del histograma. Si la variable es discreta, puede darse el caso de que haya ms de una mediana. Media aritmtica

Es la suma de los productos de los posibles valores que tome la variable xi, entre el nmero de valores que esa variable contenga.

Medidas de dispersin Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado

La medida de dispersin ms simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con que se calcula. Es comn que se use tambin el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numrico en el mismo. La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:

En su clculo slo intervienen dos elementos del conjunto. Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamao del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao. Para presentar la desviacin estndar, que es por mucho la medida generalmente ms til de la dispersin, obsrvese que la dispersin de un conjunto de datos es pequea si los valores se agrupan en forma cerrada en torno a su media y es grande si los valores se dispersan ampliamente en torno a su media. Por tanto, parecera razonable medir la dispersin de un conjunto de datos en trminos de las cantidades en las cuales difieren los valores individuales de su media. Si se tiene un conjunto de nmeros:

que constituyen una poblacin con una media

, las diferencias entre:

se denominan las desviaciones de la media y esto sugiere que se podra usar el promedio de estas desviaciones como medida de dispersin en la poblacin. A menos que las X sean todas iguales, algunas de las desviaciones sern positivas y otras negativas, la suma de todas las desviaciones de la media

y en consecuencia tambin su promedio es siempre cero. Como realmente se est interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variacin en trminos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiramos entre N, se obtendra la media estadstica que se denomina desviacin media y se representa por:

Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades tericas en problemas de inferencia y rara vez se usa. Un mtodo alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que tambin esto eliminar el efecto de los signos. Los cuadrados de nmeros reales no pueden ser negativos y pueden tomar el valor de cero. Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviacin estndar de la poblacin.

sta medida de variacin se representa por medio de sigma minscula ( ) y al expresar literalmente lo que se ha hecho aqu de manera matemtica, tambin se conoce como la raz de la desviacin cuadrada media. A su cuadrado de se le llama Varianza de la poblacin. Quiz parezca lgico utilizar la misma frmula con n y sustituidas por N y , para la desviacin estndar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir la suma de las desviaciones

entre n, se divide entre (n-1) y se define como desviacin estndar de la muestra, que se denota con s como

Su cuadrado s2, se llama la Varianza de la muestra. Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razn. Si se dividiera entre n y se utilizara s2 como estimacin de es decir, se utilizara la varianza de una muestra para determinar la varianza de la poblacin de la cual provino, el resultado sera demasiado pequeo y esto se corrige al dividir entre n-1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo entre n-1 sino que es prctico para definir s como se hizo.

Unidad 3 Probabilidad
La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica, la matemtica, la ciencia y la filosofa para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecnica subyacente de sistemas complejos.

La teora de la probabilidad es la parte de las matemticas que estudia los fenmenos aleatorios. Estos deben contraponerse a los fenmenos determinsticos, los cuales son resultados nicos y/o previsibles de experimentos realizados bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 grados Celsius a nivel del mar se obtendr vapor. Los fenmenos aleatorios, por el contrario, son aquellos que se obtienen como resultado de experimentos realizados, otra vez, bajo las mismas condiciones determinadas pero como resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento de un dado o de un dardo. Muchos fenmenos naturales son aleatorios, pero existen algunos como el lanzamiento de un dado, donde el fenmeno no se repite en las mismas condiciones, debido a que la caractersticas del material hace que no exista una simetra del mismo, as las repeticiones no garantizan una probabilidad definida. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parmetros que intervienen; sta es una de las razones por las cuales la estadstica, que busca determinar estos parmetros, no se reduce inmediatamente a la teora de la probabilidad en s.

En 1933, el matemtico sovitico Andri Kolmogrov propuso un sistema de axiomas para la teora de la probabilidad, basado en la teora de conjuntos y en la teora de la medida, desarrollada pocos aos antes por Lebesgue, Borel y Frechet entre otros. Esta aproximacin axiomtica que generaliza el marco clsico de la probabilidad, la cual obedece a la regla de clculo de casos favorables sobre casos posibles, permiti la rigorizacin de muchos argumentos ya utilizados, as como el estudio de problemas fuera de los marcos clsicos. Actualmente, la teora de la probabilidad encuentra aplicacin en las ms variadas ramas del conocimiento, como puede ser la fsica (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuacin de acciones).

==Introduccin

Tipos de eventos y clculo de probabilidad

Vous aimerez peut-être aussi