Vous êtes sur la page 1sur 81

DESARROLLO HISTORICO DE LA

ESTADISTICA
D.R.. Juan Gabriel Contreras Mtz.

Todo el que toma decisiones debe hacerlo bajo condiciones de incertidumbre, en mayor o menor grado.

Con el aumento de la competitividad, la administracin de las instituciones requiere tomar decisiones cada vez con una mayor base de conocimiento para as reducir la incertidumbre.

Datos no faltan

Aumento en la eficiencia de los computadores

Aumento en la capacidad de almacenar datos.

Pero los datos por si solos no sirven

si la institucin no es capaz de extraer informacin de ellos.

Y con los recursos necesarios, como competencias y experiencia, se puede convertir esta informacin en conocimiento

para tomar las decisiones estratgicas, tcticas y operativas.

Las etapa de produccin de datos y de extraccin de informacin, requiere de mtodos, tcnicas y herramientas de anlisis.

El desarrollo de estos mtodos, tcnicas y herramientas se encuentra en una ciencia que se llama ESTADISTICA.

CONOCIMIENTO

RECURSOS INTELECTUALES ESTADISTICA INFORMACION DATOS

ESTADISTICA

CONOCIMIENTO

RECURSOS INTELECTUALES ESTADISTICA INFORMACION DATOS

ESTADISTIC A
7

Godofredo Achenwall, 1760, acu la palabra estadstica, del italiano statista (estadista), del latn status, estado o situacin. Pensaba que la nueva ciencia sera el aliado ms eficaz del gobernante.

Antecedentes Remotos de la Estadstica - Datos sobre poblacin y riqueza.

Egipto 3050 AC

- Ramss II hizo un censo de las tierras, hacia 1300 AC

Tambin en se guardaban datos de las crecidas del Nilo, que registraban largos perodos de sequa seguidos por largos perodos de inundaciones. Slo nos llegaron datos desde el ao 622 al 1281 de nuestra era, pero hay referencias de que existi esta informacin desde tiempos remotos.

De hecho, construyeron un calendario basado en las crecidas del Nilo.


10

Babilonia 3000 AC

- Datos comerciales y agrcolas.

11

Antiguo Israel

- La Biblia, libro de los Nmeros: datos estadsticos de dos recuentos de la poblacin.

- El rey David, alrededor de 1000 AC, orden hacer un censo de Israel.

12

China, 2000 AC

- Registros numricos del bienestar material.

13

Grecia, 540 AC

- Censos peridicos con fines tributarios, sociales y militares.

14

Imperio Romano

- Censos de poblacin cada cinco aos.

15

Francia, 758 y 762 - Relaciones de tierra de la Iglesia, hechas por Pipino el Breve y por Carlomagno, respectivamente.

Francia, siglo IX

- Censos parciales de la servidumbre de los campos.


16

Inglaterra, 1086. - Censo de Guillermo I: Domesday Book.

Inglaterra, siglo XVI.

- Registro minucioso de muertes por la peste.

17

Los Censos continan en nuestros das...

...pero tienen sus das contados.

18

ESTADISTICA

Datos

Probabilidad
19

La teora de la probabilidad

Es una disciplina matemtica que fundamenta la Estadstica como una lgica y una metodologa para la medicin y el estudio de la incertidumbre en la planeacin e interpretacin de la observacin y la experimentacin.

20

Una aplicacin de la probabilidad emprica a los seguros de buques se encuentra en Flandes, en el siglo XIV.

21

Girolamo Cardano 1501-1576

Galileo Galilei 1564-1642

Haban hecho clculos de probabilidades numricas, de diversas combinaciones de dados.


22

Pero las races de la Teora de la probabilidad se encuentran en los juegos de azar.


23

Blaise Pascal

Los inicios de la probabilidad, como teora matemtica, puede rastrearse en la correspondencia que sostuvo Pascal con Fermat, en la dcada de 1650.
24

Pierre de Fermat

25

Christian Huygens Gemetra, fsico, astrnomo.

Tambin los orgenes de la teora de la probabilidad se encuentran en un corto artculo escrito por l en 1657.

26

Estos trabajos tempranos de Fermat, Pascal y Huygens no abordan problemas de estadstica inferencial, o confirmatoria, ni van ms all de los juegos de azar, que eran sus intereses inmediatos.

27

John Graunt es considerado por algunos, como el iniciador de la Estadstica, por sus trabajos en demografa, que incorporan nociones de regularidad en el comportamiento de ciertas proporciones de naturaleza aleatoria (1662).
28

Jacob Bernoulli Matemtico suizo (n. 1654)

Considerado el iniciador de la teora de la probabilidad

Introduce lo que hoy se conoce como la primera ley de los grandes nmeros.
29

Entre los siglos XVIII y XIX, la Estadstica se propag a travs de diversas disciplinas: la astronoma y la geodesia, la psicologa, la biologa, hasta las ciencias sociales.

Y tambin profundiz en el conocimiento del rol de la probabilidad, siendo desplazada la analoga de los juegos de azar, por modelos probabilsticos para efectuar medidas bajo incertidumbre.

De este modo se llega a los inicios de la inferencia estadstica, cuyo dominio de aplicacin se extiende gradualmente, desde fines de este perodo.

30

Abraham De Moivre

Efectu estudios sobre la ley de probabilidad binomial, y formul una aproximacin para muestras grandes, considerada la primera formulacin de la ley de probabilidad normal. 1718 a 1730.

31

Thomas Bayes En 1764 se public su trabajo Ensayo sobre la Resolucin de un Problema en la Doctrina del Azar pstumamente. Ignorado por sus contemporneos, tuvo poca influencia sobre el desarrollo temprano de la Estadstica. Sus contenidos sirvieron, casi dos siglos despus, para grabar su nombre en la moderna inferencia bayesiana.

32

Una forma simple del Teorema de bayes (hay casos ms generales):

33

Una forma simple del Teorema de bayes (hay casos ms generales):

34

La inferencia bayesiana es antagnica con la de los frecuentistas, que slo permiten asignar probabilidades cuando es posible que stas son apoyadas por experimentacin.

La inferencia bayesiana permite asignar probabilidades a fenmenos que no son de naturaleza aleatoria, pero cuyos resultados no son conocidos.

35

En la concepcin frecuentista de la probabilidad, si se repite un experimento n veces, se registra la fraccin de veces que se cumple el evento que nos interesa, E, la probabilidad de E es el lmite de esa fraccin, cuando n tiende a infinito.

36

Frecuentista esperando que n llegue a infinito.

37

Los Bayesianos permiten que se asigne probabilidad a eventos que no son repetibles. Incluso a eventos que no parecen aleatorios, pero cuyos resultados son desconocidos

38

Arthur Young

Desarroll un gran nmero de experimentos agrcolas en su fundo.

Public sus resultados en 1771, con ideas sorprendentemente modernas sobre el Diseo de Experimentos.

39

Pierre Simon Laplace Contribuy en muchos temas estadsticos, como profundizar la aplicacin de la probabilidad a la inferencia, la obtencin de una curva de errores, llegando a la formulacin de la ley de probabilidad normal. 1774 a 1781.

40

Adrian Marie Legendre

Cre un sistema para describir el movimiento planetario, que involucra el mtodo de los mnimos cuadrados, tan utilizado en la Estadstica de hoy, como mtodo de estimacin de parmetros. 1805. Mnimos Cuadrados fue tema dominante en el siglo XIX.

41

Karl Gauss

Tambin contribuy al mtodo de los mnimos cuadrados.

Desemboc en la ley de probabilidad normal independientemente de Laplace, como descripcin probabilstica del error, pero encontr su asociacin con el mtodo de mnimos cuadrados.

42

Adolphe Quetelet Meteorlogo, astrnomo, estadstico, socilogo. Se le ha llamado el padre de la Estadstica moderna, por observar la extraordinaria regularidad con que se reproducan ciertos fenmenos sociales, como crmenes o suicidios. 1835. Argumenta que esas regularidades slo pueden ser encontradas mediante el uso de tcnicas estadsticas. Ajust distribuciones de probabilidad a datos empricos.
43

Simen Denis Poisson

Public en 1837 el germen de dos elementos asociados a su nombre:

La distribucin de Poisson.

La generalizacin de la ley de los grandes nmeros de Bernoulli.

44

Numerosos investigadores, provenientes de las ms diversas disciplinas, hicieron contribuciones a la Estadstica durante la segunda mitad del siglo XIX, construyendo de a poco una disciplina que se ira perfilando cada vez ms como una ciencia independiente.

45

Wilhelm Lexis

Contribuy a la estadstica social, estudiando datos presentados como series de tiempo, por primera vez. 1880
46

John Arbuthnot Ingls, mdico de la reina Ana.

Realiz estudios sobre las proporciones de los sexos en los nacimientos.

47

Henry Buckle Ingls, precursor de la moderna Ciencia Histrica, aplic mtodos estadsticos para ayudar de hacer de la historia una ciencia.

48

Gustav Fechner Alemn, con estudios de medicina, aplic la experimentacin para describir relaciones entre estmulos y sensacin. Deriv la Estadstica hacia la psicologa experimental. Introdujo la medicin en la psicologa, hacia mediados del siglo XIX.
49

Hermann Ebbinghaus Psiclogo alemn, pensaba que el estudio cuantitativo era el nico medio de expresar las vagas nociones que manejaba la psicologa entonces. Aplic el diseo experimental al estudio de la memoria.

50

A partir de 1880, Francis Galton, Francis Edgeworth y Karl Pearson, crean una revolucin en la Estadstica, proporcionando una metodologa emprica que sustituye a la experimentacin controlada, en disciplinas donde la experimentacin no es posible de aplicar.

Lo hicieron separadamente Galton en la Antropologa, Edgeworth en la Economa y Pearson en la filosofa de la ciencia.

51

Francis Galton (n. 1822)

Investig el carcter hereditario de la genialidad. Fu pionero en el tema de la regresin lineal simple, y por la correlacin. Investig la distribucin normal bivariada.
52

Estudi las aproximaciones que se Francis Edgeworth obtienen cuando los conjuntos de datos crecen. Aport la aproximacin de Edgeworth, cuyo uso se ha intensificado hoy. Desarroll una versin del teorema del lmite central, que establece que bajo ciertas condiciones, un promedio muestral sigue aproximadamente la ley probabilstica normal, si el tamao muestral es grande
53

Estudi las distribuciones probabilsticas asimtricas, Llegando a introducir la distribucin Gama. Desarroll el estadstico jicuadrado. Mostr inters en los ms diversos temas, adems de la estadstica, llegando a la conviccin de que la estadstica analtica yace en los fundamentos de todo el conocimiento. 1892

Karl Pearson

54

La idea de representatividad, en Estadstica, es decir, de seleccionar aleatoriamente algunas unidades para llevar a cabo un estudio sobre una poblacin, es antigua. En esta idea se fundamenta la tcnica de muestreo. Sin embargo, durante mucho tiempo no fue aceptado, por la generalidad de los estadsticos.

55

En 1895, fue presentada formalmente en una reunin del Instituto Internacional de Estadstica, en Berna, por el director de la Oficina Central de Estadstica de Noruega, A. N. Kaier, bajo el nombre de mtodo representativo.

Despert inters pero fue rechazado.

Se present nuevamente en una reunin del Instituto Internacional de Estadstica Roma, en 1926, y finalmente aceptado.

56

Influyeron los trabajos en estudios sociales y econmicos, de A. L. Bowley.

A l se debe una aplicacin de la teora de inferencia a las encuestas por muestreo, realizado en 1906.

57

Jerzy Neyman Desarroll el muestreo de poblaciones finitas, y la estimacin por intervalos de confianza. 1934.

Estableci que la seleccin aleatoria es la base de una teora cientfica que permite predecir la validez de las estimaciones muestrales. Tambin dej establecida toda una filosofa sobre la eficiencia de la estrategia muestral.
58

Egon Pearson Hijo de Karl Pearson.

Junto a Neyman present una teora sobre cmo probar hiptesis, en base a datos. 1936. Resolvieron dificultades fundamentales para su comprensin, introduciendo las nociones de hiptesis alternativa, y los dos tipos de error, el de rechazar una hiptesis que es verdadera, y el de no rechazar una hiptesis que es falsa. Surge el Lema de Neyman-Pearson.
59

Ronald Fisher Bilogo, genetista y estadstico ingls, ingres a la estacin experimental agrcola de Rotahmsted en 1919. Contribuy a desarrollar tcnicas claves para en la experimentacin: El diseo experimental en bloques, que permite el control de efectos de factores no deseados. La aleatorizacin, que constituye una proteccin contra la introduccin de factores impredecibles.
60

El diseo factorial, para el estudio del efecto de varios factores, simultneamente.

El anlisis de varianza, tcnica de anlisis que permite separar las fuentes de variacin y as evaluar su influencia.

desarroll una teora de estimacin eficiente, basada en la Funcin de Verosimilitud.

61

Se crea una larga controversia entre Ronald Fisher y Neyman y Pearson.

Fisher visualizaba la prueba de hiptesis como un procedimiento mediante el cual el investigador poda formarse una opinin sobre alguna caracterstica de la poblacin, o parmetro.

Neyman y Pearson vieron la prueba de hiptesis como un medio para que el investigador tomara una decisin sobre un parmetro de la poblacin.

62

William Gosset

Qumico y matemtico ingls. Trabaj como qumico en la cervecera Guiness, en particular en Control Estadstico de Calidad. Publicaba sus trabajos de estadstica bajo el seudnimo de Student. desarroll el test T, basado en la distribucin de probabilidad T de Student, introducida por l.

63

George Snedecor

Fu uno de los pioneros de la Estadstica en los Estados Unidos, al constituirse en fundador del Laboratorio de Estadstica de la Iowa State University, en 1933, dedicado fundamentalmente a las aplicaciones a la agricultura. Trabaj en conjunto con Ronald Fisher, contribuyendo a desarrollar algunas de las ideas de l. En particular, son importantes sus contribuciones al Anlisis de Varianza.
64

William Cochran

Nacido en Escocia en 1909. Trabaj en la Iowa State University, junto con Snedecor. Hizo contribuciones al Diseo de Experimentos y a la Teora del Muestreo. Se traslad a Rothamsted, Inglaterra, donde tuvo contacto con Ronald Fisher, donde se involucr en aplicaciones mdicas de la estadstica.
65

Harold Hotelling

Economista y Estadstico nacido en 1895. Pionero en la combinacin de Estadstica Matemtica y Economa. Tambin trabajo con Ronald Fisher y aplic algunas de sus tcnicas. En particular al periodismo, ciencia poltica, demografa y alimentacin. Es conocido en Estadstica por sus trabajos en Anlisis Multivariante, en particular por la distribucion de probabilidad T-Cuadrada de Hotelling, una generalizacin de la T de Student.
66

Frank Wilcoxon

Qumico y Estadstico nacido en Estados nUnidos en 1892. Contribuy a la Estadstica NoParamtrica, en particular es suyo el test basado en rangos de Wilcoxon.

67

Charles Spearman

Psiclogo nacido en 1863. Se preocup de definir la inteligencia. Se le considera el primer psicometrista sistemtico Fu pionero en el desarrollo del mtodo del Anlisis Multivariante denominado Anlisis Factorial.

68

L.L. Thurstone

Naci en Estados Unidos en 1887. De formacin original ingeniero, trabaj junto a Thomas A. Edison. Realiz grandes aportaciones a la medicin de la inteligencia y de las actitudes sociales. Defendi la explicacin de la inteligencia como conjunto de siete capacidades o factores, tambin identificables mediante el anlisis factorial.

69

Abraham Wald

Desarroll la Teora Estadstica de Decisiones, y la Teora de Muestreo Secuencial. Tambin en otros campos, como Mxima Verosimilitud Asinttica, Estadstica NoParamtrica, Anlisis Discriminante, Control de calidad, Modelos Lineales con Error en las Variables, entre otros.

70

Andrey Kolmogorov Matemtico y fsico ruso. Plante los fundamentos de la teora axiomtica de la probabilidad. Hizo contribuciones cruciales a la Teora Algortmica de la Aleatoriedad, a la Mecnica Estadstica, a los Procesos Estocsticos, a la Teora de la Informacin. Analiz la entropa en los texto literarios, lo que dio origen a una corriente de estudios sobre lingstica estadstica.
71

Calyampudi Radhakrishna Rao Estadstico Indio nacido en 1920.

Hizo contribuciones en las reas de Teora de Estimacin, Inferencia, Modelos Lineales, Anlisis Multivariante, entre otras.

Es conocido especialmente por la Cota de Crmer-Rao y el Teorema de Rao-Blackwell.


72

En aos recientes ha habido un desarrollo de la Estadstica de la mano del computador. Es as como se ha desarrollado la llamada Computacin Estadstica.

El computador permite realizar operaciones repetitivas a alta velocidad.

Cuando un problema es demasiado complejo como para encontrar soluciones analticas, se pueden desarrollar mtodos basados en la repeticin.

73

Por ejemplo, mtodos que buscan aproximaciones a las soluciones ptimas mediante la repeticin.

Estos mtodos dan origen a algoritmos computacionales que requieren mucho procesamiento.

74

Entre estos mtodos, estn los ms conocidos, como el Bootstrap, de B. Efron.

El Algoritmo EM, de Dempster, Laird y Rubin.

El jacknife, la validacin cruzada (cross validation), el Gibbs sampling.

75

Y muchos ms, que an estn por descubrirse..

76

Conceptos Bsicos
DATOS: Los datos son la materia prima de la estadstica. Para este propsito se puede definir a los datos como nmeros. Las dos clases de nmeros que se utilizan en estadstica son nmeros que resultan de la toma --en el sentido literal del termino-de medidas, y aquellos que resultan del proceso de conteo. ESTADISTICA: la estadstica es la disciplina que se ocupa de 1) la recoleccin, organizacin, resumen y anlisis de datos, y 2) la obtencin de inferencias a partir de un volumen de datos cuando se examina solo una parte de estos. FUENTE DE DATOS: Registro de datos, encuestas, experimentacion, Fuentes externas. BIOESTADISTICA: Cuando los datos que se analizan proceden de las ciencias biolgicas o medicas, se utiliza el termino bioestadstica para diferenciar esta aplicacin particular de las herramientas y conceptos de la estadstica general 77

VARIABLE: Una caracterstica se clasifica como variable si, tal como se observa, se encuentra que esta toma diferentes valores en diferentes personas, lugares o cosas y estas pueden ser CUANTITATIVAS O CUALITATIVAS y estas a la vez pueden ser ALEATORIAS, DISCRETAS, CONTINUAS. POBLACION: Habitualmente se considera a una poblacin como una coleccin de entidades, por lo general personas. Sin embargo, una poblacin o coleccin de entidades puede estar compuesta de animales, maquinas, plantas o clulas. MUESTRA: Una muestra puede definirse simplemente como una parte de una poblaci6n.

78

Medidas y escalas de medicin


MEDICION: Se define como la asignacin de nmeros a objetos o eventos de acuerdo con un conjunto de reglas. Las diversas escalas de medicin son consecuencia de que la medicin puede llevarse a cabo segn los diferentes conjuntos de reglas. ESCALAS: Nominal, (consiste en designar o "nombrar" las observaciones o clasificarlas en varias categoras mutuamente excluyentes y colectivamente exhaustivas La practica de utilizar nmeros para distinguir entre diversos diagnsticos mdicos constituye una medicin sobre una escala nominal. Otros ejemplos incluyen dicotomas . como masculino-femenino, sano-enfermo, menor de 65 aos de edad-mayor de 65 aos de edad en adelante, nio-adulto y casado-soltero.

79

ESCALA ORDINAL: Siempre que las observaciones no solo difieran de categora a categora, sino que adems puedan clasificarse por grados de acuerdo con algn criterio, se dice que se miden sobre una escala ordinal. Los pacientes convalecientes pueden clasificarse como sin mejora, mejorados y bastante mejorados. ESCALA EN INTERVALOS: La escala de intervalos es una escala mas especializada que la nominal o la ordinal en el sentido de que, con esta escala, no solo es posible ordenar las mediciones, sino que tambin se conoce la distancia entre dos mediciones cualesquiera. Por ejemplo, se sabe que la diferencia entre una medida de 20 y una medida de 30 es igual a la diferencia entre las medidas de,30 y 40. ESCALA DE RAZONES: El nivel mas alto de medicin es la escala de razones. Esta escala se caracteriza por el hecho de que puede determinarse tanto la igualdad de las razones como la de los intervalos. Y para esta escala es fundamental un punto cero verdadero. La medicin de rasgos tan familiares como altura, peso y longitud, hacen uso de este tipo de escala.

80

FIN

81

Vous aimerez peut-être aussi