Vous êtes sur la page 1sur 42

Qu es la Estadstica?

Es la ciencia que orienta la toma de decisiones a partir del anlisis e interpretacin de observaciones realizadas en forma directa o experimentalmente.
Es la ciencia que proporciona los mtodos cientficos para la recopilacin, organizacin, resumen, representacin y anlisis de datos o hechos.
Tema 1: Introducin 1

Finalidad de la Estadstica

En la actualidad es considerada como un poderoso auxiliar en las investigaciones cientficas, que le permite a sta aprovechar el material cuantitativo.

La estadstica es indispensable en la formacin de cualquier profesional universitario o tcnico medio, ya que, por medio de esta se pueden realizar diagnsticos de cualquiera investigacin que se desee realizar.
La estadstica es indispensable para realizar cualquier trabajo de investigacin que requiera una recoleccin de informacin. Ella permite resumir los resultados de una investigacin en una forma significativa y cmoda. La misma permite deducir conclusiones generales y as afirmar hasta donde se puede ampliar una generalizacin de una investigacin determinada. De la misma forma permite predecir que suceder algo tomando en cuenta ciertas condiciones que se han analizado con datos anteriores.
Tema 1: Introducin 2

Ramas de la Estadstica
Estadstica Descriptiva: Mtodo que contiene la recoleccin, organizacin, presentacin y resumen de una serie de datos obtenidos en un estudio.

El proceso que sigue la estadstica descriptiva para el estudio de una cierta poblacin consta de los siguientes pasos:
Seleccin de caracteres a ser estudiados. Obtencin del valor en los caracteres seleccionados. (encuesta o medicin)
Tema 1: Introducin 3

Elaboracin de tablas de frecuencias. Representacin grfica de los resultados. Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms relevantes de una distribucin estadstica.

Casos descriptivos
1. 2. 3. 4. Diagnstico de los Censos Nacionales. Consumo de energa en los hogares. Uso de redes en colegios particulares Utilizacin de las TICs en universitarios

Tema 1: Introducin

Estadstica Inferencial: Es aquella rama de la estadstica que apoyndose en el clculo de probabilidades y a partir de datos mustrales, efecta estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Es la rama de la estadstica que hace posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente a una poblacin, fundamentndose slo en los resultados de la muestra .

Tema 1: Introducin

Conceptos bsicos en Estadstica


Poblacin(1): En trminos estadsticos, poblacin es un conjunto finito o infinito de personas, animales o cosas que presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio determinado. Est integrado por la totalidad de todas las unidades de anlisis.
Muestra: La muestra es un subconjunto de la poblacin, seleccionado de tal forma, que sea representativo de la poblacin en estudio, obtenindose con el fin de investigar alguna o algunas de las propiedades de la poblacin de la cual procede. En otras palabras es una parte de la poblacin que sirve para representarla.
(1) Algunos autores utilizan Universo como sinnimo
Tema 1: Introducin 6

Poblacin y Muestra
Poblacin

Muestra

Tema 1: Introducin

Muestreo: Es el procedimiento mediante el cual se obtiene una o ms muestras de una poblacin determinada. Existen dos tipos de muestreos a saber: Muestreo no Probabilstico: Es aquel en el cual se toma la muestra segn el criterio del investigador, estos pueden ser: muestreo intencional u opintico y el muestreo sin norma o circunstancial. Muestreo Probabilstico: Es aquel que se selecciona utilizando mtodos aleatorios en los que se utilizan las probabilidades matemticas. Entre estos se pueden mencionar: Muestreo aleatorio simple, muestreo estratificado, muestreo por conglomerado o por rea y muestreo sistemtico.
Tema 1: Introducin 8

Unidad de anlisis: Es el objeto o elemento indivisible que ser estudiado en una poblacin, sobre los cuales se van a obtener datos. Es el que genera el fenmeno estudiado y proporciona datos concretos Dato: Es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Es el resultado de la observacin, entrevista o recopilacin en general. Son la materia prima de la estadstica. Es el elemento primario de toda observacin o bsqueda.

Informacin: Es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay informacin sin datos.
Tema 1: Introducin 9

Variable: Es una caracterstica que puede tomar distintos valores. Son caractersticas observables, susceptibles de adoptar distintos valores o ser expresados en varias categoras. Adquiere un valor determinado en cada unidad de anlisis. Puede ser una caracterstica medible (peso, ingresos, rendimiento, etc.) o una cualidad no medible (sexo, nacionalidad, etc.)

Unidad de anlisis

Variable

Dato

Sexo Edad Peso Estatura

Masculino 6 aos 25 kg. 110 cm

Tema 1: Introducin

10

Tipo de Variables
Cualitativa o de Atributos: Cuando expresan una cualidad, caracterstica o atributo, tienen un carcter cualitativo, sus datos se expresan mediante una palabra, es no numrico, por lo tanto las operaciones aritmticas, como sumar y obtener promedios, no son significativas.
Ejemplos:
Sexo Nacionalidad Marcas de computadora Grado de satisfaccin Tipo de software Estado civil, etc.
Tema 1: Introducin 11

Cuantitativa o Numrica: Cuando el valor de la variable se expresa por una cantidad, es de carcter numrico. El dato o valor puede resultar de la operacin de contar o medir, por lo tanto las operaciones aritmticas, como sumar y obtener promedios, son significativas.

Ejemplos:
Nmero de computadoras Nmero de hijos Kilmetros recorridos Tiempo de vuelo Ingreso, etc.

Tema 1: Introducin

12

Las variables cuantitativas se pueden clasificar a su vez en discretas o continuas. Cuantitativas Discretas: cuando el valor de la variable resulta de la operacin de contar, su valor est dado slo por nmeros (enteros positivos). Ejemplos: cantidad de materias aprobadas, nmero hijos, nmero de computadoras, etc. Cuantitativas Continuas: cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Puede asumir cualquier valor dentro del rango de medicin, por tanto se expresa en cualquier nmero real. Normalmente se miden magnitudes como ser longitud, superficie, volumen, peso, tiempo, dinero. Ejemplos: peso al nacer, tiempo de servicios, horas trabajadas, ingreso mensual, temperatura, etc.
Tema 1: Introducin 13

Escalas de medicin de las variables:


Son el conjunto de los posibles valores que determinada variable puede tomar. Por tal razn, los tipos de escala de medicin estn ntimamente ligados con los tipos de variables a estudiar. Las magnitudes de las observaciones cuantitativas se conocen como los valores que una variable puede asumir. Es una serie de graduaciones que permiten darle un valor numrico a las caractersticas que estamos midiendo. Las escalas de medicin es el alma fundamental de toda Investigacin Cientfica, puesto que, slo a travs de ellas es como se pueden calibrar los fenmenos, sus relaciones, entre otros. Es importante conocer el tipo de escala que representan los datos, debido a que, de su esencia dependen las tcnicas estadsticas que se debern aplicar para su anlisis.
Tema 1: Introducin 14

Las escalas de medicin se clasifican en:


Escala de Medicin Nominal: Es aquella en la que los nmeros slo se emplean para diferenciar los objetos de distintas categoras o cuando se emplean nombres. Se dice que los datos que se obtienen para una variable cualitativa se miden en una escala nominal. Los datos observados simplemente se clasifican en distintas categoras que no implican orden. Los nmeros sirven como indicativos o etiquetas para identificar objetos o clases.

Ejemplos: Color de ojos Estado civil Profesiones Lugar de nacimiento, etc.


Tema 1: Introducin 15

Propiedades de la Escala Nominal:


No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos. Esta escala es considerada excluyente, es decir que la persona u objeto se incluye solamente en una categora. No existe un orden especfico para esta categora. No presentan el cero. No se basa en diferencia cuantitativa. Los elementos de una categora deben de ser equivalentes, idnticos.

Tema 1: Introducin

16

Escala de Medicin Ordinal: Es aquella en la que los nmeros se utilizan para diferenciar en orden de supremaca de acuerdo con cierto criterio jerrquico, como son los nmeros que se emplean para clasificar los distintos estratos socio-econmicos o para designar preferencias. Los datos observados se clasifican en categoras distintas en las que existe algn orden especfico. La diferencia entre dos nmeros ordinales no tiene significado cuantitativo, slo expresan, por ejemplo, que una situacin es mejor que otra, pero no cuanto. Ejemplos: Grado de instruccin Clases sociales Orden de mrito Grados militares, etc.
Tema 1: Introducin 17

Propiedades de la Escala Ordinal:

Las observaciones o elementos se les ordena en rangos o categoras diferentes. Cada categora o rango mantiene una relacin entre si, estas relaciones se expresan en trminos algebraicos de desigualdades (mayor que o menor que). Las categoras son mayores o menores que otras categoras, es decir, que existe una clasificacin de mayor a menor (jerarqua). Las categoras son mutuamente excluyentes y exhaustivas. No presentan el cero.

Tema 1: Introducin

18

Escala de Medicin de Intervalos: Es una escala ms especializada que las dos anteriores, puesto que es posible ordenar las mediciones y expresar adems en cunto difiere una situacin de la otra. Esta escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La escala de intervalos a diferencia de la nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa.
Ejemplos: Coeficiente de inteligencia, temperatura, etc.

Tema 1: Introducin

19

Propiedades de la Escala de Intervalos


Esta escala implica la cuantificacin de los datos En ests medidas se utilizan unidades constantes de medicin (capacidad, peso, grados fahrehrt o centgrados) los cuales producen intervalos iguales entre puntos de la escala. Proporcionan nmeros que manifiestan diferencias palpables entre individuos, objetos o cosas. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario. Se pueden aplicar todas las medidas estadsticas ms conocidas, con excepcin del coeficiente de variacin. Son mutuamente exclusivas y exhaustivas.
Tema 1: Introducin 20

Escala de Medicin de Razn o Proporcin: Esta constituye el nivel ms alto de medicin, posee todas las caractersticas de las escalas nominales, ordinales y de intervalos; adems tiene un cero absoluto o natural que tiene significado fsico.
El cero, significa ausencia o inexistencia total de la propiedad considerada. Son posibles todas las operaciones aritmticas. Los nmeros indican los valores concretos de la propiedad que s esta midiendo; peso, estatura, ingresos monetarios y gastos directos, son ejemplos de medidas con una escala de razn.

Tema 1: Introducin

21

Propiedades de la Escala de Razn:

La distancia entre los nmeros es un tamao conocido y constante. Los datos tienen un punto cero significativo. Puede utilizarse cualquier prueba de tipo estadstico, incluyendo el coeficiente de variacin.

Permite hacer comparaciones entre los nmeros verdaderos con un cero aritmtico siendo arbitrario nicamente la unidad de medida.

Tema 1: Introducin

22

Parmetros y Estadgrafos:
Parmetros: Son cualquiera caracterstica que se pueda medir y cuya medicin se lleve a cabo sobre todos los elementos que integran una poblacin determinada, los mismos suelen representarse con letras griegas. El valor de un parmetro poblacional es un valor fijo en un momento dado.
Ejemplo: Media Aritmtica = (mu) Desviacin Tpica = , (Sigma) etc.

Estadgrafos (Estadsticos o Estimadores): Son aquellas caractersticas medibles, cuya medicin se realiza sobre los componentes de una muestra, los mismos se representan con letras del alfabeto castellano. Los estadgrafos no tienen un valor nico, sino que pueden tomar distintos valores al ser calculados a partir de muestras diferentes.
Ejemplos: Media Aritmtica = , Desviacin Tpica = S.

x
Tema 1: Introducin 23

Ejercicios: 1. De los siguientes enunciados, cul es probablemente exija el empleo de la estadstica descriptiva y cul de la inferencia estadstica? a. Un profesor de expresin oral emplea diferentes mtodos con cada uno de sus dos cursos. Al final del curso registra las calificaciones obtenidas por sus alumnos con el fin de establecer cul es mtodo ms efectivo. b. Un ingeniero estudia la relacin entre la satisfaccin laboral de los empleados y la produccin. c. Un demgrafo registra el crecimiento de la poblacin en un rea determinada.
2. Clasificar las siguientes variables: a. Temperaturas medidas en un laboratorio cada media hora. b. Ingresos anuales de los profesores universitarios. c. Longitudes de 100 tornillos producidos en una fbrica. d. Distancia diaria recorrida por estudiante para ir de su casa a la universidad. e. Tiempo que requiere un estudiante para responder a un examen. f. Llamadas que llegan a la central telefnica de la USAT por da. g. Preferencia por cierta marca de refresco. h. Extensin del cableado de red i. Nmero de computadoras por oficina. j. Peso de carga almacenada en los contenedores
Tema 1: Introducin 24

3. Un fabricante de piezas ensambladas est interesado en la proporcin de piezas que resultan defectuosas, cuya condicin puede estar afectada por el tipo de mquina que utilice. Seleccion 2000 piezas defectuosas y encontr que el 75% de las piezas fueron hechas por la mquina A. Identifique la poblacin, muestra, unidad de anlisis, parmetro y estadgrafo.
4. La Variable Estadstica: a) Es el valor o respuesta que adquiere la caracterstica en cada unidad de anlisis. b) Es el objeto o elemento que ser estudiado en una poblacin, sobre los cuales se va obtener datos. c) Es una caracterstica observable, susceptible de adoptar distintos valores o ser expresados en varias categoras. d) Es el valor obtenido para describir en forma resumida las caractersticas ms importantes acerca de una poblacin.

Tema 1: Introducin

25

Definicin
La Estadstica es la Ciencia de la

Sistematizacin, recogida, ordenacin y presentacin de los datos referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con objeto de deducir las leyes que rigen esos fenmenos,

y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

Tema 1: Introducin

26

Para qu sirve la Estadstica?


La Ciencia se ocupa en general de fenmenos observables

La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocstico)
La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza
Tema 1: Introducin 27

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin


Los fumadores tienen ms bajas laborales que los no fumadores En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger (diseo de experimentos)

Qu individuos pertenecern al estudio (muestras)


Fumadores y no fumadores en edad laboral. Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas? Nmero de bajas Tiempo de duracin de cada baja Sexo? Sector laboral? Otros factores?

Qu datos recoger de los mismos (variables)


Recoger los datos (muestreo)

Estratificado? Sistemticamente?

No tenis que entenderlo (an)

Describir (resumir) los datos obtenidos

tiempo medio de baja en fumadores y no (estadsticos) % de bajas por fumadores y sexo (frecuencias), grficos,...

Realizar una inferencia sobre la poblacin

Los fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores.

Cuantificar la confianza en la inferencia

Nivel de confianza del 95% Significacin del contraste: p=2%


Tema 1: Introducin 28

Mtodo cientfico y estadstica

Plantear hiptesis

Disear experimento

Obtener conclusiones

Recoger datos y analizarlos

Tema 1: Introducin

29

Poblacin y muestra

Poblacin (population) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo.

Muestra (sample) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debera ser representativo Esta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales).

Tema 1: Introducin

30

Variables

Una variable es una caracterstica observable que vara entre los diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables.

En los individuos de la poblacin peruana, de uno a otro es variable:


El grupo sanguneo

{A, B, AB, O} Var. Cualitativa {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal

Su nivel de felicidad declarado

El nmero de hijos

{0,1,2,3,...} Var. Numrica discreta


{1,62 ; 1,74; ...} Var. Numrica continua

La altura

Tema 1: Introducin

31

Tipos de variables

Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos)

Nominales: Si sus valores no se pueden ordenar

Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

Ordinales: Si sus valores se pueden ordenar

Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

Cuantitativas o Numricas Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)

Discretas: Si toma valores enteros

Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Altura, Presin intraocular, Dosis de medicamento administrado, edad


Tema 1: Introducin 32

Es buena idea codificar las variables como nmeros para poder procesarlas con facilidad en un ordenador. Es conveniente asignar etiquetas a los valores de las variables para recordar qu significan los cdigos numricos.

Sexo (Cualit: Cdigos arbitrarios)


1 = Hombre 2 = Mujer

Raza (Cualit: Cdigos arbitrarios)

1 = Blanca 2 = Negra,...

Felicidad Ordinal: Respetar un orden al codificar.


1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz

Se pueden asignar cdigos a respuestas especiales como


0 = No sabe 99 = No contesta...

Estas situaciones debern ser tenidas en cuentas en el anlisis. Datos perdidos (missing data)

Tema 1: Introducin

33

Aunque se codifiquen como nmeros, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de clculo estadstico. No todo est permitido con cualquier tipo de variable.

Tema 1: Introducin

34

Los posibles valores de una variable suelen denominarse modalidades. Las modalidades pueden agruparse en clases (intervalos)

Edades:

Menos de 20 aos, de 20 a 50 aos, ms de 50 aos Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Hijos:

Las modalidades/clases deben forman un sistema exhaustivo y excluyente

Exhaustivo: No podemos olvidar ningn posible valor de la variable


Mal: Cul es su color del pelo: (Rubio, Moreno)? Bien: Cul es su grupo sanguneo?

Excluyente: Nadie puede presentar dos valores simultneos de la variable

Estudio sobre el ocio Mal: De los siguientes, qu le gusta: (deporte, cine) Bien: Le gusta el deporte: (S, No) Bien: Le gusta el cine: (S, No) Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)

Tema 1: Introducin

35

Presentacin ordenada de datos


7 6

Gnero Hombre
Mujer

Frec. 4
6

5 4 3 2 1 0 Hombre Mujer

Las tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra.
Tema 1: Introducin 36

Tablas de frecuencia

Exponen la informacin recogida en la muestra, de forma que no se pierda nada de informacin (o poca).

Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad Frecuencias relativas (porcentajes): Idem, pero dividido por el total Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas

Muy tiles para calcular cuantiles (ver ms adelante)


Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8 Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%

Sexo del encuestado Porcentaje vlido 41,9 58,1 100,0

Nmero de hij os Porcentaje vlido 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcentaje acumulado 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0

Vlidos

Hombre Mujer Total

Frecuencia 636 881 1517

Porcentaje 41,9 58,1 100,0

Vlidos

Niv el de felicidad Porcentaje vlido 31,1 58,0 11,0 100,0 Porcentaje acumulado 31,1 89,0 100,0

Vlidos

Perdidos Total

Frecuencia Muy feliz 467 Bastante feliz 872 No demasiado feliz 165 Total 1504 No contesta 13 1517

Porcentaje 30,8 57,5 10,9 99,1 ,9 100,0

Perdidos Total

0 1 2 3 4 5 6 7 Ocho o ms Total No contesta

Frecuencia 419 255 375 215 127 54 24 23 17 1509 8 1517

Porcentaje 27,6 16,8 24,7 14,2 8,4 3,6 1,6 1,5 1,1 99,5 ,5 100,0

Tema 1: Introducin

37

Datos desordenados y ordenados en tablas

Variable: Gnero

Gnero
Hombre Mujer

Frec.
4 6

Modalidades:

Frec. relat. porcentaje


4/10=0,4=40% 6/10=0,6=60%

H = Hombre M = Mujer

Muestra:
MHHMMHMMMH

10=tamao muestral

equivale a HHHH MMMMMM

Tema 1: Introducin

38

Ejemplo

Cuntos individuos tienen menos de 2 hijos?

Nmero de hij os Porcent. (vlido) 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcent. acum. 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0

frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos

Qu porcentaje de individuos tiene 6 hijos o menos?

97,3%

Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual?

2 hijos

0 1 2 3 4 5 6 7 Ocho+ Total

Frec. 419 255 375 215 127 54 24 23 17 1509

50%

Tema 1: Introducin

39

Grficos para v. cualitativas

Diagramas de barras

Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar tambin a variables discretas

Diagramas de sectores (tartas, polares)


No usarlo con variables ordinales. El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

Pictogramas

Fciles de entender. El rea de cada modalidad debe ser proporcional a la frecuencia. De los dos, cul es incorrecto?.

Tema 1: Introducin

40

Grficos diferenciales para variables numricas


419
400

375

300

Son diferentes en funcin de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.

Recuento

255 215
200

127
100

54 24 23 17

Diagramas barras para v. discretas

7 Ocho o ms

Se deja un hueco entre barras para indicar los valores que no son posibles
250 200

Nme ro de hijos

Histogramas para v. continuas

El rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.

Recuento

150

100

50

20

40

60

80

Edad del encue stado

Tema 1: Introducin

41

Qu hemos visto?

Definicin de estadstica Poblacin Muestra Variables


Cualitativas Numricas Tablas de frecuencias


Presentacin ordenada de datos

absolutas relativas acumuladas Cualitativas Numricas


Tema 1: Introducin 42

Representaciones grficas

Vous aimerez peut-être aussi