Vous êtes sur la page 1sur 22

UNIVERSIDAD ANDINA DEL

CUSCO
FACULTAD DE CIENCIAS DE LA
SALUD
ESCUELA PROFESIONAL DE MEDICINA
HUMANA

DESCRIPCIN DE DATOS Y
MEDIDAS DE DISPERSIN

CURSO: Bioestadistica I
DOCENTE: Hermitao Ayala
Huillca
SEMESTRE: 2016 I
ALUMNO: Escalante
CUSCO-Nahuamel Jose
Percy

PER
2016

PRESENTACIN
El Alumno de la Universidad Andina del Cusco, de la Facultad de Ciencias de la
Salud, de la Escuela Profesional de Medicina Humana: Percy Escalante;
Presento este trabajo sobre descripcin de datos y medidas de dispersin con
el fin de contribuir un poco ms a las nociones de esto que son tan importantes
para el aprendizaje de la estadstica.
La importancia de este tema es amplio ya que permitir al investigador agrupar,
organizar, analizar, e interpretar resultados, para esto toma como base la
fundamentacin neolgica, es decir, a partir del anlisis mental, el uso de la
inteligencia para la construccin del conocimiento con el fin de dar respuestas a
los interrogantes formulados al problema de investigacin.
Cuando se utiliza una prueba estadstica en una investigacin se establece un
sistema de relaciones entre los datos con el fin de generar conclusiones desde
sus resultados, como existencia o no entre eventos, variables o informacin
generada desde los grupos de anlisis; cambios en la magnitud de una variable
luego de la aplicacin de un tratamiento. En ese sentido, las pruebas
estadsticas le suministran al investigador bases para comparar, criterios para
referenciar o diferenciar desde el anlisis de probabilidades si existe o no
diferencias significativas entre grupos.

INTRODUCCIN
Es muy importante que los resultados numricos de cualquier estudio se
presenten en forma clara y concisa, de modo que rapidamente se pueda tener
una idea de las caracteristicas esenciales de los datos. Esto es particularmente
necesario cuando se trata de un amplio conjunto de datos, como
frecuentemente ocurre en las encuestas o en los experimentos controlados.
Realmente, una presentacion efectiva de los datos a menudo revela con
rapidez elementos tales como su categoria, su grado de siemtria, los
concentrados o dispersos que estan, donde se concentran, etc.
En este trabajo se tratarn distintas tecnicas de presentacion de datos, tanto
tabulares como graficas. Las tablas y los graficos de frecuencias que se
presentan incluyen una gran variedad de tablas y graficos. Tambien se estudia
los histogramas, un tipo de grafico de barras que resulta de representar
graficamente las frecuencias de las clases.
Se espera que al finalizar este trabajo, el estudiante tenga un amplio
conocimiento y entendimiento de la descripcin de datos y medidas de
dispersin y el papel fundamental que stos tienen en la bioestadstica; con
ello, el estudiante podr llevar a la prctica la teora aqu expuesta por
conducto de los elementos tericos y visuales descritos a lo largo del desarrollo
de los captulos.

Contenido
PRESENTACIN.............................................................................................. 2
INTRODUCCIN.............................................................................................. 3
DESCRIPCIN DE DATOS................................................................................ 5
1.1

CONCEPTO......................................................................................... 5

CAPITULO I..................................................................................................... 5
1.2

TIPOS DE DATOS................................................................................ 6

1.2.1

VARIABLE ALEATORIA...................................................................6

1.2.2

POBLACIN O UNIVERSO.............................................................6

1.2.3

MUESTRA..................................................................................... 6

1.2.4

VARIABLE ESTADSTICA................................................................6

1.2.5

DATO ESTADSTICO......................................................................7

1.3

FRECUENCIA...................................................................................... 7

1.3.1

MUESTRA..................................................................................... 7

1.3.2

DATOS ESTADSTICOS..................................................................7

1.3.3

FRECUENCIA ABSOLUTA...............................................................7

1.3.4

FRECUENCIA RELATIVA................................................................7

1.3.5

CONDICIN DE NORMALIZACIN..................................................7

1.3.6

FRECUENCIA RELATIVA ACUMULADA............................................8

1.4

DISTRIBUCIN DE FRECUENCIA.........................................................8

1.4.1

DIAGRAMA DE BARRAS E HISTOGRAMAS.....................................8

1.4.2

EJEMPLO DE VARIABLE CONTINUA...............................................9

1.5

MEDIDAS DE CENTRALIZACIN: MEDIA ARITMETICA.........................10

1.5.1
1.6

PROPIEDADES........................................................................... 10

MEDIDAS DE DISPERSIN................................................................10

1.6.1

DESVIACIN ESTNDAR Y VARIANZA.........................................11

1.6.2

PROPIEDADES........................................................................... 11

2.1

CONCEPTO....................................................................................... 12

CAPITULO II................................................................................................... 12
Medidas de Dispersin..................................................................................... 12
2.2

RANGO ESTADISTICO.......................................................................13

2.2.1

REQUISITOS DEL RANGO...........................................................13

2.3

MEDIO RANGO O RANGO MEDIO......................................................13

2.4

VARIANZA........................................................................................ 14

2.4.1
2.5

PROPIEDADES........................................................................... 14

DESVIACION TPICA..........................................................................15

2.5.1

DESVIACIN TPICA MUESTRAL..................................................15

.................................................................................................................. 15
2.5.2

DESVIACIN TPICA POBLACIONAL.............................................15

............................................................................................................... 15
2.6

COVARIANZA.................................................................................... 15

2.7

COEFICIENTE DE CORRELACION DE PEARSON.................................16

2.7.1

PROPIEDADES........................................................................... 17

CONCLUSIN................................................................................................ 18
BIBLIOGRAFA............................................................................................... 19

1.1 CONCEPTO
Los datos ayudan a los
de decisiones a hacer
fundamentadas

acerca

tanto, sobre los efectos


caractersticas
lo
permite

de

dems,

tendencias

CAPITUL
OI

el

adquirido

conocer

los

encargados de la toma
conjeturas

bien

de las causas y, por lo

DESCRIP
CIN DE
DATOS

probables

de

ciertas

algunas situaciones. Por


conocimiento
con

la

posibles

de

las

experiencia
resultados

planear con anticipacin.


Esta parte se orienta al tratamiento de datos estadsticos, esto es, al anlisis
estadstico de poblaciones finitas. Para estas poblaciones, analiza una o ms
caractersticas, con el objeto de resumir el comportamiento de cada una de
ellas dentro de la poblacin, o la relacin entre varias (1).
En Estadstica univariante ver el lector cmo se analiza una caracterstica.
Aunque se dedica una mayor atencin a las caractersticas numricas, o
variables estadsticas, una parte relevante de esta descripcin aborda el
tratamiento de los caracteres cualitativos, o atributos. El anlisis se enfoca
desde sus vertientes numricas y grficas.

El enlace Estadstica bivariante ensea a resumir la relacin entre varios


caracteres. Se abordan separadamente los casos en que ninguno, uno o los
dos caracteres son cualitativos, mostrando las herramientas de anlisis
numrico y grfico ms adecuadas en cada caso (2).

1.2 TIPOS DE DATOS


1.2.1

VARIABLE ALEATORIA
Variable de la que desconocemos el valor que tomar como
resultado de una accin.
a) VARIABLES ALEATORIAS DISCRETAS: Conjunto finito de
valores (ej. lanzamientos de un dado).
b) VARIABLES ALEATORIAS CONTINUAS: Conjunto infinito de
valores (ej. Tiempos en un cronmetro).

1.2.2

POBLACIN O UNIVERSO
Es el conjunto homogneo de elementos sobre el que se realiza el
estudio.

1.2.3

MUESTRA
Conjunto de N medidas de una cierta cantidad extradas de la
poblacin o universo.

1.2.4

VARIABLE ESTADSTICA
Es cada una de las caractersticas observadas sobre los
elementos de una poblacin.

1.2.5

DATO ESTADSTICO
Cada uno de los valores que toma la variable estadstica (3).

1.3 FRECUENCIA
1.3.1 MUESTRA

Ejemplo, N = 1000 lanzamientos de un dado

1.3.2DATOS ESTADSTICOS

Ejemplo, 6 resultados posibles

1.3.3

xk

= 1, 2, 3, 4, 5,6

FRECUENCIA ABSOLUTA
Nmero de veces

nk

que el resultado

xk

ha tenido lugar

n k=N
k

1.3.4FRECUENCIA RELATIVA
Frecuencia absoluta dividida por el nmero total de medidas N.
F

K=

NK
N

1.3.5CONDICIN DE NORMALIZACIN

1.3.6FRECUENCIA RELATIVA ACUMULADA

1.4 DISTRIBUCIN DE FRECUENCIA

1.4.1DIAGRAMA DE BARRAS E HISTOGRAMAS


Ejemplo de variable discreta: 26, 24, 26, 28, 23, 24, 25, 24, 26, 25
Ordenacin
23, 24, 24, 24, 25, 25, 26, 26, 26, 28
Tabla
TABLA DE VALORES DE x HALLADOS Y NUMERO DE
APARICIONES
Valores X k

23

24

25

26

27

28

Frecuencia nk

0.1

0.3

0.2

0.3

0.0

0.1

0.1

0.4

0.6

0.9

0.9

1.0

Frecuencia Relativa,
F k=

nk
N

Frecuencia Relativa
Acumulada

1.4.2EJEMPLO DE VARIABLE CONTINUA


26.4, 23.9, 25.1, 24.6, 22.7, 23.8, 25.1, 23.9, 25.3, 25.4
Ordenacin
22.7, 23.8, 23.9, 23.9, 24.6, 25.1, 25.1, 25.3, 25.4, 26.4

Tabla

TABL

Valo

Frecu

Frecuen

1.5 MEDIDAS DE CENTRALIZACIN: MEDIA


ARITMETICA

1.5.1

PROPIEDADES

a) La suma algebraica de las desviaciones de un conjunto de nmeros de


su media aritmtica es cero (4).

b) La suma de los cuadrados de las desviaciones de un conjunto de


nmeros de cualquier nmero a es mnima slo si a

c) Si a todos los valores de una variable x se les suma (multiplica por) una
cantidad constante A, la media de los nuevos valores tambin
aumentar en (vendr multiplicada por) esa cantidad.

1.6

MEDIDAS DE DISPERSIN
1.6.1

DESVIACIN ESTNDAR Y VARIANZA

1.6.2

PROPIEDADES
a) El clculo de la varianza puede simplificarse de la siguiente
manera:

b) Si a todos los valores de una variable x se les suma una


cantidad constante A, la varianza de los nuevos valores no
vara.
c) Si a todos los valores de una variable x se les multiplica por
una cantidad constante A, la varianza de los nuevos valores
vendr multiplicada por el cuadrado de esa cantidad (5).

CAPITUL
O II
Medidas
de
Dispersin

2.1 CONCEPTO

Las medidas de dispersin, tambin llamadas medidas de variabilidad,


muestran la variabilidad de una distribucin, indicando por medio de un nmero
si las diferentes puntuaciones de una variable estn muy alejadas de la media.
Cuanto mayor sea ese valor, mayor ser la variabilidad, y cuanto menor sea,
ms homognea ser a la media. As se sabe si todos los casos son parecidos
o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmtica. Pero la suma de las desviaciones es siempre cero, as que se
adoptan dos clases de estrategias para salvar este problema. Una es tomando
las desviaciones en valor absoluto (desviacin media) y otra es tomando las
desviaciones al cuadrado (varianza) (6).

2.2 RANGO ESTADISTICO


2.2.1

REQUISITOS DEL RANGO

a) Ordenamos los nmeros segn su tamao.


b) Restamos el valor mnimo del valor mximo

Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5) el dato menor es 4 y el dato mayor es 9.
Sus valores se encuentran en un rango de:

2.3 MEDIO RANGO O RANGO MEDIO


El medio rango o rango medio de un conjunto de valores numricos es la media del mayor

y menor valor, o la tercera parte del camino entre el dato de menor valor y el
dato de mayor valor. En consecuencia, el medio rango es (7):

Ejemplo

Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el
dato de mayor valor Max= 8. El medio rango resolvindolo mediante la
correspondiente frmula sera:

2.4 VARIANZA
La varianza es una medida estadstica que mide la dispersin de los valores
respecto a un valor central (media), es decir, es el cuadrado de las

desviaciones:

2.4.1

PROPIEDADES

a) La varianza es siempre positiva o 0:


b) Si a los datos de la distribucin les sumamos una cantidad constante la
varianza no se modifica.
i.

c) Si a los datos de la distribucin los multiplicamos por una constante, la


varianza queda multiplicada por el cuadrado de esa constante.

d) Propiedad distributiva

Siempre y cuando las variables

sean independientes

2.5 DESVIACION TPICA


La varianza a veces no se interpreta claramente, ya que se mide en unidades
cuadrticas. Para evitar ese problema se define otra medida de dispersin, que
es la desviacin tpica, o desviacin estndar, que se halla como la raz
cuadrada positiva de la varianza. La desviacin tpica informa sobre la
dispersin de los datos respecto al valor de la media; cuanto mayor sea su
valor, ms dispersos estarn los datos. Esta medida viene representada en la
mayora de los casos por S, dado que es su inicial de su nominacin en ingls.
2.5.1

DESVIACIN TPICA MUESTRAL

2.5.2

DESVIACIN TPICA POBLACIONAL

2.6

COVARIANZA

La covarianza entre dos variables es un estadstico resumen indicador de si las


puntuaciones estn relacionadas entre s. La formulacin clsica se simboliza
por la letra griega sigma () cuando ha sido calculada en la poblacin. Si se
obtiene sobre una muestra, se designa por la letra "

".

La frmula suele aparecer expresada como:

Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos
variables si ambas utilizan una escala de medida a nivel de intervalo/razn
(variables cuantitativas).
La expresin se resuelve promediando el producto de las puntuaciones
diferenciales por su tamao muestral (n pares de puntuaciones, n-1 en su
forma insesgada).
Este estadstico refleja la relacin lineal que existe entre dos variables. El
resultado numrico flucta entre los rangos de +infinito a -infinito. Al no tener
unos lmites establecidos no puede determinarse el grado de relacin lineal que
existe entre las dos variables, solo es posible ver la tendencia.

2.7 COEFICIENTE DE CORRELACION DE PEARSON


El coeficiente de correlacin de Pearson, r, permite saber si el ajuste de la nube
de puntos a la recta de regresin obtenida es satisfactorio. Se define como el
cociente entre la covarianza y el producto de las desviaciones tpicas (raz
cuadrada de las varianzas).

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar


mediante cualquiera de las dos expresiones siguientes:
Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor
Min= 3 y el dato de mayor valor Max= 8. El medio rango resolvindolo mediante
la correspondiente frmula sera:

2.7.1

PROPIEDADES

a) El coeficiente de correlacin, r, presenta valores entre 1 y +1.


b) Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La
nube de puntos est muy dispersa o bien no forma una lnea recta. No
se puede trazar una recta de regresin.
c) Cuando r es cercano a +1, hay una buena correlacin positiva entre las
variables segn un modelo lineal y la recta de regresin que se
determine tendr pendiente positiva, ser creciente.

d) Cuando r es cercano a -1, hay una buena correlacin negativa entre las
variables segn un modelo lineal y la recta de regresin que se
determine tendr pendiente negativa: es decreciente.es

CONCLUSIN
En sntesis la Descripcin de datos se completa con dos tpicos de gran
importancia en el anlisis estadstico de las realidades sociales y econmicas:
Por un lado, el anlisis de los denominados Nmeros ndices, que resumen la
variacin temporal o geogrfica de ciertas magnitudes o conceptos. El anlisis
econmico actual sera impensable si no dispusiramos, por ejemplo, de los
ndices de Produccin Industrial o el ndice de Precios de Consumo.
Por otro lado, las Series temporales, en su da denominadas Series
cronolgicas, que valoran la evolucin temporal de magnitudes econmicas.
Conceptos como la tendencia, los ndices de Variacin estacional, las Tasas de
variacin interanual, se analizan en los correspondientes enlaces.
La dispersin indica que tan cercanos o lejanos se encuentran los valores unos
de otros. Dichos valores pueden pertenecer a un conjunto de datos agrupados

(distribuciones de frecuencias) o no agrupados (ordenados de acuerdo a su


magnitud). Las medidas de dispersin que son ms comunes son: rango,
desviacin media, desviacin estndar, varianza. Las medidas de dispersin
que utilizan la media como referencia son: desviacin media, desviacin
estndar, varianza. Las medidas de dispersin vistas fueron para datos
mustrales.

BIBLIOGRAFA
1. Serret Moreno, Jaime. procedimientos estadisticos. MADRID : editorial
ESIC, 1998. ISBN: 84-7356-171-6.
2. Vilar Bario, Jose Francisco. CONTROL ESTADISTICO DE LOS PROCESOS.
madrid : FC editorial, 2005. ISBN: 84-96169-59-6.
3. Ross, Sheldon. INTRODUCCIN A LA ESTADISTICA. san diego.USA :
EDITORIAL revert, 2005. ISBN: 978-84-291-5039-1.
4. Sarabia Alegria, Jose Maria. CURSO BASICO DE ESTADISTICA PARA
CIENCIAS NATURALES. Santander, Espaa : Grficas Calima. S.A., 2006.
ISBN: 978-84-8102-971-0.
5. Mendoza, Liliana Adriana. HERRAMIENTAS DE ESTADISTICA I. Rosario,
ARGENTINA : EDITORIAL universidad del rosario, 2008. ISBN: 978-958-8378-

10-7.
6. Garca Prez, Claudia. MEDIDAS DE DISPERSIN. estado de hidalgo :
hidalgo publicaciones, 2009. ISBN: 84-2321-5675-4.
7. Levin, Richard. Estadstica para administracin y economa. s.l. : pearson
Educacion, 2004. 970-2604-97-4.

Vous aimerez peut-être aussi