Vous êtes sur la page 1sur 14

1.1. Conceptos de estadstica y su clasificacin.

ESTADSTICA. Es la ciencia que estudia los medios para derivar informacin vlida a partir de un conjunto de
datos. Es decir, estudia los mecanismos para la obtencin de datos as como su manipulacin y anlisis.
El estudio de la estadstica se ha concretado primordialmente en el anlisis de datos y su aplicacin en la toma de
decisiones, lo que ha permitido dividir a la estadstica en:
- Estadstica descriptiva
- Inferencia estadstica (estadstica inductiva o estadstica analtica).
ESTADSTICA DESCRIPTIVA. Es el proceso que se relaciona con los mtodos y/o tcnicas para la
recopilacin, organizacin y anlisis de un conjunto de datos cuantitativos, con el objeto de describir en forma
apropiada las diversas caractersticas de dicho conjunto.
INFERENCIA ESTADSTICA. Es la tcnica o metodologa mediante la cual es posible realizar la estimacin
de las caractersticas de una poblacin o realizar la toma de decisiones basados en resultados muestrales.
DEFINICIONES
POBLACIN. Es la totalidad de elementos de un grupo dado que posee una caracterstica delimitada para el
alcance de una investigacin.
MUESTRA. Se denomina muestra a una porcin de datos representativos de una poblacin.
PASOS PARA EFECTUAR UN ESTUDIO ESTADSTICO
El uso de los mtodos estadsticos es muy variado y se aplican generalmente a distintos campos como son los
negocios, economa, educacin, medicina, ingeniera, etc. Para lo cual el proceso para realizar un estudio
estadstico est constituido de las siguientes etapas:
1. Formulacin del problema. Para realizar el estudio de un problema es necesario delimitarlo y formularlo
adecuadamente, definindolo de manera clara y precisa.
2. Diseo del experimento. Esta etapa se basa primordialmente en obtener un mximo de informacin
empleando un mnimo de costo y tiempo.
3. Recopilacin de datos. Los datos provienen de observaciones reales o de documentos que se
usan de manera cotidiana, es la parte que consume mayor tiempo la cual la podemos obtener de:
a. Bancos de datos
b. Entrevistas o cuestionarios
c. Observacin directa o mediciones experimentales

4. Organizacin y descripcin. Consiste en desglosar los datos en algunas propiedades sencillas,


se incluye el problema de elaborar modelos matemticos apropiados de los datos.
5. Inferencia estadstica. Consiste en obtener conclusiones acerca de la poblacin muestreada que
dio lugar a los datos recopilados, es el principal objetivo de las investigaciones estadsticas.
6. Interpretacin y decisin. Consiste en la fase final del estudio la cual determinar si una
solucin es adecuada o no, dependiendo de los resultados obtenidos.

1.2. Recopilacin de datos

Dentro de un proceso de investigacin una de las actividades que se realizan es la recopilacin de datos, la cual
es el acopio de informacin y se incluye desde elaborar fichas bibliogrficas hasta la aplicacin de cuestionarios
con el empleo de tcnicas de muestreo.
Existe una gran variedad de tcnicas para realizar la investigacin, que se debern seleccionar de acuerdo a las
necesidades del problema, as como a diferentes factores como son el tiempo, costo, tipo de actividades a
realizar, recursos humanos, etc.
Las tcnicas de recopilacin de datos las podemos realizar con:
Investigacin documental
Investigacin de campo
LA INVESTIGACIN DOCUMENTAL. Consiste en el estudio de documentos escritos sobre un objeto
determinado, es decir son todos aquellos documentos registrados en diferentes dispositivos fsicos a los que
podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en:
1.- Documental bibliogrfica 4.- Documental audiogrfica
2.- Documental hemerogrfica 5.- Documental videogrfica
3.- Documental escrita 6.- Documental iconogrfica
LA INVESTIGACIN DE CAMPO. Consiste en obtener informacin directa mediante diferentes actividades
por contacto directo con el hecho que se quiere investigar as como las personas relacionadas y se puede realizar:
a) Por observacin directa
b) Por interrogacin
LA OBSERVACION. Es el procedimiento emprico bsico, el cual consiste en realizar la percepcin
intencionada de una actividad determinada mediante la experimentacin la cual consiste en la obtencin de
datos cuantitativos por medio de la medicin del fenmeno que se este observando. Para realizar la observacin
se utilizan diversos instrumentos auxiliares los cuales son:
1.- La ficha de campo 3.- La entrevista
2.- Estudio de Actividades 4.- La encuesta realizadas con anterioridad, biografas, etc.

LA ENTREVISTA. Es una de las tcnicas ms comunes y es considerada como la relacin directa entre el
investigador y el objeto de estudio a travs de individuos o grupos con el fin de obtener testimonios reales.
a) Entrevistas formales
b) Entrevistas informales
LA ENCUESTA. Consiste en recopilar informacin sobre una parte e la poblacin, en donde la informacin
recopilada puede emplearse para un anlisis cuantitativo con el fin de identificar las magnitudes del problema.
a) Un cuestionario
b) Una cedula de entrevista
EL CUESTIONARIO. Es un eficaz auxiliar en la observacin cientfica que contiene aspectos del fenmeno
esenciales, las cuales son preguntas formuladas por escrito y no es necesaria la presencia del investigador.
- Cuestionarios por correo
- Cuestionario administrado por el entrevistado
- Cuestionario administrado por el entrevistador
LA CEDULA. Tiene carcter de annimo, donde el encuestador es quien llena la cedula de entrevista, adems
de que es posible aclara la informacin sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel
cultural.

1.3. Distribucin de frecuencias

Distribucin de frecuencias es como se denomina en estadstica a la agrupacin de datos en categoras


mutuamente excluyentes que indican el nmero de observaciones en cada categora. Esto significa una de las
cosas ms importantes de la matemtica, su estadstica con la agrupacin de datos. La distribucin de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase.
Elementos fundamentales para elaborar una distribucin de frecuencia:
1) RANGO.
Es una medida de dispersin que se obtiene como la diferencia entre el nmero mayor y el nmero menor de los
datos.
R = N_max - N_min
Ejemplo.
Dados los nmeros: 5, 10, 12, 8, 13, 9, 15
R= 15- 5
2) AMPLITUD TOTAL.
Simplemente se obtiene sumndole 1 al rango.
AT = (R+1)
3) LAS CLASES.
Estn formadas por dos extremos. El menor se llama lmite inferior el mayor se llama lmite superior. Hay
distintos tipos de clases.
Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99)
4) EL NUMERO DE CLASES.
Se determina a travs de la formula de Sturges, la cual es vlida cuando el No de observaciones sea menor o
igual a 500. Formula.
Nc= 1 + 3.33log ( N )
Donde:
Nc es el nmero de clases. N es la cantidad de muestras tomadas.
5) VALOR DEL INTERVALO O AMPLITUD
Se Obtiene por medio de la ecuacin de dicta:
Vi = AT / Nc
Donde:
Vi es el valor de intervalo AT es la amplitud total Nc es el nmero de clase

1.3.1 Polgonos de frecuencia, histogramas y ojivas

HISTOGRAMA
En estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se
representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente sealando las marcas
de clase, es decir, la mitad del intervalo en el que estn agrupados los datos.
En trminos matemticos, puede ser definida como una funcin inyectiva (o mapeo) que acumula (cuenta) las
observaciones que pertenecen a cada subintervalo de una particin. El histograma, como es tradicionalmente
entendido, no es ms que la representacin grfica de dicha funcin.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por
comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son
cualitativos (no-numricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de
sectores
POLIGONO DE FRECUENCIA
Un polgono de frecuencia es igual que hacer un histograma.. Solo que no creas barras.. Si no pones puntos en el
nivel que se le asigna... no hay frmula.. Es un grfico... pero.. Los intervalos de lo que mides... debes hacer con
la marca de clase.. O sea.. El lmite inferior ms el lmite superior entre 2.. Para cada clase... y ese es la marca de
clase.. De cada clase.. O punto medio... y cada punto del grfico lo unes... la frecuencia.. Pues es el nmero de
veces que existe cada clase... entonces.. Puede haber polgonos de porcentaje... de frecuencia, de frecuencia
relativa.. etc.
OJIVAS:
Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es posible
ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estndar, la frecuencia
relativa. La ojiva representa grficamente la forma en que se acumulan los datos y permiten ver cuntas
observaciones se hallan por arriba o debajo de ciertos valores. Es til para obtener una medida de los cuartiles,
deciles , percentiles.

1.4. MEDIDAS DE TENDENCIA CENTRAL PARA UN CONJUNTO DATOS Y DATOS AGRUPADOS

MEDIDAS DE TENDENCIA CENTRAL


La estadstica busca entre otras cosas, describir las caractersticas tpicas de conjuntos de datos y, como hay
varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia
central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios.
MODA
La moda es el valor que aparece con mayor frecuencia en la serie de datos. As por ejemplo, de la serie {14, 15,
17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21.
La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere fcilmente: es
la altura ms corriente, es la velocidad ms comn, etc. Adems tiene la ventaja de que no se ve afectada por la
presencia de valores altos o bajos.
La principal limitacin esta en el hecho de que requiere un nmero suficiente de observaciones para que se
manifieste o se defina claramente.
Otros inconvenientes son que puede darse el caso de que una determinada serie no tenga moda o que tenga
varias modas.
Por ejemplo:
L, K, M, O, N (no hay moda)
5, 6, 10, 5, 8, 6, 7, 4 (2 modas)
MEDIANA
La mediana toma en cuenta la posicin de los datos y se define como el valor central de una serie de datos o, ms
especficamente, como un valor tal que no ms de la mitad de las observaciones son menores que l y no ms de
la mitad mayores.
El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de la serie y
esa es la mediana. Si el nmero de datos es par, existirn dos valores centrales y entonces la mediana se obtiene
sacando el promedio de ellos.
Por ejemplo:
7, 8, 8, 10, 12, 19, 23 Mes = 10
3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5

Media Aritmtica
La media aritmtica es el promedio ms comnmente usado, este puede ser simple o ponderado.
La media aritmtica simple est dada por la formula SX/n y que significa: la suma de todos los valores dividida
por el nmero de datos.
Por ejemplo:
10, 13, 10, 13, 14, 10, 13, 10, 15
Media Aritmtica Ponderada
Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es vlido asignar "pesos"
o "ponderaciones" de acuerdo a la importancia de cada dato.
En la serie del ejemplo anterior aparecen los nmeros; pero cada uno con diferente frecuencia. Si cada uno de
estos datos se multiplica por su respectiva frecuencia o ponderacin y se suman estos productos, se obtendr la
misma suma que si se hubieran sumado uno por uno.

Media Geomtrica
La media geomtrica es la raz ensima del producto de todos los valores de la serie.

As por ejemplo la media geomtrica de 3,4,9 y 12 seria:

Como este sistema de clculo resulta muy difcil de emplear, mxime cuando son nmeros grandes o largas
series de datos, en la prctica se recurre a los logaritmos.

xg = antilog (S log xi)/n


as la xg del ejemplo se calculara as:
xg = antilog ( log 3 + log 4 + log 9 + log 12 )
4
xg = antilog (0.477 + 0.602 + 0.954 + 1.079 )
4
xg = antilog (3.11)
4
xg = antilog 0.78
xg = 6
Media Armnica
La media armnica se define como el recproco de la media aritmtica de los recprocos de los valores.

y reacomodando la frmula se tiene:

As la media armnica de 3, 2, 6 sera:

Xa = 3
Clculo de las medidas de posicin en datos agrupados
Cuando los datos estn agrupados en distribucin de frecuencias las frmulas varan un poco.

Donde:
x es el punto medio de clase
f es la frecuencia absoluta
F es la frecuencia acumulada
fx es el producto del punto medio por la frecuencia absoluta
Moda (datos agrupados)

Donde:
L = Limite inferior de la clase modal.
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior.
C = Intervalo de clase.
Por ejemplo:
Primero se localiza la clase modal que es aquella en la que hay la mayor densidad de frecuencia por unidad de
intervalo y luego aplicar la formula.

La clase es: 44.5 - 49.5


Entonces:
Mo = 44.5 +

1 * 5
1+2

= 44.5 + 1.67 = 46.17


Mediana (datos agrupados)
Donde:
n = Nmero total de observaciones.
L = Limite inferior de la clase que contiene la mediana.
f = Frecuencia de la clase que contiene la mediana.
F = Frecuencia acumulada "menos de" de la clase anterior.
C = Intervalo de clase.
La determinacin de la clase que contiene la mediana se hace dividiendo n/2 y viendo en cual clase qued este
acumulado. En el ejemplo es la clase 44.5 - 49.5 ya que en sta qued el 20 dato.
Media aritmtica (datos agrupados)
Es la suma de los productos de la frecuencia por el punto medio divididos por la frecuencia acumulada total.
x = S fx = 2025 = 50.62
n
40
Percentiles (datos agrupados)
Donde:
Pm = Percentil m.
m = Nmero del percentil deseado.
n = Nmero total de observaciones.
L = Limite inferior de la clase donde est el percentil.
f = Frecuencia de la clase que contiene el percentil.
F = Frecuencia acumulada de la clase anterior a la que contiene el percentil
C = Intervalo de clase.
Clculo del P72
Primero se determina la clase donde est el percentil deseado as:
m/100 * n = 72/100 * 40 = 28.8
O sea que el P72 es el 28.8 trmino de la serie y ste queda en la clase 54.5 59.5.
P72 = 54.5 + 28.8 - 28 * 5 = 55.5
4

1.5. Medidas de dispersin para un conjunto de datos y datos agrupados

El conocimiento de la forma de la distribucin y del respectivo promedio de una coleccin de valores


de una variable, puede servir para tener una idea bastante clara de la conformacin, pero no de de la
homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada.
En el caso de las variables con valores que pueden definirse en trminos de alguna escala de medida
de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersin o
variabilidad existente en el grupo de variantes en estudio.
A estos indicadores les llamamos medidas de dispersin, por cuanto que estn referidos a la
variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o
dispersin en los datos inters, entonces no habra necesidad de la gran mayora de las medidas de
la estadstica descriptiva.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia
central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central.
Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirn comparar varias muestras.

1.5.1. Rango

Se denomina rango estadstico (R) o recorrido estadstico al intervalo de menor tamao que contiene
a los datos; es calculable mediante la resta del valor mnimo al valor mximo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersin de los datos.
Por ejemplo, para una serie de datos de carcter cuantitativo como es la estatura tal y como:
x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155
es posible ordenar los datos como sigue:
x(1) = 155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185
donde la notacin x(i) indica que se trata del elemento i-simo de la serie de datos. De este modo, el
rango sera la diferencia entre el valor mximo (k) y el mnimo; o, lo que es lo mismo:
R = x(k) x(1)
En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30
1.5.2. Varianza

En teora de probabilidad, la varianza (2) de una variable aleatoria es una medida de su dispersin
definida como la esperanza del cuadrado de la desviacin de dicha variable respecto a su media.
Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia
en metros, la varianza se expresa en metros al cuadrado. La desviacin estndar, la raz cuadrada de
la varianza, es una medida de dispersin alternativa expresada en las mismas unidades.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores atpicos y se
desaconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En
tales casos se recomienda el uso de otras medidas de dispersin ms robustas.
El trmino varianza fue acuado por Ronald Fisher en un artculo de 1918 titulado The Correlation
Between Relatives on the Supposition of Mendelian Inheritance.

Si una distribucin no tiene esperanza, como ocurre con la de Cauch tampoco tiene varianza. Existen
otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de
Pareto cuando su ndice k satisface 1 < k 2.

1.5.3 Desviacion Estandard

Bibliografia:
http://www.cienciamatematica.com/descarga/estadistica/estadistica_I.pdf
http://www.tesoem.edu.mx/alumnos/cuadernillos/2011.014.pdf
https://es.scribd.com/doc/39151481/desarrollo-de-el-temario

Vous aimerez peut-être aussi