Académique Documents
Professionnel Documents
Culture Documents
Unidad 1 – Parte 1.
La Investigación Científica
Es el nombre general que obtiene el largo y complejo proceso en el cual los avances
científicos son el resultado de la aplicación del método científico para resolver
problemas o tratar de explicar determinadas observaciones.
Se han descrito diferentes tipos de investigación entre disciplinas, así como una
terminología específica. Las definiciones más comúnmente aceptadas son las usadas
para referirse al incremento en el nivel de interacción entre las disciplinas:
Multidisciplinariedad: en este nivel de investigación la aproximación al objeto de
estudio se realiza desde diferentes ángulos, usando diferentes perspectivas
disciplinarias, sin llegar a la integración.
Interdisciplinariedad: este nivel de investigación se refiere a la creación de una
identidad metodológica, teórica y conceptual, de forma tal que los resultados sean
más coherentes e integrados.
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Elementos de Estadística Descriptiva.
Concepto de Estadística
Concepto Básicos
Llamaremos:
Individuos o elementos a las personas u objetos que contienen cierta
información que se desea estudiar.
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Variables: Tipos de Características en una Población
Análisis Unidimensional.
La información obtenida por cualquiera de los mecanismos antes mencionados es
necesario resumirla de la mejor manera para que pueda ser analizada correctamente,
dicho resumen puede hacerse de tres formas diferentes, todas ellas complementarias
entre sí:
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
1. Distribución de los Datos Resumidos en Tablas de Frecuencias
Definiremos:
Tamaño de la muestra: n el número de elementos observados o tamaño de la
muestra (en el caso de que sea finita)
Datos: x1, x2, …, xi, … a los valores de la variable aleatoria obtenidos en la muestra,
en los cuales puede haber valores repetidos.
Frecuencia absoluta o repetición: ni, el número de veces que se repite el valor xi.
ni
Frecuencia relativa: fi = n , el cociente de la frecuencia absoluta y el tamaño de la
muestra n.
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Llamaremos rango o recorrido a Re = max{xi} – min{xi}, la diferencia entre el mayor y
el menor valor de la variable (En el caso de la longitud de los intervalos sea c
constante se tiene que Re = {nº de intervalos} c)
53, 61, 55, 62, 51, 66, 74, 58, 81, 63, 62, 58, 60, 57, 60, 61, 54, 59, 64, 77
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
2. Resumen a través de Representaciones Gráficas
Existen muchos tipos de gráficos, dependiendo de una serie de factores como: el tipo
de variable a resumir o lo que se quiere resaltar, entre otros.
2.1 Gráficos Sectoriales o de Pastel: En ellos las áreas de cada sector son
proporcionales a la cantidad de datos de cada uno de ellos.
Ejemplo 4: Una encuesta a 200 consumidores a los que se les pide valorar su nivel
de satisfacción con un producto alimentación, resumido en la siguiente tabla:
1 nada satisfecho 81
2 poco satisfecho 69
3 ni satisfecho ni insatisfecho 32
4 Bastante satisfecho 12
5 muy satisfecho 6
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Para fenómenos cuantitativos y/o variables aleatorias
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Ejemplo 6: Utilizando la información del ejemplo 2, representar gráficamente
el resumen de frecuencias absolutas/relativas acumuladas.
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Ejemplo 7: Utilizando la información del ejemplo 3, representar gráficamente
el resumen de frecuencias absolutas/relativas.
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
2.5 Diagramas de Cajas.
El gráfico dibuja la distribución de los datos a través de los cuartiles asociados a la
variable, en el contexto de su rango.
La misión de estas medidas es dar una idea del valor central, alrededor del cual se
reparten los valores de la muestra obtenida.
Ejemplo 10: Los sueldos mensuales de cuatro trabajadores de una empresa son
380.000, 700.000, 910.000 y 1.840.000 pesos. Hallar la media. ¿Es representativa?
Propiedades de la media:
n
∑ (x j− x̄ )=0
Se verifica que j=1 , donde n es el número de datos. (En el caso de que
K
n j (x j x) 0
los datos estén distribuidos por clases: j 1 , donde K es el número de clases)
La media se ve afectada por cambios de escala y de origen.
La media se ve afectada por los valores extremos (outliers)
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
xn+x
n
2 +1
2
ii) Si N es par: Me = 2 (esto es, el punto medio entre los dos valores
centrales)
n
−N i−1
2
Li−1 + ci
Me = ni (donde ci = Li Li1 la amplitud del intervalo)
ii.1) Si las clases son valores: el valor (o valores) con mayor frecuencia.
ii.2) Si las clases son intervalos: el intervalo (o intervalos) de mayor frecuencia,
aceptando como representante su marca de clase.
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Ejemplo 15: Utilizando la información del ejemplo 2 calcular e interpretar la
moda.
0___________________________________________________________________________100
Cálculo:
i) Si la variable no está agrupada en clases, es decir es discreta, será el valor
correspondiente al porcentaje de la medida de posición estudiada.
ii) Si los datos están agrupados en clases entonces se utiliza la siguiente
expresión, que es una generalización de la fórmula de la mediana, dado que
la mediana es un caso particular de medida de posición (Me = C2 = D5 =
P50)
n∗p
P n∗ p =Li−1 +
100
(
100
−N i−1
ni
ci )
Ejemplo 17: Utilizando la información del ejemplo 2 calcular e interpretar: cuartil
3, decil 2 y percentil 63.
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Ejemplo 18: Utilizando la información del ejemplo 3 calcular e interpretar: cuartil
1, decil 4 y percentil 82.
En el apartado 3.1 definimos una serie de medidas de tendencia central cuyo objeto
era sintetizar toda la información de la muestra. Vamos a ver hasta que punto, para
una determinada distribución de frecuencias, estas medidas de tendencia central son
representativas como síntesis de toda información. A la mayor o menor separación de
los valores respecto de su valor central, que se pretende que sea su síntesis, se le
llama dispersión o variabilidad. Existen dos tipos de medidas de dispersión:
i) Definiremos la Varianza S 2x a:
Si los datos no están agrupados:
n
1
S
2
x n ∑ ( x j − x̄ )2
= j=1 (n Tamaño de la muestra)
Si los datos están agrupados es clases:
K K
1
Sx
2
n
∑ j ( j ) ∑ f j ( x j− x̄ )2
n x − x̄ 2
=
= j=1 j=1 (K Número de clases)
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
K K
1
S
2
x ∑ n x 2 − x̄2 = ∑ f j x 2j − x̄ 2
n j=1 j j
= j=1 (K Número de clases)
S x =√ S2x
Sx
i) Llamaremos Coeficiente de Variación de Pearson a CV x = x 100
x́
(número de veces que S contiene a x̄ )
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
Ejemplo 22: La cantidad de dinero invertido en un instrumento financiero por parte
de dos empresas se resume de la siguiente manera:
Empresa A (en millones de pesos): Media = 15,16; Varianza = 31,13
Empresa B (en dólares): Media = 4,16; Varianza = 3,02
Compara la inversión realizada por ambas empresas, comentar los resultados.
a) Medidas de Asimetría
Las medidas de asimetría se dirigen a elaborar un indicador que permita
establecer el grado de simetría (o asimetría) que presenta la distribución, sin
necesidad de llevar a cabo su representación gráfica.
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile
n
n
m3
∑ ( x i − x̄ )3 Ni
i =1
g1 = =
S3 n ni 3
( ∑ ( x i − x̄ )2
i =1 N ) 2
Ejemplo 23: Utilizar los datos del ejemplo 3 y valorar gráfica y numéricamente la
simetría de la distribución.
{
g 2=0 : MESOCURTICA
m4
g2 = 4 −3 as, si g2 > 0 : LEPTOCURTICA
S
g2 < 0 : PLATICURTICA
Rudecindo Ortega 02950 / matfis@uct.cl/ Fono (45) 2205615 - (45) 2205412 / http://www.uct.cl / / Temuco / Chile