Académique Documents
Professionnel Documents
Culture Documents
Objetivos específicos
Adquirir los conocimientos y habilidades sobre el tema, ser capaz de reconocer los
elementos habituales de la estadística
(CANAVOS, (1988)) La variable en una estadística es el grupo de valores que puede tomar
ciertas cualidades de una población del cual se está haciendo la investigación y entre estos
puede ser la natalidad, desnutrición, la edad, el peso, las notas de una evaluación, etc. y estos
pueden clasificarse en Cualitativas y cuantitativas.
1.1. Cualitativa
1.2. Cuantitativas
Son las variables que toman los valores numéricos de una investigación estadística
como:
Número de casas (1, 2,)
Edad (12,5; 24,3; 35;…)
1.3.Variable cualitativa nominal
Una variable cualitativa nominal presenta como es el objeto de investigación como el
estado civil de una persona, si es casado, soltero, separado, divorciado o viudo.
1.4.Variable cualitativa ordinal
Una variable cualitativa ordinal presenta un orden de a las respuestas de la investigación
como la nota de una evaluación: suspenso, aprobado, notable, sobresaliente.
3. Instrumentos de medición
3.1.El test
Es una forma para encuestar a las personas y tiene como objetivo lograr información sobre
rasgos definidos de la personalidad, la conducta o determinados comportamientos y
características individuales o colectivas de la persona como la (inteligencia, interés, actitudes,
aptitudes, rendimiento, memoria, manipulación, etc.). Esto se logra a base de preguntas,
actividades, manipulaciones los cuales no son observadas y evaluadas por el investigador y
3.2.Características de un Test
Debe ser elaborados con palabras claras y concisas para que la persona entrevistada
comprenda el mensaje.
Debe ser confiable, es decir ofrecer consistencia en sus resultados; éstos deben ser los
mismos siempre que se los aplique en idénticas condiciones quien quiera que lo haga.
Debe ser objetivo, evitando todo riesgo de interpretación subjetiva del investigador. La
Objetividad es requisito indispensable para la confiabilidad.
Debe ser económico, tanto en tiempo como en dinero y esfuerzo.
Debe ser de interesante, para motivar el interés de los investigadores.
4. Muestra y población
4.1.Población
Según Chiner población; es “Todo el conjunto de elementos, finito o infinito, que tiene
una o varias características que satisfacen el objeto de estudio de una investigación” (Chiner,
2,011, pág. 30).
Dicho de otra manera: son todas las personas, animales, cosas u objetos que de cierto
rango en los que se le puede obtener un resultado fructífero para la realización de ciertos
problemas y así obtener un resultado para dar una posible solución. Un ejemplo de esto seria
los estudiantes del PEM en Matemática y Física del CUNOC.
Para realizar una investigación la población tiene que ser parecido, ya que si la población
es diferente la investigación sería indistinta. Par la realización de la investigación a un cierto
tipo de población es necesario utilizar el censo, ya que a través de ello se puede obtener el
resultado, además para la investigación a veces no es posible realizar con toda la población si
no que solo una parte de ello, debido a que, si se lleva mucho tiempo, la investigación no tendría
sentido.
4.2.MUESTRA
Para Chiner, muestra: “Es cualquier subconjunto de una población y, para que sea válida, ha
de ser representativa de la población porque se va a trabajar con ella y las conclusiones se van
a extrapolar a la población”. (Chiner, 2,011, pág. 30)
Es la cantidad de elementos en lo que se quiere obtener una investigación para luego obtener
un resultado estadístico, para qué haiga muestra se requiere tener una población, ya que si la
población no se tendría el objeto de estudio. Un ejemplo de esto sería 200 estudiantes del PEM
en Matemática y Física del CUNOC.
La muestra es la parte tomada de toda la población o las que se utiliza para la realización de
cierto sondeo, en este caso no se toma todos los que están inmersos en la población si no que
es una parte mínima; porque si se tomara toda la población completa llevaría más tiempo la
investigación.
5.1.Estadística
Según Becardino estadística “Se refiere a un conjunto de métodos, normas, reglas y principios
para observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo”.
(Bencardino, 2,011, pág. 384)
En otras palabras, que para obtener los datos a utilizar es necesario recurrir a diferentes
maneras, para lo cual nos ayudaran para agilizar el tipo de investigación a realizar. Para ello es
importante recurrir a diferentes técnicas, pautas, ordenas, entre otras cosas para obtener el
resultado.
5.2.ESTADÍSTICAS
Entonces con los datos obtenidos, se realizan un ordenamiento de las mismas, para
después obtener el resultado que se espera obtener, para así publicarlos con la intención de que
otras personas interesadas puedan ver y sacar sus propias conclusiones. Para realizar esto es
necesario de un ordenamiento de los diferentes datos en cuadros o a lo que se le llama tablas
estadísticas y representarlos en las diferentes gráficas, aptos para la investigación para su mejor
interpretación.
6.1.Intervalos
Para Chiner Intervalo es la “Distancia entre dos valores. Cualquier intervalo viene definido por
dos valores llamados límites de intervalo. Uno es el límite inferior y el otro el superior””.
(Chiner, 2,011, pág. 30)
Diciéndolo de otra manera: es la distancia que puede existir entre dos valores, el espacio que
puede haber entre los intervalos nos sirve para realizar o introducir la cantidad de muestra que
puede existir entre ese intervalo.
6.2.Límites reales
Figura 1 Figura 1.
Google. (s.f.).
Recuperado el Jueves de Febrero de 2,019, de rea.ceibal.edu.uy
En el año 2,011Chiner dice que “Es el valor que sirve para representar al intervalo. Es
decir, es el punto medio del intervalo y se calcula:
𝑙𝑖𝑚.𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟+𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑥𝑚 = ” ”. (Chiner, 2,011, pág. 30)
2
Desde otro punto de vista, para cada intervalo es necesario un único valor para su
representación, porque ese valor es el que lo va a representar para obtener resultados de otros
parámetros. Para poder obtener el valor representativo se suman los límites de cada intervalo,
obteniendo el resultado de la suma, se divide entre de dos para luego obtener el valor
representativo de ese intervalo. Así también, con los demás intervalos que pueden existir.
Grafica de Marca de clase:
Figura 2
Figura 3
Aunque esta tabla sirve para resumir información de variables discretas o continuas,
de manera particular la TDF permite transformar una variable continua, a una variable discreta
definida por el número de intervalos y su frecuencia. Esta transformación permite construir
gráficos de histogramas o polígonos. Con Variables continuas como (peso, altura, producción /
superficie, etc.) el recorrido de la variable se parte en intervalos semiabiertos, las clases.
(Riobóo, 2008)
Lo primero para construir una TDF es definir el “número de clases” o intervalos a crear
y el “intervalo o ancho” de cada intervalo. Para que los gráficos permitan visualizar tendencias
de la variable en estudios, el número de clases se recomienda que no sean menor de 5 ni mayor
de 20. Al ancho de clase se calcula dividiendo el Rango (valor mayor – valor menor), con un
valor que debe variar entre 5 y 20. Hay que utilizar más clases cuando se tiene más datos
disponibles, si el número de clases es muy grande es posible tener muchas clases vacías, si es
demasiado pequeño podrían quedar ocultas características importantes de los datos al
agruparlos. Se tendría que determinar el número de clases a partir de la cantidad de datos
presente y de su uniformidad, en general con menos de treinta datos se usa una TDF con 5
clases. (Riobóo, 2008)
Para tabular una variable continua o discreta (que tome un gran número de datos distintos)
se necesitan los siguientes elementos:
𝑓𝑖
𝑓𝑒 =
𝑁
h) Frecuencia Relativa Porcentual (FR%): Son los datos en porcentaje que se requiere,
y se puede calcular por medio de la siguiente fórmula:
𝑓𝑖
𝐹𝑅% = ( ) 𝑥100%
𝑁
Los siguientes datos corresponden a las notas obtenidas por 100 alumnos en un curso de
estadística:
Solución:
𝑹 = 100 − 17 = 83
83
𝐼= = 10
8
1.
Notas Lr Xi f fr F Fr%
17-26 16.5-26.5 21.5 4 0.04 4 0.04
27-36 26.5-36.5 31.5 7 0.07 11 0.11
37-46 36.5-46.5 41.5 7 0.07 18 0.18
47-56 46.5-56.5 51.5 16 0.16 34 0.34
57-66 56.5-66.5 61.5 22 0.22 56 0.56
67-76 66.5-76.5 71.5 13 0.13 69 0.69
77-86 76.5-86.5 81.5 15 0.15 84 0.84
87-96 86.5-96.5 91.5 9 0.09 93 0.93
97-106 96.5-106.5 101.5 7 0.07 100 1.00
TOTAL 100 1.00
3. La frecuencia absoluta en el cuarto intervalo es 16. Esto nos indica que son 16 los alumnos
que tienen una nota entre 47-56.
Son las respuestas de las interrogantes de este ejercicio o ejemplo, podemos dar la
interpretación según los datos en la tabla de distribución de frecuencias.
Ahora bien, se pueden representar estos datos en forma gráfica, como por ejemplo una
gráfica de barras, un histograma, un circular, una ojiva y otros. Existe una variedad de gráficas
para la representación de datos de una tabla de distribución de frecuencias.
Las gráficas de barras se pueden obtener de los intervalos y la frecuencia. Según esta grafica
de barras, se puede ver las informaciones de las notas de los alumnos, como por ejemplo en la
barra más grande, en donde se puede ver que 22 alumnos han obtenido punteos entre 57 y 66.
También se puede notar en la gráfica que 4 alumnos han obtenido punteos entre 17 y 26.
97-106 7
87-96 9
77-86 15
67-76 13
57-66 22
47-56 16
37-46 7
27-36 7
17-26 4
Figura 4
Figura 3
Fuente:
Google. (s.f.). Recuperado el Jueves de Febrero de 2,019, de rea.ceibal.edu.uy
7.2. Histograma
Un histograma se obtiene de los datos de los límites reales y la frecuencia. En esta gráfica
se puede ver que las barras nos muestran la cantidad de alumnos y en la parte horizontal nos
muestra los límites reales de las notas que han obtenido durante la clase de estadística. Como
por ejemplo en la tercera barra nos muestra que 7 de los alumnos están en el intervalo de 36.5
y 46.5, que son los límites reales.
25
20
15
10
Figura 5
1 2 3
8 1% 3% 5% 4
25% 9%
5
15%
7
23%
6
19%
Figura 6
120
100 100
93
84
80
69
60
56
40
34
20 18
11
4
0 7
Figura
21.5 31.5 41.5 51.5 61.5 71.5 81.5 91.5 101.5
8. Medidas de tendencia central
La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de
un punto "central" y por lo general es posible elegir algún valor que describa todo un conjunto
de datos. Un valor típico descriptivo como ese es una medida de tendencia central o "posición".
Las medidas de tendencia central a estudiar son: media aritmética, mediana y moda. (Riobóo,
2008)
9. Media aritmética
También denomina media, es la medida de tendencia central que se utiliza con mayor
frecuencia. Se calcula sumando toda la observación de un conjunto de datos, dividiendo después
ese total entre el número total de elementos involucrados. (Morales, 2012)
La media aritmética de un conjunto de valores 𝑥1, 𝑥2 , 𝑥3… 𝑥𝑛 se define como el cociente entre
la suma de los valores y el número de ellos. Su símbolo es (X).
45 + 80 + 56 + 35 + 25 + 90
𝑋= = 55.17 ≈ 55
6
El promedio del test es 55 puntos.
Significa que los 55 puntos son bajos, desde ahí se puede tomar decisiones para mejorar ese
punteo obtenido.
Donde:
-Xi es la marca de clase del intervalo.
-fi es la frecuencia en el intervalo.
-N es el número de datos.
-m es el número de intervalos-
Ejemplo: Calcular la media aritmética para el peso de 40 trabajadores, según la tabla siguiente:
Tabla 1
5
𝑋𝑖𝐹𝑖 2868
𝑋=∑ = = 71.7 ≈ 72
𝑁 40
𝑖=1
10.Mediana
Para determinar el valor de la mediana primero se obtiene el arreglo ordenado de los datos
con los que estemos trabajando y luego se identifica la mediana. Para calcular la mediana
debemos considerar dos casos:
Características de la mediana
CÁLCULO DE LA MEDIANA
Para datos no agrupados:
Ejemplo: n impar
10 14 11 18 12
Ordenamos los datos:
10 11 12 14 18
𝑛+1 5+1
La posición de la mediana es = = 3 (tercer dato), es decir X= 12.
2 2
n par
10 14 12 11 18 23
Ordenamos los datos:
10 11 12 14 18 23
𝑛+1 6+1
Posición de la mediana ⇒ es = = 3.5 (entre el tercer y cuarto dato)
2 2
12+14
Obtenemos la mediana promediando el tercer y cuarto dato: = 13 = 𝑋
2
1ero. Se calcula la clase de la mediana, la cual corresponde a la clase cuya frecuencia acumulada
es mayor o igual a n/2.
𝑛⁄ − 𝐹
𝑀𝑒 = 𝐿𝑚𝑒 + [ 2 ]𝐴
𝑓𝑚𝑒
Donde:
Ejemplo:
Tabla 2
DATOS
Punteos de Matemática de Segundo Básico
45 78 89 65 76 89 78 90 53 67
45 67 89 78 78 90 45 67 78 90
67 89 67 90 46 78 67 76 67 57
Tabla 3
No. de Datos 30
Vmax 90
Vmin 45
Rango 45
Diferencia 1
Tabla 4
TABLA DE DISTRIBUCION DE FRECUENCIAS
INTERVALOS DE
CLASE
Lim. Lim. Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inferior Superior de Absoluta Acumulada Relativa Relativa %
clase
44 51 47.5 4 4 0.13 0.13 13.33
52 59 55.5 2 6 0.07 0.20 6.67
60 67 63.5 8 14 0.27 0.47 26.67
68 75 71.5 0 14 0.00 0.47 0.00
76 83 79.5 8 22 0.27 0.73 26.67
84 91 87.5 8 30 0.27 1.00 26.67 Clase mediana
30 1.00 100.00
𝑛 30
= = 15
2 2
Se aplica la formula
𝑛⁄ − 𝐹
𝑀𝑒 = 𝐿𝑚𝑒 + [ 2 ]𝐴
𝑓𝑚𝑒
15 − 14
𝑀𝑒 = 76 + [ ] 7 = 76.88
8
𝑴𝒆 = 𝟕𝟔. 𝟖𝟖
11.Moda
(Banegas, 2000) La moda es el valor que más se repite en una lista de datos, es decir, el
que se presenta con mayor frecuencia. Puede darse el caso que haya dos modas en una lista de
datos, lo que recibe el nombre de bimodal. Si hay más de dos modas, se denomina multimodal.
La moda es el valor de un conjunto de datos que ocurre más frecuentemente, se
considera el valor más típico de una serie de datos.
Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia.
La moda puede no existir o no ser única, las distribuciones que presentan dos o más máximos
relativos se designan de modo general como bimodales o multimodales respectivamente.
Características de la Moda:
CÁLCULO DE LA MODA
Ejemplo:
Datos.
25 30 50 30 45 30 55 54 23 24
1ero. Se localiza la clase modal, la cual corresponde a la clase que tenga la mayor frecuencia.
𝐷1
𝑀𝑜 = 𝐿𝑚𝑜 + [ ]𝐴
𝐷1 + 𝐷2
Donde:
Ejemplo:
Se aplica la formula
𝐷1
𝑀𝑜 = 𝐿𝑚𝑜 + [ ]𝐴
𝐷1 + 𝐷2
8−2
𝑀𝑜 = 60 + [ ]7
8−2+8−0
𝑴𝒐 = 𝟔𝟑
12.1. Cuartiles
𝑄
𝑖 = ( ) ∗ ∑𝑓
4
2do. Se localiza la clase del cuartil, la cual corresponde a la clase cuya frecuencia acumulada
es mayor o igual a 𝑖.
𝑄
( ) ∗ ∑𝑓 − 𝐹
𝑄𝑖 = 𝐿𝑄𝑖 + [ 4 ]∗𝐴
𝑓𝑄𝑖
Donde:
Ejemplo:
Aplica la formula.
𝑄
( 4 ) ∗ ∑𝑓 − 𝐹 15 − 14
𝑄𝑖 = 𝐿𝑄𝑖 + [ ]∗𝐴 𝑄2 = 76 + [ ]∗7
𝑓𝑄𝑖 8
𝑄2 = 76.88
12.2. Deciles
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los
resultados.
2do. Se localiza la clase del decil, la cual corresponde a la clase cuya frecuencia acumulada es
mayor o igual a 𝑖.
𝐷
(10) ∗ ∑𝑓 − 𝐹
𝐷𝑖 = 𝐿𝐷𝑖 + [ ]∗𝐴
𝑓𝐷𝑖
Donde:
Ejemplo:
Tabla 7
TABLA DE DISTRIBUCION DE FRECUENCIAS
INTERVALOS DE
CLASE
Lim. Lim. Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inferior Superior de Absoluta Acumulada Relativa Relativa %
clase
44 51 47.5 4 4 0.13 0.13 13.33
52 59 55.5 2 6 0.07 0.20 6.67
60 67 63.5 8 14 0.27 0.47 26.67
c68 75 71.5 0 14 0.00 0.47 0.00
76 83 79.5 8 22 0.27 0.73 26.67
84 91 87.5 8 30 0.27 1.00 26.67
∑𝑓 30 1.00 100.00
𝐷 2
𝑖=( ) ∗ ∑𝑓 𝑖 = ( ) ∗ 30 𝑖=6
10 10
Aplica la formula.
𝐷
(10) ∗ ∑𝑓 − 𝐹 6−6
𝐷𝑖 = 𝐿𝐷𝑖 + [ ]∗𝐴 𝐷2 = 52 + [ ]∗7
𝑓𝐷𝑖 2
𝑫𝟐 = 𝟓𝟐
12.3. Percentiles
CÁLCULO DE PERCENTILES
𝑝
𝑖=( ) ∗ ∑𝑓
100
2do. Se localiza la clase del percentil, la cual corresponde a la clase cuya frecuencia acumulada
es mayor o igual a 𝑖.
𝑝
(100) ∗ ∑𝑓 − 𝐹
𝑃𝑖 = 𝐿𝑝𝑖 + [ ]∗𝐴
𝑓𝑝𝑖
Donde:
Tabla 8
TABLA DE DISTRIBUCION DE FRECUENCIAS
INTERVALOS DE
CLASE
Lim. Lim. Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inferior Superior de Absoluta Acumulada Relativa Relativa %
clase
44 51 47.5 4 4 0.13 0.13 13.33
Clase
52 59 55.5 2 6 0.07 0.20 6.67 Percentil
60 67 63.5 8 14 0.27 0.47 26.67
68 75 71.5 0 14 0.00 0.47 0.00
76 83 79.5 8 22 0.27 0.73 26.67
84 91 87.5 8 30 0.27 1.00 26.67
∑𝑓 30 1.00 100.00
𝑃 70
𝑖=( ) ∗ ∑𝑓 𝑖=( ) ∗ 30 𝑖 = 21
100 100
Aplica la formula.
𝑝
(100) ∗ ∑𝑓 − 𝐹 21 − 14
𝑃𝑖 = 𝐿𝑝𝑖 + [ ]∗𝐴 𝑃70 = 76 + [ ]∗7
𝑓𝑝𝑖 8
𝑷𝟕𝟎 = 𝟖𝟐. 𝟏𝟐
13.Desviación media
Cada distancia se mide en valor absoluto, ya que, si no es así, los puntos que quedaran a la izquierda de
la media, serían negativas y las distancias siempre deben ser positivas.
Si sumamos todas las distancias de cada dato con respecto a la media, es decir, de todas las desviaciones
y la dividimos entre el número total de datos, estaremos calculando la desviación media.
La desviación media es el promedio de las distancias de cada uno de los datos a la media. Es la media
de lo que se desvía el conjunto de datos con respecto a la media.
La fórmula anterior también podemos ponerla en forma de sumatorio (el signo Σ se utiliza para indicar
la suma de varios sumandos):
(X i X )2
.
N
Ejemplo para el cálculo de la desviación media y la desviación típica con datos agrupados
Con los siguientes datos calcular la desviación media, la varianza y la desviación típica:
Ordenamos los datos en una tabla, determinando los intervalos necesarios e incluyendo los valores que
pertenecen a cada intervalo, con el fin de obtener la frecuencia absoluta:
Tabla 9
INTERVALOS Frecuencia
Absoluta
(fi)
5 - 5.5 1
5.5 - 6 2
6 - 6.5 3
6.5 - 7 4
7 - 7.5 8
7.5 - 8 1
8 - 8-5 5
Total 24
Linf Lsup
Xi
2
Tabla 11
INTERVALOS Frecuencia Marca de clase
Absoluta (xi) xi.fi
(fi)
5 - 5.5 1 5.25 5.25
5.5 - 6 2 5.75 11.5
6 - 6.5 3 6.25 18.75
6.5 - 7 4 6.75 27
7 - 7.5 8 7.25 58
7.5 - 8 1 7.75 7.75
8 - 8-5 5 8.25 41.25
Total 24 169.50
f i X 1 f 2 X 2 , , fn X n
X
N
La suma de las marcas de clase por su frecuencia la tenemos en la última fila de la cuarta columna, que
es 169.5 y la suma de todos los elementos en la última fila de la segunda columna, que es 24:
169.5
7.06
24
Añadimos una quinta columna donde iremos escribiendo la distancia de cada intervalo, haciendo la resta
de la marca de clase menos la media:
Tabla 12
INTERVALOS Frecuencia Marca de clase Distancia
Absoluta (xi) (xi.fi) (xi-x)
(fi)
5 - 5.5 1 5.25 5.25 1.81
5.5 - 6 2 5.75 11.5 1.31
6 - 6.5 3 6.25 18.75 0.81
6.5 - 7 4 6.75 27 0.31
7 - 7.5 8 7.25 58 0.19
7.5 - 8 1 7.75 7.75 0.69
8 - 8-5 5 8.25 41.25 1.69
Total 24 169.50 6.31
Tenemos la suma de las distancias de cada intervalo y el número total de datos, los cuales nos sirven
para calcular la desviación media:
(X i X)
DM
N
La suma de las distancias es 6.31, que la tenemos en la última fila de la quinta columna y el número
total de datos es 24, que lo tenemos al final de la segunda columna:
6.31
0.26
24
Por último, le añadimos una quinta columna con el cuadrado de la distancia:
Tabla 13
INTERVALOS Frecuencia Marca de clase Distancia
Absoluta (xi) (xi.fi) (xi-x) (xi-x)2
(fi)
5 - 5.5 1 5.25 5.25 1.81 3.29
5.5 - 6 2 5.75 11.5 1.31 1.72
6 - 6.5 3 6.25 18.75 0.81 0.66
6.5 - 7 4 6.75 27 0.31 0.10
7 - 7.5 8 7.25 58 0.19 0.04
7.5 - 8 1 7.75 7.75 0.69 0.47
8 - 8-5 5 8.25 41.25 1.69 1.41
Total 24 169.50 6.31 7.68
Con la suma de las distancias al cuadrado de cada intervalo y el número total de datos, podemos calcular
la desviación típica:
(X i X )2
N
La suma de las distancias al cuadrado es 7,68 y lo tenemos en la última fila de la sexta columna. El
número total de datos es 24, que lo tenemos al final de la segunda columna:
7.68
0.56
24
15.Tipos de correlación
Este coeficiente es útil por cuanto permite establecer el grado de intensidad en que una variable
dependiente se encuentra explicada por la o las variables independientes dentro de un modelo.
También facilita el estudio de variables cuantitativas en la medida que podemos explicar un
fenómeno por el grado en que una variable influye en otra, es decir nos permite efectuar afirmaciones
de carácter social, económico y físico.
Esta herramienta estadística se mide por un coeficiente que puede tomar un valor que puede oscilar
entre -1 y 1, si el valor es cercano a1 se dice que existe una relación directa entre las variables estudiadas,
una mayor cantidad en una implica que la otra aumentara también, en la medida que se acerca a 0 se
dice que el nivel de correlación es mínimo o simplemente no existe correlación y por lo tanto la variación
de una variable no explica el comportamiento de otra, finalmente si es cercano a -1 la relación es inversa,
si aumenta la variable independiente, disminuye el valor de la dependiente.
La siguiente gráfica muestra las posibles formas de correlación, vinculando el valor del coeficiente
con su expresión gráfica.
Figura 8
A partir de ello la ecuación puede mejorar su correlación si se hace pruebas para determinar si se
ajusta más a una recta, una curva exponencial o parabólica.
16.Estadística inferencial
Existen una variedad en las definiciones de la estadística, considerado por algunos como
una ciencia y otros como un método científico con fines para el bien de la ciencia.
Algunos opinan que es una ciencia que estudia los fenómenos colectivos, mediante la
observación numérica, el análisis sistemático e la interpretación lógica investigando
especialmente sus casusas y normas que la rigen. También es muy asemejado con los procesos
científicos, con la obtención de datos, para organizar y dar significa a todos los datos obtenidos.
Esta es una rama de la matemática que se ocupa de reunir, organizar y analizar datos numéricos
con ello poder resolver problemas con el tema ejes de estudio para la toma de decisiones.
División de la estadística
La estadística para una mejor presentación se ha clasificado en dos ramas o áreas las
cuales son: la estadística descriptiva y la estadística inferencial.
La estadística descriptiva:
(Ortiz, 2014, pág. 5) “La estadística descriptiva analiza, estudia y describe a la totalidad
de individuos de una población. Su finalidad es obtener información, analizarlas, elaborarlas y
simplificarla lo necesario para que pueda ser interpretada cómoda y rápidamente, y, por lo tanto,
pueda utilizarse eficazmente para el fin que se desee.”
El proceso que sigue para el estudio de una cierta población consta de los siguientes pasos:
Selección de caracteres
Elaboración de tablas de frecuencias
Representación gráfica de los resultados
(Brenes, pág. 6) “La estadística inferencial tiene como objetivo generalizar los
resultados de un subconjunto de datos a todo el conjunto. Seguidamente se presentan los
conceptos básicos de esta rama de la matemática la población y la muestra”.
(Ortiz, 2014, pág. 6 ) La estadística inferencial, sin embrago trabajo con muestras,
subconjuntos formados por algunos individuos de la población. A partir del estudio de la
muestra se pretende inferir aspectos relevantes de toda la población. Como se selecciona, como
realiza inferencia y en grado de confianza se puede tener en ella conocimientos de estadísticas
inferencial, para cuyo estudio se requieran un alto nivel de conocimiento de estadística y de
matemáticas.
Tabla 14
Estadística descriptiva Estadística inferencial
La comprende aquellos métodos gráficos y La estadística inferencial comprende
numéricos usados para recopilar, organizar y aquellos métodos y técnicas usadas para
describir la información que se ha recogido hacer generalizaciones, predicciones y
con el fin de describir sus características estimaciones que se utilizan para la
información en conocimiento.
1. Población: conjunto de datos que se desea estudiar. Estos datos deben verse como
valores de una misma variable, la cual se utiliza para designar la población. (López,
1999, pág. 14) Afirma: “es un conjunto de medidas o conjunto completo de individuos,
objetos o medidas que posee alguna característica común observable.” De este conjunto
de población es extraen el subconjunto el cual servirá para la elección de la muestra de
investigación.
2. Muestra: Es un conjunto de medidas o el recuento de una parte de los elementos
pertenecientes a la población. Expresada de otra manera es subconjunto de datos que se
seleccionan de la población.
3. Estimación: la estimación y la prueba hipótesis son partes importantes de la estadística
inferencial siendo ella la encargada de evaluar, calcular o dar valor. Un ejemplo de
estimación de un caso de la vida cotidiana seria estimar la masa promedio de la
población, usando masa del departamento de Totonicapán como la mutra.
4. Prueba de hipótesis: Es una posible solución al planteamiento de la problemática,
ejemplar seria sostener que la masa corporal de las personas de la muestra Totonicapán
sería de 100 libras.
Otro caso hipotético seria, durante una auditoria de una corporación, 14 cuentas fueron
seleccionadas aleatoriamente y revisadas en busca de errores. La población es todas las
poblaciones son las 14 cuentas, la muestra también son las 14 cuentas seleccionadas para ser
revisadas, la unidad de observación es una cuenta, la medición en este caso es cualitativa.
Variables matemáticas que se utilizan en la resolución de cálculos matemáticos de
la población y la muestra en la estadística inferencial, el cual la se aprecia en el cuadro
siguiente:
Tabla 15
CRITERIOS POBLACIÓN MUESTRA
Colección de elementos Parte o porción de la
Definición considerados población seleccionada para
su estudio.
características Parámetros Estadísticos
Símbolos Tamaño de la población = N Tamaño de la muestra = n
Media de la población = 𝜇 Media de la muestra = 𝜒
Desviación estándar de la Desviación estándar de la
población = 𝜎 (varianza r2 muestra = s
Proporción poblacional = P Proporción de la muestra = p
𝑝𝑞
Formulario básico 𝜒 ↝ 𝑁 ( 𝜇 , 𝜎⁄ ) 𝑝 ↝ 𝑁 ( 𝑃 , √ 𝑛 ) q = 1-P
√𝑛
17.Organización de datos
Procedimiento
Tipos De Datos
Datos Numéricos
Una variable es numérica cuando el resultado de la observación o medición es un
número. Se clasifican en:
a) Discretos. La variable sólo puede tomar un cierto conjunto de valores posibles. En
general, aparecen por conteo. Ejemplo: número de miembros del hogar, número de
intervenciones quirúrgicas, número de casos notificados de una cierta patología.
b) Continuos. Generalmente son el resultado de una medición que se expresa en
unidades. Las mediciones pueden tomar teóricamente un conjunto infinito de valores posibles
dentro de un rango. En la práctica los valores posibles de la variable están limitados por la
precisión del método de medición o por el modo de registro.
Ejemplos: altura, peso, pH, nivel de colesterol en sangre.
Se considera que la mayor parte las gráficas son interpretadas a partir de las tablas de
frecuencias las cuales se aprecian en estadística descriptiva.
A medida que el tamaño de muestra aumenta la proporción de casos que cae en cada
intervalo se parece más y más a la proporción poblacional. La fotografía se torna más y más
definida y la distribución maestral luce similar a la distribución poblacional. Si la población
contiene una gran cantidad de unidades de observación y la variable es continua es posible
elegir intervalos tan delgados como deseemos para construir el histograma y además hacer
crecer el tamaño de muestra indefinidamente. En este caso, la forma del histograma se
aproximará a una curva suave denomina distribución de la variable en la población.
Figura 9
La Figura 3.1 muestra dos histogramas, el primero basado en una muestra de tamaño
100 y el segundo basado en una muestra de tamaño 1000, y una curva suave que representa la
distribución poblacional. Aun cuando la variable sea discreta, una curva suave suele ser una
buena aproximación para la distribución poblacional, especialmente cuando el número De
valores posibles de la variable es grande.
Figura 11
19.Conclusiones
Llegado a este punto, se concluye que se ha cumplido con el objetivo general, que consiste en aportar
evidencia teórica del tema a tratar. Se planteó una revisión bibliográfica, que se efectuo por medio de
la técnica de la investigación, además de ejemplificar y facilitar la comprensión de los temas tratados.
Debido a que existen muchos temas a problematizar para su investigación, en lo cual es muy
importante poderlo explorar para darle una posible solución en lo que se requiere. Para esto es
de suma importancia utilizar la estadística, ya que gracias a ello podremos obtener un resultado
que nos pueda ayudar a darnos cuenta sobre los diferentes resultados de cada investigación,
para así ayudar a nosotros mismos como investigadores y a otras personas en lo que se requiere.
Porque gracias a la estadística se puede encontrar un resultado ya sea positivo o negativo al tipo
de población investigada estadísticamente.
CONCLUSIONES
La desviación media es cuando se encuentra una medida natural de desviación al promediar las
desviaciones de la media aritmética.
La desviación media es la media aritmética de las desviaciones absolutas con respecto a la media
aritmética.
La desviación típica es una medida común de la dispersión con respecto a su media. La desviación es
cero cuando no existe dispersión, y crece según esta aumenta.
Al igual que ocurre con la media, en la desviación fuertes asimetrías o muy pocas observaciones atípicas
pueden hacer que aumente mucho esta. Un ejemplo claro se vería en estadísticas deportivas, si solo se
hicieran en base a una temporada, serían observaciones totalmente diferentes si esta hubiera sido buena
o mala, comparado con hacer las estadísticas en base a todas las temporadas.
Con los diagramas de dispersión podemos ver cómo se relacionan las variables entre sí. Esto es lo que
se conoce como correlación.
Conclusión
La estadística diferencial es muy útil para detectar los avances o retrasos que puedan presentarse
en algún tipo de temática relacionada con la sociedad guatemalteca (dígase economía, índices
de violencia, la pobreza, etc.). Esta estadística más allá de solamente ocuparse en la conclusión,
interpretaciones a análisis de la temática de investigación su rol más importante es permitir
predecir posibles resultados tomando en cuanto los registros pasados.
20.Recomendaciones
Motivar al estudianteado en la investigación constante en el área de estadística, en el ámbito
educativo, el cual es pilar para su labor, para establecer criterios, de retroceso o avance a partir de la
investigación estadística.
una recomendación sería que en el desarrollo del presente curso, considerar en la aplicación correcta
de los conceptos estudiados en el quehacer educativo, dado que en el transcurso de la investigación,
pudimos comprender que es de vital importancia aplicar la estadística, para la toma de decisiones.
21.Bibliografía
Bencardino, C. M. (2,011). Estadística básica aplicada (Cuarta edición ed.). Bogotá, Colombia:
Eco Ediciones.