Vous êtes sur la page 1sur 11

ESCUELA SUPERIOR POLITÉCNICA

DEL LITORAL
FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICAS

Proyecto de Estadística

Integrantes:
Karen Sánchez Intriago
Germán Villegas Espinales
Madelyne Bajaña Quinto
Jonathan Jiménez Guacho

Profesora:
Ing. Nadia Cárdenas

Paralelo: 6

Guayaquil - Ecuador
2017 - 2018
Índice

1. Introducción .......................................................................................................................... 2
2. Objetivos ............................................................................................................................... 2
2.1. Objetivo General ........................................................................................................... 2
2.2. Objetivos Específicos ..................................................................................................... 2
3. Marco Teórico ....................................................................................................................... 2
3.1. Estadística Descriptiva................................................................................................... 2
3.1.1. Población ............................................................................................................... 2
3.1.2. Muestra ................................................................................................................. 3
3.1.3. Variable Aleatoria .................................................................................................. 3
3.1.4. Tablas de Frecuencias ........................................................................................... 3
3.1.5. Gráficos de frecuencias ......................................................................................... 6
3.1.6. Media de Tendencia central .................................................................................. 6
3.1.7. Medias de dispersión ............................................................................................ 6
3.1.8. Medidas de Posición.............................................................................................. 7
3.2. Estadística Inferencial ................................................................................................... 7
4. Análisis de Resultados ........................................................................................................... 7
5. Bibliografía .......................................................................................................................... 10
1. Introducción
La presente investigación, se llevó a cabo a través de un experimento el cual consistió
en completar 250 lanzamientos en rondas de 5 que pueden tomar valores entre 0 y 5,
desde una distancia de 6.25 metros, una vez completado los 250 lanzamientos
comenzamos a realizar los respectivos estudios vistos en clases.

El proceso para la preparación de la presente investigación conlleva en obtener los


datos y analizarlos, dando inicio a los primeros cálculos, en la que nos apoyamos de
conceptos previos vistos durante el primer parcial de la materia, la “estadística
descriptiva” con el fin de conocer la media, varianza, desviación estándar, cuartiles y
el diagrama de cajas.

2. Objetivos
2.1. Objetivo General
El objetivo fundamental de la estadística es analizar los datos y
transformarlos en información útil para tomar decisiones.

2.2. Objetivos Específicos


Probar la distribución binomial y efectuar algunos contrastes de hipótesis
realizando el experimento.

3. Marco Teórico
En la siguiente sección encontraremos conceptos básicos de que se necesitaran para
comprender la síntesis de este proyecto:

3.1. Estadística Descriptiva


La estadística descriptiva es la técnica matemática que obtiene, organiza,
presenta y describe un conjunto de datos con el propósito de facilitar su
uso generalmente con el apoyo de tablas, medidas numéricas o gráficas.
Además, calcula parámetros estadísticos como las medidas de
centralización y de dispersión que describen el conjunto estudiado.
(Wikipedia, s.f.)

Veamos a continuación ciertos conceptos importantes antes de conocer


información sobre frecuencias, medidas de tendencia y los gráficos
respectivos.

3.1.1. Población
Una población se precisa como un conjunto de los entes de interés.
Cada ente presenta características determinadas, observables y
medibles. Por ejemplo, en el elemento persona: nombre, edad, género,
peso, nacionalidad, etc. Por lo tanto, la estadística se preocupa de
estudiar las características de los elementos constituyentes de la
población, y estudiar las posibles relaciones y las regularidades que
presenta la población a partir de estas características.

La población se puede clasificar, según su tamaño, en dos tipos:

Población Finita: El número de elementos finitos. Por ejemplo, la


cantidad de alumnos dentro del curso de estadísticas.

Población Infinita: El número de elementos es infinito o tan grande


que puede considerarse en cantidad infinita. Por ejemplo, las estrellas
de la vía láctea.

3.1.2. Muestra
La mayoría de los estudios estadísticos, no se realizan sobre la
población por los altos costos en tiempo y dinero, sino sobre un
subconjunto o una parte de ella denominada muestra, partiendo del
supuesto de que este subconjunto presenta el mismo comportamiento
y característica de la población. Por ejemplo, para la población
“estudiantes de la Escuela Superior Politécnica del Litoral”, y para una
muestra podría ser “el conjunto de estudiantes de la carrera de
Ingeniería Civil”.

3.1.3. Variable Aleatoria


Una variable aleatoria es un número que representa un resultado de un
experimento aleatorio, esta puede ser discreta y continua.

Variable Aleatoria Discreta: una variable aleatoria discreta solo


puede tener valores contables distintos, tales como 0,1,2,3, 4, …. Por
ejemplo, el número de estudiantes en la clase de estadística o el número
de carros en la terminal de buses.

Variable Aleatoria Continua: una variable aleatoria continua puede


tomar cualquier valor intermedio entre dos números. Por ejemplo, el
peso y estatura de una persona.

3.1.4. Tablas de Frecuencias


La tabla de frecuencias (o distribución de frecuencias) es una tabla que
muestra la distribución de los datos mediante sus frecuencias. Se utiliza
para variables cuantitativas o cualitativas ordinales. (Cabrera, 2008)

La tabla de frecuencias es una herramienta que permite ordenar los


datos de manera que se presentan numéricamente las características de
la distribución de un conjunto de datos o muestra.
3.1.4.1. Construcción de la tabla de frecuencias
a. En la primera columna se ordenan de menor a mayor los
diferentes valores que tiene la variable en el conjunto de datos.

b. En las siguientes columnas (segunda y tercera) se ponen las


frecuencias absolutas y las frecuencias absolutas acumuladas.

c. Las columnas cuarta y quinta contienen las frecuencias


relativas y las frecuencias relativas acumuladas.

d. Adicionalmente (opcional) se pueden incluir dos columnas


(sexta y séptima), representando la frecuencia relativa y la
frecuencia relativa acumulada como tanto por cien. Estos
porcentajes se obtienen multiplicando las dos frecuencias por
cien.
3.1.4.2. TIPOS DE FRECUENCIA
3.1.4.2.1. Frecuencia Absoluta
La frecuencia absoluta (ni) de un valor Xi es el número de
veces que el valor está en el conjunto (X1, X2, …, XN).

La suma de las frecuencias absolutas de todos los elementos


diferentes del conjunto debe ser el número total de sujetos
N. Si el conjunto tiene k números (o categorías) diferentes,
entonces:

(Fórmula de la suma de las frecuencias absolutas que


tiene como resultado el número total de elementos N.)
3.1.4.2.2. Frecuencia Absoluta Acumulada
La frecuencia absoluta acumulada (Ni) de un valor Xi del
conjunto (X1, X2, XN) es la suma de las frecuencias
absolutas de los valores menores o iguales a Xi, es decir:

(Fórmula de la frecuencia absoluta acumulada.)


3.1.4.2.3. Frecuencia Relativa
La frecuencia relativa (fi) de un valor Xi es la proporción
de valores iguales a Xi en el conjunto de datos (X1, X2, …,
XN). Es decir, la frecuencia relativa es la frecuencia
absoluta dividida por el número total de elementos N:

3.1.4.2.4. Fórmula de Frecuencia Relativa


Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1.
La suma de las frecuencias relativas de todos los sujetos da
1. Supongamos que en el conjunto tenemos k números (o
categorías) diferentes, entonces:

(Fórmula de la suma de frecuencias relativas igual a 1)

Si se multiplica la frecuencia relativa por cien se obtiene el


porcentaje (tanto por cien %).
3.1.4.2.5. Frecuencia Relativa Acumulada
La frecuencia relativa acumulada es la frecuencia absoluta
acumulada dividida por el número total de sujetos N:

3.1.4.2.6. Fórmula de Frecuencia Relativa Acumulada


La frecuencia relativa acumulada de cada valor siempre es
mayor que la frecuencia relativa. De hecho, la frecuencia
relativa acumulada de un elemento es la suma de las
frecuencias relativas de los elementos menores o iguales a
él, es decir:

(Fórmula de frecuencia relativa acumulada a partir de la


suma de las frecuencias relativas de los elementos
menores o iguales al estudiado.)

3.1.5. Gráficos de frecuencias


3.1.5.1. Histograma
Es un gráfico de barras (sin espacios entre ellas), formando por
rectángulos, cuya base está dada por la amplitud de cada
intervalo y cuyas alturas corresponden a las frecuencias
(frecuencias absolutas o relativas) alcanzadas por dichos
intervalos. (Ramos & Solís, 2006)

3.1.6. Media de Tendencia central


3.1.6.1. Media Aritmética
La media aritmética es el valor obtenido por la suma de todos
sus valores dividida entre el número de sumandos, también se
le llama promedio o simplemente media. (Zurita, 2010)

3.1.6.2. Moda
Se define como el valor de la variable con mayor frecuencia
absoluta, o el valor que más se repite. Puede haber más de una
moda; para el caso que existan dos, se tiene una distribución
bimodal, y para el caso de que existan más de dos, se le llama
polimodal.

3.1.6.3. Mediana
Se define como el valor central de una distribución que tiene un
número impar de datos, una vez ordenados los datos de manera
creciente o decreciente. El dato que representa la mediana
divide la distribución en dos grupos, un 50% de valores son
inferiores y otro 50% son superiores.

Si el número de datos (N) de la distribución es par, la mediana


está dada por el promedio de los dos datos centrales.

3.1.7. Medias de dispersión


3.1.7.1. Rango
Mide la amplitud de los valores de la muestra y se calcula por
la diferencia entre el mayor valor y el menor.
3.1.7.2. Varianza
Mide la distancia existente entre los valores de la serie y la
media aritmética. Se calcula como la sumatoria de las
diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada
valor. La sumatoria obtenida se divide por el tamaño de la
muestra.

Si el número es pequeño se recomienda utilizar (n-1) en vez de


n en el denominador. La varianza siempre será mayor que cero,
mientras más se aproximan a cero, más concentrados están los
valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, más dispersos están.

3.1.7.3. Desviación Estándar


La desviación estándar, es una medida de dispersión y es de
gran utilidad tanto en la estadística descriptiva como en la
estadística inferencia. Está se define como la raíz cuadrada de
la varianza.

3.1.8. Medidas de Posición


3.1.8.1. Cuartiles
Son los tres valores que dividen al conjunto de datos ordenados
en cuatro partes iguales, son un caso particular de los
percentiles:
• El primer cuartil Q 1 es el menor valor que es mayor
que una cuarta parte de los datos
• El segundo cuartil Q 2 (la mediana), es el menor
valor que es mayor que la mitad de los datos
• El tercer cuartil Q 3 es el menor valor que es mayor
que tres cuartas partes de los datos

3.2. Estadística Inferencial


Son técnicas para obtener los resultados basados en la información
contenida en muestras.

4. Análisis de Resultados
En este experimento estadístico, ejecutaremos 250 lanzamientos de baloncesto desde
la línea de los 3 puntos, pero los aciertos no son los valores reales que analizaremos,
sino que agruparemos los datos en rondas de 5 lanzamientos para facilitar el estudio
comprimiendo los datos y comprobando que los resultados de datos agrupado y no
agrupados son iguales.
Se obtuvieron los siguientes datos:
Rondas 1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20 21
22 23 24 25 26 27 28 29 30 31 32
33 34 35 36 37 38 39 40 41 42 43
44 45 46 47 48 49 50
Aciertos 2 2 1 4 2 3 3 4 3 0
3 2 1 3 2 2 3 2 1 3 2
1 2 4 3 4 3 3 3 5 2 0
2 3 0 1 0 1 1 1 0 2 3
4 1 1 2 2 0 3
Para la elaboración de la tabla de frecuencias tendremos 5 clases con una amplitud de
1, con un valor inicial de las clases de 0 y un valor final de 5. cómo podemos observar,
según las frecuencias relativas, encestar de cuatro a cinco tiros y encestar ninguno de
una ronda de 5 lanzamientos tienen la misma probabilidad, mientras que las
probabilidades más altas se encuentran en encestar 2 y 3 de los tiros totales por ronda.

Estos datos se pueden analizar de una manera mas simple en el histograma, un grafico
de las variables vs sus frecuencias absolutas.
Pasaremos a analizar los resultados estadísticos que son mostrados a continuación:

Obtuvimos una desviación estándar de 1,249 este valor nos indica dispersión de datos
al igual que la varianza, es decir que tan lejos están los datos respecto a la media, por
lo tanto, al ser la media de 2.100 (el promedio de aciertos por cada ronda de 5 tiros) la
mayoría de datos se encontrarán en el intervalo de 1 a 3 aciertos.
El valor de la moda es 2, lo que significa que en la mayoría de rondas se encestaron 2
tiros, lo que refuerza la veracidad del valor de la media.

Como podemos observar en el diagrama de caja, tenemos que el primer cuartil se


encuentra en la variable de nombre 1, el segundo cuartil, es decir la mediana, donde la
mitad de los datos ya se han recolectado se encuentra en el 2 y el tercer cuartil se
encuentra en el 3; y sus valores atípicos serán 0 y 5.
Como podemos observar la ojiva es un grafico siempre creciente, esto se debe a que
ninguna de las variables obtuvo una frecuencia absoluta de 0, además la ojiva nos sirve
para confirmar que los cuartiles calculados anteriormente son correctos. Finalmente,
la frecuencia relativa acumulada en el variable 2 es de 60% lo que nos indica que es
mucho más probable tener menos tiros acertados.
La curtosis es negativa y por lo tanto platicúrtica, la curva de distribución es muy
achatada y a ser muy pocas las variables y tener una desviación estándar un poco alta,
hay poca concentración de datos en el área cercana a la media. El coeficiente de
asimetría es muy cercano a cero por lo que la distribución es casi simétrica, sin
embargo, al ser positivo existe una cantidad de datos mayor, en valores que son más
altos que la media.

5. Bibliografía
Cabrera, S. (20 de Agosto de 2008). Estadistica General. Obtenido de Distribucion de
Frecuencia: https://wwwyyy.files.wordpress.com/2008/08/estadistica-
generalteoria.pdf

Ramos, M. M., & Solís, M. S. (2006). Fundamentos de Matemáticas - 2 edición. En M.


M. Ramos, & M. S. Solís, Fundamentos de Matematicas - 2 edición (págs. 876 - 900).
Guayaquil: Instituto de Ciencias Matemáticas ESPOL.

Wikipedia. (s.f.). Obtenido de


https://es.wikipedia.org/wiki/Estad%C3%ADstica_descriptiva

Zurita, M. G. (2010). Probabilidad y Estadística (Segunda Edición). En M. G. Zurita,


Probabilidad y Estadística (Segunda Edición) (págs. 3 - 37). Guayaquil - Ecuador:
Instituto de Ciencias Matemáticas ESPOL.

6. Anexos
6.1. Evidencia de toma de datos

Vous aimerez peut-être aussi