Vous êtes sur la page 1sur 37

UNIVERSIDAD NACIONAL DE INGENIERIA

CLASE 01: Conceptos básicos

gpomachagua@hotmail.com
Material de Clases © German Pomachagua Perez 30-mar-17
OBJETIVOS

Que deberían saber al terminar esta clase:

Que queremos significar por estadística

Que entendemos por estadística descriptiva e inferencial.

Que es una población y que una muestra.

Que es una variable, el dato y los datos

Cuando la información se refiere a un parámetro o un estimador

Distinguir cuando una variable es cualitativa y cuando cuantitativa.

Distinguir entre una variable discreta y continua.

Distinguir las fuentes de datos


Material de Clases © German Pomachagua Perez 30-mar-17
INTRODUCCION

El objetivo fundamental de la estadística es analizar datos y transformarlos


en información para la toma de decisiones

Dato Procesamiento Información

Material de Clases © German Pomachagua Perez 30-mar-17


Actualmente con el boom de la Big Data, tener nociones
de probabilidad y estadística se ha hecho fundamental. En los
últimos años ha habido un resurgimiento de todo lo
relacionado con estadística , data mining y machine
learning empujados principalmente por la explosión de datos
con que contamos, estos conceptos combinados forman la
base de lo que actualmente se conoce como la Ciencia de
Datos

Material de Clases © German Pomachagua Perez 30-mar-17


La Optimización de Operaciones Mineras a través de la aplicación de
herramientas de Analytics, Machine Learning y Big Data busca entregar a los
participantes una visión integral de cómo los datos recopiladas durante la
ejecución de los procesos operativos en las empresas mineras, luego de ser
procesados y analizados, pueden generar información muy valiosa para la toma
de decisiones haciendo posible optimizar los diferentes procesos internos,
mejorando la calidad de los productos y la confiabilidad de los procesos así
como disminuyendo los costos y los riesgos operacionales asociados a la
industria minera.

Material de Clases © German Pomachagua Perez 30-mar-17


¿Quienes usan la estadística?
 Organismos
oficiales.
 Diarios y revistas.
 Políticos.
 Deportes.
 Marketing.
 Control de
calidad.
 Administradores.
 Investigadores
científicos.
 Médicos
 Ingenieros.
Material de Clases © German Pomachagua Perez 30-mar-17
Control de estándares de calidad en la toma, preparación y análisis de
muestras en mina (por ejemplo, para cálculo de recursos/reservas, control de
calidad, en planta (para monitoreo y control de procesos, control
granulométrico), en pilas de lixiviación y relaves (gestión ambiental)

Gestión de operaciones: determinar el


promedio de vida y la dispersión de vida
de un equipo; modelar la distribución del
rendimiento de un equipo; analizar las
características del mineral procesado
(densidad, granulometría,…)

Comparación de las características de


insumos de distintos abastecedores
(aceros para perforación, explosivos para
tronadura, reactivos para plantas de
flotación, etc.

Material de Clases © German Pomachagua Perez 30-mar-17


¿Qué es Estadística ?

 Es la ciencia que proporciona un


conjunto de métodos, técnicas y
procedimientos para recolectar,
RECOLECTAR
organizar, presentar y analizar datos
con el fin de describirlos o realizar
generalizaciones válidas. ORGANIZAR

 Es una ciencia que constantemente


ANALIZAR
proporciona métodos y técnicas para
mejorar la calidad de las observaciones
científicas, y ayuda a la toma de INTERPRETAR
decisiones en condiciones de
incertidumbre.
DATOS
Material de Clases © German Pomachagua Perez 30-mar-17
¿Qué son DATOS ?
Es el valor de la variable.
Ejemplo :

Variable Datos Unidad de


medida
Edad del paciente 27 años
Peso 70 Kg.
Tiempo permanencia 5 días
Temperatura corporal 37,5 °C
Profesión Contador ---
Si un DATO es útil para tomar decisiones se convierte en
INFORMACIÓN.

Material de Clases © German Pomachagua Perez 30-mar-17


DIVISION DE LA ESTADISTICA

ESTADÍSTICA DESCRIPTIVA: Método de recolectar, organizar, resumir, analizar e


interpretar los datos.
Tiene como objetivo presentar los datos obtenidos en forma resumida, clara y
comprensible
Ejemplo 1: Los datos del Censo de población de 2006.
Ejemplo 2: La cantidad de robos ocurridos el último mes en el distrito de Surco.
Ejemplo 3: La nota promedio del curso de Estadística de los alumnos del grupo
1.

Mencionamos algunos procedimientos:


Tablas de distribuciones de frecuencia
Gráficos de distribución de frecuencias
Diagramas de cajas
Diagramas de tallos y hojas
Estadísticos de tendencia central, dispersión y de forma

Material de Clases © German Pomachagua Perez 30-mar-17


ESTADÍSTICA DESCRIPTIVA: Algunos procedimientos
Tabla de Frecuencias Grafico de Cajas y Bigotes
<Xi-1 - Xi] fi hi Fi Hi 25

24 46

<38 - - 45] 3 0.14 3 0.14 23 52

<45 - - 52] 2 0.10 5 0.24 22 41


71
47
62

<52 - - 59] 7 0.33 12 0.57 21 43


93
65
28
94

20

<59 - - 66] 3 0.14 15 0.71 19

<66 - -73] 6 0.29 21 1.00

EDAD
18

17
21 1.00 N = 80

H OMBR E
20

MU JER

SEXO

Diagrama de Tallos y hojas Gráficos de distribución de


EDAD Stem-and-Leaf Plot frecuencias
Frequency Stem & Leaf

1,00 3. 9
3,00 4. 029
8,00 5. 14678889
5,00 6. 34689
4,00 7. 0012

Material de Clases © German Pomachagua Perez 30-mar-17


Material de Clases © German Pomachagua Perez 30-mar-17
DIVISION DE LA ESTADISTICA

Estadística Inferencial
Es un conjunto de métodos que permiten efectuar una estimación, predicción o
generalización sobre una población, basado en el análisis de datos de una
muestra.
Inferencia
Muestra POBLACIÓN

Estimador Parámetro

Ejemplo: Real Kola tiene interés en conocer si su nuevo tipo de


bebida energética tendrá aceptación en el mercado limeño

Material de Clases © German Pomachagua Perez 30-mar-17


2016

Material de Clases © German Pomachagua Perez 30-mar-17


DEFINICIONES BASICAS
Unidad Estadística: (Unidad de análisis) el elemento fundamental e
indivisible de la población (persona, animal o cosa), sobre las
cuales se va obtener datos, en otras palabras es el que proporciona
el dato.

Ejemplos: un alumno de la
universidad, un turista nacional,
un turista internacional, una
ama de casa, un supermercado,
una empresa de calzado, un
mozo, un lugar turístico, un
grifo, una persona, una familia
etc.

Material de Clases © German Pomachagua Perez 30-mar-17


Población y Muestra
Población
Conjunto de todas las unidades elementales
(personas, procesos o cosas) perfectamente
definidos de los cuales se desea obtener
información
Ejemplos :
• Todos los trabajadores afiliados a una AFP
• Todos los alumnos de las universidades publicas.
• Todas las historias clínicas de un hospital.

Material de Clases © German Pomachagua Perez 30-mar-17


POBLACION
Parámetro: Es una medición numérica que describe algunas
características de una población; para determinar su valor es
necesario utilizar toda la información de la población (censo).
Sólo hay un parámetro en cada población.
Generalmente es desconocido y por lo tanto debe ser estimado
Los más usados son:
 : Media poblacional (mu)
2 : Varianza poblacional (sigma cuadrado)
π : Proporción poblacional

Censo: Estudio realizado a todos y a cada


uno de los individuos que forman parte de
la población
Material de Clases © German Pomachagua Perez 30-mar-17
Año 2010 = 35 públicas y 65 privadas =100
Año 2016 = 51 públicas y 91 privadas =142
Material de Clases © German Pomachagua Perez 30-mar-17
Material de Clases © German Pomachagua Perez 30-mar-17
FUENTE

Material de Clases © German Pomachagua Perez 30-mar-17


Observatorio laboral: sueldos por carrera (actualizado 2016)
http://educacionalfuturo.com/noticias/observatorio-laboral-sueldos-por-carrera-2

FUENTE Material de Clases © German Pomachagua Perez 30-mar-17


Material de Clases © German Pomachagua Perez 30-mar-17
 MUESTRA: Parte o subconjunto representativo de una
población, sus elementos son seleccionados aleatoriamente
o no con el objeto de investigar las características de la
población de la cual proceden.

Muestreo: Es un procedimiento de selección de los


elementos a ser estudiados o encuestados

Material de Clases © German Pomachagua Perez 30-mar-17


Muestreo
 Actividad por la cual se toman muestras de una
población de elementos de los cuales vamos a tomar
ciertos criterios de decisión.
Si
No

Material de Clases © German Pomachagua Perez 30-mar-17


Estimador (estadígrafo): Es una medición numérica que
describe algunas características de una muestra.
Su valor es usado con propósitos de estimación de los
parámetros de una población, de la cual se extrajo la
muestra.
Los más usados son:

𝒙 : media muestral
𝑆 2 ∶ varianza muestral
𝑝 ∶ proporción muestral

Ejemplo - De los 100 estudiantes entrevistados, el 70% apoya


la resolución sobre la vacancia del Director
Material de Clases © German Pomachagua Perez 30-mar-17
Ejemplo: El siguiente gráfico muestra la evolución de la inflación desde el año
1980 al 2010. ¿El índice de precios al consumidor IPC que obtiene el INEI, es un
parámetro o un estadígrafo?

Material de Clases © German Pomachagua Perez 30-mar-17


RESUMEN

Población (N) MUESTRA (n)


P E
A S
µ x
R MUESTREO T
A I
σ2 S2
M M
E p A
T INFERENCIA
π D
R O
O R

Material de Clases © German Pomachagua Perez 30-mar-17


Simbología a utilizar

MEDIDAS POBLACION MUESTRA


(parámetro) (estadístico)
Media aritmética 𝜇 𝑥
Varianza 𝜎2 𝑆2
Desviación estándar 𝜎 𝑆
Proporción 𝜋=𝑃 p
Tamaño 𝑁 𝑛

Material de Clases © German Pomachagua Perez 30-mar-17


Material de Clases © German Pomachagua Perez 30-mar-17
Ejemplo 1: Se ha hecho un estudio en el distrito de SJL para
determinar la preferencia de una marca especial de detergente por
parte de las amas de casa. Entre las 50 amas de casa
entrevistadas, 30 dijeron que preferían esta marca.
a) ¿Cual es la unidad de análisis?
b) ¿Cuál es la población?
c) ¿Cuál es la muestra?
d) ¿Cuál es el parámetro?
e) ¿Cuál es el estimador ?
Solución:
a) Una ama de casa del distrito de SJL
b) Todas las amas de casa del distrito de SJL.
c) Las 50 amas de casa
d) Proporción poblacional de amas de casa que prefieren tal
detergente
e) El estimador proporcional
x 30
p    0.6
n 50
Material de Clases © German Pomachagua Perez 30-mar-17
Ejemplo 2: Una compañía produce poleas que se supone tengan un
diámetro promedio de 2.50 centímetros, según requerido por el
comprador. Un equipo de ingenieros examina la producción
rutinariamente para velar que se cumpla con las especificaciones. Si
encuentran que las poleas no cumplen con las especificaciones
establecidas, las máquinas que las producen son ajustadas. Ellos
seleccionan una muestra de 100 poleas de un lote producido en la
fábrica y encuentran con que el diámetro promedio es de 2.51
centímetros.
a) Indica cuál es el problema que debe ser resuelto.
b) En términos de este problema, indica explícitamente cuál es
 La población
 El parámetro
 El estimador
 La muestra
 La variable que se debe medir

Material de Clases © German Pomachagua Perez 30-mar-17


VARIABLES

Es una característica de los elementos que se va investigar y que


toma diferentes valores o categorías.

Variable

Cualitativa Cuantitativa

Nominal Ordinal Discreta Continua

Material de Clases © German Pomachagua Perez 30-mar-17


Tipos de variables: Según su naturaleza
 Cualitativas o Categóricas
Son aquellas características que se pueden clasificar, pero no medirse
 Nominales: Si sus valores no se pueden ordenar

 Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

 Ordinales: Si sus valores se pueden ordenar


 Calificaciones, Grado de satisfacción, Intensidad del dolor, la escala de
Mohs (dureza de los minerales comienza de 1 talco hasta 10 diamante)
 Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con
ellos)

 Discretas: Toma valores enteros y no puede tomar una fracción entre dos
valores consecutivos
 Número de hijos, Número de cigarrillos, Numero de accidentes

 Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


 Altura, Presión intraocular, talla, peso

Material de Clases © German Pomachagua Perez 30-mar-17


EJERCICIO
Clasificar las siguientes variables

Preferencias de cerveza.
Velocidad en Km/h.
El peso en Kg.
Signo del zodiaco.
Nivel educativo (primario secundario, superior).
Años de estudios completados.
Tipo de enseñanza (privada o pública).
Número de empleados de una empresa.
La temperatura de un enfermo en grados Celsius.
La clase social (baja, media o alta).
La presión de un neumático en Nw/cm2
Capacidad de un disco duro de un ordenador, en GB.
Velocidad de transferencia de ficheros en una red, en bps.
Resultado de un test que comprueba si un ordenador tiene virus o no.
Tipos de impresoras.
Velocidad de acceso a un disco duro, en milisegundos

Material de Clases © German Pomachagua Perez 30-mar-17


Ejemplo: Una empresa educativa HT cuenta con un total de 3750 empleados de los
cuales 660 son profesores. Los directivos saben que el 25% de los profesores usan
herramientas tecnológicas en poca escala. Uno de sus objetivos es mejorar la
calidad de la enseñanza, por lo que se ha tomado una muestra aleatoria de 145
profesores y se ha tomado en cuenta, entre otras, las siguientes características:
 Marca de computadora personal que utiliza
 Tiempo que usa la computadora personal por semana
 Número de personas de la casa que usa la computadora personal
Al procesar la información muestral se obtuvo un promedio 18 horas de uso
semanal de la computadora personal, 87% usan como programa principal un
procesador de texto.
a) Determine: población, muestra, parámetros, estadísticos, variables, tipos de
variables, escala de medición de la variable
Solución:
 Población: Los 660 profesores del centro HT
 Muestra: 145 profesores
 Parámetros: 25% de los profesores usan las herramientas tecnológicas en poca
escala(𝜋 = 25%)
Estadísticos:
 El promedio muestral es 18 horas de uso semanal de la computadora personal
(𝑥 = 18)
 87% usan como programa principal un procesador de texto (𝑝 = 87%)
Material de Clases © German Pomachagua Perez 30-mar-17
HOJA DE COMPROBACIÓN
1. L a estadística es una ciencia que sólo analiza datos

2. Los datos se organizan para mejorar su comprensión

3 El muestreo permite disponer de los datos en menor tiempo,


reduciendo costos

4 El parámetro representa a una población

5. El muestreo permite disponer de los datos en menor tiempo,


reduciendo costos.

6. El parámetro representa a una población

7. .Existen tanto estimadores como muestras se extraigan de una


población

Material de Clases © German Pomachagua Perez 30-mar-17


8.Diferentes muestras, extraídas de una misma población,
ocasionan diferente Valores del estimador

9.Los estimadores se representan por letras griegas

10.En la estadística descriptiva, el análisis se limita a un


conjunto de datos

11.Las técnicas que permiten estimar un parámetro a partir de


datos muestrales se denomina Estadística Inferencial

12.El error del muestreo consiste en la equivocación cuando


seleccionamos muestras

Material de Clases © German Pomachagua Perez 30-mar-17

Vous aimerez peut-être aussi