Vous êtes sur la page 1sur 38

Análisis de Datos Aplicados 1

Introducción a la Recolección y
Descripción de Datos

Sesión 1

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 2

Datos
Los datos son los hechos y los números que se
reúnen, analizan y resumen para su presentación
e interpretación.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 3

Elementos, Variables,
Observaciones
Los elementos son las entidades de las cuales
recogemos los datos.

Una variable es una característica de interés de cada


elemento.

Al conjunto de medidas recogidas de un elemento en


particular se le llama observación.

El número total de datos es igual al número de


elementos multiplicado por el de variables.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 4

Escalas de Medición
Las escalas de medición son:
Nominal De intervalo
Ordinal De razón

La escala determina la cantidad de información que debe


contener el dato.

La escala indica además qué tipos de resúmenes de


datos y de análisis estadísticos son los más apropiados.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 5

Escalas de Medición
• Nominal

Los Datos son etiquetas o nombres usados para


Identificar un atributo de un elemento.

Se usan etiquetas no numéricas o códigos


numéricos.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 6

Escalas de Medición

• Ordinal
Los datos tienen las propiedades de una
medición nominal y adicionalmente el orden o la
posición relativa de cada categoría tiene
significado.

Se pueden usar una etiqueta no numérica o un


código numérico.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 7

Escalas de Medición
• De Intervalo

Los datos tienen las propiedades de los ordinales


y las distancias que hay entre las observaciones se
miden en términos de una unidad de medida fija.

Datos de Intervalo son siempre numéricos.

Esta escala tiene el cero relativo que indica que


para esta variable el punto cero depende de quien
evalúa. En el cero, no siempre no hay nada.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 8

Escalas de Medición
• De razón

Los datos tienen todas las propiedades de los de


intervalo y en este caso el cociente de dos
valores tiene un significado.

Variables como son distancia, altura, peso, y


tiempo usan la escala de razón.

Esta escala tiene el cero absoluto que indica que


para esta variable no existe nada en el punto
cero.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 9

Cada escala provee diferente información

Nominal

Tercero Segundo Ganador

Ordinal

Tercero Segundo Ganador

Intervalo
20 segundos 1 segundo

Razón 1 minuto 59 2/5 segundos para 11/4 millas

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 10

Fuentes de Datos
• Fuentes existentes
Interior a la empresa – en casi todos los
departamentos
Servicios de Bases de Datos – Dow Jones & Co.
Agencias de Gobierno
Gremios – Cámaras de Comercio, Sociedad
Nacional de Industrias
Internet

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 11

Fuentes de Datos
• Estudios Estadísticos
En estudios experimentales la variable de interés
es identificada primero. Luego, uno o más
factores son controlados y los datos que se
obtienen nos dicen cómo los factores controlados
afectan a la variable de interés.
En estudios no experimentales (observacionales)
no se hace ningún intento por controlar o afectar
las variables de interés.
Una encuesta es
un buen ejemplo
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 12

Estadística Descriptiva

 La mayoría de la información estadística en los


periódicos, revistas, informes de la compañía, y
otras publicaciones consiste en datos que se
resumen y presentan en una forma que es fácil
de entender.
 A dichos resúmenes de datos, que pueden ser
tabulares, gráficos, o numéricos, se les conoce
como estadística descriptiva.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 13

Estadística Descriptiva

Datos resumidos y presentados


convenientemente. Dichos resúmenes
pueden ser:
tabulares
gráficos o
numéricos

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 14

Ejemplo: Hudson Autos


Al gerente de Hudson Autos le gustaría tener una .S
mejor comprensión de los costos de los repuestos
utilizados en las reparaciones realizadas en su taller.
Examina 50 facturas de clientes atendidos en los últimos
meses. Anota el costo de las piezas, redondeado al dólar
más cercano. Además por teléfono se comunica con ellos y
obtiene la edad del cliente, se les pide que califiquen la
calidad del servicio recibido (1=excelente, 2=muy bueno,
3=bueno, 4=regular y 5=malo) y nos indiquen el servicio
recibido 1=mantenimiento, 2=diagnóstico, 3=otro). Los datos
se muestran en la hoja de Excel adjunta

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 15

Distribución de frecuencias
Una distribución de frecuencias es una tabla
que resume los datos mostrando la frecuencia o
número de elementos que hay dentro de cada una
de sus clases, que deben ser mutuamente
excluyentes y colectivamente exhaustivas.

El objetivo es proveer información acerca del


conjunto de datos que no podría obtenerse
rápidamente por simple observación de los datos
originales.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 16

Distribución de frecuencias relativas

La frecuencia relativa de una clase es la fracción


o proporción del total de datos que pertenecen a
una determinada clase.

Una distribución de frecuencias relativas es una


tabla que nos resume un conjunto de datos
mostrando la frecuencia relativa para cada clase.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 17

Gráfico de Barras
Un gráfico de barras es una herramienta gráfica
para trabajar con datos cualitativos.
En un eje (normalmente el horizontal), colocamos
las etiquetas con los nombres de las categorías.
En el otro eje (normalmente el vertical), se puede
usar la frecuencia, la frecuencia relativa.
Usamos una barra de ancho fijo que dibujamos
arriba de cada etiqueta, con una altura de acuerdo
con su correspondiente frecuencia.
Las barras están separadas para enfatizar que
cada clase es una categoría diferente.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 18

Gráfico de Pie
El gráfico de pie es una herramienta gráfica usada
generalmente para presentar distribuciones de
frecuencia relativa de datos cualitativos.

Primero se traza un círculo; luego usando


las frecuencias relativas se subdivide
en sectores que corresponden a la
frecuencia relativa de cada clase.

Dado que hay 360° en un circulo, una clase con una


frecuencia relativa de .25 consumirá .25(360) = 90°
de ese círculo.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 19

Distribución de Frecuencias
Para Datos Numéricos
Guías para seleccionar el número de clases

Use entre 5 y 20 clases.

Conjuntos de datos con un número grande de


elementos, generalmente requieren un número
grande de clases.

Conjuntos de datos pequeños usualmente


requieren pocas clases

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 20

Distribución de Frecuencias
Para Datos Numéricos
Guía para seleccionar el Ancho de Clase

Use clases de igual ancho


Ancho aproximado de clase =

Dato más grande - Dato más pequeño


Número de Clases

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 21

Usando la función FRECUENCIA de


Excel para Construir una Distribución
de Frecuencias
La función FRECUENCIA no es una función
“simple” de Excel.
FRECUENCIA nos proporciona valores múltiples.
En Excel, la formula que dan como respuesta
múltiples valores se llaman fórmula matricial.
Una fórmula matricial tiene una forma especial de
ingresar.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 22

Usando la función FRECUENCIA de


Excel para Construir una Distribución
de Frecuencias
Pasos para ejecutar esta función:
Paso 1 Seleccionar la matriz donde deben
aparecer las frecuencias

Paso 2 Escribir la siguiente fórmula:


{= FRECUENCIA (Datos,Grupos)}

Paso 3 Presionar CTRL + SHIFT + ENTER


(La fórmula aparecerá en toda la matriz
seleccionada)
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 23

Histograma
El histograma es una manera muy común de
presentar gráficamente datos cuantitativos.

La variable de interés se coloca en el eje horizontal.

Se dibuja un rectángulo arriba de cada intervalo de


clase con una altura correspondiente a su
frecuencia, frecuencia relativa, o frecuencia
porcentual.

A diferencia del gráfico de barras, un histograma


no tiene separaciones entre rectángulos de clases
adyacentes
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 24

Usando Excel para Construir un


Histograma
Usando herramientas de Excel

Herramientas

Análisis
de Datos

Histograma

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 25

Distribución Acumulativa
Distribución Acumulada de Frecuencias
muestra el número de observaciones con valores
iguales o menores que el límite superior de cada
clase.
Distribución Acumulada de Frecuencias
Relativas muestra la proporción de ítems con
valores menores o iguales al el límite superior de
cada clase.
Distribución Acumulada de Frecuencias
Porcentuales muestra el porcentaje de ítems con
valores menores o iguales al el límite superior de
cada clase.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 26

Tablas de Contingencia y
Diagramas de Dispersión
Hasta el momento hemos visto métodos que
resumen datos pero una variable a la vez.

Los gerentes necesitan métodos que les permitan


graficar y tabular datos de manera que se entiendan
las relaciones entre dos variables.

Tablas de Contingencia y Diagramas de Dispersión


son dos métodos que permiten resumir los datos
para dos (o más) variables simultáneamente.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 27

Tablas de Contingencia

Tabla de contingencia es una forma de resumir en


una tabla datos de dos variables simultáneamente.
Se puede usar si:
 ambas variables son cualitativas, o
 Si alguna es cuantitativa, para hacer la tabla
debe ser transformada en otra cualitativa.
Las filas y las columnas definen las clases para
cada una de las dos variables.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 28

Diagramas de Dispersión y
Líneas de Tendencia
Un diagrama de dispersión es una representación
gráfica de la relación entre dos variables
cuantitativas.

Una de las variables se muestra en el eje vertical


y la otra en el horizontal.

El patrón general que muestran los puntos


sugieren la relación entre las variables.

Una línea de tendencia es una aproximación de la


relación.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 29

Diagrama de Dispersión
Una relación positiva

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 30

Diagrama de Dispersión
Una relación negativa

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 31

Diagrama de Dispersión
Ninguna relación

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 32

Procedimientos Gráficos y Tabulares


Dato
Cualitativo Cuantitativo

Métodos Métodos Métodos Métodos


Tabulares Gráficos Tabulares Gráficos

• Dist.Frec. • Gráfico de • Dist. Frec. • Histograma


• Dist.Frec.Relat. Barras • Dist.Frec.Relat. • Ojiva
• Dist.Frec.Porc. • Gráfico de • Dist.Frec.Acum. • Diagrama de
• Tab.deConting. Pie • Dist.Frec.Relat.A Dispersión
cumuladas
• Diagrama de
Hoja y Tallo
• Tab.deConting.
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 33

Errores en Presentación de Datos

1. Uso de ‘Gráficos
engañosos’.
2. Bases Relativas de
Comparación diferentes.
3. Comprimiendo el eje
vertical.
4. No punto CERO en el
eje Vertical.
5. Torta tridimensional,
girada

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 34

‘Gráfico engañoso’

Incorrecta Correcta
1960: $1.00 $
4
1970: $1.60
2
1980: $3.10

0
1990: $3.80
1960 1970 1980 1990

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 35

Base Relativa Diferente

Incorrecta Correcta

Freq. %
300 30%
200 20%

100 10%
0 0%
FR SO JR SR FR SO JR SR

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 36

Compresión de eje Vertical

Incorrecta Correcta

$ $
200 50

100 25

0 0
Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 37

No Cero en Eje Vertical

Incorrecta Correcta

$ $
45 60
42 40
39 20
36 0
J M M J S N J M M J S N

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.
Análisis de Datos Aplicados 38

Torta Tridimensional, Girada

Incorrecta Correcta

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2017.

Vous aimerez peut-être aussi