Vous êtes sur la page 1sur 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

AVISO: Esta pgina ha sido generada para facilitar la impresin de los contenidos. Los enlaces externos a otras pginas no
sern funcionales.

Anlisis de los datos e interpretacin de los


resultados.

14/04/2015 16:40

Caso prctico
En Eurasia, S.A., Pedro Domnguez est empeado en
convencer a su gerente, Juan Surez, que la empresa cuenta
con personal suficientemente motivado como para llevar a cabo
el anlisis e interpretacin de los datos de todas las
investigaciones que decidan poner en marcha. Pero Pedro no
slo se basa en el personal y su motivacin:
Juan, si nosotros mismos hacemos el anlisis e interpretacin de los datos recopilados,
nos ahorraramos un importante dinero. No te parece suficiente motivo?
Por supuesto que s, Pedro, ya sabes cmo estn las cosas. Tenemos que ahorrar costes.
Pues no es slo eso, Juan, tambin nos ahorraramos los aburridos informes que nos han
presentado en otras ocasiones. Ya sabes, cuando analizas los datos de una empresa que no
es la tuya, no es lo mismo. Quin mejor que nosotros vamos a conocer Eurasia!
Tienes toda la razn, Pedro, los informes comerciales que hacan eran aburridos, y ya no
te digo cuando venan a presentar los resultados de la investigacin, qu reuniones ms
eternas! Por favor, forma un equipo de trabajo para poder realizar todos los anlisis de datos
que estimemos oportunos a partir de ahora. Si se necesita formacin, ya sabes que para eso
Eurasia siempre est dispuesta.
Gracias, Juan. No dudes que contar con mi equipo para poder llevar a cabo cualquier
anlisis de datos e interpretacin de resultados, por muy difcil que sea. Ah! Y vers como
no te aburrirs cuando te presentemos los resultados.
No cabe duda, que el compromiso de Pedro es fuerte y el esfuerzo que requiere es grande.
El anlisis de datos y la interpretacin de resultados de cualquiera investigacin comercial no
es tarea fcil. Afortunadamente es un apasionado de la estadstica, y eso le va a servir para
manejarse muy bien en este terreno. Adems cuenta con su equipo que pondr voluntad en
cada anlisis que deba realizar. Pedro les ha insistido que la nueva tarea no consiste slo en
hacer grficos en
Excel e informes bonitos para Juan. La cuestin es mucho ms
compleja, se trata de codificar e introducir los datos en el programa informticos, de
tabularlos y representarlos grficamente. Tambin de hacer un anlisis descriptivo de
los mismos datos. El trabajo consiste tambin en trabajar con muestras si la cantidad de
informacin es importante, y de saber trasladar los resultados de esta muestra a la poblacin
objeto de estudio. Van a tener que trabajar con probabilidades y contrastar hiptesis. Y
por ltimo, Pedro y su equipo van a tener que saber manejar las herramientas informticas
necesarias como para disear el informe comercial que presente los resultados del
anlisis.
A lo largo de la unidad veremos cmo se pueden llevar a cabo estas y otras acciones.

1 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Materiales formativos de FP Online propiedad del Ministerio de Educacin,


Cultura y Deporte.
Aviso Legal

1.- Codificacin e introduccin de datos.


Caso prctico
Pedro Domnguez ya est manos a la obra. Juan Surez le ha encargado el primer trabajo
referente al anlisis de unos datos: quiere conocer a fondo cmo son sus clientes, tanto
nacionales como internacionales. En las fichas de cada cliente tienen algunos datos, pero
an quiere llegar ms all y tener toda la informacin posible para poder as comparar los
clientes de unos y otros mercados. Pedro sabe que lamentablemente el programa informtico
de la empresa es muy limitado, y las fichas de los clientes dejan mucho de desear. Por tanto,
se ha propuesto que Mara Dolores y Alberto codifiquen e introduzcan todos los datos de
todos los clientes de Eurasia, para despus representarlos grficamente y poder trabajar con
ellos. Es una tarea que les puede resultar pesada, pero que simplificar mucho a partir de
ahora cualquier trabajo de investigacin de Eurasia.

Concluido el trabajo de campo, llega una fase esencial en la investigacin de mercados: la codificacin.
Cuando codificamos, estamos traduciendo las respuestas a nmeros. Se trata de una operacin muy
importante y delicada en su ejecucin ya que de no hacerla bien se puede fallar en todo el anlisis
posterior de los datos.
El proceso de codificacin hace posible la agrupacin de los datos, y para que esta agrupacin sea
posible es imprescindible identificar antes, de manera inequvoca, cada tipo de respuesta contenida en
los documentos cumplimentados. Para ello todas las posibles respuestas se identifican utilizando
smbolos o cdigos a asignar a cada una de ellas. Por ejemplo:
En una pregunta con slo dos respuestas posibles (hombre y mujer), podramos asignar el valor "1"
cuando sea hombre y el valor "2" cuando sea mujer.
En una pregunta del tipo "Su edad es:", podemos asignar el cdigo 31 si la respuesta es 31.
En una pregunta con ms de dos variables "Nada", "Poco", "Algo" y "Bastante", podramos asignar
a cada variable un valor del 1 al 4.
Las preguntas en las que se pueden elegir varias respuestas, a cada una de ellas le daramos dos
valores. Si puedes elegir varias respuestas de las siguientes: "Amigos", "Familiares",
"Profesionales" y "Otros", cada una de estas respuestas estara dotada de dos valores, valor "1" si

14/04/2015 16:40

2 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

es seleccionada y valor "0" si no es seleccionada.


Si la pregunta es de respuesta libre, es ms complejo su tratamiento informtico y, por ende, su
codificacin, ya que se pueden obtener un gran nmero de respuestas. Se suele convertir la
pregunta en cerrada, examinando todas las respuestas dadas a la misma y a partir de ellas disear
categoras de respuestas.

La codificacin de preguntas cerradas es la ms sencilla. Se trata de asignar un nmero a


cada una de las respuestas predeterminadas.
Con todo este proceso se facilita la introduccin de los datos o respuestas en el
ordenador y su posterior tratamiento informtico-estadstico: disminuye el
tiempo de introduccin de los datos, disminuye los errores en el tecleo de los
datos de entrada y facilita las rdenes de recuento dadas al ordenador.
Generalmente los cuestionarios que van a ser tratados en ordenador llevan
impresos los cdigos de identificacin de cada una de las respuestas que la
mquina va a utilizar para proceder a realizar las tabulaciones necesarias.
Respecto a la introduccin de los datos, podemos utilizar programas para
introducir los datos y al mismo tiempo codificarlos. De esta forma se pueden
introducir saltos o filtros en el programa: por ejemplo, cuando se llega a la pregunta "a" y la respuesta ha
sido "1", puede saltar directamente a la pregunta "z", sin necesidad de pasar por el resto de preguntas.
Tambin se pueden recurrir a hojas de clculo o bases de datos convencionales para introducir la
informacin, como veremos al final del presente tema.

1.1.- Tabulacin de datos: tabulacin


unidireccional.
Continuamos con el siguiente paso en nuestro empeo de tratar los datos y convertirlos en informacin,
ahora una vez codificados tendremos que tabularlos. La tabulacin es el medio que permite al
investigador tener una visin de conjunto de la informacin de todos los cuestionarios o herramientas de
la investigacin, al convertirlos en datos homogneos que posteriormente sern objeto de anlisis.
Una vez codificadas las respuestas, se procede a introducir los datos en un programa de ordenador que
admita los datos (respuestas del cuestionario), los almacene de forma sistemtica, los archive en un
soporte informtico y los deje preparados para realizar con ellos todas las operaciones que puedan
resultar de inters (clculos de diferentes medidas estadsticas).
La tabulacin puede realizarse pregunta por pregunta (tabulacin simple o unidireccional) o bien de dos
o ms preguntas a la vez (tabulacin cruzada).

Reflexiona
Si a una empresa le interesa saber cuntos clientes usan un determinado servicio, tabular la
pregunta del cuestionario que haga referencia al tema de forma individual; pero si quiere
saber cuntas de esos clientes son de la UE y cuntos son del continente americano,
realizar una tabulacin cruzada.

Hablamos de tabulacin simple o unidireccional cuando nos referimos al recuento del nmero de casos
que se incluyen en las clases de respuestas a una pregunta del cuestionario. En este tipo de tabulacin,
las tablas estn constituidas por columnas que contienen las diferentes clases de respuestas de una

14/04/2015 16:40

3 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

pregunta (Xi) a las que se les asign un cdigo, la frecuencia absoluta (Fi), la frecuencia relativa y/o los
porcentajes (Pi) con que se presentaron dichas respuestas en la muestra.
Existen diferentes escalas de medidas de las variables en la tabulacin unidireccional.

14/04/2015 16:40

La escala nominal slo implica distincin de categoras. La variable tomar diferentes valores, por
ejemplo, se clasifican los clientes de una empresa segn la profesin de los mismos.
Ejemplo de tabulacin simple de escala nominal Profesin (Xi) Frecuencia Absoluta (fi) Frecuencia
Relativa (pi)
Agricultor

42

14,58 %

Funcionario

60

20,83 %

Obrero

94

32,64 %

Administrativo

32

11,11 %

Trabajador autnomo

54

18,75 %

Otros

2,09 %

N=288

100 %

La escala ordinal implica una ordenacin de las clases: los valores de las variables aparecen
ordenados, creciente o decrecientemente. Por ejemplo, se clasifica a los consumidores de un
producto segn su frecuencia de uso.
Ejemplo de tabulacin simple de escala ordinal Frecuencia de uso fi pi Pi
Nunca

20

13,51 %

13,51 %

Ocasionalmente

32

21,62 %

35,13 %

Poca frecuencia

56

37,84 %

72,97 %

Mucha frecuencia

22

14,86 %

87,83 %

Siempre

18

12,17 %

100 %

148

100 %

La escala cardinal o de intervalo implica no slo la ordenacin de las clases sino tambin la
distancia entre ellas.
Por ltimo, la tabulacin de razn consiste en registrar los datos originales con un nmero
cualquiera (por ejemplo: nmero de pelculas que ves al ao).

Autoevaluacin
En la pregunta sobre el sexo del encuestado, se utilizar siempre la escala de medicin
nominal. Verdadero o falso?
Verdadero.
Falso.

4 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

1.2.- Tabulacin de datos: tabulacin cruzada.


Como ya hemos visto anteriormente, la tabulacin se puede realizar no slo pregunta por pregunta sino
tambin con dos o ms de dos preguntas a la vez.
Con la tabulacin cruzada se trata de poner en relacin las respuestas a dos o ms preguntas
diferentes para ver en qu medida las respuestas estn ligadas entre s.
En la tabulacin de dos preguntas, las tablas estn constituidas por un cuadro de doble entrada en el
que las clases de respuestas de una de las preguntas se colocan como principios de lnea; al final de
cada una de stas se anotan sus frecuencias, relativas o absolutas; las clases de la otra pregunta
encabezan las columnas, a cuyo pie se colocan sus frecuencias correspondientes. En los cruces de las
filas y las columnas se anotan las frecuencias conjuntas. Estas tablas pueden estar expresadas en
porcentajes en relacin a una pregunta (tabla de porcentajes verticales o porcentajes horizontales) o en
relacin a las dos preguntas (tabla de porcentajes respecto al total de la poblacin).
Por ejemplo, si queremos saber cuntos clientes del gnero masculino y cuntos del gnero femenino
tenemos y de todos ellos cuntos volvern a comprar nuestros productos y cuntos no, podemos
construir una tabla parecida donde se representen las respuestas a ambas preguntas.
Ejemplo de tabulacin cruzada Gnero/Nueva compra S No Total
Masculino.

33 %

22 %

55 %

Femenino.

37 %

8%

45 %

Total.

70 %

30 %

100 %

A partir de una tabla de tabulacin cruzada, ya se pueden realizar anlisis ms profundos y llegar a
conclusiones de mayor peso.

14/04/2015 16:40

Ejercicio resuelto

Una consultora ha realizado un estudio evaluando la relacin calidad-precio de una serie de


restaurantes por toda la UE. La muestra est compuesta por 300 restaurantes, y ya tiene los
datos de los 10 primeros que se presentan en la siguiente imagen. Se pide realizar una
tabulacin cruzada de la calidad y precio de los restaurantes.
Muestra de restaurantes. restaurante Evaluacin de la comida Precio de la comida(euros)
1

Bueno

18

Muy bueno

22

Bueno

28

Excelente

38

Muy bueno

33

Bueno

28

Muy bueno

19

5 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Muy bueno

11

Muy bueno

23

10

Bueno

13

A partir de los resultados de la imagen anterior, los precios ms altos por comida
parecen estar asociados con una calidad mayor al restaurante y el precio ms bajo por
comida a una calidad menor, tal como se aprecia en la siguiente imagen.
En este caso, la tabulacin cruzada se basa en una variable cualitativa (calificacin de
calidad) y una variable cuantitativa (precio de la comida). Tambin, las tabulaciones
cruzadas pueden usarse cuando ambas variables son cualitativas, o cuando son
cuantitativas.
Resultados
Precio de la comida Evalucacin de la calidad 10-19 20-29 30-39 Total Total
Bueno

Muy bueno

Excelente

10

1.3.- Tratamiento de los datos. Tipos de datos.


Una vez que hemos visto cmo tabular los datos, a continuacin debemos conocer qu tipo de datos
existen dependiendo de la modalidad de estadstica con la que trabajemos.
Dentro de la estadstica distinguimos tres modalidades: estadstica analstica, descriptiva e
inferencial.
Dependiendo de la manera de tratar la informacin recogida, nos
podremos enfrentar a diferentes metodologas dentro de la estadstica:
Si el conjunto de los datos es tratado matemticamente, obteniendo
de ellos unos valores numricos que nos dan una idea de la
situacin que se analiza, decimos que estamos la estadstica
analtica.
Si la informacin es recogida y tabulada en tablas y grficos,
estaremos ante la estadstica descriptiva. En ella han de respetarse
ciertas reglas, si se quiere que los datos sean significativos. La
estadstica descriptiva realiza el estudio sobre la poblacin completa, observando una
caracterstica de la misma y calculando unos parmetros que den informacin global de toda la
poblacin.
Si lo que hacemos es sacar conclusiones del trabajo realizado, valorndolo probabilsticamente,
estamos ante la estadstica inferencial. A travs de ella se realiza el estudio descriptivo sobre un
subconjunto de la poblacin llamado muestra y, posteriormente, extiende los resultados obtenidos a
toda la poblacin.
A lo largo de la presente unidad iremos utilizando herramientas propias de cada metodologa. Pero antes
debemos tener claro la terminologa ms comn en estadstica, y los tipos de datos con los que nos
vamos a encontrar. Para ello debemos tener clara la diferencia entre poblacin y muestra.

14/04/2015 16:40

6 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Entendemos por poblacin, tambin llamado universo, el conjunto formado por todos los
elementos a los que les vamos a hacer el estudio. Y muestra es el subconjunto de la
poblacin que elegimos para hacer un estudio ms reducido.
Y partiendo de esa diferenciacin entre poblacin y muestra, podremos conocer los dos tipos de datos
que nos vamos a encontrar: parmetros o estadsticos:
El parmetro es una cantidad numrica calculada sobre una poblacin y resume los valores que
esta toma en algn atributo.
Por otra parte, el estadstico es una cantidad numrica calculada sobre una muestra que resume su
informacin sobre algn aspecto. Tambin se le suele llamar estimador. Normalmente nos interesa
conocer un parmetro, pero por la dificultad que conlleva estudiar a toda la poblacin, calculamos
un estimador sobre una muestra y confiamos en que sean prximos.
Por ltimo, al hablar de tipos de datos, debemos referirnos tambin a
las variables estadsticas, que son las diferentes propiedades o
cualidades que podemos estudiar en los individuos de una
poblacin. Segn sea el valor que tomen, numrico o no, tenemos la
siguiente clasificacin:
Variables estadsticas cuantitativas: cuando slo toma valores
numricos. Estas variables a su vez se clasifican en dos tipos:
Discretas: los valores numricos que toma son aislados, por ejemplo el nmero de hijos de
una familia.
Continuas: puede tomar cualquier valor numrico entre otros dados, por ejemplo los ingresos
medios de una poblacin cuyos ingresos oscilan entre los 1.000 y los 2.000 euros mensuales.
Variables estadsticas cualitativas: cuando la propiedad que estudiamos, su valor, no puede
expresarse con nmeros, por ejemplo el color de pelo de los turistas que visitaron Espaa en 2011.

Autoevaluacin
En las elecciones se realizan sondeos utilizando distintas tcnicas sobre una ms o menos
numerosa de personas. Cunto mayor sea el nmero de ciudadanos con derecho a voto,
mayor ser la fiabilidad de la , pero tambin mayor ser el coste del . El estudio de la se hara
mediante estadstica , pero lo que interesa es el resultado final de la . El paso de generalizar
los resultados de la , a toda la , se hace mediante tcnicas de estadstica .

1.4.- Representacin grfica de los datos (I).


No podemos pasar por alto que para el anlisis de los datos nos podemos valer de la ayuda de grficos.
Pero para ello es necesario que aprendamos a diferenciarlos y comprobar su utilidad. Los grficos tienen
por objeto representar datos numricos por medio de lneas o dibujos que permiten apreciar mediante
una sencilla y rpida observacin el comportamiento de la serie estadstica. Dependiendo del objetivo
buscado, de la variable, de la escala de medicin y del tipo de dato con el que se trabaje, se elegir el
grfico adecuado. Hay distintas formas de representar grficamente los datos:
Diagrama de lneas. Son representaciones grficas formadas por segmentos rectilneos que
resultan de unir los puntos definidos por la correspondencia existente entre dos variables, cuyos
valores se toman en los ejes de un sistema cartesiano.

14/04/2015 16:40

7 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

14/04/2015 16:40

Diagrama de rea. Igual que el de lnea, pero en este caso se sombrea o se rellena adems el rea
comprendida entre el eje horizontal y la lnea poligonal determinada por los puntos.

Diagrama de barras. Son representaciones grficas formadas por barras con anchura de trazo
uniforme, situadas horizontal o verticalmente, y cuya longitud viene determinada por los datos.

Diagramas de sectores. Son representaciones consistentes en grficos circulares, divididos en


sectores de reas proporcionales a las partes del total de aquello que se quiere representar.

Pictogramas. Son representaciones grficas muy vistosas que consisten en dibujar en lugar de
lneas, figuras varias relacionadas con lo estudiado y de magnitudes proporcionales a la intensidad
del mismo.
Histogramas. Son representaciones grficas formadas por rectngulos, cuya rea es proporcional a
la frecuencia de cada modalidad. En el caso de que los intervalos que se tomen sean iguales, las
alturas de los rectngulos se pueden tomar iguales a las frecuencias correspondientes.

Polgonos de frecuencias. Se obtiene uniendo los puntos medios del extremo superior de las barras
del histograma. Dicha figura pretende mostrar, de la forma ms simple, en qu rangos se encuentra
la mayor parte de los datos.

8 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Ejercicio resuelto

En un grupo de personas hemos preguntado por el nmero medio de das que consumen un
determinado producto. Las respuestas han sido las siguientes: 4 2 3 1 3 7 1 0 3 2 6 2 3 3 4 6
3 4 3 6. Se pide realizar la tabla de frecuencias y representar grficamente la distribucin a
travs de un diagrama de barras.
Tabulacin de los datos descritos en el
ejercicio Xi Fi
0

1.4.1.- Representacin grfica de los datos (II).


Despus de haber estudiado los distintos tipos de grficos posibles, vamos
a conocer ahora cmo podemos clasificar las variables y qu tipo de grfico
le viene mejor a cada una de ellas. El tipo de representacin grfica
depender de la variable con la que se trabaje. Entendemos variable como
la propiedad o cualidad que puede manifestarse bajo dos o ms formas
distintas en un individuo de una poblacin.
Las variables se clasifican en:
Cuantitativas: se expresan numricamente. Se clasifican a su vez en discretas y en continuas. Las
discretas toman valores numricos aislados, por lo que, fijados dos consecutivos, no pueden tomar
ningn valor intermedio. Las continuas pueden tomar cualquier valor dentro de unos lmites, por lo
que entre dos valores cualesquiera, por prximos que sean, siempre pueden encontrarse valores
intermedios.
Cualitativas: no se expresan numricamente. Se clasifican en ordinales y en nominales. Las
ordinales admiten una ordenacin de menor a mayor aunque sus resultados no son numricos. Las
nominales no admiten una ordenacin de menor a mayor.
Relacin entre grficos y variables Grfico Variable

14/04/2015 16:40

Diagrama de barras.

Cualitativa y cuantitativa discreta.

Diagrama de sectores.

Cualitativa.

Histograma.

Cuantitativa continua.

9 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Pictograma.

Cualitativa y cuantitativa.

Polgono de frecuencia.

Cuantitativa continua.

Pero el tipo de grfico no depende nicamente de la variable utilizada, tambin del objetivo buscado en
la representacin y de la escala utilizada en la tabulacin. Para la mayora de los datos que se manejan
en la investigacin de mercados internacionales, el objetivo de una representacin grfica puede ser
comparar valores, analizar el comportamiento de una variable, estudiar la distribucin de un total entre
las partes o clasificar determinados datos. En el siguiente cuadro podemos ver la correspondencia entre
estos valores:
Tipos de grficos segn la escala usada y los objetivos perseguidos Escala / Objetivo Comparar valores
Analizar comportamiento Estudiar distribucin Clasificar datos Nominal Ordinal De Razn
Diagrama de barras

Diagrama de Sectores

Diagrama de barras

Diagrama barras

Diagrama de Sectores

Diagrama de barras

Diagrama lnea o rea

Diagrama lnea o rea

Histograma

El tipo de variable, los objetivos de la representacin y la escala utilizada son tres factores a
tener en cuenta a la hora de decidir qu tipo de grfico utilizar para la representacin de los
datos.

2.- Anlisis de datos.


Caso prctico
Una vez actualizados todos los datos con los que cuenta Eurasia
sobre clientes, productos, proveedores, mercados, etc. Pedro
Domnguez se dispone a analizarlos. Es consciente que la gran
cantidad de informacin hace imposible que una sola persona pueda
llevar a cabo anlisis de los mismos, por lo que cuenta con la
inestimable ayuda de Mara Dolores. Ambos van a dedicarse a darle
sentido a tanta informacin reunida: medias aritmticas, centiles,
varianzas, etc. son trminos que tendrn que manejar. Para
empezar, van a calcular la media de edad de los clientes de Eurasia,
la ciudad del mundo de la que ms pedidos reciben, las diferencias
de precios de los proveedores con respecto a la media de precio del producto en cuestin y
si las subidas de precio que ha ido experimentado en un determinado mercado han influido
verdaderamente en la demanda o los cambios son meramente casuales.

Sabemos los tipos de datos que nos podemos encontrar, qu hacer para traducirlos al lenguaje
estadstico y cmo representarlos grficamente. El siguiente paso que debemos dar es analizar la
informacin detenidamente, desde todos los puntos de vista posibles y con las herramientas que la
estadstica pone a nuestra disposicin.
En concreto vamos a conocer las siguientes herramientas:
Anlisis univariable y multivariable de datos.

14/04/2015 16:40

10 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Medidas de posicin y de dispersin.


Anlisis de la varianza.
Medidas de forma de la distribucin.

2.1.- Anlisis univariable de datos.


Empecemos por conocer el anlisis univariable de datos. El anlisis univariable se realiza a partir de la
tabulacin simple que, como ya sabis, est referida a una sola caracterstica. El anlisis univariable
consiste en obtener, del conjunto de respuestas dadas a una pregunta reflejadas en una tabla simple, las
siguientes medidas estadsticas:
Proporciones (frecuencias relativas) o porcentajes ya calculados en las propias tablas.
Medidas que se puedan tomar como caractersticas y representativas del grupo, denominadas
medidas de tendencia central o de posicin. Estas medidas son la moda, la mediana y la media
aritmtica.
Medidas de la variabilidad de las respuestas, denominadas medidas de dispersin, como la
varianza y la desviacin tpica.

Para la obtencin de estas medidas estadsticas (que estudiars en profundidad en los siguientes
apartados) se debe tener en cuenta el tipo de escala utilizada en la elaboracin de la pregunta (nominal,
ordinal, cardinal, de intervalo o de razn).
Las escalas nominales slo admiten la moda, las escalas ordinales admiten la moda y la mediana.
las escalas de intervalo admiten la moda, la mediana y la media aritmtica y las de razn, todas las
medidas estadsticas y matemticas.
Todas las escalas admiten el clculo de porcentajes.

Autoevaluacin
La media aritmtica es una medida estadstica perteneciente al grupo de las medidas de
dispersin. Verdadero o falso?
Verdadero.
Falso.

2.2.- Anlisis multivariable de datos (I).


No podemos quedarnos en la simplicidad del anlisis univariable. Tambin podemos utilizar como
herramienta para el anlisis de la informacin el anlisis multivariable. Este anlisis permite analizar de
forma simultnea dos o ms variables observadas, es decir, permite tener una visin de conjunto de los
fenmenos y estudiar las posibles interacciones que puedan existir entre los diversos factores. Las tres
razones por las que se aplica el anlisis multivariable en la investigacin comercial son:
1. Permite analizar simultneamente toda la informacin relativa a un

14/04/2015 16:40

11 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

determinado fenmeno.
2. Permite analizar un gran nmero de encuestas.
3. Por su capacidad para hacer comprensible para la mente humana
grandes cantidades de datos que de otra manera seran difciles de
manejar, aceptando eso si una mnima prdida de informacin y
proporcionando en muchos casos una representacin grfica del
fenmeno.
Podemos distinguir tres grandes bloques dentro del anlisis multivariable: los mtodos descriptivos,
explicativos y estructurales. Esta clasificacin se hace a partir de la diferenciacin de las variables
independientes (explican el fenmeno estudiado) y de las dependientes (o a explicar):
Los mtodos descriptivos (o de interdependencia): en estos mtodos no se va a distinguir entre
variables dependientes y variables independientes. Esto quiere decir que todas las variables estn
relacionadas unas con otras, es decir, estn interrelacionadas. En definitiva, los mtodos
descriptivos tratan de dar significado a un conjunto de variables o bien tratan de agrupar las cosas.
Dentro de los mtodos descriptivos se pueden distinguir los siguientes grupos de tcnicas:
Mtodos de clasificacin, los cuales permiten agrupar individuos, empresas, etc. a partir de
un grupo de variables de partida. En concreto, a este grupo de mtodos pertenece el anlisis
cluster.
Otro bloque de mtodos descriptivos seran las tcnicas que permiten resumir informacin.
Estos seran el anlisis factorial o de componentes principales.
Mtodos explicativos (o de dependencia): son aquellos que explican unas variables en funcin de
otras, es decir, hay variables dependientes o a explicar y variables independientes o explicativas.
Por ejemplo, explicar las ventas (variable dependiente) en funcin de numerosas variables
independientes (nmero de vendedores, inversin en publicidad, promocin, renta de los
consumidores, etc.). En este grupo de anlisis multivariable de la informacin se encuentran los
mtodos de segmentacin y el anlisis discriminante.
Mtodos estructurales: en este caso el objetivo no es slo analizar cmo las variables
independientes afectan a las dependientes, sino tambin cmo estn relacionadas las variables de
los dos grupos entre s.

Para saber ms
El anlisis cluster es muy complejo pero tambin muy utilizado, principalmente para
segmentar. Para profundizar ms en l, visita el siguiente enlace, el cual te sacar de dudas.
Leccin de cluster.

2.2.1.- Anlisis multivariable de datos (II).


Conforme ms profundizamos en el anlisis multivariable, encontraremos mayor
complejidad en las herramientas. Pero eso no quiere decir que no est a
nuestro alcance su conocimiento y manejo. Continuaremos por tanto con el
anlisis multivariable y veremos cunto partido se le puede sacar en el anlisis
de la informacin obtenida. Dentro de los mtodos explicativos o de
dependencia, podemos encontrar dos grandes subgrupos dependiendo de si la
variable dependiente es cuantitativa o cualitativa.
Si la variable es cuantitativa, se pueden aplicar algunas de las siguientes
tcnicas:
Anlisis de la regresin. Se usa a partir de analizar la relacin entre una variable dependiente y una

14/04/2015 16:40

12 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

o varias variables independientes. Por ejemplo, se usar cuando intentamos predecir el gasto anual
de una empresa en consumibles a partir de su nivel de compra de materiales, consumo de luz,
ubicacin geogrfica, tiempo de constitucin como empresa, etc.
Anlisis de la varianza. Si la muestra total se encuentra dividida en varios grupos basados en
variables independientes cualitativas y la dependiente es cuantitativa. Por ejemplo, si queremos
saber si hay diferencias en el nivel de colesterol dependiendo del sexo de la persona, y si afecta
tambin el tipo de ocupacin de esta persona.
Si la variable es cualitativa, se puede aplicar la tcnica del anlisis discriminante.
El anlisis discriminante tiene como objetivo explicar la pertenencia de individuos u objetos a
grupos preestablecidos. En este anlisis, la variable dependiente es la pertenencia a grupos de
elementos (consumidores, empresas, individuos, etc.). La variable dependiente tiene dos
categoras: cuando el elemento si pertenece al grupo y cuando no pertenece. En cuanto a las
variables independientes, son un conjunto de variables relevantes para el estudio que se est
realizando y sobre las cuales se poseen observaciones para cada elemento de la muestra. Un
ejemplo de este anlisis sera determinar los ratios financieros que mejor permiten discriminar entre
empresas rentables y poco rentables.
Por otro lado tambin merece atencin observar los mtodos descriptivos o de interdependencia. Estos
mtodos son fcilmente aplicables y poco costosos. Miden asociaciones o interrelaciones, pero no
establecen relaciones de causalidad, que, en todo caso, han de ser formuladas por analistas
experimentados.
En este grupo, destacamos el anlisis factorial o anlisis de componentes principales. Se utilizan
ambos para analizar interrelaciones entre un nmero elevado de variables cuantitativas explicando
dichas interrelaciones en trminos de un nmero menor de variables denominadas factores (si son
inobservables) o componentes principales (si son observables). Por ejemplo, si queremos conocer
el estado financiero de una empresa, podemos hacerlo a partir del conocimiento de determinados
ratios financieros, a partir de los cuales se construiran varios ndices numricos que definan su
situacin.
Para finalizar el estudio del anlisis multivariable, podemos organizar cmo llevarlo a cabo. Se pueden
establecer cinco etapas:
1. Objetivos del anlisis. Se define el problema y se especifican los objetivos y tcnicas multivariantes
que se utilizarn. Se establecern las relaciones de dependencia o independencia que se van a
investigar as como las variables que se deben observar.
2. Diseo del anlisis. En este caso se debe decidir el tamao de la muestra y sus caractersticas.
3. Hiptesis del anlisis. A partir de la tcnica multivariante a utilizar, se decide la hiptesis principal
con la que se trabajarn en el curso del anlisis.
4. Realizacin del anlisis y ajuste de datos. Se deben observar posibles desviaciones y su influencia
sobre los resultados, as como las correcciones oportunas.
5. Interpretacin de los resultados. Se establece la validez de los resultados obtenidos, analizando si
se pueden extrapolar estos resultados a la poblacin de la que procede la muestra.

2.3.- Medidas de posicin central: La media


aritmtica. La media aritmtica ponderada.
Las medidas de posicin central describen cmo todos los valores de los datos se agrupan en torno a un
valor central. Cuando hablamos de "promedio", "valor medio", o del valor ms comn o frecuente, nos
referimos de manera informal a la media, la mediana y la moda: tres medidas de posicin central.
La media aritmtica, generalmente conocida como la media, es la medida ms comn de la posicin
central. En ella todos los valores desempean el mismo papel, sirviendo como "punto de equilibrio" del
conjunto de datos. Nos da una idea en torno a qu valor se encuentran concentrados los valores de una
variable estadstica, aunque en ocasiones no resulte un valor demasiado representativo.

14/04/2015 16:40

13 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Se calcula sumando todos los valores del conjunto de datos (x1,x2,x3xn) y dividiendo el resultado por
el nmero de valores considerados (N). La ecuacin de la media se escribira:

Siendo:
igual a la media aritmtica. N igual al nmero de valores o tamao de la muestra. igual al i-simo
valor de la variable Xi igual al sumatorio de todos los valores. Si el valor de la variable x. xi se repite
veces, aparece en la expresin de la media aritmtica de la forma:

14/04/2015 16:40

, que ser la expresin que consideraremos definitiva de la media aritmtica.

Ejercicio resuelto

Si tenemos la siguiente distribucin, se pide hallar la media aritmtica, de los siguientes datos
expresados en kg.
Tabulacin de datos para el posterior clculo de una media aritmtica xi ni xi ni
54

108

59

177

63

252

64

64

Total

10

601

La suma de las desviaciones de un conjunto de nmeros respecto de su media aritmtica es


cero.
Por ejemplo:
De estos valores 8, 3, 5, 12, 10 la media aritmtica

es igual a 7,6

(8 7,6) + (3 7,6) + (5 7,6) + (12 7,6) + (10 7,6) = 0,4 4,6 2,6 +4,4 + 2,4 = 0

Reflexiona
Si tenemos un valor que difiera mucho de los dems en el conjunto de datos, crees que la
media aritmtica se ver muy afectada por ese valor? Piensa que la media aritmtica tiene en

14 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

cuenta todos los valores, incluidos los extremos. Crees que es positivo el uso de la media
en el caso de que existan valores muy extremos?
En ocasiones no todos los valores de la variable tienen el mismo peso. En este caso aumentamos el
valor de la variable tantas veces como consideremos su peso. Por tanto podemos definir la media
aritmtica ponderada como aquella media que se utiliza cuando a cada valor de la variable xi se le otorga
una ponderacin wi o peso distinto de la frecuencia o repeticin. Para poder calcularla se tendr que
tener en cuenta las ponderaciones de cada uno de los valores que tenga la variable. Se suele
representar como:

Siendo:
igual a la media aritmtica ponderada. wi igual a la ponderacin. xi igual al i-simo valor de la
variable X.

Ejercicio resuelto

Si los ingresos medios anuales de los trabajadores agrcolas y no agrcolas en EEUU son
9.000 $ y 15.000 $ respectivamente, cul sera la media de todos?
Si hacemos:
Pero slo sera cierto si hubiera tantos trabajadores de un tipo como de otro. Pero si hay
un trabajador agrcola por cada diez de otro tipo, la media evidentemente es otra como
puedes observar:

2.4.- Medidas de posicin central: La mediana.


La mediana (Me) es el valor que divide en dos partes iguales a un conjunto
de datos ya ordenado, no vindose afectada por los valores extremos, de
manera que puede utilizarse cuando estn presentes. Ordenados los datos
de forma creciente, la mediana deja igual nmero de observaciones
inferiores que superiores a ella. El lugar que ocupa se determina dividiendo
el nmero de valores entre 2:
Si el nmero de valores (N) es impar, existe un nico valor de la variable en
el centro de la distribucin, y ste es la mediana. Por ejemplo, si el nmero
de observaciones es 5, 6, 7, 9 y 10, la mediana es el valor central.
Me=7
En el caso de que el nmero de datos (N) sea par, la mediana se define como la media aritmtica de los
dos valores centrales.
Por ejemplo: si el nmero de observaciones hubiera 5, 6, 7, 9, 10, 12, la mediana sera la media
aritmtica de los valores centrales 7 y 9.

14/04/2015 16:40

15 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Si en un mismo estudio, distintas variables (xi) se repiten determinado nmero de veces (ni), se calculan
las frecuencias absolutas acumuladas (Ni), a continuacin se busca el valor cuya frecuencia absoluta
acumulada coincida, o sea, inmediatamente superior a

y este valor es justamente la mediana.

Ejercicio resuelto

Hallar la mediana de la siguiente distribucin de frecuencias:


Tabulacin de datos para el posterior clculo de una mediana xi ni Ni
1

10

10

12

22

15

37

25

62

30

62

30

92

10

102

107

N=

107

Se halla en primer lugar el lugar que ocupa la mediana


El valor de la variable correspondiente a la mediana, ser el que corresponda a la
primera frecuencia acumulada mayor que

. En este caso M6=4 porque 62 que es la

frecuencia acumulada de la variable 4, es la primera frecuencia acumulada mayor que


53,5.

Tambin puede ocurrir que habiendo un nmero par de valores centrales, el valor de

sea igual a

una frecuencia acumulada. En este caso, la mediana se obtiene tomando la media aritmtica del valor de
la variable correspondiente a esta frecuencia absoluta y la siguiente.

14/04/2015 16:40

Ejercicio resuelto

Hallar la mediana de la siguiente distribucin de frecuencias:


Tabulacin de datos para el posterior clculo de una mediana xi ni Ni
1

13

13

10

23

16 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Se halla

eXe

25

33

17

50

N=

50

esta frecuencia acumulada pertenece a la variable de valor 3.

En este caso, tendremos que calcular la media aritmtica de las dos variables para
hallar la media.

La mediana, como medida de posicin central, resulta de gran utilidad cuando existan valores
anormalmente bajos o elevados (mucha dispersin). La mediana es menos sensible que la
media aritmtica a estos valores extremos porque en su determinacin no intervienen todos
los valores de la variable sino los que ocupan los valores centrales.

2.5.- Medidas de posicin central: La moda.


La moda (Mo) es el valor del conjunto de datos que aparece con mayor
frecuencia. Los valores extremos no afectan a la moda. Con frecuencia, en
un conjunto de datos no existe moda, o bien, hay varias modas. Por
ejemplo, si nos encontramos con los valores 1 6 0 6 13 2 7 4 0 2 6 6 8 6,
primero deberamos colocarlos en orden ascendente 0 0 1 2 2 4 6 6 6 6 6 7
8 13. Una vez ordenados los valores, podemos comprobar que el valor 6
aparece cinco veces, ms que ningn otro valor. La moda por tanto es 6.
En el caso en el que distintas variables (xi) tienen una frecuencia de repeticin determinada (ni), el
clculo de la moda ser muy sencillo: se localiza la mayor frecuencia absoluta y su valor correspondiente
ser la moda.
Si, por ejemplo, los datos con los valores con los que trabajamos son 17,2, 19,2, 24,1, 24,4, 43,7, 46,5,
49,2 52,3: en este caso los datos no tienen moda ya que ninguno de sus valores aparece con mayor
frecuencia. Cada uno aparece slo una vez.

14/04/2015 16:40

Ejercicio resuelto

Hallar la moda de la siguiente distribucin de frecuencias:


Tabulacin de datos para el posterior clculo de la moda xi ni Ni
1

13

13

10

23

25

17 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

18

33

17

50

En este caso est claro cual es la moda, la mayor frecuencia es 18, luego la moda es
Mo=4

Autoevaluacin
En el conjunto de datos 7 7 8 4 3 2 7 1 0 9 3 6 1 1 la moda es 7. Verdadero o falso?
Verdadero.
Falso.

2.6.- Medidas de posicin: Los centiles. Los


cuartiles.
Hasta ahora hemos visto que la mediana es el valor que hace que el 50 % de los datos sean anteriores a
ella y el otro 50 % posteriores. Generalizando esta idea, se establecen otros parmetros llamados
medidas de posicin, que clasifican a un individuo dentro de la poblacin. Entre las ms usadas estn los
centiles o percentiles, cuartiles y deciles.
Una vez ordenados los datos, los centiles o percentiles son los valores que dejan a su izquierda un
porcentaje determinado de la poblacin. Se representan por Ch o Ph, donde h indica el porcentaje. Por
ejemplo, el percentil uno (P1) es aquel punto de la distribucin que deja por debajo la centsima parte o
el 1% de los datos de la serie. Debemos tener en cuenta que, por ejemplo, el percentil diez (P10)
corresponde al primer decil y el percentil veinte (P20) corresponde al segundo decil.
Los percentiles son muy tiles para mostrar la posicin de los
individuos en los grupos. Por ejemplo, si decimos que un individuo
obtiene en una prueba un resultado correspondiente al percentil P55,
queremos decir que dicha persona es mejor que el 55% del total de
individuos de anlogas caractersticas. De esta forma, los percentiles prximos a 50 nos mostrarn
individuos medios, de caractersticas medias. Los percentiles prximos a 100 nos mostrarn individuos
de caractersticas altas y los percentiles prximos a 0 nos indicarn individuos de caractersticas bajas.

La mediana (Me) se corresponde con el quinto decil, es decir, con el percentil 50 (P50)
Si los percentiles dividen a la poblacin o muestra en cien partes iguales, los cuartiles la dividen en
cuatro partes iguales y los deciles en diez partes iguales.
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales. Hay tres cuartiles denominados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25 %) de todos los valores de la sucesin ordenada; el tercer cuartil, es el valor en el cual o por debajo
del cual quedan las tres cuartas partes (75%) de los datos.
Los deciles dividen a la muestra en diez partes iguales, es decir, en 9 divisiones. Son denominados
habitualmente como D1,D2, D3,D9, correspondientes al 10 %,20 %,30 %,,90 %.

14/04/2015 16:40

18 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

El clculo de los parmetros vistos hasta ahora es muy parecido. Si existiera un valor cuya frecuencia
absoluta acumulada coincidiera con el lugar que buscamos, habra que hacer el promedio entre dicho
valor y el siguiente. Para buscar el lugar que ocupa el parmetro de posicin deseado, buscamos aqul
cuya frecuencia absoluta acumulada sea igual o inmediatamente superior a
de datos y el valor de m y k depende del tipo del parmetro:
para los cuartiles: m=1, 2, 3. Siempre k=4.
para los deciles: m=1, 2, 3,9. Siempre k=10.
para los percentiles: m=1, 2, 3,99. Siempre k=100.

14/04/2015 16:40

19 de 50

, donde N es el total

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

14/04/2015 16:40

eXe

Ejercicio resuelto

A partir de los datos de la tabla, vamos a calcular el primer cuartil (Q1), el tercer Cuartil (Q3),
el sexto Decil (D6)y el Percentil 70 (P70).
Tabulacin de datos para el clculo de los percentiles xi ni Ni
1

13

21

30

33

37

40

N=

40

Para hallar Q1 calculamos el lugar que ocupa

, entonces Q1= 4 y significa

que el 25 % de los alumnos han obtenido una nota inferior a 4 y el 75 % una nota
superior a 4.
Para averiguar Q3 calculamos su posicin

, como coincide con el valor de

una frecuencia absoluta acumulada se hace el promedio del valor correspondiente de la


variable y el siguiente es decir
Para D6 calculamos el lugar

.
,con lo cual D6 = 6, pues la primera frecuencia

absoluta acumulada que supera el valor 24, es 30 que corresponde al valor 6 de la


variable. Diriamos que el 60 % de los alumnos han sacado menos de 6 de nota.
Para hallar P70 calculamos

, entonces P70 = 6, por las mismas razones

que en el calculo de D6.

20 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Para saber ms
Ampliando los conceptos de cuartiles, deciles y percentiles, te aconsejo visitar la siguiente
presentacin, en la cual tambin se explica el clculo de estos parmetros si nos
encontramos con una tabla de frecuencias.
Resumen textual alternativo

2.7.- Medidas de dispersin. El rango o


recorrido.
Cuando la mayora de los valores de la variable se distribuyen muy cerca de los valores centrales de
sta (
Me), decimos que la serie es concentrada y en caso contrario que es dispersa. Por ejemplo, si
tenemos dos empresas en distintos pases, con ventas trimestrales en miles de euros de 120, 180, 110 y
190 en una; y en la otra de 140, 150, 160 y 150. Si calculamos la media aritmtica veremos que en
ambos casos vale 150, y que por tanto ambas empresas no se diferenciaran en ventas. Pero es fcil ver
que la primera empresa es muy irregular en cuanto a las ventas, cosa que no sucede con la segunda.
Los parmetros de dispersin diferencian estas dos situaciones, de ah su importancia.
El recorrido o rango de una distribucin se define
como la diferencia entre los valores mayor y menor de la variable. Cuanto
menor es el recorrido, mayor es el grado de representatividad de los
valores centrales. El recorrido presenta el inconveniente de que los datos
extremos influyen mucho en su clculo. De esta forma basta que uno de
ellos se separe mucho, para que el recorrido se vea sensiblemente
afectado.
Para evitar este inconveniente, tambin se puede hacer uso de otro tipo de rango, el
rango intercuartlico (Q), que adems de solventar la dificultad expuesta anteriormente, concentra el 50%
de los valores centrales de la serie estadstica.
Los procesos en los que ms se utilizan el rango son en los controles de calidad, donde se prefijan unos
determinados lmites para los valores de la variable, fuera de los cuales se desecha el producto. El rango
no es una medida de dispersin muy significativa, pero es muy fcil de calcular.

14/04/2015 16:40

21 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Ejercicio resuelto

Calcular el recorrido y el rango intercuartlico de la siguiente serie: 3, 7, 7, 7, 8, 8, 8, 8, 15.


Aplicando la frmula del rango o recorrido, tenemos que: Rango = 15 3 = 12.
Para el rango intercuartlico, tenemos que calcular adems los cuartiles 1 y 3 para poder
aplicar la frmula estudiada. Entonces tenemos que:
lo que indica que el 7 elemento igual a 8.
lo que indica que el 3er elemento igual a 7.
Luego aplicando la frmula del rango intercuartlico, tenemos que: Q es igual a 8 menos
7, igual a 1.

Autoevaluacin
Si las ventas de una empresa son muy estacionales, podremos decir que presenta unos
valores con un recorrido muy corto. Verdadero o falso?
Verdadero.
Falso.

2.8.- Medidas de dispersin. La varianza. La


desviacin tpica o estndar.
El rango o recorrido no son las nicas medidas de dispersin que debemos conocer. Vamos a manejar a
continuacin dos conceptos muy importantes en el anlisis estadstico: la varianza y la desviacin tpica
o estndar.
As como las medidas de posicin central nos permiten identificar el punto central de los
datos, las medidas de dispersin nos permiten reconocer cunto se dispersan los datos
alrededor del punto central. Es decir, nos indican cuanto se desvan los valores alrededor de
su media. Este tipo de medidas son parmetros informativos que nos permiten conocer cmo
los valores de los datos se reparten a travs del eje X, mediante un valor numrico que
representa el promedio de dispersin de los datos. Las medidas de dispersin ms
importantes y las ms utilizadas son la varianza y la desviacin estndar (o tpica).
La varianza (S2) nos permite identificar la diferencia media que hay entre cada uno de los valores
respecto a su punto central (
). Esta diferencia media es calculada, elevando cada una de las
diferencias al cuadrado (con el fin de eliminar los signos negativos), y calculando su media aritmtica; es
decir, sumando todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo
este resultado por el nmero de observaciones que se tengan.
Donde xi representa a cada uno de los valores,

representa la media de todos los valores y N

representa el nmero de observaciones o el tamao de la muestra.

14/04/2015 16:40

22 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Recomendacin
En ocasiones podemos encontrarnos que el denominador de la frmula de la varianza es
(N-1) en lugar de N, es decir, que se le resta uno al tamao de la muestra; esto se hace con
el objetivo de aplicar una pequea medida de correccin a la varianza, intentado hacerla ms
representativa para la poblacin.
Con frecuencia

no es un nmero entero, entonces las desviaciones

suelen ser nmeros decimales. Las operaciones de elevar al cuadrado


cada una de las desviaciones (xi ) y multiplicarlas por las frecuencias
respectivas pueden resultar sumamente laboriosas, por ello se suele usar
otra frmula en la que se evitan estos clculos.

La desviacin estndar o tpica (S) se obtiene de la raz cuadrada positiva de la varianza. Esta medida
nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o
media. La desviacin estndar nos da como resultado un valor numrico que representa la media de
diferencia que hay entre los datos y la media. De su clculo resulta por tanto un nmero ms manejable,
siendo este un parmetro ms usado que la varianza.

Ejercicio resuelto

Dados los valores 0, 1, 1, 8: calcular la varianza y la desviacin estndar.


Primero calculamos la media aritmtica de los valores dados:
Una vez conocida la media, debemos calcular la diferencia existente entre cada valor y
la media de todos los valores:
;
;

Y por fin podemos aplicar la frmula antes estudiada:

Por lo tanto, la varianza es 10,25 y la desviacin estndar es 3,2.

2.9.- Anlisis de la varianza.

14/04/2015 16:40

Reflexiona
23 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

En la investigacin comercial, podemos concluir en ocasiones que determinados resultados


sean producto de la casualidad ms que de lo causal. En este punto nos encontramos con la
duda de dnde se encuentra la frontera entre lo causal y lo casual en la investigacin
comercial o qu herramienta existe para diferenciar entre el azar y la causalidad. La
respuesta es sencilla: esa herramienta se llama anlisis de la varianza.
Podramos saber a travs de una frmula estadstica si la variacin en la
demanda de un artculo viene o no determinada significativamente por la
variacin del precio? Efectivamente podemos, para ello vamos a estudiar el
anlisis de la varianza (conocido tambin como ANOVA).
El anlisis de la varianza se utiliza para verificar si hay diferencias
estadsticamente significativas entre medias cuando estudiamos ms de
dos grupos o muestras. En la pregunta que planteamos al principio,
tenemos un nico factor influyente que es el precio. Pero nos podemos encontrar casos de anlisis de
varianza mucho ms complejos en los que se estudien dos o ms factores: por ejemplo, si queremos
saber si el precio de un producto y el mercado donde se comercializa afectan a las ventas. En este caso
los factores no controlados seran dos: precio y mercado.
Lo ms particular del anlisis de la varianza es que acude a la comparacin de las varianzas. La razn
es que si las medias son iguales, la varianza total disminuye, pero si son muy diferentes, aumenta.
Aplicado al primer ejemplo, si la varianza entre grupos (aplicando los distintos precios a los distintos
mercados) aumenta, significar que el factor precio afecta significativamente a las ventas.
Las distintas tcnicas de anlisis de varianza son muy complejas, por lo que proponemos prestar
atencin a la resolucin del siguiente ejercicio, basado en el anlisis de la varianza de un solo factor.

14/04/2015 16:40

Ejercicio resuelto

Una empresa multinacional ha fijado, para un nico producto, distintos precios en tres
mercados diferentes. Ha observado que la demanda del producto ha variado si se ha variado
tambin el precio, pero quiere saber si las subidas de precio que ha ido experimentado el
producto han influido verdaderamente en la demanda o los cambios son meramente
casuales. Los valores con los que trabaja son los siguientes:
Demandas de un mismo producto en distintos mercados y precios.
Mercado 1 Mercado 2 Mercado 3 Sumas Niveles Precio 1 Precio 2 Precio 3 Precio 4
23

20

23

66

19

22

19

60

20

22

19

60

19

20

20

59

1 Paso: Clculo de S1, S2 y S3.


S1 consiste en sumar todos los cuadrados de los datos. En este caso es de 5027.
S2 consiste en sumar los cuadrados de las sumas de los distintos niveles divididos cada
uno entre el nmero de mercados. En este caso es de 5012,33.
S3 se obtiene dividiendo el cuadrado de la suma total de todos los niveles dividido entre
el nmero total de datos. En este caso es de 5002,08.
2 Paso: Clculo de dispersin, grado de libertad y varianza.
- Intragrupos: Dispersin es S1-S2 = 14,67. Grado de libertad: nmero total de
valores menos nmero de niveles: 12-4= 8. Varianza: es la divisin entre la

24 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

dispersin intragrupos y el grado de libertad: 14,67/8=1,83


- Intergrupos: Dispersin es S2-S3 = 10,25. Grado de libertad: nmero de niveles
menos uno: 4-1=3. Varianza: divisin entre la dispersin intergrupos y el grado de
libertad: 10,25 / 3 = 3,42
- Total: Dispersin es S1-S3 = 24,92. Grado de libertad: nmero total de valores
menos uno: 12-1=11. Varianza: no es necesario su clculo.
3 Paso: Clculo del estadstico F. Divide la varianza intergrupos entre la intragrupos. En
este caso es de 1,87.
4 Paso: Volcado de datos. En la siguiente hoja de clculo puedes ver todos los datos en
una tabla que facilitar el clculo. Como vers se ha aadido una columna denominada
P-valor en la que se ha calculado la distribucin de probabilidad con nivel de
significacin del 5%, a travs de la funcin DISTR.F.INV de una hoja de clculo.
5 Paso: Si el estadstico de F (1,87) es menor que el P-valor (4,07) quiere decir que el
precio no afecta a las ventas, no es un factor causal en este caso. En el caso de que el
estadstico F fuera mayor que el P-valor, el precio si habra afectado a las ventas y el
factor sera causal por tanto.
Volcado de datos en hoja de clculo
Dispersin Grado de libertad Varianza Estadstico de F P-valor de F Intergrupos
Intragrupos Total
10,25

3,42

14,67

1,83

24,92

11

1,87

4,07

2.10.- Medidas de forma de la distribucin.


Asimetra y Kurtosis.
Podremos establecer una distribucin de datos sin necesidad de tener que realizar su representacin
grfica? Como veremos en este apartado, es posible gracias a las medidas de forma. Estas medidas de
forma se pueden clasificar en dos grandes grupos como son las medidas de asimetra y las medidas de
kurtosis.
Las medidas de asimetra se dirigen a elaborar un indicador que nos permita establecer el grado de
simetra o asimetra que presenta la distribucin de los datos, sin necesidad de llevar a cabo la
representacin grfica de la distribucin.
Diremos que una distribucin es simtrica si existe el mismo nmero de valores a ambos lados de dicho
eje, equidistantes de la media aritmtica y tales que cada par de valores equidistantes a la media tengan
la misma frecuencia. En las distribuciones simtricas, media y mediana coinciden. Si slo hay una moda,
tambin coincide. En caso contrario, estas distribuciones sern asimtricas, pudiendo definir la asimetra
como la ausencia de simetra en la distribucin. En el caso de la asimetra a la derecha, la mediana es
menor que la media aritmtica. En el caso de la asimetra a la izquierda, la mediana es mayor que la
media aritmtica.

Si una distribucin es simtrica, el eje de simetra de su representacin grfica ser una recta
paralela al eje de ordenadas, que pasa por el punto cuya abscisa es la media aritmtica.
Hay diferentes formas de detectar la asimetra, la ms fiable es a travs del coeficiente de asimetra de
Fisher, por medio de la siguiente frmula:

14/04/2015 16:40

25 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

, donde
nmero de valores,

. Siendo xi es el valor,

es la media de los valores, N es el

es la desviacin tpica al cubo.

Pudiendo afirmar entonces que si


asimtrica positiva. Si

eXe

, la distribucin es simtrica. Si

, la distribucin es

, la distribucin es asimtrica negativa.

Las medidas de kurtosis se aplican a distribuciones campaniformes, es decir, unimodales simtricas o


moderadamente asimtricas y estas medidas tratan de estudiar la distribucin de frecuencias en la zona
central de la distribucin. La mayor o menor concentracin de frecuencias alrededores de la media,
darn lugar a una distribucin ms o menos apuntada. De aqu que tambin se le llamen medidas de
apuntamiento.
Como medida o coeficiente de kurtosis o apuntamiento podemos utilizar el coeficiente

de Fisher

que dice:
, donde
el nmero de valores,

. Siendo xi es el valor,
es la desviacin tpica elevado a cuatro.

Pudiendo afirmar entonces que si


leptocrtica. Si

es la media de los valores, N es

, la distribucin es mesocrtica. Si

, la distribucin es

, la distribucin es platicrtica.

3.- Anlisis probabilstico.

14/04/2015 16:40

Caso prctico
La labor del nuevo equipo de anlisis estadstico se complica cada vez ms. Juan Surez
est viendo cmo su equipo responde bien ante los continuos retos que les plantea, por lo
que cada da que pasa solicita ms informacin sobre su empresa. En esta ocasin ha
decidido la compra de una base de datos de potenciales clientes en Chile. La razn es que
quiere introducirse en ese mercado, por lo que ha puesto a su equipo manos a la obra.
Quiere tener una estimacin del xito o fracaso de la implantacin de Eurasia en Chile.
indica Pedro a Mara Dolores.
La base de datos es demasiado amplia, debemos coger una muestra. afirma Mara
Dolores.
No hay problema, vamos a coger una muestra lo suficientemente representativa y vamos a
contemplar todas las posibilidades para que nuestros clculos sean lo ms acertados posible.
T te encargars de calcular la edad media y el perfil de nuestros clientes potenciales de
Chile indica Pedro a Mara Dolores.

26 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

No podemos olvidarnos de nuestro negocio en Argentina y Mxico. Necesitamos conocer


si el ligero descenso de las ventas en ambos pases est relacionado con el aumento del
plazo de entrega le dice Juan Surez a Pedro en la reunin que estn manteniendo.
Sin problema jefe, tendrs toda la informacin en menos de una semana.

Hemos comenzado la unidad por el anlisis de la informacin desde el


punto de vista estadstico, calculando determinados parmetros que nos
facilitan la comprensin de los datos. Pero la estadstica pone a nuestra
disposicin otra serie de herramientas muy tiles cuando la cantidad de
informacin que manejamos es superior a las posibilidades que tenemos de
su estudio o simplemente no tenemos posibilidad de acceder a toda la
informacin necesaria para hacer un estudio analtico. En ese caso
podemos recurrir al anlisis probabilstico y la definicin de hiptesis, que
nos dan una aproximacin a la realidad. En concreto vamos a estudiar en el presente apartado:
Estimaciones puntual y por intervalos.
Contraste de hiptesis, definiendo los distintos tipos de hiptesis.
Obtencin de la distribucin muestral.
Nivel de significacin y regin crtica.

3.1.- Estimacin puntual.


Como ya sabemos, mediante el estudio de una muestra de una poblacin
se quiere generalizar las conclusiones del total de la misma. Mientras
menor sea el error estndar de un estadstico (cualquier funcin
determinada a partir de los datos muestrales), ms cercanos sern unos de
otros de sus valores. Existen dos tipos de estimaciones para parmetros:
puntuales y por intervalo.
Una estimacin puntual es un nico valor estadstico y se usa para estimar
un parmetro. El estadstico usado se denomina estimador (es el
estadstico que se aproxima al parmetro). El estimador ms usado para la estimacin puntual es la
media muestral ( )
Para estimar un parmetro de la poblacin con un estadstico, hemos de exigirle a ste ltimo una serie
de condiciones para aceptar la estimacin como buena, estos requisitos son:

14/04/2015 16:40

El estadstico tiene que ser insesgado, es decir, la media de la distribucin muestral del estadstico
ha de coincidir con el parmetro poblacional.
Suficiencia, la muestra posee toda la informacin necesaria acerca del parmetro.
Consistencia. Dado un estadstico diremos que es consistente si al aumentar el tamao de la
muestra, el estadstico converge en probabilidad al parmetro. Dicho de otro modo, cuando la
muestra se hace muy grande la probabilidad de que el estimador est muy cerca del parmetro es
casi uno.
Eficiencia, de todos los estadsticos consistentes ser mejor aquel que converja ms rpidamente
al parmetro. Esto los sabremos por la varianza, a menor varianza, menor dispersin.

Si a partir de las observaciones de una muestra, se calcula un solo valor como estimacin de

27 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

un parmetro de la poblacin desconocido, el procedimiento se denomina estimacin puntual.


La media de la poblacin se puede estimar puntualmente mediante la media de la muestra:
La proporcin de la poblacin se puede estimar puntualmente mediante la proporcin de la muestra:

La desviacin tpica de la poblacin se puede estimar puntualmente mediante la desviacin tpica de la


muestra, aunque hay mejores estimadores:

Reflexiona
Una muestra aleatoria de 3 coches de un modelo determinado, podra presentar una vida til
en aos de
=5,
=6,4 y
=5,9. El valor calculado de la duracin media muestral
es

=5,77 como el valor ms adecuado de ,es decir, de la duracin promedio. El

estimador puntual de es la media muestral . El enunciado "la estimacin puntual de es 5,77"


se expresa: =5,77, entonces =

Autoevaluacin
Si al tomar una muestra de 100 estudiantes, obtenemos que la media de sus notas es 6,2,
decimos que 6,2 es una estimacin puntual de Verdadero o falso?
Verdadero.
Falso.

3.2.- Estimacin por intervalos.


Ahora vamos a cambiar de planteamiento, y en lugar de efectuar la estimacin dndole un valor concreto
como hasta ahora, vamos a verlo desde la perspectiva de la estimacin por intervalos, cuyo
planteamiento es otro. Lo que haremos es dar un intervalo donde afirmaremos o pronosticaremos que en
su interior se encontrar el parmetro a estimar, con una probabilidad de acertar previamente fijada y
que trataremos que sea la mayor posible, es decir, prxima a 1. Al valor de esta probabilidad la
representaremos por 1- , y la llamaremos nivel de confianza. A mayor valor de 1- , ms probabilidad
de acierto en nuestra estimacin, por tanto eso implica que tendr que ser pequeo, prximo a 0.
Recordemos que 1- representa siempre una probabilidad por lo que ser un valor entre 0 y 1, si bien en
la mayora de los enunciados de los problemas suele ser enunciado en trminos de tanto por cierto.

Si se dice que el nivel de confianza es del 90 %, significa que 1- vale 0,9 y por tanto vale
0,1.
Es evidente que, a igual nivel de confianza, cuanto mayor tamao tenga la muestra, el intervalo de
confianza se reducir, puesto que el valor obtenido en la muestra se acercar ms al valor real de la
poblacin y por tanto el margen de error cometido se har ms pequeo. Es deseable por tanto que un

14/04/2015 16:40

28 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

intervalo de confianza tenga la menor amplitud posible.


Si el tamao de la muestra permanece constante y variamos 1- , el tamao del intervalo se har ms
grande cuanto ms aumente 1- , es decir que el margen de error se har ms grande cuanto ms
precisin exijamos.

Reflexiona
Si para dar un intervalo de confianza de la media de la estatura de una poblacin de adultos
de un pas, es seguro que acertara al cien por cien si el intervalo que diese fuese (1,50 m
1,90 m), pero sera una estimacin absurda ya que no sabra apreciar realmente la media.
Por tanto se trata de dar un intervalo lo ms reducido posible.
Si partimos de una poblacin que sigue una distribucin normal,
bastar con encontrar el punto crtico
para tener un intervalo
que contenga la media poblacional con probabilidad 1- . Si tomamos
que el rea de confianza (Z) se obtiene de:

, bastar con

hacer unas sencillas operaciones para llegar a que el intervalo de confianza para la media de una
poblacin normal con desviacin tpica conocida sea:

Ejercicio resuelto

Una muestra aleatoria de 100 visitantes de una pgina web juvenil revela que la media de
edad es de 18,1 aos. Halla una estimacin de las edades con un intervalo de confianza de
90 % para la edad media de todos los visitantes, sabiendo que la desviacin tpica de la
poblacin es de 0.4.
Tenemos que:

. Como la funcin de distribucin

de probabilidad de la tabla N (0,1) me da el rea de probabilidad acumulada, tengo que


ver qu valor de z me da. Si el intervalo de confianza es 0,9, tengo que buscar el valor z
correspondiente a =0,1. Entendiendo que /2=0,05 tengo que buscar en la tabla N (0,1)
el valor correspondiente a 0,9+0,05=0,95. Se corresponde para un valor de z=1,64. As
pues el intervalo buscado es:
. Por tanto, segn los datos facilitados,
la edad de los visitantes de la web juvenil rondar entre los 18,03 y 18,17 aos.
Tabla N(0,1) de distribucin de la probabilidad.

3.3.- Contraste de hiptesis.


Hasta ahora hemos visto dos formas de efectuar una estimacin de un
parmetro de la poblacin a partir de una muestra: la estimacin puntual y
la estimacin por intervalos de confianza.

14/04/2015 16:40

29 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Pero existe una tercera forma de inferencia estadstica denominada


contraste de hiptesis y que, como apunta la expresin, trata de dar crdito
o no (contraste) a una afirmacin que haremos previamente (hiptesis) a
raz de los resultados obtenidos en las muestras.
Por ejemplo, deseo contrastar si el precio medio de un determinado producto en una regin determinada
es mayor que 50. El estudio mediante un contraste de hiptesis me permitir aceptar el dato como
vlido o no, con un determinado nivel de confianza.
Para entenderlo, debemos conocer dos conceptos claves: la hiptesis nula y la hiptesis alternativa. Se
llama hiptesis nula, y se representa por Ho, a la afirmacin que quiero contrastar, en contraposicin con
la hiptesis alternativa, representada por H1.
El proceso de contrastar me dir si debo aceptar o rechazar la hiptesis nula. Si los valores muestrales
difieren mucho de los tericos que se obtendran de ser Ho cierta, rechazaramos la hiptesis, diciendo
que las diferencias son estadsticamente significativas.
Los pasos que hay que seguir para contrastar una hiptesis son los siguientes:
1. Establecer con claridad las hiptesis nula y alternativa.
2. Delimitar la zona de aceptacin, segn lo estudiado en el apartado anterior (intervalos de
confianza).
3. Verificar y comparar.
4. Tomar una decisin acerca de la aceptacin o no de la hiptesis.

Ejercicio resuelto

Una empresa est implementando un nuevo proceso para atender a sus clientes,
considerndose aceptable que la gestin con cada cliente tenga una duracin media de 180
minutos, con una desviacin tpica igual a 5. Se toma una muestra de 50 clientes atendidos
por este nuevo proceso y de esta muestra se calcula el tiempo medio de atencin, que ha
sido de 195 minutos. Se puede aceptar la hiptesis de validez del nuevo proceso de
atencin al cliente con un riesgo igual o menor al 5 %?
1 Enunciamos las hiptesis nula y alternativa: Ho: =180; H1: 180.
2 Definimos la zona de aceptacin conociendo:=0,05 el valor de

=180 ; =5 ; n=50
= (178,60, 181,38). Ese es el intervalo
de confianza para la media.
3 Verificacin. El valor que se ha obtenido de la media muestral ha sido de 195 minutos.
4 Decisin: Como la media muestral ha sido de 195 minutos, no cae dentro de la zona
de aceptacin, rechazamos por tanto Ho; es decir, no podemos aceptar la validez del
nuevo proceso de atencin al cliente.

3.4.- Tipos de hiptesis.


En el apartado anterior hablamos de dos tipos de hiptesis (nulas y estadsticas), pero existen otros tipos
que veremos a continuacin. En concreto veremos que existen cuatro grandes grupos de hiptesis: de
investigacin, nulas, alternativas y estadsticas.
Toda hiptesis, para que sea digna de tomarse en cuenta para la investigacin, debe reunir ciertos
requisitos:

14/04/2015 16:40

30 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

1. Deben referirse a una situacin real.


2. Los trminos (variables) de la hiptesis deben ser comprensibles,
precisos y lo ms concretos posibles.
3. La relacin entre variables propuesta por una hiptesis debe ser
clara y verosmil (lgica).
4. Los trminos de la hiptesis y la relacin planteada entre ellos,
deben ser observables y medibles.
5. Las hiptesis deben estar relacionadas con tcnicas disponibles para
probarlas.
Las hiptesis de investigacin son proposiciones tentativas acerca de las posibles relaciones entre dos o
ms variables y que cumplen con los cinco requisitos citados antes. Se les suele simbolizar como Hi o
H1, H2, H3. Tambin se les denomina como hiptesis de trabajo. Dentro de las hiptesis de investigacin
distinguimos varios tipos:
Hiptesis descriptivas del valor de las variables. Ejemplo: "La expectativa de ingresos anuales de
los trabajadores de la empresa X oscila entre 55.000 y 75.000 .
Hiptesis correlacionales. Ejemplo: "A mayor publicidad, ms ventas".
Hiptesis de la diferencia entre grupos. Ejemplo: "Los adolescentes fuman ms que las
adolescentes"
Hiptesis causales bivariadas. Ejemplo: "La paga extraordinaria aumenta la motivacin de la
poblacin por comprar impulsivamente, cuando es recibida a finales de diciembre".
Hiptesis causales multivariadas. Ejemplo: "La paga extraordinaria, la iluminacin y el ambiente
navideo aumentan la motivacin de la poblacin por comprar impulsivamente".
Las hiptesis nulas constituyen proposiciones acerca de la relacin entre variables, slo que sirven para
refutar o negar lo que afirma la hiptesis de investigacin. Debido a que este tipo de hiptesis resulta la
contrapartida de la hiptesis de investigacin, hay prcticamente tantas clases de hiptesis nulas como
de investigacin. Las hiptesis nulas se simbolizan con Ho. Ejemplo: "La expectativa de ingresos anuales
de los trabajadores de la empresa X no oscila entre 55.000 y 75.000 ".
Las hiptesis alternativas son posibilidades alternas ante la hiptesis de investigacin y nula. Se
simbolizan como Ha y slo pueden formularse cuando efectivamente hay otras posibilidades adems de
las hiptesis de investigacin nula. De no ser as, no pueden existir. Ejemplo:
Hi: "Los adolescentes fuman ms que las adolescentes".
Ho: "Los adolescentes no fuman ms que las adolescentes".
Ha: "Los adolescentes fuman menos que las adolescentes".
Las hiptesis estadsticas son la transformacin de las hiptesis de investigacin, nulas y alternativas, en
smbolos estadsticos. Se pueden formular slo cuando los datos del estudio que se van a recolectar y
analizar para probar o rechazar las hiptesis son cuantitativos (nmeros, porcentajes, promedios).

14/04/2015 16:40

31 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Autoevaluacin
Si partimos de la siguiente formulacin de una hiptesis de investigacin: "La media mensual
de quejas de clientes recibidas en nuestra web es menor de 200", cules sern las hiptesis
nula y alternativa?
Ejercicio de relacionar Afirmacin de la hiptesis Relacin Tipo de hiptesis
La media mensual de quejas de clientes recibidas en nuestra
web es mayor de 200.

1. Hiptesis
alternativa.

La media mensual de quejas de clientes recibidas en nuestra


web es igual de 200.

2. Hiptesis nula.

3.5.- Obtencin de la distribucin muestral.


Como hemos visto hasta ahora, la estadstica inferencial extrae la informacin contenida en
determinadas muestras (los estadsticos y ) para definir poblaciones (con sus parmetros,
y S).
Para poder llegar a ese paso, es necesario conocer la relacin que se establece entre estadsticos y
parmetros. La distribucin muestral de un estadstico permite poner en relacin ambas cosas.

Ejercicio resuelto

Ante una poblacin con N=3 elementos con valor X=1,2 y 3. Se extraen muestras de n=2
elementos. Calcular los correspondientes estadsticos descriptivos y de cada una de las
muestras posibles.
Tenemos 9 posibles muestras: (1,1); (1,2); (1,3); (2,1); (2,2); (2,3); (3,1); (3,2) y (3,3).
En cada una de las muestras pueden calcularse los correspondientes estadsticos
descriptivos:
Las medias ( ) seran: 1; 1,5; 2; 1,5; 2; 2,5; 2; 2,5 y 3, respectivamente.
Las desviaciones tpicas ( ) seran: 0; 0,5; 1; 0,5; 0; 0,5; 1; 0,5 y 0, respectivamente.

Por tanto, los estadsticos descriptivos son variables aleatorias que pueden adoptar diferentes valores y
que tienen su propia distribucin de probabilidad. En el ejercicio resuelto anterior vemos que
puede
tomar 5 posibles valores y que la probabilidad que corresponde a cada uno de ellos (F(
distribucin) es:

14/04/2015 16:40

32 de 50

i), su

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Distribucin muestral Distribucin muestral

Donde E(

1,5

2,5

Total:

1/9

2/9

3/9

2/9

1/9

)=

En definitiva, un anlisis de la distribucin muestral de la media quedara de la siguiente forma:


1. Valor esperado:
2. Varianza:
3. Modelo de distribucin:
Para obtener valores en tablas hay que convertir las puntuaciones

en tpicas. Es decir:

Ejercicio resuelto

La media de la compra mensual un determinado producto de nuestro catlogo se distribuye


normalmente con media 80 y desviacin tpica 10. Si extraemos una muestra aleatoria
simple de 25 clientes:
a. Qu probabilidad hay de que un cliente obtenido al azar realice una compra de 75 ?
b. Qu posibilidad hay de que la media aritmtica sea de 75 en lugar de 80 ?
;
a.

Hay un
69,15 % de probabilidad.

b.

Hay un
99,38 % de probabilidad.

3.6.- Nivel de significacin.


Recordando el contraste de hiptesis anteriormente estudiado, dicho contraste no establece la verdad de
la hiptesis, sino un criterio que nos permite decidir si una hiptesis se acepta o se rechaza, o el
determinar si las muestras observadas difieren significativamente de los resultados esperados. En este

14/04/2015 16:40

33 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

proceso podemos incurrir en dos tipos de errores segn sea la situacin real y la decisin que tomemos.
Si rechazamos una hiptesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras que si
la aceptamos debiendo ser rechazada diremos que hemos cometido un error de tipo II.
Tipos de errores en el contraste de hiptesis
Situacin real: Decisin:
Ho es cierta.

Ho es falsa.

Aceptar Ho.

Correcto.

Error II.

Rechazar Ho.

Error I.

Correcto.

A la probabilidad de cometer un error de tipo I le llamamos nivel de significacin.


La probabilidad de cometer un error de tipo I es una cantidad que se fija de
antemano (antes incluso de extraer las muestras) en un nmero pequeo
denominado nivel de significacin (o nivel de riesgo), y se representa con la
letra . Tpicamente se elige un valor pequeo, un 5 % o 1 %. Todo experimento,
en su definicin y antes de elegir las muestras, debe llevar descrito cul es el
criterio con el que rechazaremos una hiptesis. Esto se traduce en prefijar el
nivel de significacin del contraste.
La seleccin de un nivel de significacin conduce a dividir en dos regiones el
conjunto de posibles valores del estadstico de contraste:
La regin de rechazo, con probabilidad , bajo Ho.
La regin de aceptacin, con probabilidad 1- , bajo Ho.
Si el estadstico de contraste toma un valor perteneciente a la regin de aceptacin, entonces no existen
evidencias suficientes para rechazar la hiptesis nula con un nivel de significacin y el contraste se
dice que estadsticamente no es significativo. Si, por el contrario, el estadstico cae en la regin de
rechazo entonces se asume que los datos no son compatibles con la hiptesis nula y se rechaza a un
nivel de significacin . En este supuesto se dice que el contraste es estadsticamente significativo.
De esta manera, si nos encontramos con frases del estilo: "Se declararn significativos los contrastes
cuando la significacin sea inferior al 5 %". Esta frase debe entenderse como que se rechazar la
hiptesis nula del contraste si, al examinar la muestra, se observa que discrepa tanto de la hiptesis
nula, que si esta fuese realmente cierta, la probabilidad de obtener una muestra como la obtenida (o an
peor), es inferior al 5 %.

3.7.- Regin crtica.


La regin crtica est constituida por el conjunto de muestras para las cuales se rechaza la hiptesis
nula. Mientras que la regin de aceptacin est constituida por el conjunto de muestras para las cuales
se acepta la hiptesis nula. El valor o valores que separan la regin crtica de la regin de aceptacin
reciben el nombre de valor o valores crticos.
Podemos representar la regin crtica de diversas formas:
Si el contraste es bilateral, ser representara de la siguiente forma:

Si el contraste es unilateral a la izquierda:

14/04/2015 16:40

34 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Si el contraste es unilateral a la derecha:

Autoevaluacin
Si la zona de rechazo de la hiptesis queda a un nico lado de la regin de aceptacin,
decimos que el contraste es bilateral. Verdadero o falso?
Verdadero.
Falso.

4.- Tcnicas de inferencia estadstica.


Extrapolacin de los resultados de la muestra a
la poblacin objeto del estudio.
Caso prctico
Nuestros protagonistas disponen de mucha informacin de sus
clientes reales y potenciales as como de la competencia, pero
quieren realizar un estudio minucioso de todos ellos.
Para ello van a hacer uso de ms tcnicas estadsticas
relacionados con la inferencia. Pedro, Mara Dolores y Alberto,
que forman el grupo encargado del anlisis estadstico, estn
muy entusiasmados con utilizar las herramientas de la Estadstica
para poder determinar por ejemplo, cmo se comportan los
clientes potenciales en Chile, o cmo se comporta la competencia
frente al aumento de los precios. Con esa informacin podrn determinar tendencias y
estimaciones futuras.

La inferencia estadstica persigue la obtencin de conclusiones sobre un gran nmero de datos,


basndose en la observacin de una muestra obtenida de ellos; tambin intenta medir su significacin,
es decir, la confianza que nos merecen.
Inferir es establecer un nuevo conocimiento a partir de uno ya dado. En la investigacin, nos
interesa inferir informacin sobre una poblacin, basndonos en la informacin contenida en
una muestra.
Con las tcnicas de inferencia, se persigue tomar decisiones y obtener conclusiones sobre una
caracterstica desconocida de la poblacin a partir de la informacin contenida en una o ms muestras
representativas de esa poblacin. La herramienta terica que utiliza es la teora de la probabilidad.

14/04/2015 16:40

35 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

La inferencia estadstica estudia principalmente dos tipos de problemas:


La estimacin: consiste en determinar una caracterstica desconocida de
la poblacin. Puede ser: puntual (determinar el valor concreto) o por
intervalos (determinar un intervalo en el que est contenida con cierto
grado de probabilidad).
El contraste de hiptesis (ya estudiado anteriormente): determinar si es
aceptable, a partir de los datos muestrales, que la caracterstica estudiada
tome un valor predeterminado o pertenezca a un intervalo concreto.
Por tanto uno de los propsitos de la inferencia estadstica es estimar cantidades desconocidas de la
poblacin (tales como la media poblacional, la varianza, etc.) llamadas parmetros poblacionales, o ms
brevemente parmetros, a partir del conocimiento de las correspondientes cantidades muestrales (tales
como la media muestral, la varianza muestral, etc.) llamados estadsticos muestrales, o ms brevemente
estadsticos.
En el presente captulo, vamos a analizar otras tcnicas de inferencia estadsticas no vistas hasta ahora
como la regresin lineal y correlacin simple o los nmeros ndices.

4.1.- Regresin lineal y correlacin simple.


Muy a menudo se encuentra en la prctica que existe una relacin entre
dos o ms variables. Por ejemplo, los ingresos de una empresa dependen
en cierto modo de sus ventas. Si todos los valores de las variables cumplen
exactamente una relacin exacta, entonces se dice que las variables estn
perfectamente correlacionadas o que hay una correlacin perfecta entre
ellas o, ms sencillamente, que existe una funcin o una frmula que las
relaciona.
En el campo de la investigacin de mercados, es difcil poder encontrar frmulas, pero s obtenemos a
menudo correlaciones, aunque no sean perfectas, como el ejemplo que ponamos al principio. Y
partiendo de ese ejemplo nos puede surgir la siguiente duda: en qu medida estn relacionadas los
ingresos y las ventas de una empresa? Si somos capaces de encontrar una forma de medir
adecuadamente esa relacin, entonces, por ejemplo, podemos decidir si las ventas e ingresos de esa
empresa estn ms relacionados entre s que los de la competencia.
Cuando se busca una medida para medir esa relacin se dice que se est buscando medir la correlacin
entre esas dos variables. Por tanto, averiguar la correlacin entre dos variables se refiere siempre a
hallar una medida de la relacin entre esas dos variables.
Si se trata slo de dos variables, se habla de correlacin simple. Y cuando se trata de ms de dos
variables, se habla de correlacin mltiple.
Pero adems nos puede surgir otra duda: podramos hallar una frmula para estimar los ingresos de
una empresa a partir de sus ventas (o al revs)? Cuando se busca una frmula de ese tipo se dice que
se est buscando una regresin entre dos variables.
Por tanto, hallar una regresin entre dos variables se refiere siempre a hallar una frmula o ecuacin que
represente la relacin aproximada entre esas dos variables.
Y de la mismo forma que antes, cuando se trata de dos variables solamente, se habla de regresin
simple. Cuando se trata de ms de dos variables se habla de regresin mltiple.

4.2.- Ajuste de curvas en la regresin lineal y


correlacin simple.
14/04/2015 16:40

36 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Consideramos una distribucin bidimensional en la que se supone existe una relacin entre las variables
X e Y. Si representamos grficamente en un eje de coordenadas los pares de valores de las dos
variables, el problema del ajuste consiste en la obtencin de la ecuacin de una curva que pase "cerca"
de los puntos establecidos. Un dibujo de la nube de puntos o diagrama de dispersin de la distribucin
nos puede indicar si es razonable pensar en que puede haber una buena correlacin lineal entre las dos
variables.

En los diagramas de arriba se puede observar cmo en el de la izquierda, una lnea recta inclinada
puede aproximarse a casi todos los puntos, mientras que en el otro, cualquier recta deja a muchos
puntos alejados de ella. As pues, el hacer un anlisis de regresin lineal slo estara justificado en el
ejemplo de la izquierda. Como se puede ver en ambos diagramas, ninguna recta es capaz de pasar por
todos los puntos, y seguir siendo recta. De todas las rectas posibles, la Recta de Regresin de Y sobre X
es aquella que minimiza un cierto error, considerando a X como variable explicativa o independiente y a
Y como la explicada o dependiente.
Cules son los problemas?
Elegir el tipo de curva que mejor se adapte.
Fijado el tipo de curva a travs de una ecuacin, determinar los parmetros mediante las
condiciones que se impongan.
Al conjunto de puntos resultante se le denomina "Diagrama de dispersin" o nube de puntos.
Mediante el ajuste de curvas se pretende encontrar una funcin que mejor se ajuste a la nube de puntos,
es decir determinar una funcin que resuma la informacin de las variables independientes con las
dependientes.
Las funciones que se ajustan con ms frecuencia son:
Las funciones que se ajustan con ms frecuencia son:
Recta:
Parbola:
Curva o funcin exponencial:
Curva geomtrica o funcin potencial:
Siendo: X igual a variable independiente, e Y igual a variable dependiente.
Analicemos el Mtodo de los mnimos cuadrados:
Este mtodo consiste en encontrar la ecuacin que mejor se ajuste a la nube de puntos. Hace mnimos
la suma de los cuadrados de las diferencias entre los valores observados (yi) y los tericos (y) que se
obtengan mediante la ecuacin.
Permite calcular los valores de a y b, e informa de la dependencia directa o inversa entre variables.
Si se utiliza una recta, se llamara "Recta de los Mnimos Cuadrados", y si se utiliza como funcin una
parbola, se le conoce como "Parbola de los Mnimos Cuadrados".
El ajuste de una recta se determina por la obtencin de los valores a y b, cuya expresin es la siguiente:

14/04/2015 16:40

37 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

4.3.- Tcnicas de regresin lineal y correlacin


mltiple.
Parten del anlisis multivariable, que permite establecer a partir de datos numerosos, ciertas relaciones y
leyes operativas. Qu significa multivariable? Segn M.G. Kendall, afirma que "pueden incluirse en el
anlisis multivariable a todos los mtodos estadsticos que, simultneamente, analizan ms de dos
variables en un muestreo de observaciones".

Reflexiona
Crees que es posible predecir la variacin de las ventas de una empresa en funcin de las
acciones de la competencia? Si no es as, habra que considerar otras variables en dicho
anlisis? Cules pueden ser?
Se puede estimar el valor de las ventas de una empresa en funcin de los gastos en
publicidad y las comisiones de los vendedores? Cules seran las variables independientes
y dependientes? Existira relacin entre dichas variables? Cmo sera la relacin de
dependencia entre las mismas?

Cul es el objetivo de la regresin lineal mltiple? Es evidente que tratar


de explicar una variable en funcin de otra solamente es bastante limitado,
por ello con la regresin lineal mltiple se explica el comportamiento de una
variable Y con ms de una variable predictora utilizando una funcin lineal.
La ecuacin de regresin lineal mltiple es la siguiente:

Para saber ms
El anlisis multivariable es mucho ms complejo pero ms real. Para profundizar ms en su
clculo, tanto de la regresin como de la correlacin mltiple, visita el siguiente enlace, el
cual te sacar de dudas.
Regresin y correlacin mltiple.

Los clculos para determinar los coeficientes de correlacin mltiples son complejos, ya que se utilizan
matrices pero sus interpretaciones son iguales a las estudiadas hasta ahora, solo que haciendo uso de
ms de dos variables en los anlisis.

4.4.- Nmeros ndices.


Imagina la cantidad total de vehculos vendidos, el incremento de salario, crecimiento de la poblacin, el
producto interior bruto, las ventas de mviles, en un ao y en un lugar determinado, al final del periodo
nos encontraramos con una gran cantidad de datos y de diferentes naturalezas, as que cmo hacer
que estos datos representen una informacin til? A travs de los nmeros ndice, uno para cada una de
las variables (ventas, salario, poblacin,..)

14/04/2015 16:40

38 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Cmo podemos llevar toda esa informacin en un solo nmero?


Reduciendo los datos, para poder expresar un nmero general.
Cul es su objetivo? Poner de manifiesto cmo va cambiando algo
a lo largo del tiempo.
Se constituyen como un instrumento frecuentemente utilizado para la
descripcin de magnitudes econmicas y se consideran una medida
estadstica que tiene como finalidad comparar una variable o
magnitud econmica a lo largo del tiempo.

Segn Leonard Kasmier, "un nmero ndice es un valor relativo expresado como porcentaje o
cociente, que mide un periodo dado contra un periodo base determinado".
Segn Rosembaum y Highland, "un nmero ndice es una forma especial de razn utilizada
para mostrar cambios durante el periodo. Se compara una cantidad (venta, precio,
produccin,..) con el valor correspondiente en algn periodo anterior al que se le conoce
como la base".

Si la comparacin se realiza para los valores de una sola magnitud, hablaremos de ndices simples. En
cambio, cuando se trabaja con ms de una magnitud a la vez, hablaremos de ndices complejos. En
cualquier caso siempre se van a comparar dos situaciones, una de las cuales se considerar de
referencia. A la situacin inicial, cunado las comparaciones son temporales, se le conoce como periodo
base o referencia, frente al periodo corriente o actual con el que se realiza la comparacin.
En la construccin de un nmero ndice, se le asigna al periodo de referencia el valor 100. Esto implica
que los nmeros ndices no son otra cosa que porcentajes. Se trata de los porcentajes de cada valor de
la magnitud con respecto al valor de referencia o base.
Formalmente un ndice simple, para una variable concreta, se define de la forma siguiente:

Donde Yit y Yi0 son dos valores concretos de una magnitud o variable Yi. El primero de los valores
corresponde al momento actual (t) y el segundo al momento base o de referencia (t=0). Una vez que se
han elaborado los nmeros ndices, se determina la variacin (en tantos por ciento) que ha sufrido la
variable Yi al pasar del periodo de referencia al actual.

5.- Series temporales. Estimacin de tendencias.

14/04/2015 16:40

Caso prctico
El grupo estadstico de Eurasia sigue trabajando en el anlisis estadstico de los datos que
manejan. En esta ocasin van a profundizar en las estimaciones. El proceso de expansin de
Eurasia les exige realizar determinadas predicciones de cara a su implantacin en buena
parte de los pases de habla espaola en Sudamrica. Se basarn en la observacin de todo
tipo de movimientos en dichos pases, para hacer una buena prediccin.

39 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Los precios se comportan de igual forma a lo largo del tiempo? Es


posible realizar predicciones de los precios?
Para dar respuesta a estas preguntas, se utilizan las Series Cronolgicas o
Temporales, a travs de las cuales realizamos una recopilacin de datos
observados a lo largo de un tiempo.
Cules son los objetivos de las series temporales?
1. Una explicacin de cmo se generan las observaciones a lo largo del tiempo, al objeto de una
mejor comprensin del fenmeno en cuestin.
2. Entender el desarrollo del fenmeno a fin de ser capaces de proporcionar predicciones sobre
valores futuros de la caracterstica objeto de estudio.
Analizaremos el concepto de series temporales, sus principales componentes, movimientos
caractersticos, y finalmente los mtodos de estimacin de la tendencia.

5.1.- Series temporales.


Qu se entiende por serie temporal y para qu es til?
Una serie temporal se define como un conjunto finito de valores numricos, que provienen de
observaciones efectuadas en ciertos momentos a intervalos iguales de tiempo.
Analicemos los componentes de las series temporales:
La metodologa que consideramos para el estudio de una serie cronolgica
o temporal, utilizando procedimientos de estadstica descriptiva, consiste en
un mtodo de descomposicin. La serie puede descomponerse en cuatro
componentes, los cuales son:
1. Tendencia secular: es el movimiento de la serie a largo plazo, es
decir, refleja el comportamiento general de la serie. Por ejemplo, la tendencia creciente del IPC.
2. Variacin estacional: representa fluctuaciones de la serie en periodos de tiempo inferior a un ao,
que se repiten con una periodicidad conocida. Es decir, pretende recoger los crecimientos o
decrecimientos en la serie cronolgica por el hecho de estar en una determinada poca de un ao,
en general, estacin.
3. Variacin cclica: representa la pauta de comportamiento de la serie de carcter peridico, con
periodos de duracin diferente, desconocida y superiores a un ao. Por ejemplo, los ciclos
econmicos con etapas de prosperidad, recesin y recuperacin.
4. Variacin irregular: es una fluctuacin impredecible que ocurre aleatoriamente en diferentes
instantes de tiempo. En este componente se recogen desde hechos como huelgas, catstrofes,
etc.; a ligeras desviaciones en los factores anteriores.
De los componentes de las series temporales surgen los movimientos ms caractersticos de las
mismas, clasificndose en cuatro movimientos:

14/04/2015 16:40

En qu consisten los movimientos con tendencia secular? Hay determinadas variables,


normalmente de tipo macroeconmico, cuya conducta manifiesta un comportamiento estable y con
tendencia secular o al largo plazo. Es el comportamiento tpico de ndices como el PIB, la

40 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

poblacin, etc.
Movimientos estacionales. Hay variables que fluctan de forma casi idntica en funcin de una
determinada poca del ao. Por ejemplo, productos agrcolas cuya produccin se determina en
funcin de una poca del ao, piensa por ejemplo en las castaas, cul es la poca de
produccin? Lgicamente, en otoo. O productos de consumo, los cuales se asocian a la poca del
ao, por ejemplo los ventiladores, cuyo mximo consumo se produce en la poca estival.
Movimientos cclicos. Hay otras variables cuyo comportamiento se asocia, no a la poca del ao,
sino a situaciones macroeconmicas y sus fluctuaciones, es decir a movimientos de los ciclos
econmicos de un pas, como crecimiento, recesin y depresin. Qu tipo de bienes son ms
susceptibles de estos movimientos? Los bienes energticos.
Movimientos irregulares. Hay variables cuyo comportamiento es aleatorio o irregular, y su
movimiento es de tipo horizontal. Qu los genera? Fenmenos naturales o sociales, como
huelgas, huracanes, terremotos,

5.2.- Estimacin de tendencias.


Planteamos dos procedimientos para la determinacin de la tendencia secular en una serie cronolgica.
1. Consiste en el ajuste de una curva a las observaciones. En este caso presuponemos que el
componente de mayor importancia en las observaciones es la tendencia secular. El primer paso
sera la eleccin de la familia de curvas a considerar para posteriormente seleccionar una curva de
entre la familia, que nos dar una expresin para la tendencia. La variable independiente es el
tiempo.
Se utilizar el Ajuste de una lnea recta utilizando el ajuste por mnimos cuadrados, en qu
consiste? Tal como hemos visto en apartados anteriores, es un mtodo que nos permite realizar
una representacin de un grupo de datos mediante una solucin nica. Es muy simple y sus
aplicaciones son ilimitadas. Con el mismo se puede calcular en una funcin una serie de datos
registrados. Se trata de obtener la siguiente ecuacin:
Cules son sus ventajas e inconvenientes?
Ventajas:
Es objetivo.
Proporciona la misma ecuacin ya que no importa quien realice el
anlisis.
Proporciona una estimacin probabilstica de la ecuacin que
representa a unos datos experimentales.
Proporciona intervalos pequeos de error.
Desventajas:
Slo es til para ajustar modelos lineales.
Requiere tener al menos diez mediciones bajo las mismas circunstancias experimentales.
Los resultados deben estar descritos por una distribucin de probabilidad conocida
(distribucin normal).
Requiere programa informtico para llevarlo a cabo.
2. El segundo procedimiento es el de las medias mviles. Es un mtodo ms flexible que no exige la
suposicin de una forma funcional. Este mtodo se utiliza para la determinacin de la tendencia
secular o como un mtodo de transformar las observaciones a otras ms suavizadas para
posteriormente ajustar una curva a estos valores. Se entiende por suavizamiento de la serie a la
obtencin de unos valores transformados con menos fluctuaciones.

14/04/2015 16:40

Autoevaluacin
41 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

El mtodo de ajuste de una lnea por Mnimos Cuadrados es utilizado en modelos no


lineales. Verdadero o falso?
Verdadero.
Falso.

6.- Aplicaciones informticas para el tratamiento


y anlisis de la informacin: Hojas de clculo y
Bases de datos.
Caso prctico
Pedro ha asignado como asesor informtico del grupo de estadstica de Eurasia a Ahmed
Rasyanni. l se va a encargar de volcar todas las frmulas y datos recopilados por sus
compaeros en una hoja de clculo. Tambin es el encargado de la gestin de las bases de
datos compradas. l es la pieza clave que faltaba del grupo formado por Pedro, Alberto y
Mara Dolores para el estudio estadstico. Sin los conocimientos informticos de Ahmed, todo
el trabajo que han estado realizando no tendra ningn sentido.

Hoy en da es imposible trabajar en estadstica sin el apoyo de un


ordenador, mnimo de una calculadora. No obstante, es estrictamente
necesario conocer los conceptos estadsticos, su metodologa y sus
aplicaciones. La combinacin de una buena metodologa, prcticas y
aplicaciones informticas producen como resultado la optimizacin de la
aplicacin de los mtodos estadsticos en la prctica.
Aunque existe software especializado en estadstica como SPSS o
Statgraphics, no todos los usuarios necesitan la potencia de estos paquetes. Las hojas de clculo
actuales cuentan con un elevado nmero de funciones y otras herramientas de anlisis que ayudan a
afrontar algunos clculos estadsticos sencillos como, por ejemplo, contrastar hiptesis.
La hoja de clculo Excel ofrece funcionalidades que van ms all de la tabulacin, clculo de frmulas y
creacin de grficos. Adems de representar todos los tipos de grficos, calcula la media, moda,
mediana, recorrido, varianza y desviacin tpica. Tambin el coeficiente de correlacin y la recta de
regresin, as como calcula cualquier probabilidad en la normal estndar N (0,1) y genera la tabla. La
instalacin del programa es muy sencilla e incluye un comando para el anlisis de datos, dentro de las
"herramientas para el anlisis".

14/04/2015 16:40

Para saber ms
42 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

En el siguiente enlace encontrars ejemplos de ejercicios de estadstica resueltos con Excel.


Podrs as comprobar cmo se crean grficos estadsticos, cmo hallar medias,
desviaciones, coeficiente de correlacin lineal, regresin, etc.
Estadstica con Excel.

Si trabajamos con gran cantidad de informacin, es conveniente utilizar un potente programa que edite y
gestione todos nuestros datos. Al igual que con las hojas de clculo, existen infinidad de programas
informticos para este cometido. Pero no debemos irnos siempre a los ms complejos. El paquete de
Microsoft Office viene ofreciendo desde hace muchos aos el programa de gestin de datos Access. Con
Access resulta ms adecuado crear listas de datos complejas y trabajar con ellas, adems de ofrecer
herramientas para especificar, organizar, conservar y recuperar los datos.
Al pertenecer al mismo paquete, se pueden integrar fcilmente los datos de Access y Excel, de manera
que se pueden crear bases de datos en uno y sus correspondientes clculos estadsticos en otro.
Tambin existen hojas de clculo y bases de datos gratuitas. Como por ejemplo las integradas en el
programa de software libre OpenOffice, OpenOffice.org Dat y OpenOffice.org Base respectivamente.

7.- Presentacin de resultados. La importancia


del informe comercial.
Caso prctico
Juan Surez, conoce de la experiencia y buen hacer del grupo,
por lo que ha pedido a Pedro que hagan una presentacin de
los resultados estudiados hasta ahora en la que estn y
participen todos los miembros del grupo encargado del anlisis
estadstico.
Pedro, veo bien que estis todos presentes. Por favor, ten en
cuenta las aburridas presentaciones y los informes incomprensibles de la empresa que
contratamos para ello el ao pasado. Creo que podis aprender de los errores de esa
empresa para hacer un buen trabajo Afirma convencido Juan Surez.
No te preocupes Juan. El trabajo ms pesado ya est hecho. Tan slo queda plasmarlo en
un documento que ya tenemos ideado y que te va a servir de estmulo para tomar decisiones
sobre el proceso de expansin de Eurasia. Cuentan con que el informe ser lo ms
adecuado a las necesidades de la empresa, y la presentacin no te ocupar mucho tiempo.
La haremos dinmica e iremos al grano, no pretendemos aburrirte.
Pedro y su grupo tienen los conocimientos necesarios para redactar un informe sencillo,
adems conocen a la perfeccin a Juan y saben lo que le gusta y lo que no. Es por ello que
idearn el informe y la presentacin teniendo presente siempre las necesidades de Eurasia y
los deseos de Juan.

Los resultados finales de la investigacin comercial deben ser planteados y


explicados en el informe. La elaboracin y presentacin del informe de
investigacin es el paso final en el proceso de investigacin. El informe
permite sintetizar los resultados obtenidos en la investigacin a una
audiencia especfica para un propsito especfico. Para ello debe haber

14/04/2015 16:40

43 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

sido redactado teniendo en cuenta tanto los objetivos generales del estudio,
como la utilidad de la investigacin.
La importancia del informe se basa principalmente en dos pilares:
Es el nico resultado tangible de la investigacin comercial.
La investigacin ser juzgada en funcin de la utilidad del informe para el cliente.
Cada investigacin comercial requerir de un informe adecuado a ella; sin embargo, hay aspectos que
deben tenerse en cuenta en la elaboracin y presentacin de cualquier informe:
Tener en cuenta a la audiencia. La identificacin de la audiencia afectar a decisiones de
presentacin como la seleccin del material que se incluir en el informe, el nivel tcnico de la
presentacin o qu recursos son los adecuados a la misma.
Estructurar la presentacin. La estructura de un informe debe incluir una introduccin, un cuerpo,
unas conclusiones y recomendaciones, y un resumen.
Ser especfico y visual. La informacin que proporciona el informe debe ser til a quien toma las
decisiones; esto ayuda a la concrecin y a la visualizacin.
La compra de otros estudios o incluso la profesionalidad del investigador se ver condicionada por la
valoracin del informe.

7.1.- Estructura y elementos del informe


comercial.
No existe un formato especfico que sea el adecuado para todas las situaciones.
Un trabajo de investigacin no est concluido hasta tanto haya sido escrito el
informe. De nada sirve que la hiptesis sea brillante, o que el estudio haya sido
muy cuidado, si no somos capaces de comunicar correctamente los resultados.
No podemos por tanto descuidar la redaccin de un informe ya que no se trata
de algo intrascendente, sino todo lo contrario, el informe es una parte inherente
al proceso de investigacin.
Un formato bsico para un informe comercial podra ser el que incluye los
siguientes elementos:
Portada.
ndice del informe.
Informe directivo.
Cuerpo del informe.
Conclusiones y recomendaciones.
Anexos.
Portada. Debe contener un ttulo que resuma la esencia de la investigacin, fecha y nombre de la
persona u empresa que lo est presentando y a quin va dirigido dicho informe. En caso de ser
confidencial, los individuos que van a recibirlo deben estar incluidos en esta pgina.
ndice del informe. En el ndice debemos enumerar los ttulos y nmeros de pginas correspondientes. El
objetivo es ayudar a los lectores a encontrar aquella informacin que les resulta ms interesante dentro
de la investigacin.
Informe directivo. En l se resumen de manera condensada y clara los aspectos fundamentales del
informe. Es la parte del mismo que proporciona los resultados ms esenciales para la toma de
decisiones de la direccin de la empresa.
Cuerpo del informe. En este apartado escribiremos los detalles de la investigacin. Es conveniente dividir
el cuerpo del informe en cuatro subapartados: introduccin, metodologa, resultados y limitaciones:

14/04/2015 16:40

44 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

En la introduccin proporcionamos al lector una aproximacin bsica necesaria para comprender el


resto del informe.
En la metodologa describimos el procedimiento de recoleccin y anlisis de datos, as como el
diseo y eleccin de la muestra.
Despus llegaremos al subapartado de resultados, que podremos organizar alrededor de los
objetivos de la investigacin, procurando as comprobar su validez.
Y por ltimo, en limitaciones, debemos hacer pblicas las posibles dificultades encontradas con el
muestreo y la no respuesta.
Conclusiones y recomendaciones. En este apartado trataremos de relacionar de forma clara los
resultados de la investigacin con las necesidades de informacin, recomendando acciones basadas
siempre en las conclusiones a las que hemos llegado.
Anexos. En este espacio proporcionaremos el material que no es esencial en el cuerpo del informe, por
su complejidad o bien por su menor inters. Podrn ser, por ejemplos, detalles de la muestra,
instrucciones para el entrevistador, tablas estadsticas, etc.

7.2.- La redaccin del informe comercial. El


texto del informe.
Si recordamos, en la elaboracin de cualquier informe debemos tener en
cuenta a la audiencia, estructurar la presentacin y ser especfico y visual.
Siguiendo estas tres premisas podemos desarrollar un lenguaje en el texto
del informe con una serie de requisitos como:
Ser conciso, pero sin dejar nada en el tintero. No se trata de dar
absolutamente todos los detalles de la investigacin, pero s aquellos
que se crean suficientemente relevantes.
Utilizar palabras y frases cortas. Son mucho ms fciles de digerir que construcciones ms
complejas.
Tener en cuenta la apariencia. Si tenemos muchas pginas o bloques en blanco hace que el
informe sea ms difcil de leer. Las tablas y cuadros ayudan a cuidar la apariencia y evitar tantos
espacios en blanco.
Si transcribimos ciertos comentarios de los encuestados, contribuimos a que el informe sea ms
interesante.
Evitar los clichs y frases hechas. Hay que ser en la medida de lo posible originales en la redaccin
de un informe.
Escribir en tiempo presente. Es ms til y hace el informe ms cercano y real que si utilizamos el
pasado o condicional, por ejemplo.
Utilizar la voz activa en detrimento de la pasiva en la construccin de las frases.
Si hacemos ciertas citas de los comentarios de los encuestados, hacemos que el informe sea ms
interesante y legible, y puede proporcionar una mejor idea, adems de representarlo como ms
cercano.
Un aspecto muy importante sobre el que debemos reflexionar es acerca de la objetividad del informe.
Probablemente en ms de una ocasin los resultados no sean los esperados o no sean aceptados,
entrando en conflicto con la experiencia y juicio de quien toma las decisiones. Tambin contradecir
decisiones tomadas anteriormente a la investigacin. En estas circunstancias a priori adversas podra
tentarnos desviar el informe, haciendo que los resultados parezcan ms aceptables a la direccin. Sin
embargo, debemos actuar con profesionalidad y presentar los resultados de la investigacin de una
manera objetiva (es decir, sin sesgo) y defender su validez.

14/04/2015 16:40

45 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

Autoevaluacin
La redaccin del informe comercial debe ser rica en la utilizacin de vocabulario y diferentes
tiempos verbales. Verdadero o falso?
Verdadero.
Falso.

7.3.- La redaccin del informe comercial.


Normas para los grficos.
Los grficos pueden mejorar una presentacin centrando la atencin en los
puntos importantes que no pueden explicarse en el texto. Son medios muy
rpidos y atractivos de presentar nmeros, tendencias y relaciones.
Como ya sabemos existen diversos tipos de representaciones grficas, pero
Cules son las representaciones ms usadas en los informes? Las que se
utilizan ms frecuentemente en la presentacin de los resultados de una
investigacin comercial son el diagrama circular, el de barras y el de lneas.
El diagrama circular es una de las formas ms simples y efectivas de
representar las relaciones proporcionales. En este diagrama hay que evitar colocar excesiva
informacin. Es recomendable distinguir no ms de 5 o 6 segmentos de informacin.
El diagrama de barras presenta las magnitudes de los datos segn la longitud de varias barras de
diferente color que estn colocadas con respecto a una escala horizontal o vertical. Estas grficas
son las ms indicadas para representar comparaciones mltiples y relaciones complejas. Para
comparar conjuntos de datos en una sola grfica, se puede utilizar una grfica de barras por
conglomerados: agrupan los temas generales y luego dividen la informacin en categoras
especficas.
Por ltimo, una de las grficas ms utilizadas en los informes comerciales es aquella representada
a travs de lneas. Es especialmente efectiva si hacemos referencia a un periodo de tiempo, ya que
permite plasmar los datos en un largo periodo de tiempo. Tambin permite comparar diferentes
series en un mismo diagrama, diferenciando en ese caso cada serie con un color diferente.
Independientemente del que utilicemos, todo grfico incluido en un informe comercial debe incluir:

14/04/2015 16:40

Nmero del grfico o tabla.


Ttulo del grfico.
Un enunciado o leyenda del grfico.
Una pequea explicacin sobre los datos que presenta.

Para saber ms
Para incluir grficos en el informe nos tenemos que valer de una hoja de clculo o cualquier
programa informtico que permita la interpretacin grfica de los resultados. Como ya hemos
visto en apartados anteriores, se recomienda el uso de Excel para crear grficos. En este
vdeo podrs ver un tutorial muy sencillo sobre cmo crear grficos en Excel.
Resumen textual alternativo

46 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

7.4.- La redaccin del informe comercial.


Normas para las tablas.
Al igual que los grficos, las tablas utilizadas para presentar los datos
ayudan a la comprensin del informe. Podemos seguir unas directrices
claras con respecto a la confeccin de dichas tablas:
Todas ellas deben tener un ttulo y un nmero. Ejemplo: Tabla 15.3
"Ventas de Mayo 2011".
Los datos deben ser colocados con claridad en cada una de las celdas,
pudiendo destacar en negrita aquellos ms importantes o destacados.
Hay que indicar con claridad la fecha de los datos que se presentan.
Debemos indicar en algn lugar de la tabla la unidad de medida
utilizada. Por ejemplo: euros, horas, litros, etc.
Procuraremos dar un formato atractivo, cuidando especialmente los bordes que delimitarn el
espacio de la tabla. Se pueden utilizar distintos tipos de lneas para diferenciar datos dentro de una
misma tabla. As mismo se puede recurrir al uso de varios colores en una misma tabla, aunque
tampoco se debe abusar del color. Hay que buscar un punto intermedio: ni disear tablas aburridas
ni sobrecargadas.
Las tablas deben ir acompaadas siempre de una pequea explicacin y/o comentario sobre los
datos presentados, as como de una aclaracin si fuera necesario sobre la manera en que se han
presentado. Tambin se pueden realizar llamadas a travs de asteriscos (*) o nmeros (1) para
oportunas aclaraciones.
Finalmente se debe indicar la fuente de donde se han obtenido los datos contenidos en la tabla.

Reflexiona
La inclusin o no de tablas en un informe comercial puede convertirse en algo controvertido.
Sobre todo si preparamos informes comerciales para multinacionales o empresas extranjeras.
Por lo que antes de incluir siempre es conveniente pararse y reflexionar sobre algunas
preguntas: Quin va a leer mi informe? Se entendern las tablas? Estn en un lenguaje
fcilmente comprensible? Son cmodas de leer? El tipo de letra utilizado es el correcto?
El color o colores utilizados permiten su correcta lectura? Le dan sentido al informe? Si en
alguna de estas preguntas la respuesta es un "no", deberamos plantearnos la inclusin de
tablas en el informe.

Autoevaluacin
En el ttulo de la tabla se debe indicar tambin la fuente de donde se ha obtenido esa
informacin. Verdadero o falso?
Verdadero.
Falso.

7.5.- La redaccin del informe comercial.


Exposicin oral y audiovisual de los resultados.
El momento de la exposicin oral podra convertirse en el nico momento en el

14/04/2015 16:40

47 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

que los resultados del informe sean conocidos por aquellos que deban
evaluarlo. Por tanto, esta evaluacin depender en gran medida de la forma en
que se comunique la informacin. De ah la importancia de la presentacin.
Al igual que para la redaccin del informe, en la exposicin es muy conveniente
pensar en los destinatarios del mismo, as como en el espacio y recursos
disponibles. Si se desconoce el lugar y los medios con los que se podr contar,
se debe preparar una presentacin adaptable a cualquier situacin. Por
ejemplo, si queremos apoyarnos de un ordenador adems de pantalla y proyector, y no es posible
averiguar si se podr disponer de dichos medios, debemos pedirlos con suficiente antelacin o en ltimo
caso alquilarlos o llevarlos nosotros mismos.
Otro aspecto a tener muy en cuenta en cualquier exposicin es la brevedad: debemos ser concisos en la
presentacin, aunque exhaustivos. No podemos pasar por alto la informacin que consideremos ms
interesante, pero tampoco podemos centrarnos exclusivamente en ella.
El idioma es tambin muy importante, especialmente en los negocios internacionales. No podemos
apoyarnos de una presentacin audiovisual en un idioma diferente al de la audiencia. Y evidentemente
debemos dirigirnos a ellos en una lengua conocida por todos.
Tambin debemos mantener el contacto visual con el pblico, para dar confianza y credibilidad a la
exposicin. Este contacto visual puede ser complementado con el uso adecuado del lenguaje corporal,
para ayudar a la presentacin. Los gestos son una ayuda pues realzan la importancia del tema en
cuestin. Pero tambin se debe evitar distraer a la audiencia, controlando al mximo los movimientos.
Se puede amenizar la exposicin con el uso de ancdotas. Nos podemos
remitir a ejemplos y comentarios que aclaren las ideas expuestas. Si nos
dirigimos a una audiencia de un pas diferente al nuestro, siempre es muy
recurrente hacer referencia a aspectos culturales o costumbres de nuestro
pas.
Es aconsejable conseguir la participacin de los asistentes, motivarles a
preguntar. Para ello nos mostraremos desde el inicio de la exposicin una
total disposicin para contestar preguntas. Con ello damos sensacin de transparencia y colaboracin.
Es muy efectivo tambin el uso de pausas que den a los miembros de la audiencia la oportunidad de
reflexionar.
Se debe evitar las muletillas al exponer y procurar hacerlo de forma fluida. El tono, timbre y entonacin
de la voz debe tambin manejarse a favor de la total credibilidad de lo que se expone.
Y por ltimo, y no menos importante, se debe conocer muy bien el trabajo que se est exponiendo. Hay
que evitar la lectura del informe. Toda exposicin, por pequea o poco relevante que sea para la
empresa, requiere de una preparacin previa. De un estudio de la audiencia, del lugar y de los recursos
con los que se cuenta. No debemos pasar por alto que va a ser nuestra mejor tarjeta de visita.

7.6.- Aplicaciones informticas para la


elaboracin del informe comercial
No existen programas especficos para la elaboracin del informe comercial, y en caso de haberlos
seran costosos y probablemente complejos. Por ello se aconseja recurrir a procesadores de texto,
especialmente Google Docs, Open Office o bien Microsoft Word, que permiten la combinacin de textos
con tablas, grficos, enlaces, etc. Con el procesador de texto podremos ejercer las siguientes funciones
de cara al informe final:
Creacin. El procesador de textos posibilita la creacin del informe de manera sencilla,
introducindolo con el teclado y, despus, guardndolo en un dispositivo de memoria.
Edicin. Un informe ya creado puede ser modificado o tratado de muy diversas maneras.

14/04/2015 16:40

48 de 50

eXe

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

eXe

Impresin. El procesador de texto permite dar al informe una forma adecuada para su salida por la
impresora.
Realizacin de grficos. El procesador de texto permite la inclusin de distintos tipos de grficos,
siendo muy intuitivo su uso. Se puede recurrir a la ayuda en caso de no conocer el procedimiento
para incluir grficos.
Diseo de tablas. Las tablas a las que antes hemos hecho referencia pueden ser diseadas y
editadas a travs del procesador.
La particularidad de Microsoft Word o del software libre Open Office Writer es su
capacidad para mezclar en un mismo informe textos, frmulas estadsticas,
imgenes, grficos, tablas, hojas de clculo, etc., y mostrar en pantalla una
imagen exacta de cmo va a quedar impreso el documento.
Para la elaboracin de la presentacin se aconseja el uso de Microsoft Power
Point. Este programa, de fcil uso, permite crear presentaciones grficas de
manera rpida y sencilla. Tambin podemos recurrir al programa Impress, de
Open Office.
Con Power Point e Impress podemos crear presentaciones de gran calidad ya que incorpora gran
cantidad de herramientas que nos permiten personalizar hasta el ltimo detalle, por ejemplo podemos
controlar el estilo de los textos y de los prrafos, podemos insertar grficos, dibujos, imgenes, efectos
animados, pelculas, sonidos, etc.
Se podr acceder a las presentaciones creadas, si se desea, a travs de Slideshare o Google
Presentations, por ejemplo. Ambas son aplicaciones gratuitas que permiten alojar las presentaciones,
invitando a las personas que queremos que las vean.

Autoevaluacin
Power Point no slo es una buena herramienta para editar textos y realizar clculos
estadsticos sino tambin para editar diapositivas que me servirn para la presentacin del
informe. Verdadero o falso?
Verdadero.
Falso.

Anexo.- Licencias de recursos.


Licencias de recursos utilizados en la Unidad de Trabajo. Recurso (1) Datos del recurso (1) Recurso (2)
Datos del recurso (2)

14/04/2015 16:40

Autora: Stocklib.
Licencia: Uso educativo
no comercial para
plataformas pblicas de
Formacin Profesional a
distancia.
Procedencia: CD-DVD
Num. ECD001.

Autora: Stocklib.
Licencia: Uso educativo no
comercial para plataformas
pblicas de Formacin
Profesional a distancia.
Procedencia: CD-DVD Num.
ECD001.

Autora: Stockbyte.
Licencia: Uso educativo
no comercial para
plataformas pblicas de
Formacin Profesional a

Autora: Desconocido.
Licencia: AttributionNonCommercial 2.0 Generic
(CC BY-NC 2.0).
Procedencia:

49 de 50

https://aulavirtual.educa.jccm.es/Aula_Virtual/blocks/recopila/view.ph...

distancia.
Procedencia: CD-DVD
Num. EP006.

http://www.flickr.com/photos
/crystaljingsr/3915514724
/in/photostream

Autora: Stocklib.
Licencia: Uso educativo
no comercial para
plataformas pblicas de
Formacin Profesional a
distancia.
Procedencia: CD-DVD
Num. ECD001.

Autora: Kiko Llan.


Licencia: AttributionNonCommercial-ShareAlike
2.0 Generic (CC BY-NC-SA
2.0).
Procedencia:
http://www.flickr.com/photos
/kikollan/3093393008/

Autora: Stocklib.
Licencia: Uso educativo
no comercial para
plataformas pblicas de
Formacin Profesional a
distancia.
Procedencia: CD-DVD
Num. ECD001.

Autora: Stockbyte.
Licencia: Uso educativo no
comercial para plataformas
pblicas de Formacin
Profesional a distancia.
Procedencia: CD-DVD Num.
V43.

Autora: Stockbyte.
Licencia: Uso Educativo
no comercial para
plataformas FPaD.
Procedencia: CD/DVD
Num. CD165.

Autora: Stockbyte.
Licencia: Uso educativo no
comercial para plataformas
pblicas de Formacin
Profesional a distancia.
Procedencia: CD-DVD Nm
EP006.

Autora: Stocklib.
Licencia: Uso Educativo
no comercial para
plataformas FPaD.
Procedencia: CD/DVD
Num. ECD001.

Autora: Stockbyte.
Licencia: Uso Educativo no
comercial para plataformas
FPaD.
Procedencia: CD/DVD Num.
EP006.

Autora: Stockbyte.
Licencia: Uso Educativo
no comercial para
plataformas FPaD.
Procedencia: CD/DVD
Num. V43.

Autora: Photodisc.
Licencia: Uso educativo no
comercial para plataformas
pblicas de Formacin
Profesional a distancia.
Procedencia: CD-DVD Num.
V07.

Autora: Stockbyte.
Licencia: Uso educativo
no comercial para
plataformas pblicas de
Formacin Profesional a
distancia.
Procedencia: CD-DVD
Num. V43.

14/04/2015 16:40

eXe

50 de 50

Vous aimerez peut-être aussi