Académique Documents
Professionnel Documents
Culture Documents
MANUAL DE ESTADSTICA
Sistema de Gestin
de la Investigacin
UPN
MANUAL DE
ESTADSTICA
Profesor: MsC. Luis Alberto Rubio Jcobo
Este manual pretende ser un material de consulta bsica para docentes y estudiantes de
las diferentes carreras profesionales de nuestra universidad, en cuanto al uso adecuado
de la estadstica, requerida en diversos momentos del proceso investigativo.
LA ESTADSTICA .............................................................................................................................. 8
1. DEFINICIN. .................................................... 8
2. CLASIFICACIN DE LA ESTADSTICA ................................ 8
DISEOS DE INVESTIGACIN ........................................................................................................ 8
I.1. DISEOS DE INVESTIGACIN EN EL ENFOQUE CUANTITATIVO: ........... 8
I.1.1 DISEOS NO EXPERIMENTALES ............................... 9
A. DISEOS TRANSECCIONALES O TRANSVERSALES ............. 9
A.1. DISEOS EXPLORATORIOS ............................ 9
A2. DISEOS DESCRIPTIVOS .............................. 9
A3. DISEOS DESCRIPTIVOS ............................. 10
B. DISEOS LONGITUDINALES O EVOLUTIVOS .................. 10
B1. DISEOS DE TENDENCIA ............................. 11
B2. DISEOS DE EVOLUCIN DE GRUPO (cohorte) ........... 11
B3. DISEOS DE PANEL ................................. 11
I.1.2 DISEOS EXPERIMENTALES ................................. 11
A. DISEOS PRE-EXPERIMENTALES ........................... 12
A1. DISEO DE UN SOLO GRUPO CON UNA SOLA MEDICIN: ........... 12
A2. DISEO DE PREPRUEBA-POSPRUEBA CON UN SOLO GRUPO ....... 12
B. EXPERIMENTOS PUROS .................................. 12
B1. DISEO DE POSPRUEBA NICAMENTE Y GRUPO CONTROL ......... 12
B2. DISEO CON PREPRUEBA-POSPRUEBA Y GRUPO CONTROL ........ 12
B3. DISEO DE CUATRO GRUPOS DE SALOMN ..................... 13
B4. DISEOS EXPERIMENTALES DE SERIES CRONOLGICAS MLTIPLES . 13
B5. DISEOS FACTORIALES...................................... 13
C. CUASI-EXPERIMENTOS ................................... 13
C1. DISEO DE POSPRUEBA NICAMENTE Y GRUPOS INTACTOS13
C2. DISEO CON PREPRUEBA-POSPRUEBA Y GRUPOS INTACTOS ....... 14
DEFINICIONES ESTADSTICAS .................................................................................................... 14
1. UNIVERSO. .................................................... 14
2. POBLACIN. ................................................... 14
A. SEGN SU EXTENSIN: ....................................... 14
B. SEGN SU MBITO O NATURALEZA: ............................. 14
3. MUESTRA. .................................................... 14
4. UNIDAD DE ESTUDIO. ............................................ 14
5. VARIABLE. .................................................... 15
6. PARMETRO. .................................................. 15
2. CLASIFICACIN DE LA ESTADSTICA
La Estadstica se clasifica de la siguiente manera:
2.1. Estadstica Descriptiva
Es el rea de la Estadstica que describe y analiza una poblacin, sin pretender sacar
conclusiones de tipo general. Es decir, las conclusiones obtenidas son vlidas slo para
dicha poblacin.
2.2. Estadstica Inferencial
Es el rea de la Estadstica, cuyo propsito es inferir o inducir leyes de comportamiento de
una poblacin, a partir del estudio de una muestra. Es decir, las conclusiones obtenidas a
partir de una muestra, son vlidas para toda la poblacin.
PARTE I:
DISEOS DE INVESTIGACIN
Segn Hernndez, Fernndez y Baptista (2006), una vez que se ha realizado el planteamiento del
problema, se ha definido el alcance de la investigacin y se formularon las hiptesis, se debe
visualizar la manera prctica y concreta de responder a las interrogantes de investigacin, y
cumplir con los objetivos propuestos.
Para esto se debe seleccionar o desarrollar uno o ms diseos de investigacin y aplicarlos al
contexto particular de cada estudio.
El diseo se refiere al plan o estrategia concebida para obtener la informacin que se desea.
En el enfoque cualitativo, el investigador utiliza el diseo o diseos para analizar la
certeza de las hiptesis formuladas en un contexto en particular o para aportar evidencia
respecto a los lineamientos de la investigacin.
En el enfoque cuantitativo, la calidad de una investigacin se encuentra relacionada con
el grado en que se aplica el diseo tal y como fue preconcebido, aunque en algunos casos
el diseo se debe ajustar ante posibles cambios en la situacin.
Recoleccin de
datos nica
Ejemplos:
1. En las encuestas pre-electorales de opinin sobre las tendencias electorales de
la poblacin, su objetivo es describir en una eleccin especfica- el nmero de
electores que se inclinan por los diferentes candidatos contendientes, es decir se
centran en la descripcin de las preferencias del electorado.
A. DISEOS PRE-EXPERIMENTALES
B. EXPERIMENTOS PUROS
Los experimentos puros son aquellos que renen los dos requisitos para logar el
control y la validez interna: 1) grupos de comparacin, y 2) equivalencia de grupos.
C. CUASI-EXPERIMENTOS
En los diseos cuasi-experimentales tambin se manipulan deliberadamente, al
menos, una variable independiente para analizar su efecto y relacin con una o
ms variables dependientes. Se diferencian de los experimentos puros en el
grado de seguridad o confiabilidad que pueda tenerse sobre la equivalencia inicial
de los grupos. En estos diseos, los sujetos no se asignan al azar a los grupos
ni se emparejan, sino que dichos grupos ya estn formados antes del
experimento: son grupos intactos.
PARTE II:
DEFINICIONES ESTADSTICAS
1. UNIVERSO.
Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes, definidas en
forma general en un espacio y tiempo.
Ejemplo:
Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de de pacientes, conjunto de
clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos, conjunto de
documentos, etc.; de una determinada regin o zona en un tiempo determinado.
2. POBLACIN.
Es un conjunto grande y completo de individuos, elementos o unidades que presentan como
mnimo una caracterstica en comn y observable. Para definir una poblacin esta debe
contener los siguientes elementos: CONTENIDO, ESPACIO Y TIEMPO.
Al nmero de elementos de una poblacin de denota por N.
Una poblacin puede clasificarse de la siguiente manera:
A. SEGN SU EXTENSIN:
Poblacin Finita: es aquella que tiene un determinado nmero de elementos.
Poblacin Infinita: es aquella cuyos elementos no se pueden contar.
3. MUESTRA.
Es una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir que es
una coleccin de unidades de muestreo seleccionados de un marco muestral o de varios
marcos muestrales. Al nmero de elementos de la muestra se denota por n.
Una muestra tiene las siguientes caractersticas:
a. Es representativa.
b. Es adecuada.
c. Homognea.
4. UNIDAD DE ESTUDIO.
Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la
informacin. Es el individuo u objeto del cual se toman las mediciones u observaciones.
Ejemplos:
5. VARIABLE.
Una variable es una caracterstica de estudio de una poblacin. Una variable es lo que se
quiere evaluar en una investigacin. Las caractersticas toma diferentes valores que varan de
individuo a individuo o de objeto a objeto. Aquellas caractersticas que permanecen
inalterables en las unidades de estudio reciben el nombre de constantes.
Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X,
Y, Z; y los valores de las variables se designan con letras minsculas: xi , yi , etc.
Las variables se clasifican de la siguiente manera:
Por su relacin: Variable dependiente - Variable independiente.
Por su escala de medicin: Nominal Ordinal Intervalo Razn.
Por su naturaleza: Cuantitativas - Cualitativas.
Ejemplos:
Unidad de estudio Variable
Estudiante Peso, talla, edad, ci, nmero de hermanos,
raza, color de ojos, tipo de sangre, etc.
Empresa Ganancia, costos, produccin, nmero de
trabajadores, numero de computadoras, etc.
PYME Nmero de trabajadores, aos de
funcionamiento, ganancias, etc
Variable
Cualidad Cantidad
O o
Cualitativa Atributo Cuantitativa nmero
6. PARMETRO.
Es un valor, una cantidad, un indicador que se obtiene con informacin de la poblacin.
Dentro de estos tenemos:
a. El promedio poblacional
b. La varianza poblacional.
c. La proporcin poblacional, etc.
7. ESTIMADOR.
Es un valor, una cantidad, un indicador que se obtiene con informacin de la muestra. Dentro
de estos tenemos:
a. El promedio muestral.
b. La varianza muestral.
c. La proporcin muestral, etc.
OBSERVACIN:
La observacin es una tcnica que implica seleccionar ver y registrar sistemticamente, la
conducta y caractersticas de seres vivos, objetos o fenmenos. La observacin de la
conducta humana es una tcnica de recoleccin de datos muy utilizada que puede llevarse
a cabo de diferentes formas:
a. Observacin participativa: El observador participa en la situacin que observa
b. Observacin no participativa: El observador no participa en la situacin que observa
Las observaciones pueden servir para diferentes propsitos. Pueden dar informacin
adicional y ms confiable de la conducta de las u.e. que las entrevistas o los cuestionarios.
Los cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o
porque los entrevistados olvidan o no desean contestar algunas cosas. Con la observacin
se puede, entonces, verificar la informacin recolectada (especialmente sobre temas como
alcoholismo, drogadiccin, sida,) pero tambin puede ser una fuente primaria de
informacin (observacin sistemtica de los juegos de los nios).
La observacin de la conducta humana puede formar parte de algn estudio, pero como
consume tiempo se usa con mayor frecuencia en estudios de pequea escala.
ENTREVISTA:
La entrevista es una tcnica de recoleccin de datos que involucra el cuestionamiento oral
de los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas
durante la entrevista pueden ser registradas por escrito o grabadas en una cinta. La
entrevista puede conducirse con diferentes grados de flexibilidad.
Las entrevistas utilizan una cdula para asegurar que se discuten todos los puntos, pero
dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer
preguntas adicionales para obtener tanta informacin adicional como sea posible, Las
preguntas son abiertas y no hay restricciones para las respuestas.
Este mtodo poco estructurado de hacer las preguntas puede ser til para entrevistas
individuales o grupales con informantes claves.
Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o de la
situacin que esta investigando. Se aplica en estudios exploratorios y en los estudios de
caso.
ENCUESTAS:
Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo de
obtener informacin de una muestra de individuos. Una "encuesta" recoge informacin de
una "muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no
humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas).
Las encuestas pueden ser clasificadas por su mtodo de recoleccin de datos: las
encuestas por correo, telefnicas y entrevistas en persona son las ms comunes. En los
mtodos ms nuevos de recoger datos, la informacin se entra directamente a la
computadora ya sea por un entrevistador adiestrado o an por la misma persona
entrevistada. Un ejemplo bien conocido es la medicin de audiencias de televisin usando
PARTE III:
1. DEFINICIN DE MUESTREO
Es una herramienta de la investigacin cientfica, su funcin bsica es determinar qu parte
de la realidad en estudio (poblacin o universo) debe de examinarse con la finalidad de hacer
inferencias sobre el TODO de la que procede.
El muestreo estadstico es un enfoque sistemtico que se refiere al proceso de seleccin de
los elementos, sujetos o casos de una poblacin. Para que el muestreo est bien realizado es
necesario que los elementos escogidos representen bien a toda la poblacin. Si la muestra no
cumple este cometido se dice que la muestra es sesgada o tendenciosa; en el caso
contrario, cuando la muestra ha sido bien seleccionada, se habla de muestra representativa.
A. UNIDAD DE MUESTREO.
Es cada uno de los elementos que forma el marco muestral, que aparecen separados y
por una sola vez. Esta unidad a veces coincide con la unidad de anlisis.
Ejemplos:
En un estudio de presin arterial alta, la unidad de estudio es la persona adulta con hipertensin
y la unidad de muestreo es la familia.
En un estudio de parasitosis la unidad de estudio y la unidad de muestreo puede ser la familia.
En un estudio sobre mortalidad infantil, la unidad de estudio es el recin nacido y la unidad
muestral es la historia clnica de la madre gestante.
B. MARCO MUESTRAL.
Es una lista o registro actualizado de todas las unidades de la poblacin, de manera que
puedan ser ordenadas numricamente desde el primer elemento hasta el ltimo elemento
(N) de la poblacin. Las diferentes especificaciones que se tenga del marco muestral
definirn su alcance geogrfico, periodo de estudio y su fuente. De este marco muestral se
seleccionarn los elementos de la muestra.
Ejemplo:
Base de datos de pacientes atendidos en el Hospital Regional Docente. Ao 2000.
Historias Clnicas del Servicio de Pediatra del HRDT.
Directorio de los mdicos del Hospital
Plano de viviendas del distrito de Trujillo.
Listado de los alumnos matriculados en la UNT-2004.
Listado de las facturas de las ventas del primer trimestre de una Farmacia.
Listado de todas las farmacias del Departamento de La Libertad.
C. ERROR DE ESTIMACIN:
El error de estimacin es la diferencia que existe entre el valor de una estimacin muestral
y el valor del parmetro obtenido de la poblacin.
Esta clase de error es llamado tambin error de muestreo.
-E +
E
Ejemplo: x+z s+ -
1 /
2 x
st
Generalmente este error es desconocido, por lo tanto el investigador tienen fijar este error
(variacin mxima entre el estimador y el parmetro).
Esta diferencia recibe el nombre de Precisin del estimador o error tolerable.
Este error se expresar en valores absolutos: 2 aos, 3 aos o en trminos relativos:
5%, 8 %, 0.002.
D. ERROR NO MUESTRAL:
Estos errores, son llamados tambin errores ajenos al muestreo o errores de no muestreo.
No se pueden medir fcilmente, y aumentan a medida que aumenta el tamao de la
muestra. Los tipos de errores no muestrales que suelen presentarse son:
Definicin equivocada del problema,
Definicin defectuosa de la poblacin;
Marco muestral imperfecto o desactualizado,
La no-respuesta,
El sesgo de respuesta,
Sin embargo, los errores ajenos al muestreo pueden ser controlados mediante una
atencin cuidadosa en la definicin del problema, en la construccin de los instrumentos
de medicin (cuestionario) y en los detalles del trabajo de campo.
Estos errores tienen una presencia fuerte en las encuestas de opinin.
F. NIVEL DE ERROR:
Error Alfa ():
Es la probabilidad de rechazar incorrectamente una Hiptesis cuando es verdadera, a esta
probabilidad se le denomina VALOR P. Tambin se le llama error tipo I.
G. POTENCIA (1-):
Es la probabilidad de llegar a la conclusin de que haba una diferencia cuando
efectivamente as era.
4. TIPOS DE MUESTREO
A. MUESTREO PROBABILSTICO:
Procedimiento de Seleccin
El procedimiento de seleccin de una muestra estratificada consiste en:
(i)Dividir la poblacin en L estratos mutuamente excluyentes y colectivamente
exhaustivos, siendo (L>1). Cada estrato de la poblacin tendr N i unidades, y la
poblacin total consta de:
L
N Ni
i 1
Cualitativa Cuantitativa
VARIABLE
(Proporcin Poblacional) (Promedio Poblacional)
Z 2 P(1 P) Z 2S 2
POBLACIN INFINITA
(Cuando no se conoce N) n0 n0
E2 E2
Z 2 P(1 P) N Z 2S 2 N
POBLACIN FINITA n 2 n 2
(Cuando se conoce N) E ( N 1) Z 2 P(1 P) E ( N 1) Z 2 S 2
Columna
01-05 06-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50
Fila
01 54463 22662 65905 70639 79365 67382 29085 69831 47058 08186
02 15389 85205 18850 39226 42249 90669 96325 23248 60933 26927
03 85941 40756 82414 02015 13858 78030 16269 65978 01385 15345
04 61149 49440 11286 88218 58925 03638 52862 62733 33451 77455
05 05219 81619 10651 67079 92111 59888 84502 72095 83453 75577
06 41417 98326 87719 92294 46614 50948 64886 20002 97365 30976
07 28357 94070 20652 35774 16249 75019 21145 05217 47286 76305
08 17783 00015 10806 83091 91530 36466 39981 62481 49177 75779
09 40950 84820 29881 85966 62800 70326 84740 62660 77379 90279
10 82995 64157 66164 41180 10089 41757 78258 96448 88629 37231
11 96574 17676 55659 44105 47361 34833 86679 23930 53249 27083
12 34754 88040 53364 71726 45690 66334 60332 22554 90600 71113
13 06318 73403 49927 57715 50423 67372 63116 48888 21515 80183
14 62111 52820 07243 79931 89292 84767 85693 73947 22278 11551
15 47534 09243 67879 00544 23410 12740 02540 54440 32949 13491
16 98614 75993 84460 62846 59844 14922 48730 73443 48167 34770
17 24856 03648 44898 09351 98795 18644 39765 71058 90368 44104
18 96887 12479 80621 66223 86085 78285 02432 53342 42856 94771
19 90801 21472 42815 77408 37390 76766 52615 32141 30268 18106
20 55165 77312 83666 36028 28420 70219 81369 41943 47366 41067
21 75884 12952 84318 95108 72305 64620 91318 89872 45375 85436
22 16777 37116 58550 42958 21460 43910 01175 87894 81378 10620
23 46230 43877 80207 88877 89380 32992 91380 03164 98656 59337
24 42020 66892 46134 01432 94710 23474 20423 60137 60609 13119
25 81007 00333 39693 28039 10154 95425 39220 19774 31782 49037
26 68089 01122 51111 72373 06902 74373 96199 97017 41273 21546
27 20411 67081 89950 16944 93054 87687 66930 87236 77054 33848
28 58212 13160 06468 15718 82627 76999 05999 58680 96739 63700
29 70577 42866 24969 61210 76046 42054 42054 12696 93758 03283
30 94522 74358 71659 62038 79643 44741 44741 05437 39038 13163
31 42626 86819 85651 88780 17401 03252 99547 32404 17918 62880
32 16051 33763 57194 16752 54450 19031 58580 47629 54132 60631
33 08244 27647 33851 44705 94211 46716 11738 55784 95374 72655
34 59497 04392 09419 89964 51211 04894 72882 17805 21896 83864
35 97155 13428 40293 09985 58434 01412 69124 82171 59058 82859
36 98409 66162 95763 47420 20792 61527 20441 39435 11859 41567
37 45476 84882 65109 96597 25930 66790 65706 61203 53634 22557
38 89300 69700 50741 30329 11658 23166 05400 66669 48708 03887
39 50051 95137 91631 66315 91428 12275 24816 68091 71710 33258
40 31753 85178 31310 89642 98364 02306 24617 09609 83942 22716
41 79152 53829 77250 20190 56535 18760 69942 77448 32278 48805
42 44560 38750 86635 56540 64900 42912 13953 79149 18710 68618
43 68328 83378 63369 71381 39564 05615 42451 64559 97501 65747
44 46939 38689 58625 08342 30459 85863 20781 09284 26333 91777
45 83544 86141 15707 96256 23068 13782 08467 89467 93842 55349
46 91621 00881 04900 54224 46177 55309 17852 27491 89415 23466
47 91896 67126 04151 03795 59077 11848 12630 98375 52068 60142
48 55751 62515 21108 80830 02263 29303 37204 96926 30506 09808
49 85156 87689 95493 88842 00664 55017 55539 17771 69448 87530
50 07521 56898 12236 60277 39102 62315 12239 07105 11844 01117
PUNTO DE ARRANQUE:
A (a , b)
PROCEDIMIENTO
El procedimiento de seleccin de una muestra sistemtica consiste en:
Tener el Marco Muestral cuyas unidades deben ser ordenados en magnitud de
acuerdo con algn esquema (poblacin ordenada).
En base al orden se establece la enumeracin desde 1 hasta N.
Determinar el intervalo de seleccin k, k debe ser el mximo entero de N/n.
Seleccionar un nmero aleatorio entre 1 y k (arranque aleatorio).
Sea a = arranque aleatorio, entonces los elementos de la muestra sistemtica son:
a, k + a, 2k + a , .................................................., (n - 1)k + a
PARTE IV:
Cuando se va a analizar los datos obtenidos a travs de diseos descriptivos, las tcnicas
estadsticas a utilizar son las siguientes:
1. Cuadros de Distribucin de frecuencias
2. Grficos estadsticos
3. Medidas estadsticas descriptivas
1.1. DEFINICIN:
Un cuadro de distribucin de frecuencias, es una tabla resumen de un conjunto de
datos que muestra el comportamiento o distribucin de la variable en estudio en forma
rpida y resumida.
An cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta,
generalmente es comn seguir algunos pasos que de alguna forma homogenizan
criterios y ayudan a los fines didcticos.
Para realizar este anlisis se tienen que tener en cuenta el tipo de variable que se est
evaluando.
b. Intervalos de clase:
Los intervalos son subconjuntos de la recta real Ron que estn definidos por un
lmite menor o inferior Li y un lmite mayor o superior Ls.
c. Frecuencia:
d. Marca de clase:
Se denota por Yi. Es el promedio de los valores correspondientes a los lmites
inferior y superior de cada uno de los intervalos determinados.
2.1 DEFINICIN
Excel puede crear grficos a partir de datos previamente seleccionados en una hoja de
clculo. El usuario puede incrustar un grfico en una hoja de clculo, o crear el grfico
en una hoja especial para grficos. En cada caso el grfico queda vinculado a los datos
a partir de los cuales fue creado, por lo que si en algn momento los datos cambian, el
grfico se actualizar de forma automtica. Los grficos de Excel contienen muchos
objetos, ttulos, etiquetas en los ejes que pueden ser seleccionados y modificados
Para crear un grfico con el Asistente para Grficos, se deben seguir los siguientes
pasos:
1. Seleccionar los datos a representar.
2. Ejecutar el comando Insertar / Grfico o hacer clic en el botn
Luego seleccionar el rango de los datos a evaluar, sealando correctamente las series
que estn evaluando.
Luego debemos configurar los aspectos que conciernen a la presentacin del grfico,
aportando una vista preliminar del mismo. As, se determinan el ttulo, las inscripciones
de los ejes, la apariencia de stos, la leyenda, la aparicin o no de tabla de datos y los
rtulos. Las opciones de <Atrs, Siguiente> y Finalizar son las mismas que en los
otros cuadros.
3. MEDIDAS ESTADSTICAS
La estadstica descriptiva es una tcnica que consiste en obtener indicadores que describen el
comportamiento de un conjunto de datos. Dentro de estas medidas estadsticas tenemos:
A. Las medidas de Posicin: Dentro de estas tenemos:
a. Medidas de tendencia central: Media, Moda, Mediana.
b. Medidas de localizacin: cuartiles, deciles y percentiles.
B. Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de variacin.
C. Las medidas de deformacin: asimetra y kurtosis.
A. MEDIA ARITMTICA:
Se denota por x
Es la medida estadstica ms fcil de calcular.
La media o promedio es el punto central de un conjunto de datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
B. MEDIANA:
Se denota por Me.
Es un valor que divide al conjunto de datos en dos partes iguales, es decir,
cada segmento tiene el 50% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
C. MODA:
Se denota por Mo.
La moda es el valor que ms se repite en un conjunto de datos.
En un conjunto de datos se presentan los siguientes casos:
a. No existir datos Amodal
b. 1 moda Unimodal.
c. 2 modas Bimodal
d. 3 a ms modas Multimodal
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
A. CUARTILES:
Se denotan por Qk, donde k=1,2,3
Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir,
cada sector tiene el 25% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
B. DECILES:
Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9
Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir,
cada sector tiene el 10% de los datos.
C. PERCENTILES:
Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99
Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir,
cada sector tiene el 1% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
A. RANGO:
Se denota por R y la medida de variabilidad ms fcil de calcular.
Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto
de datos.
C. DESVIACIN ESTANDAR:
Mide la variabilidad de un conjunto de datos respecto a su valor central pero en
unidades originales.
Esta es la medida de variabilidad que tiene una interpretacin lgica.
Se obtiene al sacar la raz cuadrada de la varianza.
D. COEFICIETE DE VARIACIN:
Se denota por C.V.
El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento
homogneo o heterogneo.
Para llegar a determinar la homogeneidad se compara con un valor
convencional del 33%.
Si el CV 33% el conjunto de datos tiene un comportamiento homogneo.
Si el CV > 33% el conjunto de datos tiene un comportamiento heterogneo.
A. ASIMETRIA:
La asimetra se entiende como la deformacin horizontal de un conjunto de
datos.
Para conocer esta asimetra se calcula el coeficiente de asimetra As.
En un conjunto de datos pueden presentar los siguientes casos:
a. As= 0, el conjunto de datos es simtrica.
b. As<0, el conjunto de datos es asimtrica negativa.
c. As>0, el conjunto de datos es asimtrica positiva.
X Mo 3( X Me) Q3 2Q2 Q1
As As As
S S Q3 Q1
B. KURTOSIS:
Se entiende por Kurtosis a la deformacin vertical de un conjunto de datos, es
decir, mide el apuntamiento o achatamiento de un conjunto de datos.
Para conocer qu tipo de asimetra tiene un conjunto de datos, se utilizan las
siguientes formulas:
M4
K2 3
( s) 2
B.3 Kurtosis en funcin de los cuantiles:
Si K3>0.263, el conjunto de datos es leptocrtica.
Si K3=0.263, el conjunto de datos es mesoctica.
Si K3<0.263, el conjunto de datos es platicrtica.
Q3 Q1
As
2( P90 P10 )
1. ANALISIS DE CORRELACIN:
n n n
n X iYi X i Yi
r n
i 1
n
i 1
n
i 1
n
n X i2 ( X i ) 2 n Yi 2 ( Y1 ) 2
i 1 i 1 i 1 i 1
Interpretacin:
NEGATIVA POSITIVA
2. ANLISIS DE REGRESIN
Esta relacin funcional entre las variables, es una ecuacin matemtica de la forma
Y= A + B X, que recibe el nombre tambin de Funcin de Regresin o Modelo de
Regresin.
PASOS A SEGUIR:
i 1 i 1
Y = A + B (Xo)
Y 0 1 X1 2 X 2 ... K X K
Para encontrar este modelo, es decir, estimar sus coeficientes tambin se utiliza el
Mtodo de los Mnimos Cuadrados Ordinarios.
Los elementos de este modelo de regresin mltiple son los siguientes:
Y es la variable dependiente o variable respuesta.
A las Xs se le llama variables independientes.
Bs se les llama coeficientes de regresin.
En el ARLM se prueban las siguientes Hiptesis:
Ho: Los Bs son iguales a cero (No hay efecto de las variables independientes en Y);
H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y).
Para dar respuesta a esta Hiptesis se utiliza el anlisis de varianza.
INFERENCIA ESTADSTICA
ESTIMACIN ESTADSTICA
A. ESTIMACIN PUNTUAL:
Es aquel nico valor que se obtiene de la muestra, es decir, que para su clculo se debe tener
informacin muestral. Las formulas para calcular o realizar estas estimaciones son las
siguientes:
PARMETRO 2 P
n n
ESTIMACIN xi (x x)i
2
P p
a
PUNTUAL x i 1
s
2 2 i 1
n
n n 1
B. ESTIMACIN INTERVLICA:
Al realizar una estimacin, siempre se va a cometer un error. Entonces, cuando estimamos un
parmetro nunca va a ser exacto, ese valor ser mayor o menor al verdadero. Entonces se
obtendr un intervalo de valores posibles. Ese intervalo se llama estimacin intervlica. A esa
diferencia mayor o menor se llama error de estimacin, el cual est en relacin directa con la
variabilidad del estimador y el nivel de confianza determinado por el investigador. La
estimacin intervlica para un parmetro en general, est dada por:
Z / 2 Z / 2
Error de Estimacin Error de estimacin
A. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas
poblacionales se CONOCEN:
12 22
1 2 : ( x1 x 2 ) Z / 2
n1 n2
B. Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas
poblacionales DESCONOCIDAS:
1 1
1 2 : ( x1 x2 ) t( / 2, n n 2) sc2 ( )
1 2
n1 n2
Donde :
(n 1 1)s 12 (n 2 1)s 22
sc
2
, se llama varianza mancomunada
n1 n 2 2
IV. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES:
PRUEBA DE HIPTESIS
Para realizar un anlisis de pruebas de hiptesis hay que conocer algunas definiciones
preliminares que debemos conocer:
A. DEFINICIONES PRELIMINARES:
a. HIPTESIS: Es una respuesta a priori a un problema.
b. HIPTESIS ESTADSTICA: En un enunciado acerca del valor de un parmetro
poblacional.
c. PRUEBA DE HIPTESIS: Es un procedimiento basado en la informacin muestral y en
la teora de probabilidad, para determinar si una hiptesis estadstica debe ser aceptada
o rechazada.
B. CLASES DE HIPTESIS:
a. HIPTESIS NULA.
Se denota por Ho.
Es una afirmacin o enunciado tentativo que se realiza acerca del valor de un
parmetro poblacional.
Por lo comn es una afirmacin acerca del parmetro de poblacin cuando toma
un valor especfico.
b. HIPTESIS ALTERNATIVA.
Se denota por H1.
Es una afirmacin o enunciado contraria a la presentada en la hiptesis nula.
Error Tipo I:
Se comete este error cuando se rechaza la hiptesis nula, cuando es verdadera.
Se denota por = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:
Se comete este error cuando se acepta la hiptesis, cuando es falsa.
Se denota por = P(Aceptar Ho/Ho es falsa)
Decisin
Ho Verdadera Ho Falsa
posible
Aceptar Ho Decisin Error Tipo II
correcta
Rechazar Ho Error tipo I Decisin Correcta
PASOS:
Plantear la hiptesis nula y alternativa.
Especificar el nivel de significancia (o confianza) que se va a
utilizar.(Generalmente la plantea el investigador)
Elegir el estadstico de prueba que debe ser especificado en trminos de
un estimador del parmetro a probar.
Establecer el valor o valores crticos para rechazar o aceptar Ho. (Se
encuentran en la tabla de probabilidades)
Determinar la Regin de Aceptacin y de Rechazo, en funcin a los
valores crticos y tomar la decisin de aceptar o rechazar Ho.
Dar la conclusin respectiva
Para resolver prueba de hiptesis con EXCEL hay que tener presente lo siguiente. En Excel
solamente se puede evaluar hiptesis de comparacin de medias en la cual se puede utilizar
la prueba de T de Student o la prueba Z.
Se utilizara la prueba T de Student cuando la varianza se desconoce y adems la muestra
es pequea (n30). Aqu hay que distinguir dos casos:
a. Cuando se supone que la varianza es igual en ambos grupos.
b. Cuando se supone que la varianza es diferente en ambos grupos.
PRUEBA Z:
Se utilizar la prueba Z cuando la varianza se conoce y cuando la muestra es grande (n>30).