Vous êtes sur la page 1sur 26

TEMA 10

Estimadores
Puntuales y
De Confianza

Facilitador:

Alumna:

2015

INTRODUCCIN
El presente trabajo se hace con el propsito de ampliar nuestro conocimiento acerca
de la estadstica pero especficamente de conocer los estimadores puntuales y de
confianza para lo cual se desarrollaran ciertos puntos como lo son:

Estimadores puntuales de la media muestral


Proporcin muestral
Varianza muestral
T de student
Ji cuadrado
Intervalo de confianza
Prueba de hiptesis
Regresin lineal de dos variables
Regresin lineal mltiple
Medidas de correlacin

La distribucin de probabilidad de t se public por primera vez en 1908 en un artculo de


W. S. Gosset. En esa poca, Gosset era empleado de una cervecera irlandesa que
desaprobaba la publicacin de investigaciones de sus empleados. Para evadir esta
prohibicin, public su trabajo en secreto bajo el nombre de "Student". En consecuencia, la
distribucin t normalmente se llama distribucin t de Student, o simplemente distribucin t.
Para derivar la ecuacin de esta distribucin, Gosset supone que las muestras se seleccionan
de una poblacin normal. Aunque esto parecera una suposicin muy restrictiva, se puede
mostrar que las poblaciones no normales que poseen distribuciones en forma casi de
campana an proporcionan valores de t que se aproximan muy de cerca a la distribucin t.

Qu es una estimacin?
Cuando queremos realizar un estudio de una poblacin cualquiera de la que
desconocemos sus parmetros, por ejemplo su media poblacional o la probabilidad de xito
si la poblacin sigue una distribucin binomial, debemos tomar una muestra aleatoria de
dicha poblacin a travs de la cual calcular una aproximacin a dichos parmetros que
desconocemos y queremos estimar. Bien, pues esa aproximacin se llama estimacin.
Adems, junto a esa estimacin, y dado que muy probablemente no coincida con el valor
real del parmetro, acompaaremos el error aproximado que se comete al realizarla.
Estimacin puntual
Una estimacin puntual del valor de un parmetro poblacional desconocido (como
puede ser la media , o la desviacin estndar ), es un nmero que se utiliza para
aproximar el verdadero valor de dicho parmetro poblacional. A fin de realizar tal
estimacin, tomaremos una muestra de la poblacin y calcularemos el parmetro muestral
asociado (x para la media, s para la desviacin estndar, etc.). El valor de este parmetro
muestral ser la estimacin puntual del parmetro poblacional.
Por ejemplo, supongamos que la compaa Sonytron desea estimar la edad media de los
compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y
calculan la media de esta muestra, este valor ser un estimador puntual de la media de la
poblacin.

ESTIMACIONES DE PUNTO Y ESTIMACIONES DE


INTERVALO, SU FIABILIDAD:
Una estimacin de un parmetro de la poblacin dada por un solo
nmero se llama una estimacin de punto del parmetro. Una estimacin de un
parmetro de la poblacin dada por dos puntos, entre los cuales se pueden
considerar encajado al parmetro, se llama una estimacin del intervalo del
parmetro.

Las estimaciones de intervalo que indican la precisin de una estimacin y son por tanto
preferibles a las estimaciones de punto

Ejemplo:
Si decimos que una distancia s a medido como 5.28 metros (m), estamos dando una
estimacin de punto. Por otra parte, si decimos que la distancia es 5.28 0.03 m, (sea, que
est entre 5.25 y 5.31 m), estamos dando una estimacin de intervalo
El margen de error o la percepcin de una estimacin nos informa su fiabilidad.

Estimacin para la Media


Es conocido de nosotros durante este curso, que en base a la distribucin muestral de
medias que se gener en el tema anterior, la frmula para el clculo de probabilidad es la

siguiente:
. Como en este caso no conocemos el parmetro y lo queremos
estimar por medio de la media de la muestra, slo se despejar de la formula anterior,
quedando lo siguiente:

De esta frmula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de
confianza establecido. Pero en ocasiones se desconoce
por lo que en esos casos lo
correcto es utilizar otra distribucin llamada "t" de student si la poblacin de donde
provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la
desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la
poblacin (s= ).
Ejemplos:
1. Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de
una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentracin
media de zinc en el ro. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:
La estimacin puntual de
95% es 1.96, por lo tanto:

es = 2.6. El valor de z para un nivel de confianza del

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo


ser ms amplio:

El intervalo de confianza proporciona una estimacin de la presicin de nuestra


estimacin puntual. Si
es realmente el valor central de intervalo, entonces
estima sin error. La mayor parte de las veces, sin embargo, no ser exactamente
igual a y la estimacin puntual es errnea. La magnitud de este error ser el valor
absoluto de la diferencia entre y , y podemos tener el nivel de confianza de que

esta diferencia no exceder

Como se puede observar en los resultados del ejercicio se tiene un error de


estimacin mayor cuando el nivel de confianza es del 99% y ms pequeo cuando
se reduce a un nivel de confianza del 95%.
2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una
muestra de 30 focos tiene una duracin promedio de 780 horas, encuentre un
intervalo de confianza de 96% para la media de la poblacin de todos los focos que
produce esta empresa.
Solucin:

Con un nivel de confianza del 96% se sabe que la duracin media de los focos que
produce la empresa est entre 765 y 765 horas.

ESTIMACIN DE UNA PROPORCIN


Un estimador puntual de la proporcin P en un experimento binomial est dado por la
estadstica P=X/N, donde x representa el nmero de xitos en n pruebas. Por tanto, la
proporcin de la muestra p =x/n se utilizar como estimador puntual del parmetro P.
Si no se espera que la proporcin P desconocida est demasiado cerca de 0 de 1, se puede
establecer un intervalo de confianza para P al considerar la distribucin muestral de
proporciones.

Al despejar P de esta ecuacin nos queda:

En este despeje podemos observar que se necesita el valor del parmetro P y es


precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporcin de la
muestra p siempre y cuando el tamao de muestra no sea pequeo.

Cuando n es pequea y la proporcin desconocida P se considera cercana a 0 a 1, el


procedimiento del intervalo de confianza que se establece aqu no es confiable, por tanto,
no se debe utilizar. Para estar seguro, se debe requerir que np nq sea mayor o igual a 5.
El error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de
confianza de que esta diferencia no exceder

Ejemplos:
1. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas
amplias para evaluar la funcin elctrica de su producto. Todos los reproductores de
discos compactos deben pasar todas las pruebas antes de venderse. Una muestra
aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms
pruebas. Encuentre un intervalo de confianza de 90% para la proporcin de los
reproductores de discos compactos de la poblacin que no pasan todas las pruebas.
Solucin:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645

0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporcin de discos defectuosos
que no pasan la prueba en esa poblacin est entre 0.0237 y 0.0376.

VARIANZA DE UN ESTIMADOR
Otra propiedad importante de un estimador es su varianza (o su raz cuadrada, la desviacin
estndar).
La importancia de la desviacin estndar es que nos permite darle un sentido numrico a la
cercana del valor del estimador a su valor esperado.
Entre menor sea la desviacin estndar (o la varianza) de un estimador, ser ms probable
que su valor en una muestra especfica se encuentre ms cerca del valor esperado. Para
aclarar esto, considere dos estimadores T1 y T2, suponga que ambos son instigados y
suponga que la varianza de T1 es menor que la de T2 Qu quiere decir esto? Simplemente
que en un entorno fijo del valor del parmetro, los valores de T1 son ms probables que los
de T2. O sea que vamos a encontrar a T1 ms cerca del valor del parmetro que a T2. Esto
hace que nuestras preferencias estn con T1.
Cuando un estimador tiene una varianza menor que otro decimos que el estimador es ms
eficiente.
En el pizarrn vemos algunos estimadores instigados:

La proporcin muestra como estimador de la proporcin poblaciones.

La media muestra como estimador del valor esperado poblaciones.

La varianza de la muestra como estimador de la varianza de la poblacin.

DISTRIBUCION "t DE STUDENT"


Supngase que se toma una muestra de una poblacin normal con media
y varianza
Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la

distribucin
es una distribucin normal estndar. Supngase que la varianza de
2
la poblacin
es desconocida. Qu sucede con la distribucin de esta estadstica si se
reemplaza
por s? La distribucin t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribucin t son
respectivamente.

=0 y

para

>2,

La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la


distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y
unimodales, y el valor mximo de la ordenada se alcanza en la media =0 Sin embargo, la
distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es
mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a
infinito, la forma lmite de la distribucin t es la distribucin normal estndar.

Propiedades de las distribuciones t


1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, est ms dispersa que la curva normal estndar z.
3. A medida que

aumenta, la dispersin de la curva t correspondiente disminuye.

4. A medida que
, la secuencia de curvas t se aproxima a la curva normal
estndar, por lo que la curva z recibe a veces el nombre de curva t con gl =
La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con

grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media

y desviacin estndar
t con

. Entonces la variable aleatoria

tiene una distribucin

= n-1 grados de libertad.

La distribucin de probabilidad de t se public por primera vez en 1908 en un artculo de


W. S. Gosset. En esa poca, Gosset era empleado de una cervecera irlandesa que
desaprobaba la publicacin de investigaciones de sus empleados. Para evadir esta
prohibicin, public su trabajo en secreto bajo el nombre de "Student". En consecuencia, la
distribucin t normalmente se llama distribucin t de Student, o simplemente distribucin t.
Para derivar la ecuacin de esta distribucin, Gosset supone que las muestras se seleccionan
de una poblacin normal. Aunque esto parecera una suposicin muy restrictiva, se puede
mostrar que las poblaciones no normales que poseen distribuciones en forma casi de
campana an proporcionan valores de t que se aproximan muy de cerca a la distribucin t.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la muestra
y siempre es mayor a uno. nicamente cuando el tamao de la muestra tiende a infinito las
dos distribuciones sern las mismas.
Se acostumbra representar con t el valor t por arriba del cual se encuentra un rea igual
a . Como la distribucin t es simtrica alrededor de una media de cero, tenemos
; es decir, el valor t que deja un rea de

a la derecha y por tanto un

rea de
a la izquierda, es igual al valor t negativo que deja un rea de
derecha de la distribucin. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.

en la cola

Para encontrar los valores de t se utilizar la tabla de valores crticos de la distribucin t del
libro Probabilidad y Estadstica para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con
= 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por
tanto un rea de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que
se tiene que hacer la resta de
. La manera de encontrar el valor de t es buscar el
valor de
en el primer rengln de la tabla y luego buscar los grados de libertad en la
primer columna y donde se intercepten

se obtendr el valor de t.

Ejemplo: Encuentre la probabilidad de t0.025 < t < t0.05.


Solucin:

Como t0.05 deja un rea de 0.05 a la derecha, y t 0.025 deja un rea de 0.025 a la izquierda,
encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t0.025 < t < t0.05) = 0.925

DISTRIBUCION JI-CUADRADA (X2)


En realidad la distribucin ji-cuadrada es la distribucin muestral de s 2. O sea que si se
extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula
su varianza, se obtendr la distribucin muestral de varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el
estadstico X2. Si se elige una muestra de tamao n de una poblacin normal con varianza
, el estadstico:

Tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1 grados de
libertad y se denota X2 (X es la minscula de la letra griega ji). El estadstico ji-cuadrada
est dado por:

Donde n es el tamao de la muestra, s2 la varianza muestral y


la varianza de la
poblacin de donde se extrajo la muestra. El estadstico ji-cuadrada tambin se puede dar
con la siguiente expresin:

Propiedades de las distribuciones ji-cuadrada


1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribucin X 2 depende del gl=n-1. En consecuencia, hay un
nmero infinito de distribuciones X2.
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simtricas. Tienen colas estrechas que se extienden a la
derecha; esto es, estn sesgadas a la derecha.
5. Cuando n>2, la media de una distribucin X2 es n-1 y la varianza es 2(n-1).

6. El valor modal de una distribucin X2 se da en el valor (n-3).


La siguiente figura ilustra tres distribuciones X 2. Note que el valor modal aparece en el
valor (n-3) = (gl-2).

La funcin de densidad de la distribucin X2 est dada por:

para x>0
La tabla que se utilizar para estos apuntes es la del libro de probabilidad y
estadstica de Walpole, la cual da valores crticos
(gl) para veinte valores especiales de
. Para denotar el valor crtico de una distribucin X 2 con gl grados de libertad se usa el
smbolo
(gl); este valor crtico determina a su derecha un rea de
bajo la curva X2
y sobre el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en
el lado izquierdo y
a o largo del lado superior de la misma tabla.

INTERVALOS DE CONFIANZA.
1. Intervalo de confianza para (media) con (desviacin estandar) conocida.

Un vendedor mayorista de partes automotrices necesita una estimacin de la vida media


que puede esperar de los limpiaparabrisas en condiciones normales de manejo. La
administracin de la empresa ya ha determinado que la desviacin estndar de la vida til
de la poblacin es de seis meses. Supongamos que se selecciona una sola muestra aleatoria
de 100 limpiaparabrisas, y obtenemos que la vida media de estos 100 limpiaparabrisas es de
21 meses. Se pide calcular un intervalo de confianza del 95% para la vida media de la
poblacin de los limpiaparabrisas.
Tenemos X como la distribucin de la vida til en meses de la poblacin de
limpiaparabrisas, no sabemos qu distribucin tiene, al igual que desconocemos su media.
En este caso s conocemos la desviacin estndar poblacional.

La media muestral
normal:

por el teorema central del lmite se va a aproximar la distribucin

Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la
poblacin de limpiaparabrisas, es decir para

, es decir que el valor Z de la tabla de la normal estndar


que deja un rea de 0,9 entre Z Y +Z es Z=1,96. O de otro modo, como el nivel de
confianza es 0,9, = 0,05, entonces el valor Z que deja su derecha un rea de
y a la izquierda de Z un rea de
El error mximo de estimacin es la mitad de la longitud del intervalo,

Con una confianza del 95%, la vida media de la poblacin de limpiaparabrisas que vende
este mayorista est entre 19,824 meses y 22,176 meses.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de todos los intervalos van a incluir a la vida media poblacional
en meses de todos los parabrisas que vende este mayorista.
2. Intervalo de confianza para con desconocida.
El administrador de una planta industrial generadora de energa desea estimar, por
intervalo, la cantidad de carbn que se consumi por termino medio semanalmente durante

ao pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400
toneladas, la desviacin estndar muestral 700 toneladas. Cul ser el intervalo de
confianza del 95% para el consumo medio semanal durante el ao pasado? (Supongamos
normalidad).
Tenemos X como la distribucin de toneladas de carbn consumidas cada semana del ao
pasado por la planta de energa y su media y su desviacin estndar desconocidas

Aunque n < 30, suponemos que la media muestral,

, sigue una distribucin normal

Para estimar la desviacin estndar poblacional vamos a utilizar la desviacin estndar


muestral S que es 700 toneladas.
Por lo tanto, el intervalo de confianza del 95% para el consumo promedio de toneladas de
carbn en cada semana del ao pasado, es decir para , ser:

Utilizamos la t-Student porque la desviacin estndar poblacional es desconocida. En las


tablas,
, una t-Student con 10 1 = 9 grados de libertad que deja
su derecha un rea de 0,025. =0,05 porque el nivel de confianza es de 1- = 0,95
Con una confianza del 95%, el consumo promedio semanal de carbn durante el ao
pasado por esta planta de energa estar entre 10.899 toneladas y 11.901 toneladas.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de todos los intervalos van a incluir al consumo promedio
poblacional de toneladas de carbn por semana durante el ao pasado por la planta de
energa.
3. Intervalo de confianza para la probabilidad de xito p en una binomial.
Durante un ao y medio las ventas han estado disminuyendo de manera coherente en los
1.500 establecimientos de una cadena de comida rpida. Un empresa de consultora ha
determinado que el 30% de una muestra de 95 sucursales tiene claros signos de una mala
administracin. Construir un intervalo de confianza del 95% para esta porcin.
A la poblacin de todos los establecimientos de sta cadena de comida rpida le vamos a
llamar X que seguir una binomial con probabilidad de xito, probabilidad de tener signo
de mala administracin, p desconocida. A fin de estimar dicho parmetro, se toma una
muestra de tamao n = 95 y definimos P como la proporcin de xitos en la muestra. En
este caso P es 0,3 y 1- P= 0,7.

Como n > 20, n p 5 y n(1 p) 5, entonces la distribucin X es aproximadamente


normal, i.e.:

Como p es desconocida, la aproximaremos por p que es la estimacin puntual de p.


Entonces, la proporcin muestral de xitos, que la hemos utilizado para estimar la
proporcin de la poblacin tendr la siguiente distribucin:

Por lo tanto la estimacin del error estndar de la proporcin de establecimientos que tiene
claros signos de mala ser 0,057.
El intervalo de confianza del 95% para la probabilidad de xito poblacional p viene dado
por:
Donde
es el valor z*, de manera que el 95% del rea bajo la curva
normal se incluye entre 1,96 y 1,96.
Por lo tanto, con un nivel de confianza del 95%, la proporcin de establecimientos de esta
cadena de comida rpida que tiene mala administracin estar entre 0,20788 y 0,39212.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de
establecimientos con mala administracin

PRUEBAS DE HIPTESIS
Otra manera de hacer inferencia es haciendo una afirmacin acerca del valor que el
parmetro de la poblacin bajo estudio puede tomar. Esta afirmacin puede estar basada en
alguna creencia o experiencia pasada que ser contrastada con la evidencia que nosotros
obtengamos a travs de la informacin contenida en la muestra. Esto es a lo que llamamos
Prueba de Hiptesis
Una prueba de hiptesis comprende cuatro componentes principales:
-Hiptesis Nula

-Hiptesis Alternativa
-Estadstica de Prueba
-Regin de Rechazo
La Hiptesis Nula, denotada como H0 siempre especifica un solo valor del parmetro de la
poblacin si la hiptesis es simple o un conjunto de valores si es compuesta (es lo que
queremos desacreditar)

La Hiptesis Alternativa, denotada como H1 es la que responde nuestra pregunta, la que se


establece en base a la evidencia que tenemos. Puede tener cuatro formas:

Como las conclusiones a las que lleguemos se basan en una muestra, hay posibilidades de
que nos equivoquemos.
Dos decisiones correctas son posibles:
Rechazar H0 cuando es falsa
No Rechazar H0 cuando es verdadera.
Dos decisiones incorrectas son posibles:
Rechazar H0 cuando es verdadera
No Rechazar H0 cuando es falsa.
Tamao de los errores al tomar una decisin incorrecta en una Prueba de Hiptesis

La Probabilidad de cometer un error Tipo I se conoce como Nivel de Significancia, se


denota como y es el tamao de la regin de rechazo El complemento de la regin de
rechazo es 1 y es conocido como el Coeficiente de Confianza
En una prueba de Hiptesis de dos colas la regin de no rechazo corresponde a un intervalo
de confianza para el parmetro en cuestin.
La Regin de Rechazo es el conjunto de valores tales que si la prueba estadstica cae
dentro de este rango, decidimos rechazar la Hiptesis Nula
Su localizacin depende de la forma de la Hiptesis Alternativa: Si
entonces la regin se encuentra en la cola derecha de la distribucin de la estadstica de
prueba.
Si
entonces la regin se encuentra en la cola izquierda de la distribucin
de la estadstica de prueba

Si
entonces la regin se divide en dos partes, una parte estar en la cola
derecha de la distribucin de la estadstica de prueba y la otra en la cola izquierda de la
distribucin de la estadstica de prueba.
Conclusiones de una Prueba de Hiptesis
Si rechazamos la Hiptesis Nula, concluimos que hay suficiente evidencia estadstica
para inferir que la hiptesis nula es falsa
Si no rechazamos la Hiptesis Nula, concluimos que no hay suficiente evidencia
estadstica para inferir que la hiptesis nula es falsa

Estadstica de Prueba
La Estadstica de Prueba es una estadstica que se deriva del estimador puntual del
parmetro que estemos probando y en ella basamos nuestra decisin acerca de si rechazar o
no rechazar la Hiptesis Nula.

Ejemplo:
Siempre se calcula considerando la Hiptesis Nula como si fuera verdadera.

REGRESIN LINEAL SIMPLE


Slo se maneja una variable independiente, por lo que slo cuenta con dos parmetros. Son
de la forma:

donde

es el error asociado a la medicin del valor

y siguen los supuestos de modo que

(media cero, varianza constante e igual a un

con

).

Anlisis

Dado el modelo de regresin simple, si se calcula la esperanza (valor esperado) del valor Y,
se obtiene:

Derivando respecto a

e igualando a cero, se obtiene:

Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente


solucin para ambos parmetros:

La interpretacin del parmetro medio

es que un incremento en Xi de una unidad, Yi

incrementar en

REGRESIN LINEAL MLTIPLE


La regresin lineal permite trabajar con una variable a nivel de intervalo o razn. De la
misma manera, es posible analizar la relacin entre dos o ms variables a travs de
ecuaciones, lo que se denomina regresin mltiple o regresin lineal mltiple.
Constantemente en la prctica de la investigacin estadstica, se encuentran variables que
de alguna manera estn relacionadas entre s, por lo que es posible que una de las variables
puedan relacionarse matemticamente en funcin de otra u otras variables.
Maneja varias variables independientes. Cuenta con varios parmetros. Se expresan de la
forma:

donde
que

es el error asociado a la medicin del valor

y siguen los supuestos de modo

(media cero, varianza constante e igual a un

con

).

CORRELACIN
La correlacin trata de establecer la relacin o dependencia que existe entre las dos
variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios de la
otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay
correlacin entre ellas.

TIPOS DE CORRELACIN
1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma
redondeada.

GRADO DE CORRELACIN
El grado de correlacin indica la proximidad que hay entre los puntos de la nube de
puntos. Se pueden dar tres tipos:
1. Correlacin fuerte
La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula

COEFICIENTE DE CORRELACIN LINEAL


El coeficiente de correlacin lineal es el cociente entre la covarianza y el producto de las
desviaciones tpicas de ambas variables.
El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades

1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.


Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no
vara.
2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1.
1 r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es
fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.

5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte


y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.
7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional.
Ejemplos:

Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:
Matemticas

Fsica

2
3
4
4
5
6
6
7
7
8
10
10

1
3
2
4
4
4
6
4
6
7
9
10

Hallar el coeficiente de correlacin de la distribucin e interpretarlo.


xi
2
3
4
4
5
6
6
7
7
8
10
10
72

yi
1
3
2
4
4
4
6
4
6
7
9
10
60

xi 2

xi yi
2
9
8
16
20
24
36
28
42
56
90
100
431

1 Hallamos las medias aritmticas.

4
9
16
16
25
36
36
49
49
64
100
100
504

y i2
1
9
4
16
16
16
36
16
36
49
81
100
380

2 Calculamos la covarianza.

3 Calculamos las desviaciones tpicas.

4 Aplicamos la frmula del coeficiente de correlacin lineal.

Al ser el coeficiente de correlacin positivo, la correlacin es directa.


Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy fuerte.
Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:
Y/X
1
2
3

2
1
2

1
4
5

3
2
0

Determinar el coeficiente de correlacin.


Convertimos la tabla de doble entrada en tabla simple.
xi
0
0
0
2
2
2
4
4

yi
1
2
3
1
2
3
1
2

fi
2
1
2
1
4
5
3
2
20

xi f i
0
0
0
2
8
10
12
8
40

xi 2 f i
0
0
0
4
16
20
48
32
120

yi fi
2
2
6
1
8
15
3
4
41

yi2 fi
2
4
18
1
16
45
3
8
97

xi yi fi
0
0
0
2
16
30
12
16
76

Al ser el coeficiente de correlacin negativo, la correlacin es inversa.


Como coeficiente de correlacin est muy prximo a 0 la correlacin es muy dbil.

CONCLUSIN

Concluimos que la estimacin es un proceso que permite decir algo de los hechos
poblacionales (parmetros), utilizando para ello la informacin proporcionada por una
muestra seleccionada de la poblacin de inters generalmente por mtodos aleatorios. Se
analizan las formas adecuadas para el establecimientos del conocimientos numricos o
abstracto de un parmetro de la una poblacin y que evidentemente nos es desconocidos
partiendo de una informacin suministrada por la muestra
Tambin se pudo aprender los dos tipos de estimacin que se pueden efectuar como:
Estimacin Puntual: el cual consiste en asignarle un valor especfico al estimador
Estimacin Intervalo: el cual consiste en asignar un rango de valores, el valor estimador.
El objetivo de la estimacin puntual es usar una muestra para obtener nmeros que
en algn sentido sean los que mejor representan a los verdaderos valores de los parmetros
y en la estimacin por intervalos es el de obtener intervalos estrechos con alta
confiabilidad.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la
muestra y siempre es mayor a uno. nicamente cuando el tamao de la muestra tiende a
infinito las dos distribuciones sern las mismas.
En cambio la distribucin ji-cuadrada es la distribucin muestral de s2. O sea que si se
extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula
su varianza, se obtendr la distribucin muestral de varianzas.
La correlacin trata de determinar si los cambios en una de las variables influyen en los
cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas
o que hay correlacin entre ellas.
EXISTEN 3 TIPOS DE CORRELACIN:

Correlacin directa

Correlacin inversa

Correlacin nula

Vous aimerez peut-être aussi