Académique Documents
Professionnel Documents
Culture Documents
Aspectos básicos
Prácticos (descriptivos)
Datos cualitativos
Proporción de fallecidos.
Porcentaje de fumadores.
Cuantitativos
Datos Cuantitativos
Son aquellos que pueden medirse o cuantificarse (que pueden ser contados).
Pueden ser de dos tipos:
Ejemplos:
Presión arterial.
Edad.
Colesterolemia.
En ocasiones, por convenciones previas o por iniciativa del investigador (ej. para facilitar el
análisis de los datos), datos de naturaleza continua son agrupados en categorías según sus
valores se encuentren dentro de ciertos rangos, o sobre o bajo un umbral determinado,
siendo tratados como variables discretas:
No admiten valores intermedios. Se enumeran (cuentan) más que se “miden”. Suelen tomar
solamente valores enteros (número de hijos, número de partos, número de hermanos, etc).
Variables
Discretas (sus unidades no admiten división)
Ejemplo:
Son datos discretos, porque se cuentan por números indivisibles: no se puede tener
2,5 hijos, o 1,3 mascotas. Los datos discretos también puede ser categóricos, como
decir si prefieres el color “rojo” o “azul”, o si eres “hombre” o “mujer”, o si un producto
es “bueno” o “malo”..
Ejemplo:
Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento,
puesto que no hay que incluir gastos de entrenamiento de personal, el único gasto
sería el de franqueo postal.
Entre las limitaciones que presenta este método podemos señalar el número de
preguntas que pueden formularse es relativamente limitado; además las
investigaciones efectuadas por este método tienen un carácter selectivo, debido a
que muchas de las personas que potencialmente podrían ser investigadas no
posee servicio telefónico, por lo que quedan sin la posibilidad de ser entrevistados.
todas las empresas que ejercen una actividad económica que contribuye
al PIB y sus unidades locales;
las unidades jurídicas que constituyen dichas empresas;
los grupos de empresas truncados y los grupos multinacionales de empresas;
los grupos de empresas totalmente residentes.
Objetivo
El REE existe principalmente con el objetivo de proporcionar un marco para todas
las encuestas económicas. En consecuencia, está diseñado para proporcionar un
medio para coordinar la cobertura de las encuestas a empresas y para obtener
coherencia en la clasificación de unidades de información estadística. También
sirve como fuente de datos para compilar de información demográfica sobre
empresas.
Variables
Las unidades típicas de un REE son las unidades jurídicas y las unidades locales
aunque, con fines estadísticos, estas pueden transformarse en unidades tales
como empresas y establecimientos.
Las unidades jurídicas comprenden:
La unidad jurídica sigue constituyendo, sola o a veces junto con otras unidades
jurídicas, el soporte jurídico de la unidad estadística "empresa".
Una unidad local es una empresa o parte de la misma (por ejemplo, un taller, una
fábrica, un almacén, una oficina, una mina o un depósito) situada en un lugar
identificado geográficamente. En dicho lugar o desde él se lleva a cabo una
actividad económica en la cual, salvo algunas excepciones, trabajan una o más
personas (aunque solo sea a tiempo parcial) para la misma empresa.
En la primera sección, conceptos básicos, del articulo, Formulación del sistema de
cuentas nacionales - conceptos básicos, están explicadas las relaciones entre
empresas, unidades locales y establecimientos.
Las unidades registradas deben describirse según el tipo de unidad estadística
(unidad jurídica, unidad local o empresa) mediante tres categorías de variables:
Internet
Recopilación de datos
Es este el segundo paso de una investigación estadística. La información que requiere la
investigación es suministrada por el ama de casa, el hombre de negocios, o cualquier otro
informante; ya sea por intermedio de una persona que visita al informante y le hace las
preguntas necesarias para anotarlas en un formulario, o enviando al informante una lista
de preguntas que puede contestar en el momento que desee, o que debe contestar con
carácter obligatorio como sucede en la encuesta anual manufacturera que anualmente
realiza el DANE, organismo rector de las estadísticas en Colombia. También pueden
obtenerse los datos a través de encuestas telefónicas o
entrevistas personales. Algunas veces la información se obtiene mediante “
registron lo cual significa, que la información se proporciona a la autoridad competente en
el momento que ocurre el hecho, o después de que éste suceda. Son ejemplos de
recolección por registro: los nacimientos, las defunciones, los accidentes automovilísticos,
las ventas de propiedad raíz ante una notaría, el consumo de energía. , etc. Para fines
estadísticos, los datos se clasifican como INTERNOS y EXTERNOS. Los datos obtenidos de
los propios archivos son datos internos
Sin embargo, en muchas ocasiones es necesario establecer comparaciones con datos de la
misma índole pero referidos a una escala de mayor magnitud o simplemente es necesario
obtener la información de una fuente diferente a los propios archivos. Estos datos
exógenos se denominan datos externos
. Ahora bien, desde el punto de vista de la frecuencia con que se realiza la investigación, la
recolección puede hacerse de manera: OCASIONAL si la información se toma en
circunstancias extraordinarias como algunas encuestas de opinión, PERIÓDICA cuando la
investigación se realiza en lapsos de tiempos regulares como por ejemplo la recolección
sobre precios al consumidor de carácter mensual, los censos de población que
normalmente se efectúan cada diez años, etc., y CONTINUA cuando los datos se registran
automáticamente en el momento que se presenten los hechos, sin interrupción, como los
datos sobre criminalidad, natalidad, etc
Procesamiento de la información
Comprender y aplicar la probabilidad y estadística descriptiva e inferencial que le permitan
recolectar, organizar, presentar y analizar datos para abordar la resolución de problemas en
el contexto educativo.
Crítica y codificación, tabulación
Codificación
Comboni, S. y Juárez, J., afirman desde una perspectiva cuantitativa que: “La
codificación es un procedimiento técnico mediante el cual, los datos obtenidos se
clasifican en categorías y se traducen en símbolos, ya sean cifras o letras; es decir,
se asigna a cada opción de respuestas un número o una letra que permita tabularla
rápidamente.”
Taylor, S.J. y Bogdan, R., por su parte, sostienen desde una perspectiva
cualitativa lo siguiente: “… la codificación es un modo sistemático de desarrollar y
refinar las interpretaciones de los datos. El proceso de codificación incluye la
reunión y análisis de todos los datos que se refieren a temas, ideas, conceptos,
interpretaciones y proposiciones. Durante esta etapa del análisis, lo que inicialmente
fueron ideas e intuiciones vagas se refinan, expanden, descartan o desarrollan por
completo.”
2) Codifique todos los datos. Codifique todas las notas de campo, las
transcripciones, los documentos y otros materiales, escribiendo en el margen el
número asignado o la letra correspondiente a cada categoría.
4) Vea que datos han sobrado. … Algunos de esos datos probablemente se ajusten
a las categorías de codificación existentes. También se pueden plantear nuevas
categorías… .
5) Refine su análisis. La codificación y separación de los datos permite comparar
diferentes fragmentos relacionados con cada tema, concepto, proposición, etcétera,
y en consecuencia refinar y ajustar las ideas.”
Tabulación
Entonces tabular es contar las unidades que son ubicadas, ya sea en forma
manual o con la utilización de una computadora, en cada categoría de una variable
o unidades que son ubicadas simultáneamente en categorías determinadas de dos
o más variables. Por lo tanto, la tabulación puede ser simple, esto es, univariable o
cruzada, es decir, bivariable o multivariable.
Presentación de la información
La presentación de datos estadísticos constituye en sus diferentes modalidades
uno de los aspectos de mas uso en la estadística descriptiva. A partir podemos
visualizar a través de los diferentes medios escritos y televisivos
de comunicación masiva la presentación de los datos estadísticos sobre
el comportamiento de las principales variables económicas y sociales, nacionales
e internacionales.
1-Presentación escrita: Esta forma de presentación de informaciones se usa
cuando una serie de datos incluye pocos valores, por lo cual resulta mas
apropiada la palabra escrita como forma de escribir el comportamiento de los
datos; mediante la forma escrita, se resalta la importancia de las informaciones
principales.
2-Presentación tabular: Cuando los datos estadísticos se presentan a través de
un conjunto de filas y de columnas que responden a un ordenamiento lógico; es de
gran eso e importancia para el uso e importancia para el usuario ya que constituye
la forma más exacta de presentar las informaciones. Una tabla consta de varias
partes, las principales son las siguientes:
Titulo: Es la parte más importante del cuadro y sirve para describir todo él
contenido de este.
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de
cada columna.
Columna matriz: Es la columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la
tabla.
Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de
estos.
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que
aparecen en la tabla o cuadro y que no han sido explicados en otras partes.
3-Presentación grafica: Proporciona al lector o usuario mayor rapidez en la
comprensión de los datos, una grafica es una expresión artística usada para
representar un conjunto de datos.
De acuerdo al tipo de variable que vamos a representar, las
principales graficas son las siguientes:
Histograma: Es un conjunto de barras o rectángulos unidos uno de otro, en razón
de que lo utilizamos para representar variables continuas.
Polígono de frecuencias: Esta grafica se usa para representar los puntos medios
de clase en una distribución de frecuencias
Gráfica de barras: Es un conjunto de rectángulos o barras separadas una de la
otra, en razón de que se usa para representar variables discretas; las barras
deben ser de igual base o ancho y separadas a igual distancia. Pueden
disponerse en forma vertical y horizontal.
Gráfica lineal: Son usadas principalmente para representar datos clasificados por
cantidad o tiempo; o sea, se usan para representar series de tiempo o
cronológicas.
Gráfica de barra 100% y gráfica circular: se usan especialmente para representar
las partes en que se divide una cantidad total.
La ojiva: Esta grafica consiste en la representación de las frecuencias acumuladas
de una distribución de frecuencias. Puede construirse de dos maneras diferentes;
sobre la base "menor que" o sobre la base "o más". Puede determinar el valor de
la mediana de la distribución.
En estadística denominamos gráficos a aquellas imágenes que, combinando la
utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y
un sistema De referencia (coordenadas), permiten
presentar información cuantitativa.
La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a
las tablas, sino que también constituyen por sí mismos una poderosa herramienta
para el análisis De los datos, siendo en ocasiones el medio más efectivo no sólo
para describir y resumir la información, sino también para analizarla.
En este trabajo solo nos vamos a centrar únicamente en los gráficos como
vehículo de presentación de datos, sin abordar su otra faceta como herramienta
de análisis.
Media aritmética
En matemáticas y estadística, la media aritmética (también llamada promedio o media) de
un conjunto finito de números es el valor característico de una serie de datos cuantitativos,
objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se
obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos.
Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno
de los principales estadísticos muestrales.
La suma de las desviaciones con respecto a la media aritmética es cero (0).
La media aritmética de los cuadrados de las desviaciones de los valores de la variable con
respecto a una constante cualquiera se hace mínima cuando dicha constante coincide con
la media aritmética.
Si a todos los valores de la variable se le suma una misma cantidad, la media aritmética
queda aumentada en dicha cantidad.
Si todos los valores de la variable se multiplican por una misma constante la media
aritmética queda multiplicada por dicha constante.
La media aritmética de un conjunto de números positivos siempre es igual o superior a
la media geométrica:
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se
representa por la letra griega µ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra)
cuando se trata del promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras que el
promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a
tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas,
gramos, etc.
Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:
Ejemplo de desviaciones:
Una propiedad interesante de la media aritmética es que la suma de las desviaciones es cero.
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición
central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene
valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por
ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Mediana (estadística), el valor de la variable que deja el mismo número de datos antes y
después que él;
Mediana (geometría), la línea que une cualquier vértice de un triángulo con el punto
medio del lado opuesto;
Mediana (arqueología), un yacimiento arqueológico romano en la ciudad serbia de Niš;
Mediana (tráfico), es la separación que impide el paso entre los carriles de dirección
contraria en una calzada.
Moda
La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de
frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una
muestra puede tener más de una moda.
Media geométrica
En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números
(por decir n números) es la raíz n-ésima del producto de todos los números, es recomendada
para datos de progresión geométrica, para promediar razones, interés compuesto y números
índices.
Media armónica
La media armónica (designada usualmente mediante H) de una cantidad finita de números es
igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos valores y es
recomendada para promediar velocidades.
La media armónica resulta poco influida por la existencia de determinados valores mucho más
grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más
pequeños que el conjunto.
La media armónica no está definida en el caso de que exista algún valor nulo.
Desviación estándar
La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden en
metros, la varianza lo hace en metros cuadrados. Si queremos que la medida de dispersi´on sea de
la misma dimensionalidad que las observaciones bastar´a con tomar su ra´ız cuadrada.
Desviación media
Desviación media, Dm
Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que
se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos que se
encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos “no agrupados”.
Coeficiente de variación
Hemos visto que las medidas de centralizaci´on y dispersi´on nos dan informaci´on sobre una
muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para comparar dos
poblaciones. Por ejemplo, si nos piden comparar la dispersi´on de los pesos de las poblaciones de
elefantes de dos circos diferentes, S nos dar´a informaci´on ´util. ¿Pero qu´e ocurre si lo que
comparamos es la altura de unos elefantes con respecto a su peso? Tanto la media como la
desviaci´on t´ıpica, x y S, se expresan en las mismas unidades que la variable. Por ejemplo, en la
variable altura podemos usar como unidad de longitud el metro y en la variable peso, el kilogramo.
Comparar una desviaci´on (con respecto a la media) medida en metros con otra en kilogramos no
tiene ning´un sentido. El problema no deriva s´olo de que una de las medidas sea de longitud y la
otra sea de masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa,
de dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el peso en
toneladas de una poblaci´on de 100 elefantes con el correspondiente en miligramos de una
poblaci´on de 50 hormigas.
k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento
restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el
40% de las observaciones.
Cuando n es impar:
Siendo A, el número del percentil.
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer
cuartil con el percentil 75.
Curva de Lorenz
La curva de Lorenz es una representación gráfica utilizada frecuentemente para plasmar
la distribución relativa de una variable en un dominio determinado. El dominio puede ser el
conjunto de hogares o personas de una región o país, por ejemplo. La variable cuya
distribución se estudia puede ser el ingreso de los hogares o las personas. Utilizando como
ejemplo estas variables, la curva se trazaría considerando en el eje horizontal el porcentaje
acumulado de personas u hogares del dominio en cuestión y en el eje vertical el porcentaje
acumulado del ingreso. Su autoría es de Max O. Lorenz en 1905.
Cada punto de la curva se lee como porcentaje acumulativo de los hogares o las personas. La
curva parte del origen (0,0) y termina en el punto (100,100). Si el ingreso estuviera distribuido
de manera perfectamente equitativa, la curva coincidiría con la línea de 45 grados que pasa
por el origen (por ejemplo el 30% de los hogares o de la población percibe el 30% del ingreso).
Si existiera desigualdad perfecta, o sea, si un hogar o persona poseyera todo el ingreso, la
curva coincidiría con el eje horizontal hasta el punto (100,0) donde saltaría el punto (100,100).
En general la curva se encuentra en una situación intermedia entre estos dos extremos.
Curva de Lorenz y desigualdad[editar]
Si una curva de Lorenz se encuentra siempre por encima de otra (por lo tanto, está más cerca
de la línea de 45 grados que la otra), entonces podemos decir, sin ambigüedad, que la primera
exhibe menor desigualdad que la segunda. Esta comparación gráfica entre distribuciones de
distintos dominios geográficos o temporales es el principal empleo de las curvas de Lorenz. El
indicador gráfico de bienestar más usado es la Curva de Lorenz Generalizada (CLG), que es
una derivación de la curva de Lorenz habitual. La CLG sólo se diferencia de la de Lorenz en
que en la escala vertical no se representan las cantidades relativas acumuladas sino las
cantidades acumuladas (no relativas) divididas por el número N de elementos de la población.
La lógica pretendida es representar qué cantidad absoluta corresponde a cada porcentaje de
individuos. Para clarificar este aspecto, supóngase que la curva de Lorenz normal de una
población nos dice que el 50% de los menos ricos poseen el 25% de la riqueza total. Se puede
comprender que es muy diferente la situación de bienestar de este 50% de la población según
si la riqueza total es muy pequeña o muy grande. Es obvio que es peor poseer el 50% de una
cantidad pequeña que poseer el 25% de una cantidad mucho mayor. El dividir las cantidades
acumuladas por el total de elementos N es necesario para poder comparar riquezas entre
poblaciones distintas que tengan un número diferente de elementos: no es lo mismo una
riqueza total de 1.000.000€ en un conjunto de 10 personas que esa misma riqueza total en un
conjunto formado por 1.000 personas.
Coeficiente de gini
El coeficiente de Gini es una medida de la desigualdad ideada por
el estadístico italiano Corrado Gini. Normalmente se utiliza para medir la desigualdad en los
ingresos, dentro de un país, pero puede utilizarse para medir cualquier forma de distribución
desigual. El coeficiente de Gini es un número entre 0 y 1, en donde 0 se corresponde con la
perfecta igualdad (todos tienen los mismos ingresos) y donde el valor 1 se corresponde con la
perfecta desigualdad (una persona tiene todos los ingresos y los demás ninguno).
El índice de Gini es el coeficiente de Gini expresado en referencia a 100 como máximo, en
vez de como 1, y es igual al coeficiente de Gini multiplicado por 100. Una variación de dos
céntesimas del coeficiente de Gini (o dos unidades del índice) equivale a una distribución de
un 7% de riqueza del sector más pobre de la población (por debajo de la mediana) al más rico
(por encima de la mediana).
Aunque el coeficiente de Gini se utiliza sobre todo para medir la desigualdad en los ingresos,
también puede utilizarse para medir la desigualdad en la riqueza. Este uso requiere que nadie
disponga de una riqueza neta negativa.
El coeficiente de Gini se calcula como una proporción de las áreas en el diagrama de
la curva de Lorenz. Si el área entre la línea de perfecta igualdad y la curva de Lorenz es a, y el
área por debajo de la curva de Lorenz es b, entonces el coeficiente de Gini es a/(a+b).
Esta proporción se expresa como porcentaje o como equivalente numérico de ese porcentaje,
que es siempre un número entre 0 y 1. El coeficiente de Gini se calcula a menudo con
la Fórmula de Brown, que es más práctica:
Propiedades
Todas las curvas de Lorenz pasan por los puntos (0,0) y (1,1). A mayor índice de Gini se
tiene una mayor desigualdad. Si dos curvas de Lorenz se cruzan entre sí, se recomienda
no sacar conclusiones visualmente pues pueden ser engañosas; es mejor comparar la
desigualdad que representan, calculando primero los índices de Gini correspondientes a
cada curva.
Para determinar el área entre la curva de Lorenz y la línea de perfecta equidad, lo ideal es
calcular una integral definida, pero a veces no se conoce la definición explícita de la curva
de Lorenz, por lo que es interesante utilizar otras fórmulas con un número finito de
sumandos.
Las propiedades del índice de Gini son comparables con las del cuadrado del coeficiente
de variación.1
Empíricamente, la renta de muchos países se aproxima a una distribución Gamma (con
parámetro k < 5), lo cual lleva a los índices de Gini observados entre 0,50 y 0,25. Los
países con índices superior a 0,50 tienen una distribución aún más desigual que
la distribución exponencial.
Teoría de probabilidades
La teoría de la probabilidad es una rama de las matemáticas que estudia los fenómenos
aleatorios y estocásticos. Los fenómenos aleatorios se contraponen a los fenómenos
deterministas, los cuales son resultados únicos y/o previsibles de experimentos realizados
bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 ºC a nivel
del mar se obtendrá vapor. Los fenómenos aleatorios, por el contrario, son aquellos que se
obtienen de experimentos realizados, otra vez, bajo las mismas condiciones determinadas
pero como resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento
de un dado o de una moneda.
La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado
que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y
saber si un suceso es más probable que otro.
Muchos fenómenos naturales son aleatorios, pero existen algunos como el lanzamiento de un
dado, donde el fenómeno no se repite en las mismas condiciones, debido a que las
características del material hace que no exista una simetría del mismo, así las repeticiones no
garantizan una probabilidad definida. En los procesos reales que se modelizan
mediante distribuciones de probabilidad corresponden a modelos complejos donde no se
conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las
cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a
la teoría de la probabilidad en sí.
En 1933, el matemático soviético Andréi Kolmogórov propuso un sistema de axiomas para la
teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida,
desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros.
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual
obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la
rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de
los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más
variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el
desarrollo de las difusiones y el movimiento Browniano), o la economía (donde destaca el
modelo de Black y Scholes para la valuación de acciones).
La teoría de la probabilidad se desarrolló originalmente a partir de ciertos problemas
planteados en el contexto de juegos de azar. Inicialmente, no existía una teoría axiomática
bien definida y las definiciones iniciales de probabilidad se basaron en la idea intuitiva de un
cociente de ocurrencias:
(1)
donde A es un suceso cualquiera y:
,
La interpretación de esta probabilidad es la frecuencia promedio con la que aparece
Definición axiomática[editar]
Artículo principal: Axiomas de probabilidad
.
Probabilidad discreta[editar]
Este tipo de probabilidad, es aquel que puede tomar sólo ciertos valores diferentes
que son el resultado de la cuenta de alguna característica de interés. Más
exactamente, un problema de probabilidad discreta es un problema definido por un
conjunto de variables aleatorias que sólo pueden tomar un conjunto finito o infinito
numerable de valores diferentes:
Probabilidad continua[editar]
Un problema de probabilidad continua es uno en el que aparecen variables
aleatorias capaces de tomar valores en algún intervalo de números reales (y
por tanto asumir un conjunto no numerable de valores), por lo que
continuando con la notación anterior:
Para una variable aleatoria discreta esta función no es continua sin constante
a tramos (siendo continua por la derecha pero no por la izquierda). Para una
variable aleatoria general la función de distribución puede descomponerse en
una parte continua y una parte discreta:
Enfoque de probabilidades
Clásico
Los resultados de un experimento son igualmente viables, es decir, tienen teóricamente las mismas
posibilidades de ocurrir.
En este caso la probabilidad de ocurrencia de un evento será:
Número de resultados en los que se presenta el evento / número total de resultados posibles
Por ejemplo, la probabilidad de que en una baraja francesa de 52 cartas salga el cinco de trébol es de
1/52.
Empírico
Por ejemplo, la probabilidad de que Brasil gané el mundial de Suráfrica 2010 es de 5 mundiales
ganados anteriormente / 18 mundiales que se han celebrado en total.
Subjetivo
Se puede definir como la probabilidad asignada a un evento por parte de un individuo, basada en la
evidencia que se tenga disponible. Esa evidencia puede presentarse en forma de frecuencia relativa
de presentación de eventos pasados o puede tratarse simplemente de una creencia meditada.
N
.
y
Si se lanza una moneda dos veces, S = {cc, cs, sc, ss}, donde (c representa "sale cara" ys, "sale
cruz"), los sucesos elementales son {cc}, {cs}, {sc} y {ss}.
y
Si X es una variable aleatorianormalmente distribuida, S = (-’, +’), los números reales, lossucesos
elementales son todos los conjuntos {x}, donde x
.Pueden tener probabilidades que son estrictamente mayores que cero, cero, no definidas
ocualquier combinación de estas. Por ejemplo, la probabilidad de cualquier variable
aleatoriadiscreta está determinada por las probabilidades asignadas a los sucesos elementales
delexperimento que determina la variable. Por otra parte, cualquier suceso elemental
tieneprobabilidad cero en cualquier variable aleatoria continua. Existen distribuciones mixtas que
no soncompletamente continuas, ni completamente discretas, entre las que pueden darse
ambassituaciones.
EVENTO COMPUESTO
C
uando calculas probabilidades, a menudo tienes que tomar en consideración dos o más
eventos,conocidos como eventos compuestos. En un evento compuesto, si el segundo evento no
dependedel resultado del primer evento, entonces los eventos son independientes. Si el resultado
de unevento de un evento compuesto influye en el otro evento, entonces los eventos son
dependientes.
Probabilidad de dos eventos independientes
La probabilidad de que ocurran dos eventos independientes secalcula multiplicando la
probabilidaddel primer evento por la probabilidad del segundo evento. P(A y B) = P(A)
·
P (B)
Probabilidad de dos eventos dependientes
Si dos eventos A y B son dependientes, entonces la probabilidadde que ocurran los dos eventos
esigual al producto de la probabilidad de A por la probabilidad de B después de ocurrir A. P(A y B)
=P(A)
Eventos dependientes e
independientes
Eventos dependientes
Dos o más eventos serán dependientes cuando la ocurrencia o no-ocurrencia de uno de ellos
afecta la probabilidad de ocurrencia del otro (o otros). Cuando tenemos este caso, empleamos
entonces, el concepto de probabilidad condicional para denominar la probabilidad del evento
relacionado. La expresión P(A|B) indica la probabilidad de ocurrencia del evento A sí el evento B
ya ocurrió.
Eventos Independientes
Ejemplo:
lanzar al aire dos veces una moneda son eventos independientes por que el resultado del primer
evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo
lanzamiento.
Esta fórmula nos permitirá obtener todos aquellos arreglos en donde el orden es importante y solo se usen
parte (r) de los n objetos con que se cuenta, además hay que hacer notar que no se pueden repetir objetos
dentro del arreglo, esto es, los n objetos son todos diferentes.
Entonces, ¿ qué fórmula hay que usar para arreglos en donde se utilicen los n objetos con que se cuenta?
Si en la fórmula anterior se sustituye n en lugar de r, entonces.
nPn= n!/ (n -n)! = n! / 0! = n! / 1 = n!
Como 0! = 1 de acuerdo a demostración matemática, entonces
nPn= n!
Ejemplos:
1) ¿Cuantas representaciones diferentes serán posibles formar, si se desea que consten de Presidente,
Secretario, Tesorero, Primer Vocal y Segundo Vocal?, sí esta representación puede ser formada de entre 25
miembros del sindicato de una pequeña empresa.
Solución:
Por principio multiplicativo:
25 x 24 x 23 x 22 x 21 = 6,375,600 maneras de formar una representación de ese sindicato que conste de
presidente, secretario, etc., etc.
Por Fórmula:
n = 25, r=5
25P5 = 25!/ (25 -5)! = 25! / 20! = (25 x 24 x 23 x 22 x 21 x....x 1) / (20 x 19 x 18 x ... x 1)=
= 6,375,600 maneras de formar la representación
2) a. ¿Cuántas maneras diferentes hay de asignar las posiciones de salida de 8 autos que participan en una
carrera de fórmula uno? (Considere que las posiciones de salida de los autos participantes en la carrera son
dadas totalmente al azar) b. ¿Cuántas maneras diferentes hay de asignar los primeros tres premios de esta
carrera de fórmula uno?
Solución:
a. Por principio multiplicativo:
8 x 7 x 6 x 5 x 4 x 3 x 2 x 1= 40,320 maneras de asignar las posiciones de salida de los autos participantes en
la carrera
Por Fórmula:
n = 8, r = 8
8P8= 8! = 8 x 7 x 6 x 5 x 4 x......x 1= 40,320 maneras de asignar las posiciones de salida ......etc., etc.
b. Por principio multiplicativo:
8 x 7 x 6 = 336 maneras de asignar los tres primeros lugares de la carrera
Por fórmula:
n =8, r = 3
8P3 = 8! / (8 - 3)! = 8! / 5! = (8 x 7 x 6 x 5 x ........x1)/ (5 x 4 x 3 x......x1) = 336 maneras de asignar los tres
primeros lugares de la carrera
3) ¿Cuántos puntos de tres coordenadas ( x, y, z ), será posible generar con los dígitos 0, 1, 2, 4, 6 y 9?,
Si, a. No es posible repetir dígitos, b. Es posible repetir dígitos.
Solución:
a. Por fórmula
n = 6, r = 3
6P3 = 6! / (6 - 3)! = 6! / 3! = 6 x 5 x 4 x 3! / 3! = 6 x 5 x 4 = 120 puntos posibles
Nota: este inciso también puede ser resuelto por el principio multiplicativo
b. Por el principio multiplicativo
6 x 6 x 6 = 216 puntos posibles
¿Cuál es la razón por la cuál no se utiliza en este caso la fórmula?. No es utilizada debido a que la fórmula de
permutaciones sólo se usa cuando los objetos no se repiten, esto quiere decir que en el inciso a. Los puntos
generados siempre van a tener coordenadas cuyos valores son diferentes ejem. (1, 2, 4), (2, 4, 6), (0, 4, 9),
etc. etc., mientras que los puntos generados en el inciso b. Las coordenadas de los puntos pueden tener
valores diferentes o repeticiones de algunos valores o pueden tener todas las coordenadas un mismo
valor ejem. (1, 2, 4), (1, 2, 2), (1, 1, 1), etc., etc.
4) a. ¿Cuántas maneras hay de asignar las 5 posiciones de juego de un equipo de básquetbol, si el equipo
consta de 12 integrantes?, b. ¿Cuántas maneras hay de asignar las posiciones de juego si una de ellas solo
puede ser ocupada por Uriel José Esparza?, c. ¿Cuántas maneras hay de que se ocupen las posiciones de
juego si es necesario que en una de ellas este Uriel José Esparza y en otra Omar Luna?
Solución:
a. Por fórmula:
n = 12, r = 5
12P5 = 12! / (12 - 5 )! = 12 x 11 x 10 x 9 x 8 = 95,040 maneras de asignar las cinco posiciones de juego
a. Por principio multiplicativo:
1 x 11 x 10 x 9 x 8 =7,920 maneras de asignar las posiciones de juego
Por fórmula:
1 x 11P4 = 1 x 11! / (11 - 4)! = 11! / 7! = 11 x 10 x 9 x 8 = 7,920 maneras de asignar las posiciones de juego
con Uriel José en una determinada posición
a. Por principio multiplicativo
1 x 1 x 10 x 9 x 8 = 720 maneras de ocupar las diferentes posiciones de juego
Por fórmula:
1 x 1 x 10P3 = 1 x 1 x 10! / (10 - 3)! = 10! / 7! = 10 x 9 x 8 = 720 maneras de ocupar las posiciones de juego
con Uriel José y Omar Luna en posiciones previamente definidas
5) Cuántas claves de acceso a una computadora será posible diseñar, si debe constar de dos letras,
seguidas de cinco dígitos, las letras serán tomadas del abecedario y los números de entre los dígitos del 0 al
9. a. Considere que se pueden repetir letras y números, b. Considere que no se pueden repetir letras y
números, c. ¿Cuántas de las claves del inciso b empiezan por la letra A y terminan por el número 6?, d.
¿Cuántas de las claves del inciso b tienen la letra R seguida de la L y terminan por un número impar?
Solución:
a. Por principio multiplicativo:
26 x 26 x 10 x 10 x 10 x 10 x 10 = 67,600,000 claves de acceso
Por fórmula:
26P2 x 10P5 = 26 x 25 x 10 x 9 x 8 x 7 x 6=19,656,000 claves de acceso
a. Por fórmula:
Donde:
nPx1,x2,......, xk = Número total de permutaciones que es posible obtener con n objetos, entre los que hay una
cantidad x1 de objetos de cierto tipo, una cantidad x2 de objetos de un segundo tipo,...... y una cantidad xk de
objetos del tipo k.
n = x1 + x2 + ...... + xk
Ejemplos:
1) Obtenga todas las señales posibles que se pueden diseñar con seis banderines, dos de los cuales son
rojos, tres son verdes y uno morado.
Solución:
n = 6 banderines
x1 = 2 banderines rojos
x2 = 3 banderines verdes
x3 = 1 banderín morado
6P2,3,1 = 6! / 2!3!1! = 60 señales diferentes
2) a. ¿Cuántas claves de acceso a una computadora será posible diseñar con los números
1,1,1,2,3,3,3,3?, b.¿cuántas de las claves anteriores empiezan por un número uno seguido de un dos?, c.
¿cuántas de las claves del inciso a empiezan por el número dos y terminan por el número tres?
Solución:
a. n = 8 números
x1 = 3 números uno
x2 = 1 número dos
x3 = 4 números cuatro
8P3,1,4 = 8! / 3!1!4! = 280 claves de acceso
b. n = 6 (se excluye un número uno y un dos)
x1 = 2 números uno
x2 = 4 números tres
1 x 1 x 6P2,4 = 1 x 1 x 6! / 2!4! = 15 claves de acceso
El primer número uno nos indica el número de maneras como es posible colocar en la primera posición de la
clave de acceso un número uno, debido a que todos los números uno son iguales, entonces tenemos una sola
manera de seleccionar un número uno para la primera posición, el siguiente número uno nos indica el número
de maneras como se colocaría en la segunda posición el número dos y la expresión siguiente nos indica todos
los arreglos posibles que es posible diseñar con los números restantes.
c. n = 6 (se excluye un número dos y un tres)
x1 = 3 números uno
x2 = 3 números tres
1 x 6P3,3 x1 = 1 x 6! / 3!3! = 20 claves de acceso
El número uno inicial nos indica que existe una sola manera de seleccionar el número dos que va en la
primera posición del arreglo, mientras que el número uno final nos indica que hay una sola manera de
seleccionar el número tres que va al final del arreglo aún y cuando haya cuatro números tres, como estos son
iguales al diseñar una permutación es indistinto cuál número tres se ponga, ya que siempre se tendrá el
mismo arreglo y la expresión intermedia nos indica todos los arreglos posibles a realizar con los números
restantes.
3) ¿De cuántas maneras es posible plantar en una línea divisoria de un terreno dos nogales, cuatro
manzanos y tres ciruelos?
Solución:
n = 9 árboles
x1 = 2 nogales
x2 = 4 manzanos
x3 = 3 ciruelos
9P2,4,3 = 9! / 2!4!3! = 1260 maneras de plantar los árboles
4) Si un equipo de fútbol soccer femenil participa en 12 juegos en una temporada, ¿cuántas maneras hay
de que entre esos doce juegos en que participa, obtenga 7 victorias, 3 empates y 2 juegos perdidos?
Solución:
n = 12 juegos
x1 = 7 victorias
x2 = 3 empates
x3 = 2 juegos perdidos
12P7,3,2 = 12! / 7!3!2! = 7,920 maneras de que en la temporada este equipo logre siete victorias,
tres empates y dos juegos perdidos.
Pruebas ordenadas
Se le llama prueba ordenada al hecho de seleccionar r objetos de entre n objetos contenidos en una urna uno
tras otro. Una prueba ordenada puede ser llevada a efecto de dos maneras:
1) Con sustitución (con reemplazo).- En este caso se procede a seleccionar el primer objeto de entre
los n que hay, se observa de qué tipo es y se procede a regresarlo a la urna, luego se selecciona el siguiente
objeto, lo anterior se repite hasta que se han extraído los r objetos de la prueba, por tanto el número
de pruebas ordenadas de con sustitución se obtiene:
Número total de pruebas ordenadas con sustitución = n x n x n x .........x n = nr
Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, dado que se ha
regresado a la urna el primer objeto, también se tendrán n objetos y así sucesivamente.
2) Sin sustitución (sin reemplazo).- En este caso se procede a seleccionar el primer objeto, el cual no es
regresado a la urna, luego se selecciona el segundo objeto, lo anterior se repite hasta completar los r objetos
de la prueba, por lo que el número total de pruebas ordenadas sin sustitución se obtiene:
Número total de pruebas ordenadas sin sustitución = n(n-1)(n-2).........(n-r +1) = nPr
Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, hay n -1 maneras,
dado que el primer objeto no se regresa a la urna, luego cuando se extrae el r-ésimo objeto, hay (n -r +1) de
que sea seleccionado.
Ejemplos:
1) ¿Cuántas maneras hay de que se asignen tres premios de un sorteo en donde el primer premio es una
departamento, el segundo premio es un auto y el tercer premio es un centro de cómputo, si los participantes
en este sorteo son 120 personas, a.sí la asignación se puede hacer con sustitución, b.sí la asignación se
puede hacer sin sustitución.
Solución:
a. Por principio multiplicativo:
120 x 120 x 120 = 1,728,000 maneras de asignar los premios
Por fórmula: n =120, r = 120
nr = 1203 = 1,728,000 maneras de asignar los tres premios
Hay que considerar que en este caso, al regresar cada boleto que es extraído de la urna, las personas que
participan en el sorteo tienen la posibilidad de no ganar uno solo de los premios, de ganar un premio, dos de
los premios o los tres premios. Cosa que generalmente no ocurre.
b. Por principio multiplicativo:
120 x 119 x 118 = 1,685,040 maneras de asignar los premios
Por fórmula:
n = 120, r = 3
120P3 = 120! / (120 - 3)! = 120! / 117! = 120 x 119 x 118 = 1,685,040 maneras de asignar los premios
Hay que hacer notar que en este caso, como los boletos que son seleccionados ya no regresan a la urna de
donde fueron extraídos, los participantes solo pueden recibir un premio en caso de que fueran de los
afortunados. Esta es la forma en que generalmente se efectúa un sorteo.
2) ¿Cuántas formas hay de asignar las primeras cinco posiciones de una carrera de autos de fórmula K, si
participan 26 autos en esta carrera?. Considere que la asignación es totalmente al azar.
Solución:
Esta asignación debe ser sin sustitución, esto es, se trata de una prueba ordenada sin sustitución, por lo que
la solución es la que se muestra.
n = 26, r = 5
26P5 = 26! / (26 - 5)! = 26! / 21! = 26 x 25 x 24 x 23 x 22 = 7,893,600 maneras de asignar las cinco
primeras posiciones de salida
3) ¿Cuántas formas hay de asignar el orden de participación de las primeras 5 concursantes de 11
finalistas de un concurso de Miss Mundo?
Solución:
Esta asignación debe realizarse sin sustitución, por lo que se trata de una prueba ordenada sin sustitución.
n = 11, r = 5
11P5 = 11! / (11 - 5)! = 11! / 6! = 11 x 10 x 9 x 8 x 7 = 55,440 maneras de asignar la participación
Combinaciones
Como ya se mencionó anteriormente, una combinación, es un arreglo de elementos en donde no nos interesa
el lugar o posición que ocupan los mismos dentro del arreglo. En una combinación nos interesa formar grupos
y el contenido de los mismos.
La fórmula para determinar el número de combinaciones es:
La expresión anterior nos explica como las combinaciones de r objetos tomados de entre n objetos pueden
ser obtenidas a partir de las permutaciones de r objetos tomados de entre n objetos, esto se debe a que como
en las combinaciones no nos importa el orden de los objetos, entonces si tenemos las permutaciones de esos
objetos al dividirlas entre r!, les estamos quitando el orden y por tanto transformándolas en combinaciones, de
otra forma, también si deseamos calcular permutaciones y tenemos las combinaciones, simplemente con
multiplicar estas por el r! obtendremos las permutaciones requeridas.
nPr = nCr r!
Y si deseamos r = n entonces;
nCn = n! / (n -n)!n! = n! / 0!n! = 1
¿Qué nos indica lo anterior?
Que cuando se desea formar grupos con la misma cantidad de elementos con que se cuenta solo es posible
formar un grupo.
Ejemplos:
1) a. Si se cuenta con 14 alumnos que desean colaborar en una campaña pro limpieza del Tec, cuantos
grupos de limpieza podrán formarse si se desea que consten de 5 alumnos cada uno de ellos, b.si entre los 14
alumnos hay 8 mujeres, ¿cuantos de los grupos de limpieza tendrán a 3 mujeres?, c.¿cuántos de los grupos
de limpieza contarán con 4 hombres por lo menos?
Solución:
a. n = 14, r = 5
14C5 = 14! / (14 - 5 )!5! = 14! / 9!5!
= 14 x 13 x 12 x 11 x 10 x 9!/ 9!5!
= 2002 grupos
Entre los 2002 grupos de limpieza hay grupos que contienen solo hombres, grupos que contienen solo
mujeres y grupos mixtos, con hombres y mujeres.
b. n = 14 (8 mujeres y 6 hombres), r=5
En este caso nos interesan aquellos grupos que contengan 3 mujeres y 2 hombres
8C3*6C2 = (8! / (8 -3)!3!)*(6! / (6 - 2)!2!)
= (8! / 5!3!)*(6! / 4!2!)
= 8 x7 x 6 x 5 /2!
= 840 grupos con 3 mujeres y 2 hombres, puesto que cada grupo debe constar
de 5 personas
c. En este caso nos interesan grupos en donde haya 4 hombres o más
Los grupos de interés son = grupos con 4 hombres + grupos con 5 hombres
= 6C4*8C1 + 6C5*8C0 = 15 x 8 + 6 x 1 = 120 + 6 = 126
2) Para contestar un examen un alumno debe contestar 9 de 12 preguntas,
a. ¿Cuántas maneras tiene el alumno de seleccionar las 9 preguntas?,
b. ¿Cuántas maneras tiene si forzosamente debe contestar las 2 primeras preguntas?,
c. ¿Cuántas maneras tiene si debe contestar una de las 3 primeras preguntas?,
d .¿Cuántas maneras tiene si debe contestar como máximo una de las 3 primeras preguntas?
Solución:
a. n = 12, r = 9
12C9 = 12! / (12 - 9)!9! = 12! / 3!9! = 12 x 11 x 10 / 3!
= 220 maneras de seleccionar las nueve preguntas o dicho de otra manera,
el alumno puede seleccionar cualquiera de 220 grupos de 9 preguntas para contestar el examen
b. 2C2*10C7 = 1 x 120 = 120 maneras de seleccionar las 9 preguntas entre las que están las dos primeras
preguntas
c. 3C1*9C8 = 3 x 9 = 27 maneras de seleccionar la 9 preguntas entre las que está una de las tres primeras
preguntas
d. En este caso debe seleccionar 0 o 1 de las tres primeras preguntas
3C0*9C9 + 3C1*9C8 = (1 x 1) + (3 x 9) = 1 + 27 = 28 maneras de seleccionar las preguntas a contestar
3) Una señora desea invitar a cenar a 5 de 11 amigos que tiene, a. ¿Cuántas maneras tiene de invitarlos?,
b. ¿cuántas maneras tiene si entre ellos está una pareja de recién casados y no asisten el uno sin el otro, c.
¿Cuántas maneras tiene de invitarlos si Rafael y Arturo no se llevan bien y no van juntos?
Solución:
a. n = 11, r = 5
11C5 = 11! / (11 - 5 )!5! = 11! / 6!5!
= 11 x 10 x 9 x 8 x 7 x 6! / 6!5!
= 462 maneras de invitarlos
Es decir que se pueden formar 462 grupos de cinco personas para ser invitadas a cenar.
b. Esta señora tiene dos alternativas para hacer la invitación, la primera es no invitar a la pareja y la segunda
es invitar a la pareja.
2C0*9C5 + 2C2*9C3 = (1 x 126) + (1 x 84) = 210 maneras de invitarlos
En este caso separamos a la pareja de los demás invitados para que efectivamente se cumpla el que no
asistan o que asistan a la cena.
c.La señora tiene dos alternativas para hacer la invitación, una de ellas es que no invitar a Rafael y a
Arturo o que asista solo uno de ellos.
2C0*9C5 + 2C1*9C4 = (1 x 126) + (2 x 126) = 126 + 252 = 378 maneras de hacer la invitación
4) En un plano hay 10 puntos denominados A, B, C, ....,etc. etc., en una misma línea no hay más de dos
puntos, a. ¿Cuántas líneas pueden ser trazadas a partir de los puntos?, b. ¿Cuántas de las líneas no pasan
por los puntos A o B?, c. ¿Cuántos triángulos pueden ser trazados a partir de los puntos?, d. ¿Cuántos de los
triángulos contienen el punto A?, e. ¿Cuántos de los triángulos tienen el lado AB?.
Solución:
a. En la redacción del problema se aclara que en una misma línea no hay más de dos puntos debido a que
si lo anterior ocurriera no se podría dar contestación a las preguntas que se hacen.
Una línea puede ser trazada a partir de cómo mínimo dos puntos por lo tanto,
10C2 = 10! / (10 - 2)!2! = 10! / 8!2! = 45 líneas que se pueden trazar
b. En este caso excluiremos los puntos A y B y a partir de los ocho puntos restantes se obtendrán las
líneas.
2C0*8C2 = 1 x 28 = 28 líneas que no pasan por los puntos A o B
c. Un triángulo puede ser trazado a partir de tres puntos, luego;
10C3 = 10! / (10 - 3)!3! = 10! / 7!3! = 120 triángulos posibles de trazar
d. En este caso se separa el punto A de los demás, se selecciona y posteriormente también se
seleccionan dos puntos más.
1C1*9C2 = 1 x 36 = 36 triángulos que contienen el punto A
e. Los puntos A y B forman parte de los triángulos a trazar por lo que;
2C2*8C1 = 1 X 8 = 8 triángulos que contienen el lado AB
Particiones ordenadas
Se le llama partición ordenada al hecho de repartir n objetos en células de una cantidad
de x1 objetos, x2 objetos,......y xk objetos.
Para deducir la fórmula de particiones ordenadas partiremos de un ejemplo.
¿Cuántas maneras hay de repartir 10 libros diferentes entre tres alumnos, si al primero le daremos 2, al
segundo 3 y el resto al tercer alumno?
Ejemplos de esta partición serían las siguientes si se numeran los libros del 1 al 10;
Solución:
Lo primero que debemos hacer es seleccionar 2 libros de los 10 que se tienen para el primer alumno, esto es;
10C2 = 10! / (10 - 2)!2! = 10! / 8!2! = 45 maneras de seleccionar los libros
Luego se seleccionan 3 libros de los 8 que quedan para el segundo alumno;
8C3 = 8! / (8 - 3)!3! = 8! / 5!3! = 56 maneras
Y por último se procederá a seleccionar cinco libros de los cinco que quedan para el tercer alumno, lo que
se muestra a continuación;
5C5 = 5! / (5 -5)!5! = 5! / 0!5! = 1 manera
Por tanto el número total de particiones ordenadas en células de 2, 3 y 5 elementos se determina:
10C2*8C3*5C5 = (10! / (10 - 2)!2!)*(8! / (8 - 3)!3!)*(5! / (5 - 5)!5!) = 10! /2!3!5!
La expresión anterior nos recuerda a la fórmula utilizada para encontrar las permutaciones de n objetos, entre
los cuales hay algunos objetos que son iguales, por lo que usaremos la misma fórmula para encontrar las
particiones ordenadas.
Por tanto la fórmula para las particiones ordenadas sería:
Esta fórmula sólo puede ser utilizada cuando se reparten todos los objetos, no parte de ellos, en ese caso se
usarán combinaciones.
Donde:
nPx1,x2,.....,xk = Total de particiones ordenadas o reparticiones que es posible hacer cuando los n objetos
son repartidos en grupos de x1 objetos, x2 objetos ...... y xk objetos.
n = x1 + x2 + ......+ xk
Ejemplos: 1) ¿Cuántas maneras hay de repartir 9 juguetes entre tres niños, si se desea que al primer niño
le toquen 4 juguetes, al segundo 2 y al tercero 3 juguetes?
Solución:
Por combinaciones,
9C4*5C2*3C3 = 126*10*1= 1260 maneras de repartir los juguetes
Por fórmula,
n=9
x1 = 4
x2 = 2
x3 =3
9P4,2,3 = 9! / 4!2!3! = 1,260 maneras de repartir los juguetes
2) ¿Cuántas maneras hay de repartir los mismos 9 juguetes entre tres niños, si se desea darle 3 al primer
niño, 2 al segundo niño y 2 al tercer niño?
Solución:
En este caso únicamente se puede dar solución por combinaciones, ya que no es posible usar la fórmula
debido a que se reparten solo parte de los juguetes.
9C3*6C2*4C2 = 84*15*6 = 7,560 maneras de repartir los juguetes (solo se reparten 7 y quedan dos juguetes)
3) a. ¿Cuántas maneras hay de que se repartan 14 libros diferentes entre 3 alumnos, si se pretende que al
primer alumno y al segundo les toquen 5 libros a cada uno y al tercero le toque el resto?, b. ¿Cuántas
maneras hay de que se repartan los libros si se desea dar 5 libros al primer alumno, 3 al segundo y 2 libros al
tercer alumno?
Solución:
a. Por fórmula:
n = 14
x1 = 5
x2 = 5
x3 = 4
14P5,5,4 = 14! / 5!5!4! = 21,021 maneras de repartir los libros en grupos de 5, 5 y 4 libros
b. Por combinaciones:
14C5*9C3*6C2 = 2,002*84*15 = 2,522,520 maneras de repartir 10 de los 14 libros en grupos de 5, 3 y 2 libros
4) a. ¿Cuántas maneras hay de repartir a 12 alumnos en 4 equipos de 3 personas cada uno de ellos para
que realicen prácticas de laboratorio diferentes?,
b. ¿Cuantas maneras hay de que se repartan los 12 alumnos en 4 equipos de 3 personas si se va a realizar
una misma práctica?
Solución:
a. En este caso al ser prácticas de laboratorio diferentes, es posible resolver el problema por
combinaciones o por la fórmula, dado que se reparten todos los alumnos
Por fórmula:
n = 12
x1 = 3 práctica 1
x2 = 3 práctica 2
x3 = 3 práctica 3
x4 = 3 práctica 4
12P3,3,3,3 = 12! / 3!3!3!3! = 369,600 maneras de repartir a los estudiantes en cuatro equipos de 3 personas
para realizar prácticas diferentes
b. En este caso lo más probable es que se crea que la solución es igual que la que se ha dado al inciso a,
pero esto no puede ser debido a que si se desea repartir a los alumnos para realizar una misma práctica, el
orden en el que se hace la repartición no tiene importancia, ya que al equipo de tres personas les da lo mismo
quedar en el primer equipo a quedar en el segundo o tercero, ya que la práctica a realizar es la misma,
entonces la solución es;
12P3,3,3,3 * 1 /4! = 12! / 3!3!3!3! * 1 / 4! = 369,600 / 4! = 15,400 maneras de repartir a los alumnos en equipos
de 3 personas para realizar una misma práctica
Al multiplicar la solución que se da al inciso a, por 1/4! se está quitando el orden de los grupos, que en este
caso no nos interesa.
Distribuciones discretas de
probabilidad
sociado con él un suceso A de probabilidad p y sea A* el suceso contrario, cuya
probabilidad será q=1-p. Para distinguirlos con mayor facilidad, al suceso A lo
llamaremos éxito, y al suceso A* fracaso.
Todo experimento que tenga esta características diremos que sigue el modelo de
la distribución binomial.
forma:
a) Media:
b) Varianza:
En ella hay que observar:
Ajuste.
[Volver al principio]
Distribución polinomial.
[Volver al principio]
Distribución de Poisson.
[Volver al principio]
Distribución Hipergeométrica.
[Volver al principio]
[Volver al principio]
luego:
Principales características
Medición
Existen diversas definiciones del termino "medición", pero estas dependen de los diferentes puntos de vista
que se puedan tener al abordar el problema de la cuantificación y el proceso mismo de la construcción de
una escala o instrumento de medición.
En general, se entiende por medición la asignación de números a elementos u objetos para representar o
cuantificar una propiedad. El problema básico está dado por la asignación un numeral que represente la
magnitud de la característica que queremos medir y que dicho números pueden analizarse por
manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los atributos de nuestras percepciones
se transforman en entidades conocidas y manejables llamadas "números". Es evidente que el mundo
resultaría caótico si no pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la físico
saber que el hierro tiene una alta temperatura de fusión.
Niveles o Escalas de mediciones
Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la asignación,
puramente arbitraria de números o símbolos a cada una de las diferentes categorías en las cuales podemos
dividir el carácter que observamos, sin que puedan establecerse relaciones entre dichas categorías, a no ser
el de que cada elemento pueda pertenecer a una y solo una de estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes
respecto del atributo o propiedad en estudio, después de lo cual se asignan nombres a tales clases, y el
hecho de que a veces, en lugar de denominaciones, se le atribuyan números, puede ser una de las razones
por las cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo San Carlos de
acuerdos a la carrera que cursan.
Carrera Número asignada a la categoría
Educación 1
Administración 2
Se ha de tener presente que los números asignados a cada categoría sirven única y exclusivamente par
identificar la categoría y no poseen propiedades cuantitativas.
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal
es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los números asignándolo a
los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que
A posee un mayor grado de atributo que B.
La asignación de números a las distintas categorías no puede ser completamente arbitraria, debe hacerse
atendiendo al orden existente entre éstas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas
sus categorías, el cálculo de las medidas estadísticas de posición, como por ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el orden de llegada, estamos llevando
una escala ordinal, es decir que al primero en llegar ordinal, es decir que al primeo en llegar le asignamos el
nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada número representará una categoría en
general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los números asignados
guardan la misma relación que el orden de llegada a la consulta.
Escalas de intervalos iguales:
la escala de intervalos iguales, está caracterizada por una unidad de medida común y constante que asigna
un número igual al número de unidades equivalentes a la de la magnitud que posea el elemento observado.
Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en
ningún momento ausencia de la magnitud que estamos midiendo. Esta escala, además de poseer las
características de la escala ordinal, encontramos que la asignación de los números a los elemento es tan
precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la
escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente
cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las medidas
estadísticas a excepción del coeficiente de variación.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.
Escala de coeficientes o Razones:
El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos
iguales únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala
significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se
dispone de una unidad de medida para el efecto. A iguales diferencias entre los números asignados
corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Además, siendo
que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no tienen hijos,
otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos.
Las variables y su medición:
Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de valores,
llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier
valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable
es discreta".
Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de
ser medidas cuantitativamente, es decir, que pueden expresar numéricamente la magnitud de dichas
variaciones. Por intuición y por experiencia sabemos que pueden distinguirse dos tipos de variables; las
continuas y las discretas
Las variables continuas se caracterizan por el hecho de que para todo para de valores siempre se puede
encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.)
Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores
consecutivos. Por ejemplo, la estatura, el peso, la temperatura.
Para ver el gráfico seleccione la opción "Descargar" del menú superior
Ejemplo:
En el preescolar Blanca de Pérez, ubicado en la urbanización Monseñor Padilla de esta ciudad se procedió a
recoger las medidas de talla y peso de los niños que a este asisten.
Niño Peso Talla
José 18,300 1,15
Julio 20,500 1,20
Pedro 19,000 1,10
Luis 18,750 1,18
.Las variables discretas serán aquellas que pueden tomar solo un número limitado de valores separados y
no continuos; son aquellas que solo toman un determinado números de valores, porque entre dos valores
consecutivos no pueden tomar ningún otro; por ejemplo el número de estudiantes de una clase es una
variable discreta ya que solo tomará los valores 1, 2, 3, 4... nótese que no encontramos valor como 1,5
estudiantes
Por otro lado es evidente que se trata de un modelo discreto y que el campo de
variación de la variable será el conjunto de los número naturales, incluido el
cero:
Función de cuantía
Que sería : ir a
programa de cálculo
Cuya representación gráfica
para un modelo de media 11
sería la adjunta .
Obsérvense los valores
próximos en la media y su
forma parecida a la campana
de Gauss , en definitiva , a la
distribución normal
Su expresión será :
luego :
Para la obtención de la media y la varianza aplicaríamos la F.G.M.; derivándola
sucesivamente e igualando t a cero .
Así.
haciendo t = 0
por lo que =
En cuanto a la moda del modelo tendremos que será el valor de la variable que
tenga mayor probabilidad , por tanto si Mo es el valor modal se cumplirá que
:
Y, en particular:
A partir de estas dos desigualdades, es muy sencillo probar que la moda tiene
que verificar: De manera que la moda será la parte entera del
parámetro o dicho de otra forma, la parte entera de la media
Podemos observar cómo el intervalo al que debe pertenecer la moda tiene una
amplitud de una unidad , de manera que la única posibilidad de que una
distribución tenga dos modas será que los extremos de este intervalo sean
números naturales, o lo que es lo mismo que el parámetro sea entero, en cuyo
caso las dos modas serán -1 y .
Teorema de adición.
"La variable suma de dos o más variables independientes que tengan una
distribución de Poisson de distintos parámetros (de distintas medias) se
distribuirá, también con una distribución de Poisson con parámetro la suma de
los parámetros (con media, la suma de las medias) :
En efecto:
Así e
Debemos probar que la variable Z= x+y seguirá una Poisson con parámetro
igual a la suma de los de ambas:
Para Y
Función de cuantía.
Veamos :
Media y varianza.
Puede comprobarse en la
representación gráfica de una
hipergeométrica con N =100000
como ésta ,es idéntica a la de una
binomial con los mismos
parámetros restantes n y p , que
utilizamos al hablar de
la binomial
Mientras que en una distribución de probabilidad discreta un suceso con probabilidad cero
es imposible, no se da el caso en una variable aleatoria continua. Por ejemplo, si se mide
lo largo de una hoja de roble, el resultado 3,5 cm no es posible, pero tiene probabilidad
uno porque hay infinitos valores posibles entre 3 cm y 4 cm. Cada uno de esos valores
individuales tiene probabilidad cero, aunque la probabilidad de ese intervalo no lo es. Esta
aparente paradoja no se resuelve por el hecho de que la probabilidad de que X tome
algún valor en un conjunto infinito como un intervalo, no puede calcularse mediante la
adición simple de probabilidades de valores individuales. Formalmente, cada valor tiene
una probabilidad infinitesimal que estadísticamente equivale a cero.
Existe una definición alternativa más rigurosa en la que el término "distribución de
probabilidad continua" se reserva a distribuciones que tienen función de densidad de
probabilidad. Estas funciones se llaman, con más precisión, variables
aleatorias absolutamente continuas (véase el Teorema de Radon-Nikodym). Para una
variable aleatoria X absolutamente continua es equivalente decir que la probabilidad
P[X = a] = 0 para todo número real a, en virtud de que hay un incontables conjuntos de
medida de Lebesgue cero (por ejemplo, el conjunto de Cantor).
Una variable aleatoria con la distribución de Cantor es continua de acuerdo con la primera
definición, pero según la segunda, no es absolutamente continua. Tampoco es discreta, ni
una media ponderada de variables discretas y absolutamente continuas.
En aplicaciones prácticas, las variables aleatorias a menudo ofrece una distribución
discreta o absolutamente continua, aunque también aparezcan de forma natural mezclas
de los dos tipos.
Definición[editar]
Para una variable continua hay infinitos valores posibles de la variable y entre cada dos de
ellos se pueden definir infinitos valores más. En estas condiciones no es posible deducir la
probabilidad de un valor puntual de la variable; como se puede hacer en el caso
de variables discretas, pero es posible calcular la probabilidad acumulada hasta un cierto
valor (función de distribución de probabilidad), y se puede analizar como cambia la
probabilidad acumulada en cada punto (estos cambios no son probabilidades sino otro
concepto: la función de densidad.
En el caso de variable continua la distribución de probabilidad es la integral de la función
de densidad, por lo que tenemos entonces que:
Sea una variable continua, una distribución de probabilidad o función de
Para que sea una FDP ( ) legítima, debe satisfacer las siguientes
dos condiciones:
1. 0 para toda .
2.
Donde:
x = variable de tipo discreto; solo toma valores enteros
= np = media de la distribución Binomial
= = desviación estándar de la distribución Binomial
Ejemplos:
1. La probabilidad de que un paciente se recupere de una rara enfermedad
de la sangre es de 0.4. Si se sabe que 100 personas han contraído esta
enfermedad, ¿Cuál es la probabilidad de que: a) al menos 30 sobrevivan?,
b) más de 46 sobrevivan?, c) menos de 50 no sobrevivan?
Solución:
a)
n = 100
p = p(paciente se recupere) = 0.40
q = p(paciente no se recupere) = 1 – p = 1 – 0.40 = 0.60
= np = (100)(0.40) = 40 pacientes se recuperen
= = pacientes que se recuperan
x = variable que nos define el número de pacientes que se recuperan
x = 0, 1, 2,....,100 pacientes que se recuperan
X = 29.5 = 40
p( z = -2.14) =0.4838
a)
p(z = 1.33) = 0.4082
b) n = 100
p = p(paciente no sobreviva) = 0.60
q = p(paciente sobreviva) = 1 – p = 0.40
pacientes que no se recuperan
pacientes que no se recuperan
x = variable que nos define el número de pacientes que no sobreviven
x = 0, 1, 2, ....,100
p( z = -2.14) = 0.4838
2. Una prueba de opción múltiple tiene 200 preguntas, cada una con 4
posibles respuestas, de las cuáles solo una es la correcta ¿cuál es la
probabilidad de que al azar se den de 25 a 30 respuestas correctas para
80 de las 200 preguntas acerca de los cuales el estudiante no tiene
conocimientos?
Solución:
n = 80
p = p(dar una contestación correcta) = 0.25
q = p(dar una contestación incorrecta) = 1 – p = 0.75
preguntas contestadas correctamente
preguntas contestadas correctamente
x = número de preguntas que son contestadas correctamente = 0, 1, 2,...,80
b)
, p(z2= 0.30) =
0.1179
Distribución t de student
En probabilidad y estadística, la distribución t (de Student) es una distribución de
probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para
la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de
una población y ésta debe ser estimada a partir de los datos de una muestra.
valor
Chi-cuadrado de ajuste
Así pues, una vez calculadas las frecuencias absolutas de cada valor o
intervalo de valores, obtendremos el número total de observaciones de la muestra
(T) sumando las frecuencias observadas
Estadístico de contraste
Una condición básica para que podamos llevar a cabo una prueba chi-
cuadrado es que las frecuencias de las distintas clases deben ser suficientemente
altas como para garantizar que pequeñas desviaciones aleatorias en la muestra
no tengan importancia decisiva sobre el valor del estadístico de contraste.
Sea cual sea el criterio que elijamos, si resultara que la prueba no es viable
podríamos recurrir a englobar los valores o clases de valores con sus vecinos más
próximos y pasar así a engrosar sus frecuencias. Este procedimiento no puede
llevarse hasta el absurdo pero proporciona una salida digna a situaciones
complejas. En casos excepcionales se pueden englobar valores que no sean
vecinos porque exista algún nexo lógico de conexión entre ellos.
Por tanto, todo lo que necesitamos serán unas estimas de las funciones de
probabilidad de ambas variables por separado (f(x) y f(y)) y de la función de
probabilidad conjunta (f(x,y))
Estadístico de contraste
A este número tendremos que restarle I debido a que, para calcular las
frecuencias esperadas, necesitamos calcular las I sumas de filas en la tabla
anterior. Conocidas las sumas de filas obtenemos el número total de
observaciones sin perder ningún grado de libertad.
Como hemos visto, esta prueba no hace ninguna suposición acerca del tipo
de distribución de ninguna de las variables implicadas y utiliza únicamente
información de la muestra, es decir, información contingente. Esta es la razón por
la que, habitualmente, se le llama chi-cuadrado de contingencia.
Hipótesis nula:
Hipótesis alternativa:
Si tomamos una muestra de tamaño n i en cada población y contamos en
cada caso el número de sucesos A aparecidos en la muestra obtendríamos la
siguiente tabla:
Esta es una tabla típica a la que se puede aplicar la metodología de la prueba chi-
cuadrado de independencia. Veamos como corresponden las hipótesis de una y
otra prueba. Si la clasificación de las observaciones en sucesos A y no-A fuera
independiente de la clasificación en muestras, la frecuencia relativa de A (y la de
no-A) serían iguales en todos los casos y los valores esperados de las frecuencias
absolutas se calcularían multiplicando la estima común de la frecuencia relativa
global por el número de observaciones en cada muestra.
lo cual no es otra cosa que el cociente entre la suma de la fila uno (F1) y el total de
observaciones (T)
Correlación lineal
El c oe f ic i en te de c or r e l ac ió n li n e a l e s el c o ci en t e en t r e
l a co v ar i a nz a y el pr odu ct o d e l as de s vi a c io ne s t í p ic a s d e
amba s v a ri abl e s.
El c oe f ic i en te de c or r e l ac ió n li n e a l s e ex pr e s a m edi an t e l a
l etr a r .
Propiedades
1. El c oe f ic i en te d e co r r el a c ió n n o v arí a al h a c e rl o l a e s cal a d e
me di ci ón .
E s d eci r, si e xp r e sa mo s l a al tu ra en m e tr o s o en c en tí met r o s el
c o efi ci en t e d e c o r r el aci ón n o v a rí a.
2. El si gn o d el c oe f i ci e nt e d e co r r el a c i ón e s el mi s m o qu e el d e
l a co v ar i a nz a .
Si l a c o va ri an z a e s po si ti va, l a c o r r el aci ón es di r e ct a.
Si l a c o va ri an z a e s n eg ati va , l a c o r r el a ci ón es i n v e r sa .
Si l a covari an z a es n u l a, n o exi ste correl aci ón .
3. El c oe f ic i en te d e co r r el a c ió n li n e a l e s u n n ú m e r o r e al
c omp r en di do en t r e −1 y 1 .
−1 ≤ r ≤ 1
4. Si el c oe f ic i en te d e c o rr e l ac i ón l in e al t o ma v al o r es c e r can o s
a −1 l a c o r r el a ci ón e s f ue rt e e i nv e r s a , y s e r á t an t o má s f u e rt e
cu an t o m á s s e ap r o xi me r a −1 .
5. Si el c oe f ic i en te d e c o rr e l ac i ón l in e al t o ma v al o r es c e r can o s
a 1 l a c o r r el aci ón e s f u er te y d i re ct a , y s e rá t an t o má s fu e rt e
cu an t o m á s s e ap r o xi me r a 1.
6. Si el c oe f ic i en te d e c o rr e l ac i ón l in e al t o ma v al o r es c e r can o s
a 0 , l a c or r el a ci ón e s d éb i l .
7. Si r = 1 ó −1 , l os pu n t o s d e l a n u b e e stán s ob r e l a r ect a
c r eci en t e o d e c r e ci e n te . En t r e amb as va ri abl e s h ay de p en d en c i a
fu nc i on a l .
Universo y muestra
Definiciones y cualidades de una buena muestra
Una muestra es un subconjunto de la población, que se obtiene para averiguar las propiedades o
características de esta última, por lo que interesa que sea un reflejo de la población, que
sea representativa de ella, concepto al que volveremos más adelante.
Puesto que el fin que perseguimos al hacer una investigación basada en el estudio de una muestra, es inferir
los resultados a la población que nos interesa, es recomendable distinguir entre dos tipos de población: la
población objetivo y la población muestreada. La población objetivo es aquella sobre la cual el investigador
desea establecer una conclusión, por ejemplo, si deseamos determinar la deserción escolar de los estudiante
del Colegio Palma Real en el Sector Los Girasoles, la población objetivo está representada por todos los
estudiantes que estudian en dicho Centro Educativo.
La población muestreada es aquella a partir de la cual se extrajo la muestra y sobre la que puede
establecerse la conclusión. Para el ejemplo anterior, supóngase que se decidió extraer la muestra de
estudiantes del Centro Educativo Palma Real (De Palma real y los Girasoles); en este caso la población
muestreada está constituida por todos los estudiantes del centro. Los métodos de la inferencia
estadística permiten al investigador sacar conclusiones sobre la población muestreada, no sobre la población
objetivo, por lo que es conveniente que ambas coincidan, sin embargo en ocasiones esto no es factible y la
población muestreada es más restringida que el objetivo, en cuyo caso es necesario que el investigador esté
consciente de lo expuesto anteriormente.
Según Roberto Hernández Sampieri 2006, 4ta Edición reza que la muestra es, en esencia, un subgrupo de la
población. Digamos que es un subconjunto de elementos que pertenecen a ese conjunto definido en sus
características al que llamamos población. Esto se representa en la figura 8.3. Con frecuencia leemos y
escuchamos hablar de muestra representativa, muestra al azar, muestra aleatoria, como si con los simples
términos se pudiera dar más seriedad a los resultados. En realidad, pocas veces es posible medir a toda la
población, por 10 que obtenemos 0 seleccionamos una muestra y, desde luego, se pretende que este
subconjunto sea un reflejo fiel del conjunto de la población. Todas las muestras bajo el enfoque cuantitativo
deben ser representativas; por 10 tanto, el uso de este término resulta por demás inútil. Los términos al azar y
aleatorio denotan un tipo de procedimiento mecánico relacionado con la probabilidad y con la selección de
elementos; pero no logran esclarecer tampoco el tipo de muestra y el procedimiento de muestreo. Hablemos
entonces de estos conceptos en los siguientes apartados.
Tipos de muestreo
Muestreo probabilístico (aleatorio): En este tipo de muestreo, todos los
individuos de la población pueden formar parte de la muestra, tienen probabilidad
positiva de formar parte de la muestra. Por lo tanto es el tipo de muestreo que
deberemos utilizar en nuestras investigaciones, por ser el riguroso y científico.
Por ejemplo, para analizar los gastos familiares o para controlar el nivel de audiencia
de los programas y cadenas de televisión, se utiliza un muestreo por conglomerados-
familias que han sido elegidas aleatoriamente.
Las familias incluyen personas de todas las edades, muy representativas de las mismas
edades y preferencias que la totalidad de la población.
Muestreo no Probabilístico
Existen otros procedimientos para seleccionar las muestras, que son menos precisos
que los citados y que resultan menos costosos. El procedimiento más utilizado es el
muestreo no probabilístico, denominado opinático consistente en que el investigador
selecciona la muestra que supone sea la más representativa, utilizando un criterio
subjetivo y en función de la investigación que se vaya a realizar.
Un muestreo no probabilístico muy utilizado hoy en día por los institutos de opinión es
el de itinerarios, consistente en facilitar al entrevistador el perfil de las personas que
tiene que entrevistar en cada uno de los itinerarios en que se realizan las entrevistas.
Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen
la población, realizándose lo que se denomina un censo, es decir, el estudio de todos
los elementos que componen la población.
Concepto de muestreo
Una estadística es una característica de una muestra, los estadísticos emplean letras
latinas minúsculas para denotar estadísticas y muestras.
Terminología
Muestreo probabilístico
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la
población ya que al elegir a los miembros de la muestra con una periodicidad constante
(k) podemos introducir una homogeneidad que no se da en la población. Imaginemos
que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5
primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio
sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no
podría haber una representación de los dos sexos.
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamaño dado de la muestra.
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran
homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo,
según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se
pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o
el estratificado para elegir los elementos concretos que formarán parte de la muestra.
En ocasiones las dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).
Los métodos presentados hasta ahora están pensados para seleccionar directamente
los elementos de la población, es decir, que las unidades muéstrales son los elementos
de la población.
Muestreos No Probabilísticos:
• de Conveniencia
• de Juicios
• por Cuotas de Bola de Nieve Discrecional
Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se
hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos
de enfermos, etc.
Muestreo Discrecional • A criterio del investigador los elementos son elegidos sobre lo
que él cree que pueden aportar al estudio. • Ej. : muestreo por juicios; cajeros de un
banco o un supermercado; etc.
Diseño de muestra
Los estudios de consumo, oferta y abastecimiento de dendrocombustibles se realizan
fundamentalmente utilizando técnicas de muestreo. Esto significa que a través del estudio
de un pequeño grupo (muestra) elegido aleatoriamente, se obtienen datos de las variables
de interés de un grupo de mayor tamaño (universo6), para después inferir sobre el
comportamiento de esas variables en el universo. Esto es así porque hacer estos estudios
en todo el universo, con excepción de aquéllos muy pequeños, tiene altos costos.
Números índices
En general, las magnitudes socioeconómicas varían en el tiempo y en el espacio. Con
frecuencia estaremos interesados en hacer comparaciones de dichas magnitudes en dos o
más periodos de tiempo o en dos o más zonas geográficas. Por ejemplo, analizar la evolución
del PIB español en los últimos años, comparar el PIB de los países europeos o, lo que es de
más interés, estudiar la evolución de los precios de los productos de consumo a lo largo del
tiempo o comparar el nivel de desarrollo de los países del mundo.
Período actual o corriente: período de tiempo que se compara con el período base.
Índices simples: recogen la evolución del precio, la cantidad o el valor de un único bien
o producto.
precios, las cantidades o los valores de kbienes o productos. A su vez, los índices
bienes.
Simples
Números Sin Sauerbeck, Brandstreet-Dûtot,
índices Compuestos o ponderar …
complejos Laspeyres, Paasche,
Ponderados
Edgeworth, Fisher, …
bienes.
bienes.
Precios
Números índices Cantidades
Valores
Casi todos los índices se construyen para responder a una cierta pregunta en particular. Los elementos
incluidos en el compuesto dependen de la pregunta en cuestión.
Selección de los pesos apropiados
Los pesos seleccionados deberían representar la importancia relativa de los diferentes elementos.
Desafortunadamente, lo que resulta apropiado en un período puede volverse inapropiado en un lapso muy
corto.
Selección de un período base
El período base seleccionado debe ser un período normal, preferentemente un período bastante reciente.
Normal significa que el período no debe estar en un pico o en una depresión de una fluctuación. Una técnica
para evitar la elección de un período irregular consiste en promediar los valores de varios períodos
consecutivos.
10.2 Advertencia en la interpretación de un índice
En cuanto a las advertencias en la interpretación de un índice, podemos mencionar las siguientes :
Generalización a partir de un índice específico
Los factores relacionados con un índice tienden a cambiar con el tiempo, en particular, los pesos apropiados.
A menos que se cambien los pesos de acuerdo a las circunstancias, el índice se vuelve cada vez menos
confiable.
Cambios de calidad
Los números índice no reflejan los cambios en la calidad de los productos que miden. Si la calidad ha
cambiado realmente, entonces el índice sobrestima o subestima los cambios en los niveles de precios.