Vous êtes sur la page 1sur 58

Dpto.

Mtodos de Investigacin y Diagnstico en Educacin

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

2
Pgina 0. Introduccin I. Procesos Bsicos en Excel 3 4 4 7 11 11 13 13 14 14 16 20 20 21 25 27 30 32 32 37 38 38 40 41 42 48 51 51 52 52 53 54 55 55 56

1. Estructura general del programa y de los ficheros 2. Creacin y gestin de un fichero de trabajo nuevo 3. Importacin de Datos desde otras aplicaciones 4. Conceptos bsicos tratados
II. Anlisis Estadstico de Datos con Excel

1. Diseo de la base de datos 2. Anlisis de datos con frmulas y funciones


2.1. Uso de frmulas 2.2. Uso de funciones 2.2.1. Algunas observaciones sobre Funciones Estadsticas en Excel

3. Anlisis de Datos con Tablas dinmicas


3.1. Ejemplo A: Tablas dinmicas con una sola variable: Distribucin de frecuencias y porcentajes 3.2. Ejemplo B: Tablas dinmicas con dos variables cualitativas (tablas de contingencia de doble entrada) 3.3. Ejemplo C: Resmenes descriptivos para variables cuantitativas e uno o varios grupos usando Tablas dinmicas

4. La herramienta Anlisis de Datos


4.1. Descripcin de variables cuantitativas 4.1.1. Estadstica descriptiva e Histograma 4.1.2. Coeficiente de correlacin 4.2. Test de hiptesis para dos muestras 4.2.1. Organizacin previa de los datos: Autofiltros 4.2.2. Prueba F para varianzas de dos muestras 4.2.3. Prueba t para dos muestras 4.3. Test de hiptesis para ms de dos muestras: Anlisis de Varianza

5. El complemento EzAnalyze
5.1. Describir 5.1.1. Estadstica descriptiva 5.1.2. Porcentajes 5.2. Grficas 5.2.1. Histogramas 5.2.2. Desagregacin 5.3. Avanzado 5.3.1. Correlacin 5.3.2. Pruebas T

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

3
INTRODUCCIN

Este documento trata de ser un material de apoyo a las clases que desarrollan el primer bloque de contenidos de la asignatura: Anlisis de datos con Excel. Al incluir una parte muy importante de los temas y procedimientos que se tratarn, as como de las actividades y casos prcticos que se llevarn a cabo, esperamos que la materia pueda ser seguida por los alumnos ms fcilmente. Con todo, no es un material exhaustivo ni trata de recoger todos los aspectos susceptibles de ser tratados en un curso sobre el tema. Sobre el bloque de contenidos en s, cabe decir que la principal razn por la que puede ser muy til saber cmo utilizar Excel para realizar anlisis de datos es su amplia disponibilidad al estar integrado en Office, a diferencia de lo que ocurre con los paquetes estadsticos profesionales (tales como SPSS). De hecho, Excel es muy usado para la introduccin y gestin previa de los datos en el anlisis estadstico y para el tratamiento descriptivo de la informacin. Complementariamente, el alumno debe tener noticia de que este programa presenta algunas claras limitaciones frente a los programas profesionales de anlisis estadstico. Estas limitaciones incluyen el hecho de que una parte importante de mtodos estadsticos de uso habitual no estn disponibles o presentan informacin slo parcial, as como la presencia de errores en algunas rutinas de clculo, informacin equivocada en algunos mens de ayuda y resultados imprecisos en varios procedimientos. Debido a las limitaciones anteriores se han escritos macros y sobre todo Add-in (aplicaciones accesorias que se acoplan a otra para proporcionar herramientas extra a la primera) que mejoran las prestaciones del programa para el anlisis de datos y que en su mayora son fciles de obtener. Por otro lado, Excel tiene algunos puntos fuertes y utilidades muy prcticas para el uso estadstico, entre los que destaca especialmente el trabajo con Tablas Dinmicas, como veremos a lo largo del curso. A modo de conclusin valorativa, podramos decir que si se trata de hacer un anlisis estadstico bsico, Excel puede ser una herramienta aconsejable y suficiente en una amplia variedad de casos y puede ser utilizada sin mayores reservas (anlisis descriptivos, diferencias de medias, problemas sencillos de Anlisis de Varianza...). A medida que las exigencias de anlisis aumentan, las limitaciones del programa aumentan igualmente y lo adecuado es tratar los datos con programas especficos de anlisis estadstico1. Por lo que se refiere al material, incluye un resumen de los aspectos ms relevantes de las exposiciones y tambin las actividades prcticas que se irn realizando en la clase de modo simultneo (identificadas con el smbolo ). Termina con la formulacin de dos casos prcticos de carcter ms global y realista para ser resueltos con Excel y que suponen el empleo integrado en un problema de investigacin del conjunto de herramientas y procedimientos anteriores.

Para ampliar informacin sobre los puntos fuertes y dbiles de Excel y sobre las valoraciones crticas del mismo para el trabajo estadstico pueden consultarse entre otras las siguientes fuentes: A) University of Reading Statistical Service Centre (2002). Using Excel for Statistics. Tips and Warnings. The University of Reading. Disponible en: www.rdg.ac.uk/ssc/dfid/booklets/xfs.pdf. B) Dennis R. Helsel (2002) Is Microsoft Excel an Adequate Statiscal Package?. Practicalstatistics.com. http://www.practicalstas.com/Pages/excelstas.html. C) Cryer, D.J. (2001). Problems with Using Microsoft Excel for Statistics. Paper presented at Joint Statistical Meetings 2001, Atlanta, GA. Disponible en: www.stat.uiowa.edu/~jcryer/JSMTalk2001.pdf.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

I. PROCESOS BSICOS EN EXCEL 20032


1. ESTRUCTURA GENERAL DEL PROGRAMA Y DE LOS FICHEROS

El entorno de trabajo de Excel es el comn a todas las aplicaciones Windows. De este modo, cuando arrancamos el programa, la ventana principal de Excel presenta las barras y botones tpicos de todas ellas: barra de ttulo, barra de mens (desde la que se accede a los distintos submens disponibles para la gestin de los datos), barras de herramientas e iconos, barra de estado, barras de desplazamiento horizontal y vertical, botn de maximizar, minimizar y cerrar, etc. Adems, incluye los elementos propios de una hoja de clculo, que describiremos brevemente a continuacin: Cuadro de nombres y Barra de frmulas. Estos dos elementos estn situados inmediatamente debajo de la barra de herramientas, tal y como se muestra en la figura 1. En el cuadro de nombres, situado a la izquierda, aparece la posicin de la celda activa, denominada referencia y, a continuacin, en la barra de frmulas se muestra el contenido de esa celda.

Figura 1

Ventana de documento: Hojas de clculo y libros de trabajo

La forma de la ventana de documento de Excel es similar a la de todas las hojas de clculo, formada por una estructura en cuadrcula de filas y columnas. Cada una de las columnas tiene una letra en la parte superior, que es el nombre o etiqueta de la columna. Por su parte, cada fila tiene un nmero en la parte izquierda que es el nombre o etiqueta de la fila.

2 Este epgrafe tiene por objetivo presentar de modo esquemtico las caractersticas bsicas del programa con el fin de que aquellos alumnos que no han manejado nunca antes Excel se familiaricen con sus modos bsicos de operacin. Se trata por tanto nicamente de proporcionar la informacin mnima necesaria para poder utilizar el programa con el fin de realizar anlisis estadsticos bsicos. En la bibliografa pueden encontrarse textos para una aproximacin monogrfica al uso de Excel.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

5 La interseccin de una fila con una columna forma un rectngulo llamado celda. Cada una de las celdas, por tanto, se denomina por la letra de su columna y el nmero de su fila (por ejemplo: A6, B9, etc.). Dentro de cada una de las celdas se pueden introducir datos de diverso tipo (texto, fechas, nmeros...) y tambin frmulas. La celda sobre la que est situado el cursor se denomina celda activa y es la que est preparada para la introduccin de datos. La celda activa aparece siempre resaltada con un recuadro, y su referencia y contenido se muestran en el cuadro de nombres y en la barra de frmulas respectivamente. Cuando trabajamos con Excel creamos, damos nombre y guardamos libros de trabajo, que pueden estar compuestos por una o varias hojas de clculo, cada una de ellas con la estructura bsica que acabamos de describir. Por lo tanto en Excel los documentos se denominan libros de trabajo. Un libro de trabajo es el conjunto de hojas de clculo que se agrupan en un mismo fichero o archivo. En la parte inferior de la pantalla se muestran las tres pestaas correspondientes a las tres hojas de clculo que por defecto asigna el programa a cada libro nuevo que abrimos. En la figura 2 se muestran los distintos elementos descritos. Adems, podemos ver cmo la hoja activa, la que en ese momento est abierta, presenta la pestaa en fondo blanco, mientras que las restantes aparecen sombreadas en gris.

Figura 2

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

6 ACTIVIDAD 1: Un vistazo inicial a los mens de Excel Recorre los distintos mens y las diferentes opciones que ofrece cada uno de ellos. Observa que unas tienen asociados cuadros de dilogo (se muestran con puntos suspensivos), otras ofrecen un submen con nuevas opciones (se muestra un pequeo tringulo a la derecha), algunas presentan a la izquierda un icono para indicar que tienen asociado ese smbolo en la barra de herramientas y otras tienen asociada una tecla o combinacin de teclas que realizan esa misma funcin (que se indican a la derecha y son herencia de los antiguos modo de trabajo de los programas anteriores a Windows). La mayor parte de las opciones se presentan en color negro, lo cual significa que estn disponibles, mientras que algunas se presentan en sombra para indicar que en ese momento estn desactivadas. ACTIVIDAD 2: Inspeccionando la estructura y el contenido de un fichero de Excel Sobre el fichero introduccin.xls realiza las siguientes actividades: 2.1. Celdas activas, referencias y contenido Usa las teclas de movimiento del cursor y observa que se puede activar cualquier celda. Con el ratn tambin se puede activar una celda, colocando el puntero del ratn sobre ella y pulsando el botn principal (generalmente es el izquierdo). Prubalo con varias celdas. Puedes ver que en el Cuadro de nombres aparece la posicin de la celda activa denominada referencia de la celda y, a continuacin, en la Barra de frmulas se muestra el contenido de esa celda. Mueve el cursor por las celdas de la hoja y observa cmo vara el contenido del cuadro de nombres, la barra de frmulas, etc. 2.2. Tipos de datos en una celda Localiza en la hoja de clculo inicial: a) Valores constantes (datos que se escribe directamente en una celda, y no cambian a menos que se seleccione la celda y se edite su valor). b) Frmulas (una secuencia de valores, referencias de celdas, nombres, funciones u operadores que producen un nuevo valor a partir de valores existentes; una frmula comienza siempre con el signo (=) y su valor puede cambiar cuando cambian otros valores de la hoja de clculo). 2.3. Hojas en el libro de trabajo Sita el puntero del ratn sobre alguna de las pestaas de fondo gris y pulsa el botn. Reptelo con varias hojas. Selecciona de nuevo la hoja inicial.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

7
2. CREACIN Y GESTIN DE UN LIBRO DE TRABAJO NUEVO

Una vez que nos hemos familiarizado con los elementos bsicos de la ventana principal de Excel y con sus ficheros pasaremos a tratar algunos aspectos bsicos de la creacin y de la gestin de los mismos. 2.1. Introduccin, edicin y borrado de los datos de una celda Para introducir datos en una celda debemos proceder como sigue: 1. Seleccionamos la celda haciendo clic con el ratn sobre la misma. Esta aparecer resaltada y su referencia se mostrar en el cuadro de nombres. 2. Escribimos los datos que deseemos introducir. Apreciaremos que, de modo simultneo a lo que ocurre en la celda activa, en la barra de frmulas aparecer lo que escribimos. Adems aparecen ahora dos nuevos botones en esta barra, a la izquierda del signo igual, los botones Cancelar (aspa en rojo) e Introducir (signo de verificacin en verde), tal y como muestra la figura 3. 3. Finalmente, podemos optar por cualquiera de los siguientes pasos para dejar fijo el valor introducido: Presionar Entrar Seleccionar con el ratn la siguiente celda donde deseamos introducir datos, o cualquier otra Hacer clic en el botn Introducir Datos de la barra de frmulas

Figura 3

Para corregir el contenido de la celda activa mientras se estn introduciendo datos en ella, basta pulsar la tecla Retroceso para borrar los caracteres situados a la izquierda del cursor y continuar introduciendo los datos correctos. Si se desea eliminar todos los valores introducidos en la celda haremos clic sobre el botn cancelar de la barra de frmulas. Para editar el contenido de celdas con datos ya introducidos, y en el caso de querer sustiuir todos los valores originales de una celda por otros distintos, basta seleccionarla y escribir los nuevos datos, que reemplazarn automticamente a los anteriores. Si nicamente deseamos sustituirlos parcialmente, podemos hacer doble clic sobre la celda, de modo que aparecer el cursor de texto con el que podemos movernos y corregir los valores deseados. Tambin se puede activar la celda, hacer clic sobre la barra de frmulas y realizar all las correcciones. Para borrar completamente el contenido de una celda o conjunto de celdas, en primer lugar se seleccionan las mismas y despus se pulsa la tecla Supr o la tecla Retroceso.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

8 Para copiar o mover celdas podemos recurrir a las opciones de Copiar, Cortar y Pegar o bien utilizar el sistema de arrastrado. 2.2. Rangos en la hoja de clculo Muchas de las operaciones que se realizan en la hoja de clculo requieren que previamente se haya seleccionado un rango, puesto que es el modo bsico de indicar al programa la ubicacin del conjunto de datos o valores con los que se quiere trabajar. Un rango es un conjunto de celdas conexas que forman un rectngulo y puede estar formado por celdas de una sola fila, de una sola columna o de varias filas y columnas contiguas. La referencia de un rango se compone de las referencias de las celdas superior izquierda e inferior derecha del rea rectangular, separndolas por el signo de dos puntos. Por ejemplo: B3:F3, C5:C18, E10:G17, ... El rango formado por la fila 5 se designa como 5:5 y la columna H forma el rango H:H. Puesto que la seleccin de rangos constituye una operacin bsica previa al anlisis y la gestin de datos con Excel, conviene tener presente el procedimiento adecuado para cada caso: Para seleccionar una celda: Hacer clic en ella Para seleccionar un rango o grupo de celdas contiguas: Hacer clic sobre la primera y arrastrar a continuacin el ratn hasta cubrir el rea deseada. Para seleccionar dos o ms celdas o rangos no adyacentes: Seleccionar la primera celda o rango, y proceder a seleccionar el segundo y siguientes manteniendo la tecla Ctrl presionada. Para seleccionar una columna o fila entera: Hacer clic sobre su encabezado Para seleccionar todas las celdas de la hoja: Hacer clic en el botn seleccionar todo, en la esquina superior izquierda de la hoja de clculo

2.3. Nombres de celdas o rangos En Excel es posible asignar un nombre a una celda o a un rango, para de esta forma: - Desplazarnos a esa celda o rango ms fcilmente - Utilizar los nombres en una frmula - Identificar mejor los rangos (por ejemplo: Total Actitud para denominar a toda una columna) Para dar un nombre a una celda haremos lo siguiente: 1. Situamos el cursor en la celda a la que deseemos nombrar, por ejemplo, A1 y hacemos clic en la casilla de los Nombres de celdas:

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

9 2. Escribimos el nombre deseado, por ejemplo, Primera y pulsamos Intro. La celda ha recibido un nombre.

Si ahora situamos el cursor en cualquier otra celda, abrimos la lista de nombres y escogemos Primera, el cursor salta a la celda con ese nombre; en nuestro caso, a la celda A1.

Asimismo, si seleccionamos un rango entero de celdas, podemos tambin asignarle un nombre y utilizarlo para desplazarnos a l. 2.4. Definicin de la estructura del libro Como adelantamos, por defecto Excel asigna tres hojas a cada nuevo libro creado. Puede resultar muy til reunir en un nico libro o archivo toda la informacin sobre un mismo tema, pero organizado en distintas hojas. Por ejemplo, podemos organizar un libro de modo que los datos originales ocupen una hoja denominada datos, y en las siguientes se dipongan los resultados de los anlisis bajo el nombre descriptivo, t de Student, correlacin, etc. A continuacin se describe brevemente cmo cambiar de una hoja a otra, como asignarles un nombre, cmo aadir y eliminar hojas en un libro y cmo mover una hoja a otra posicin del libro.

Para cambiar de una hoja a otra, basta hacer clic sobre la pestaa de la hoja que se desea tener activa Para sustituir el nombre genrico de las hojas que por defecto asigna el programa (Hoja, seguido del nmero de orden que tienen en el libro), hacemos doble clic sobre la pestaa correspondiente y procedemos a escribir el nuevo nombre Si se han ocupado todas las hojas del libro y se desea aadir nuevas hojas: a) Nos situamos con el ratn en la hoja inmediatamente anterior a la que se desea insertar b) En el men Edicin seleccionamos Insertar, Hoja de clculo. Se insertar una nueva hoja con el nombre genrico y el nmero siguiente de las ya creadas dentro del libro Para eliminar una hoja: a) Hacemos clic sobre la pestaa correspondiente a la hoja que se desea eliminar b) En el men Edicin se selecciona el comando Eliminar Hoja Para mover una hoja basta hacer clic sobre la pestaa de la hoja que se desea mover y arrastrarla para depositarla en la nueva posicin manteniendo pulsado el botn izquierdo del ratn.

2.5. Guardar el libro de trabajo

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

10 Como es habitual en cualquier aplicacin Windows, para guardar el archivo de trabajo se procede como sigue: Ejecutar el comando Guardar, disponible en el men Archivo 1. 2. Seleccionar la carpeta en la que se desea guardar el libro de trabajo 3. Escribir el nombre que se desea asignar al libro en el cuadro de texto Nombre del archivo 4. Hacer clic sobre el botn Aceptar. Los ficheros bsicos de Excel tiene la forma *.xls, y el programa asigna esta extensin automticamente a un libro cuando es guardado. ACTIVIDAD 3: Creacin de un fichero de datos en Excel. 1. Introduce los datos siguientes en una hoja de Excel Caso ID Sexo Estado 1 EXPED01 1 1 2 EXPED02 1 1 3 EXPED03 1 2 4 EXPED04 1 2 5 EXPED05 2 1 6 EXPED06 2 1 7 EXPED07 2 2 8 EXPED08 2 2 2. Guarda el archivo con el siguiente nombre: actividad3 ACTIVIDAD 4: Seleccin de rangos y asignacin de nombre En el fichero actividad3.xls: 1. Sita el puntero del ratn sobre el encabezado de una fila (su nmero) o de una columna (su letra) y pulsa el botn del ratn. Observa que al hacerlo la fila o columna respectiva queda resaltada. Prueba con diferentes filas y columnas. Realiza la misma operacin anterior pero arrastrando, es decir, sin soltar el botn del ratn, despus de apretarlo, y desplazndolo. Observa que de esa forma se pueden seleccionar varias filas o columnas. Para quitar la seleccin basta hacer clic sobre cualquier celda. 2. Realiza la operacin de arrastre partiendo de una celda y observa que se resalta el rango que se desee, quedando en modo inverso, es decir, el fondo de las celdas resaltadas cambia de color, exceptuando la celda inicial que se destaca con un marco que resalta los bordes. Selecciona varios rangos simultneamente utilizando la tecla Control. 3. Selecciona el rango donde estn dispuestos los datos correspondientes a la variable Altura y dale como nombre Altura ACTIVIDAD 5: Copiar y mover celdas En el fichero actividad3.xls

Edad 60 23 40 65 21 25 33 48

Peso Altura 70 165 80 175 70 170 62 170 69 160 65 160 50 154 60 151

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

11 1. Selecciona la columna donde estn dispuestos los datos de la variable Edad, incluido el rtulo. 2. Accede a la opcin Edicin Copiar o bien al botn Copiar Observa que en la celda aparecen puntos parpadeantes. 3. Selecciona cualquier otra celda vaca de encabezado de columna. 4. Accede a Edicin Pegar o pulsa el botn Pegar Observa que la zona parpadeante contina activa. 5. Pulsa la tecla Esc. Repite la operacin con la opcin Cortar sobre la copia de la variable para trasladarla a otro sitio. Observa que la columna de origen ha desaparecido, es decir, se ha movido. Prueba este otro mtodo para copiar: 1. Sita el puntero del ratn en el borde de la columna a copiar 2. Pulsa la tecla de CONTROL y sin soltarla, arrastra la celda a otra posicin. Suelta despus. Con este mtodo, si no pulsamos la tecla de control, la celda se movera. Asimismo, podemos copiar o mover un rango de celdas seleccionado con los mismos mtodos.
3. IMPORTACIN DE DATOS DESDE OTRAS APLICACIONES.

Excel puede importar (y exportar) ficheros de formatos muy diversos. Es de especial inters considerar que: a) Los ficheros de datos de Excel (*.xls) pueden importarse muy fcilmente en SPSS, de modo que podemos grabar datos en Excel que podemos posteriormente trasformar en ficheros del sistema SPSS (*.sav) para analizarlos con este programa En SPSS pueden grabarse los ficheros de datos directamente en formato Excel, de modo que si grabamos originalmente los datos en SPSS tambin podemos pasarlos a Excel para analizarlos con este programa.

b)

4. CONCEPTOS CLAVE TRATADOS

Hoja: Se denomina as a la zona donde estamos trabajando. Cada hoja tiene un nombre identificativo que podemos cambiar. Los nombres de las hojas se pueden observar en la zona inferior de la pantalla. Celda: Cuadro individual que forma parte de la hoja. En las celdas introduciremos los datos. Columna: Se nombran de la A a la Z y estn dispuestas en vertical. Despus de la columna Z, nos encontramos con la columna AA,AB,AC... y as hasta la AZ. Seguidamente, comenzara la BA, BB.. y as hasta la ltima columna que es la IV. Para el trabajo estadstico, en las columnas habitualmente se disponen las distintas variables que sern objeto de anlisis.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

12 Fila: Dispuestas en horizontal, se numeran desde la 1 hasta la 16.384 que es la ltima. Para el trabajo estadstico, en las filas habitualmente se disponen los sujetos de los que hemos obtenido medidas en las distints variables. Libro de trabajo: Conjunto de hojas. Un libro puede tener varias hojas. Al grabarlo, se crea un fichero con la extensin XLS con todas las hojas que tuviese el libro. Rango: Grupo de celdas adyacentes, es decir, que se tocan. Un rango de celdas por ejemplo que va desde la A1 hasta la A5 se reflejara con el siguiente nombre: A1:A5. El nombre de un rango siempre har referencia a la primera y a la ltima celda seleccionadas.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

13 II. ANLISIS ESTADSTICO DE DATOS CON EXCEL

1. DISEO DE LA BASE DE DATOS

Para la introduccin y gestin de datos en Excel es conveniente adoptar la estructura comn que las bases de datos adoptan en los paquetes estadsticos ms habituales. Como ya comentamos en la introduccin, aunque Excel es una herramienta til para el anlisis estadstico bsico, puesto que presenta algunas limitaciones conviene asegurar que los datos pueden ser exportados fcilmente, si lo deseamos, a otras aplicaciones para completar los anlisis. En el diseo de la base de datos conviene tener presente las siguientes indicaciones: 1. Todos los datos deben estar grabados en una sola Hoja y en un solo Libro de Excel 2. El nombre de las variables los ubicaremos en la primera fila de la Hoja. Conviene tambin que el nombre no exceda de 8 caracteres y que se inicie con una letra (no con un nmero). 3. Evitaremos introducir otros datos de texto, como ttulos o encabezados, en la Hoja. 4. Si disponemos de varios grupos, todos sus datos han de incluirse en la misma Hoja, utilizando una variable que indica la pertenencia a uno u otro grupo (ver figura 4). 5. Conviene grabar todos los datos en formato numrico, y emplear los cdigos 1 y 0 si se dispone slo de dos grupos. 6. Para los valores perdidos conviene dejar la celda en blanco, sin grabar ningn valor. Como has podido observar, todos los ficheros con los que hemos trabajado hasta ahora presentaban esta estructura.

Caso Genero Test 1 0 12 2 1 14 3 0 23 4 1 17


Estructura estndar (recomendada)

Datos mujeres Caso Test 1 12 3 23 Datos varones Caso Test 2 14 4 17


Estructura de datos no exportable (a evitar)

Figura 4

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

14 ACTIVIDAD 6: Codificacin de instrumentos de recogida de datos para su grabacin y diseo de base de datos 1. En el Anexo se reproduce un cuestionario para la recogida inicial de datos de la asignatura, as como un ejemplo de la estructura que puede presentar un libro de cdigos. Prepara una libro de cdigos para el cuestionario y en un fichero de Excel dispn la estructura de la base de datos. Graba el fichero con el nombre codificacin1.xls. 2. Imagina que se hubiera incluido tambin la siguiente cuestin: Seala los dos motivos fundamentales por los que has elegido esta asignatura optativa: Me vena bien para organizar el horario Me interesa el Anlisis de Datos En general me interesa manejarme bien con los ordenadores Me parece til para otras asignaturas de la carrera Me convenci algn compaero/a Incluye la codificacin de esta pregunta en el libro de cdigos y en el fichero cofidicacin.xls

2. ANLISIS DE DATOS CON FRMULAS Y FUNCIONES

Para analizar datos en una hoja de clculo podemos aplicar una frmula que realice operaciones tales como: suma, multiplicacin, divisin, etc. sobre nuestros datos. Para ello, cuando la barra de frmulas est activa, o cuando se edite una celda: Podemos directamente escribir en ella una frmula utilizando operadores aritmticos (suma, resta, multiplicacin, divisin...) o de comparacin (mayor que, menor que..). Podemos insertar una funcin, que es una frmula especial que ya est escrita, por lo que el uso de funciones simplifica y acorta el trabajo con frmulas. Entre las funciones incluidas en Excel hay un captulo especial dedicado a las Funciones Estadsticas del que trataremos posteriormente.

Por lo tanto hay varias formas de introducir una frmula en una celda, si bien debemos tener en cuenta que las frmulas y funciones siempre comienzan con el signo igual (=). 1. 2. La primera de ellas es teclearla directamente. As, si deseamos hallar el total de las celdas B5 a B7 tendremos que escribir =B5+B6+B7. Otro procedimiento, ms prctico y rpido, sera insertar una funcin, en este caso =SUMA(B5:B7). Para insertar una funcin adems podemos utilizar los cuadros de dilogo del comando Pegar Funcin que facilitan una gua paso a paso en Excel, lo que nos ayuda a seleccionar la misma entre las disponibles, marcar los argumentos o datos sobre los que queremos trabajar e insertarla en la barra de frmula correctamente.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

15 2.1. Uso de frmulas Tomamos como ejemplo un conjunto de datos ficticio. Supuestamente corresponden a los resultados obtenidos por cuatro sujetos en una prueba de seleccin de 60 pregunta objetivas de opcin mltiple que se dividen en 3 bloques de contenido, en cada uno de los cuales se obtiene una puntuacin parcial. Para obtener la puntuacin total de cada uno de los sujetos se podra proceder como sigue: 1. En la celda correspondiente al total del sujeto 1 escribimos la siguiente expresin: =B2+C2+D2 y pulsamos Introducir 2. Una vez que en la celda aparece el valor de la operacin, copiamos la frmula en las celdas correspondientes al resto de los sujetos pinchando con el ratn el cuadrado de su esquina inferior derecha y arrastrando mientras mantenemos el botn izquierdo presionado. 3. Al soltar el botn aparecer realizada la operacin suma correspondiente a la celda del total de cada sujeto (figura 5)

Figura 5

De modo similar trabajamos con el resto de frmulas que permiten operaciones en Excel. Los operadores aritmticos y de comparacin disponibles en Excel se presentan en la tabla 1.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

16 Operador aritmtico + * / ^ Operacin Suma Resta Multiplicacin Divisin Exponenciacin Operador de comparacin > < = <> <= >= Operacin Mayor que Menor que Igual a No igual a Menor o igual que Mayor o igual que

Tabla 1. Operadores lgicos y de comparacin en Excel

ACTIVIDAD 7: Insertar y copiar frmula A partir de los datos del fichero actividad3.xls, calcula para todos los sujetos su altura en centmetros, insertando y copiando la frmula adecuada. El resultado debe ser una columna a continuacin de la ltima con el rtulo cm donde aparezca el valor correspondiente para cada sujeto.

2.2. Uso de funciones Como ya habamos comentado, una funcin puede considerarse como un acceso directo que se emplea para el trabajo con frmulas. Excel tiene ms de 200 funciones incorporadas, agrupadas en 10 categoras bsicas que permiten una localizacin fcil y rpida (de ingeniera, de texto, estadsticas, financieras, matemticas y trigonomtricas, etc.). En el ejemplo visto en el epgrafe anterior, en vez de escribir =B2+C2+D2 (o quiz una frmula mucho ms larga, donde tenemos que sumar un nmero elevado de trminos) podemos escribir =SUMA(B2:D2) y obtendremos idnticos resultados. Con el fin de facilitar el trabajo con funciones, de modo que no sea necesario recordar el formato de una funcin particular, el comando Pegar funcin permite crear la misma paso a paso, seala la informacin obligatoria y opcional que se debe proporcionar e indica como escribirla en el orden correcto. Para activar el comando bien se hace clic en el botn correspondiente de la barra de herramientas (inmediatamente a derecha del botn autosuma y con el icono grfico de una f con una x como subndice), bien se selecciona en el men Insertar la opcin Funcin. El procedimiento comprende dos pantallas: en la primera se elige la funcin que se desea emplear; en la segunda se procede a introducir los argumentos de la funcin elegida. A continuacin ilustraremos el procedimiento para insertar funciones tomando como ejemplo el clculo del promedio (media aritmtica) de la puntuacin total obtenida por los cuatro sujetos del ejemplo del epgrafe anterior:

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

17 1. Situamos el cursor en la celda donde ha de aparecer la funcin. Tras hacer clic en el botn Insertar funcin, en la ventana de dilogo Pegar Funcin seleccionamos en el rea Categora de la funcin, Estadsticas. En el cuadro Nombre de la Funcin, entre todas las disponibles seleccionamos Promedio. Podemos observar que en la parte inferior de la ventana se presenta la informacin bsica sobre la funcin Promedio: su sintaxis, y una breve descripcin de la misma (figura 6). Esta informacin podemos ampliarla en la opcin de Ayuda.

Figura 6

2. Una vez seleccionada la opcin pulsaremos Aceptar, lo que dar paso a la siguiente ventana o cuadro de dilogo (figura 7).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

18

Figura 7

En este momento debemos introducir los argumentos. Se debe seleccionar el cuadro correspondiente al argumento que se quiere introducir (Nmero 1 en nuestro caso) haciendo clic y a continuacin, introducimos tecleando directamente el mismo o minimizamos el cuadro en el botn situado a la izquierda para seleccionarlo con el ratn sobre la hoja de clculo. En nuestro caso, para introducir el rango E2:E5, donde se situn las puntuaciones totales de cada sujeto, procedemos como sigue: 3. Hacemos clic sobre el botn que minimiza el cuadro de dilogo (en color rojo y en el extremo derecho del cuadro del argumento Nmero 1) 4. Marcamos con el ratn el rango de inters y volvemos a hacer clic sobre el botn para regresar al cuadro de dilogo 5. Introducido ya el argumento, pulsamos Aceptar. El resultado de la frmula aparece ya incorporado a la celda correspondiente (Ver figura 8 para el seguimiento de esta secuencia). De modo anlogo al mostrado pueden insertarse el resto de las funciones disponibles en Excel.

ACTIVIDAD 8: Insertar y pegar una funcin 1. A partir de los datos del fichero actividad3.xls calcula la media y la desviacin tpica de las variables edad, peso y altura en esta muestra. 2. Inspecciona el men completo de Funciones Estadsticas para hacerte idea del tipo de herramientas disponibles en este men de Excel.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

19

Figura 8

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

20 2.2.1. Algunas observaciones sobre funciones Estadsticas en Excel 1. Aunque el programa incorpora un nmero importante de funciones estadsticas y un buen nmero de ellas pueden ser de gran utilidad para nosotros, muchos de los procedimientos de estadstica descriptiva e inferencial incorporados como funciones son mucho ms fciles de obtener usando la Macro automtica correspondiente en la Herramienta Anlisis de Datos que se explica en un epgrafe posterior. 2. Algunos de los procedimientos, no obstante, no se encuentran disponibles en la Herramienta Anlisis de Datos y su obtencin es bastante laboriosa. Es el caso de la prueba Chi cuadrado de independencia entre dos variables cualitativas. Esta funcin requiere introducir, adems de la tabla de contingencia original (frecuencias observadas) que debe ser construida por el usuario (utilizando las opciones de Tablas Dinmicas que se explican tambin posteriormente) la tabla con las frecuencias esperadas o tericas, que deben ser calculadas ntegramente por el usuario. 3. Frecuentemente usaremos las funciones estadsticas para obtener resmenes descriptivos bsicos y rpidos sobre la misma hoja de datos, al modo de la configuracin de datos del archivo introduccin.xls que ya se inspeccion. Es importante en este sentido saber qu desviacin tpica calcula Excel en las distintas funciones relacionadas con este estadstico: DESVESTP: Desviacin tpica sesgada, esto es, estimada dividiendo por N (la que habitualmente obtenemos para caracterizar descriptivamente a una muestra) VARP: Varianza sesgada. Es el cuadrado de la funcin DESVESTP. DESVEST: Desviacin tpica insesgada, esto es, estimada dividiendo por N-1 VARP: Varianza insesgada. Es el cuadrado de la funcin DESVEST.
3. ANLISIS DE DATOS CON TABLAS DINMICAS

El uso de la opcin de Tablas Dinmicas que incorpora Excel es muy til para la organizacin y el anlsis de informacin cuantitativa. Este tipo de tablas permite resumir y cruzar datos en tablas de una, dos y tres dimensiones, es decir, utilizando una, dos o tres variables, ofreciendo una variedad considerable de estadsticos (frecuencias, porcentajes, media y desviacin tpica) y gran versatilidad, puesto que son interactivas y permiten ser modificadas con gran facilidad. El proceso general para crear una Tabla dinmica es el siguiente: 1. Hacer clic en cualquier celda de la base de datos 2. En el men Datos, seleccionar Informe de tablas y grficos dinmicos 3. Seguir las instrucciones del Asistente para tablas y grficos dinmicos (figura 9)

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

21

Figura 9

A continuacin desarrollamos tres ejemplos concretos de creacin de tablas dinmicas a partir de una base de datos sobre precios de matricula de instituciones de educacin superior pblicas y privadas de los Estados Unidos. Tenemos un listado de 46 universidades, y para cada una de ellas hemos grabado el coste, el tipo de centro (pblico o privado), el contexto en el que se ubica (urbano, suburbano, rural) y su perfil o tipo de titulaciones que ofrece.

3.1. Ejemplo A. Tabla dinmica con una sola variable: Distribuciones de frecuencias o Porcentajes Queremos obtener la distribucin de los centros universitarios atendiendo a su carcter pblico o privado. Para ellos, y tras indicar en el paso 1 que nuestro datos estn en una base de datos de Excel, se nos presentar la pantalla reproducida en la figura 10.

Figura 10

Hemos de marcar la base de datos completa donde estn nuestros datos, incluidos lo rtulos o encabezados de columnas, minimizando para ello el cuadro de dilogo en el botn rojo situado a la derecha de la ventana Rango(figura 11).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

22

Figura 11

Una vez que hemos proporcionado el rango de entrada, indicamos que en nuestro caso queremos que la tabla se ubique en una Hoja de Clculo nueva y distinta a donde estn los Datos. A continuacin pulsaremos el botn Diseo para especificar el tipo y caractersticas de nuestra tabla (figura 12)

Figura 12

En nuestro caso slo est implicada una variable, Tipo (de centro). Por ello

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

23 arrastraremos con el ratn el botn de campo correspondiente a esta variable tanto a la posicin de FILA como a la de DATOS (figura 13).

Figura 13

Por defecto el estadstico de resumen es Contar (es decir, frecuencia). Haciendo doble clic sobre este botn podemos cambiarlo si as lo deseamos (figura 14).

Figura 14

En el botn Opciones, adems, podemos elegir cmo queremos que se muestre el dato. En nuestro caso solicitaremos que nos muestre porcentajes de cada categora (pblico/privado) con respecto al total de centros (figura 15).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

24

Figura 15

El resultado que ofrece el programa se muestra en la figura 16. Adems, vemos que al generar la tabla dinmica el programa presenta la Barra de Herramientas de Tabla Dinmica. Actuando sobre los botones de la misma podemos modificar su diseo y tambin obtener automticamente un grfico a partir de los datos de la misma.

Figura 16

De especial inters son los botones que dan acceso al Asistente para Grficos y al Asistente

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

25 para Tablas Dinmicas (sealados en la figura 16). Pulsando sobre el primero Excel genera automticamente un grfico en una hoja nueva a partir de los datos existentes en la tabla, grfico que por defecto ser de barras y que podemos modificar como deseemos. En el Asesor para Tablas Dinmicas podemos redefinir y cambiar la tabla original.

ACTIVIDAD 9. Distribucin de frecuencias y representacin grfica para una variable cualitativa usando Informes de Tablas y Grficos Dinmicos Los datos del ejemplo anterior estn grabados en el fichero tablas.xls. 1. Replica los resultados que se han mostrado en el ejemplo, aadiendo como resultado un grfico de sectores que represente la distribucin de los centros de la muestra atendiendo a su carcter pblico o privado. El resultado final del grfico debe ser el que se muestra en la figura 17 2. Acta sobre el botn de campo Tipo de la Tabla que has generado. Prueba a marcar y demarcar alguna categora y observa cmo se modifica la tabla.
Total Centros

Pblico 33% Privado 67%

Figura 17

3.2. Ejemplo B. Tablas dinmicas con dos variables cualitativas (tablas de contingencia de doble entrada) Para construir una tabla de contingencia de doble entrada (considerando dos variables conjuntamente) realizamos un proceso similar al descrito anteriormente. De este modo, si quisiramos obtener la composicin de la muestra de centros atendiendo simultneamente a su carcter pblico o privado y a su perfil (titulaciones impartidas), en el diseo deberamos especificarlo como muestra la figura 18.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

26

Figura 18

El resultado obtenido sera en este caso el mostrado en la figura 19. Si deseamos que los datos ofrecidos se presenten en la forma de porcentajes, en la Barra de Herramientas de Tablas dinmicas podemos cambiar la especificacin inicial y solicitar datos en forma de porcentajes de filas, columnas o total.

Figura 19

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

27 ACTIVIDAD 10. Diseo de tablas dinmicas de contingencia (doble entrada) para variables cualitativas usando Tablas dinmicas Con los datos del fichero tablas.xls. 1. Replica los resultados que se han mostrado en el ejemplo 2. Acta sobre los botones de campo Tipo y Perfil de la Tabla que has generado. Prueba a marcar y demarcar alguna categora y observa cmo se modifica la tabla.

3.3. Ejemplo C. Resmenes descriptivos para variables cuantitativas en uno o varios grupos usando Tablas dinmicas Suponemos ahora que deseamos obtener un informe descriptivo bsico de la variable Coste en el conjunto de la muestra. Para ello podemos construir una Tabla Dinmica en la que disponemos en el rea de DATOS de la ventana Diseo la variable Coste. Por defecto el programa incluir como estadstico la Suma. Haciendo doble clic sobre el botn de campo podemos modificarlo, seleccionando otros diversos (figura 20) como el Promedio (media aritmtica).

Figura 20

Como habitualmente deseamos ms de un estadstico de resumen, conducimos al rea de datos la variable Coste tantas veces como estadsticos queramos obtener, repitiendo las operaciones anteriores para seleccionar la desviacin tpica, el mximo y el mnimo (figura 21).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

28

Figura 21

El resultado que obtendremos es el reproducido en la figura 22.

Figura 22

Para obtener un informe descriptivo comparado del Coste de la enseanza en las universidades pblicas y privadas, bastara trasladar el Botn de Campo Tipo a las COLUMNAS, como muestra la figura 23.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

29

Figura 23

El resultado obtenido en este supuesto es el mostrado en la figura 24.

Figura 24

ACTIVIDAD 10. Resmenes descriptivos usando Informes de Tablas Dinmicos Replica las dos tablas dinmicas que se han mostrado en el ejemplo con los datos del fichero tablas.xls

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

30
4. LA HERRAMIENTA ANLISIS DE DATOS

Microsoft Excel incorpora un Complemento o Macro automtica que incluye un conjunto de herramientas para el anlisis de datos (denominado Herramientas para anlisis), lo que permite ahorrar pasos en el desarrollo de anlisis estadsticos. Cuando utilizamos una de estas herramientas, proporcionamos los datos y parmetros para cada anlisis; la herramienta utilizar las funciones de macros estadsticas correspondientes y, a continuacin, mostrar los resultados en una tabla de resultados. Algunas herramientas generan grficos adems de tablas de resultados. La secuencia general de uso de las Herramientas para anlisis es el siguiente: 1. En el men Herramientas, seleccionar Anlisis de datos (figura 25).

Figura 25

2. En el cuadro Herramientas para anlisis, hacer clic en la herramienta que deseemos utilizar (figura 26) 3. Introducir el rango de entrada, el rango de salida y, a continuacin, seleccionar los parmetros necesarios y las opciones deseadas. Estas especificaciones variarn de un anlisis a otro y las cometaremos especficamente para cada caso.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

31

Figura 26

En ocasiones la instalacin bsica no incorpora este Complemento. En este caso, debemos proceder como sigue: 1. En el men Herramientas, seleccionar Complementos. 2. Activar la casilla de verificacin Herramientas para anlisis como muestra la figura 273

figura 27

Nos centraremos aqu en algunas de las opciones ms habituales, que se indican a continuacin agrupadas conforme a su funcin: 1. Descripcin de variables cuantitativas Estadstica Descriptiva e Histograma Coeficiente de Correlacin 2. Test de hiptesis para dos muestras: igualdad de varianzas y medias
3 Si Herramientas para anlisis no aparece en la lista del cuadro de dilogo Complementos, debemos hacer clic en Examinar y buscar la unidad, la carpeta y el nombre de archivo del complemento o macro automtica de las Herramientas para anlisis que normalmente estar ubicado en la carpeta Microsoft Office\Office\Library\Anlisis; o bien, ejecutar el programa de instalacin si no estuviera instalado.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

32 Prueba F para varianzas de dos muestras Prueba t para dos muestras o suponiendo varianzas iguales o suponiendo varianzas desiguales o emparejadas 3. Test de hiptesis para ms de dos muestras: Anlisis de varianza. de un factor (muestras independientes) de dos factores con una muestra por grupo (muestras relacionadas) de dos factores con ms de una muestra por grupo (diseo factorial)

ACTIVIDADES DEL BLOQUE ANLISIS DE DATOS Cada uno de los procedimientos que se incluyen en este apartado se describe a continuacin con un ejemplo. Los datos correspondientes a cada uno de ellos estn grabados en el fichero Excel que se indica en el epgrafe. Los alumnos deben replicar el proceso descrito en cada caso.
4.1. Descripcin de variables cuantitativas

4.1.1. Estadstica Descriptiva e Histograma (

descriptiva.xls)

Estas dos opciones del men Anlisis de datos son tiles y adecuadas para realizar informes descriptivos completos de una variable cuantitativa. La opcin Estadstica Descriptiva facilita de modo automtico un resumen numrico completo de la variable (estadsticos de tendencia central y dispersin) mientras que la opcin Histograma permite elaborar este tipo de grfico a partir de una distribucin de frecuencias agrupadas. En este ltimo caso, sin embargo, frecuentemente tendremos que construirla parcialmente nosotros mismos. Llevaremos a cabo a continuacin ambos procesos utilizando la variable Medida. El primer paso es, lgicamente, seleccionar en el men Herramientas la opcin Anlisis de Datos, y dentro de ella, Estadstica Descriptiva. Se abrir el cuadro de dilogo correspondiente, donde procederemos a especificar los distintos parmetros tal y como muestra la figura 28.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

33

Figura 28

El rango de entrada lo marcaremos minimizando esta ventana y seleccionando toda la columna que incluye los datos de la variable Medida, incluido el rtulo. Como opcin de salida indicaremos en este caso que los resultados se coloquen en una hoja del libro distinta a la de Datos y que lleve por nombre Descriptivo Medida. Una vez seleccionados los elementos bsicos del informe (los que habitualmente son de inters), procedemos a Aceptar. Los resultados ofrecidos por el programa a partir de las indicaciones anteriores son los reproducidos en la figura 29.

Figura 29

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

34 Para completar el informe deseamos obtener una representacin grfica de la distribucin de la variable. Para ello seleccionamos en el men Datos de nuevo Anlisis de datos, y a continuacin Histograma. Aparecer el cuadro de dilogo que se muestra en la figura 30. Con esta opcin podemos obtener: a) Una distribucin de frecuencias agrupada en intervalos, denominados clases en Excel b) Un grfico asociado a la distribucin de frecuencias (opcin Crear Grfico)

Figura 30

Si nos limitamos a indicar el rango de entrada (comn al de la operacin anterior) y el de salida (quiz lo ms prctico es disponer el grfico junto con el informe descriptivo que elaboramos anteriormente), el programa fija automticamente las clases (lmites de los intervalos de la distribucin de frecuencias). Este resultado automtico habitualmente habr que desecharle. Veamos por qu. En nuestro caso el resultado ofrecido por el programa es el que muestra la tabla 2.
Clase Frecuencia 39 1 60,3333333 9 81,6666667 20 103 10 124,333333 2 145,666667 1 y mayor... 2 Tabla 2

Vemos que los lmites de los intervalos son muy poco convencionales y que la distribucin es poco matizada precisamente en el centro. Por ello suele ser ms til introducir en el rango de clases los lmites fijados por el usuario. En nuestro ejemplo, y puesto que el Rango de la variable es igual a 128 (ver figura 29) y las medidas de tendencia central se sitan entre 64 y 77 (pocos casos presumiblemente por encima de 100-110), podemos elaborar como clases para nuestro ejemplo las de la tabla 3 , copindolas en la hoja Descriptivo Medida junto al informe.

Clases

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

35
39 49 59 69 79 89 99 109 119 129
Tabla 3

En el cuadro de dilogo Histograma, entonces, introducimos el rango en el que hemos dispuesto las clases y pulsamos Aceptar. El resultado de la distribucin de frecuencias y el correspondiente Histograma, que aparece como un objeto incrustado en la propia hoja de Clculo se muestra en la figura 31.

Clases Frecuencia 39 1 49 2 59 6 69 8 79 13 89 6 99 4 109 1 119 0 129 1 y mayor... 3

Histograma
Frecuencia 20 10 0 y mayo 119 39 59 79 99 Frecuencia

Clases

Figura 31

El grfico originalmente ofrecido por defecto en la opcin Histograma habitualmente debe ser formateado y modificado para que presente un aspecto adecuado. Como todos los grficos en Excel, seleccionando los distintos elementos del grfico con el botn izquierdo del ratn (ttulos, leyenda, serie de datos, ejes, etc.) podemos modificarle. As, por ejemplo, realmente un histograma es una representacin estadstica de una variable cuantitativa continua y por lo mismo presenta convencionalmente las barras contiguas. Para modificar el grfico actual con este fin, seleccionamos con el ratn las barras y haciendo clic en el botn derecho del ratn aparecer un men contextual donde podemos seleccionar Formato de la serie de datos (cuadro de dilogo en figura 32).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

36

Figura 32

Si en la opcin correspondiente indicamos un Ancho de rango igual a cero, el resultado es el ensanche automtico de cada barra. La figura 33 muestra un posible aspecto final del Histograma para la distribucin de la variable Medida.

Medida
14 12 Frecuencia 10 8 6 4 2 0
39 49 59 69 79 89 99 10 9 11 9 12 9 y m or ... ay

Figura 33

4.1.2. Coeficiente de correlacin (

Correlaciones y dos muestras.xls)

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

37 Esta opcin es til y adecuada para obtener coeficientes de correlacin de Pearson entre dos o ms variables cuantitativas. Para ello seleccionaremos en Anlisis de Datos la opcin correspondiente a Coeficiente de correlacin y proporcionaremos los parmetros solicitados en el cuadro de dilogo. En nuestro ejemplo obtendremos la matriz de correlaciones del conjunto de variables cuantitativas de la hoja de Datos (v1 a v10). Es suficiente indicar el rango de entrada, la opcin y la opcin de salida (en nuestro caso una nueva hoja con nombre correlaciones, as como la opcin rtulos puesto que los incluimos en la seleccin del rango de entrada (Figura 34). Una vez que hemos pulsado Aceptar, Excel dispone la matriz en la hoja indicada. Una visualizacin adecuada es la mostrada en la tabla 4. Pero como habitualmente el programa ofrece un exceso de posiciones decimales, este parmetro puede cambiarse seleccionando en el men Formato, la opcin Celdas e indicar un nmero ms razonable de decimales para mostrar los resultados (ver figura 35).

Figura 34

v1 v2 v3 v4 v5 v6 v7 v8 v9 v10

v1 v2 1,000 0,008 1,000 0,169 0,201 0,237 0,233 0,507 0,132 0,277 0,092 0,260 0,356 0,069 0,179 0,337 -0,005 0,340 0,238

v3 1,000 0,745 0,155 0,299 0,270 0,116 0,295 0,377

v4

v5

v6

v7

v8

v9

v10

1,000 0,246 0,504 0,446 0,234 0,320 0,376

1,000 0,348 0,350 0,326 0,243 0,210

1,000 0,460 0,389 0,445 0,275

1,000 0,289 1,000 0,260 0,354 1,000 0,233 0,323 0,400 1,000

Tabla 4

Un aspecto importante que se debe tener en cuenta es que para obtener coeficientes de correlacin los rangos de las dos o ms variables con las que se quiere calcular deben ser adyacentes, por lo que puede ser necesario cortar y pegar columnas si la base de datos lo requiere. Una limitacin mayor que esta, no obstante, es el hecho de que el programa no proporcione la significacin asociada al coeficiente de correlacin, lo que exige consultar tablas de distribucin de r de Pearson para determinar la misma.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

38

Figura 35

4.2. Test de hiptesis para dos muestras ( muestras.xls)

Correlaciones y dos

4.2.1. Organizacin previa de los datos: Autofiltros Para poder llevar a cabo contrastes de hiptesis que suponen comparacin de grupos los datos en Excel deben estar organizados de modo similar a como los disponemos para el clculo manual. Es decir, si como es habitual la base de datos est organizada en forma de lista o de matriz variables/sujetos, primero debemos preparar los datos y luego solicitar los anlisis de inters (prueba F, t, Anlisis de Varianza). Para organizar los datos de modo ms o menos automtico y evitar errores, se pueden usar varios procedimientos. Exponemos aqu el correspondiente al uso de la funcin Autofiltro, que permite seleccionar fcilmente subconjuntos de datos. Una vez seleccionados los datos podemos cortar y pegar la informacin relativa a cada subgrupo y organizar convenientemente los rangos de entrada. Los pasos a seguir para organizar, a modo de ejemplo, los datos de varones y mujeres para ser comparados en la variable V1 seran los siguientes: 1. En el men Datos seleccionamos Filtro y entre las distintas opciones disponibles la correspondiente a Autofiltro. Para realizar esta operacin debe estar seleccionada cualquier celda de la base de datos (figura 36).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

39

Figura 36

2. Al habilitar la opcin Autofiltro en el encabezado de cada columna (variable) aparecer un botn de flecha que da acceso a un men que permite seleccionar slo los casos que presentan un valor determinado de esa variable (figura 37). En el ejemplo, si seleccionamos el valor 0 slo se mostrarn los datos de la base para los varones.

Figura 37

3. Una vez que hemos seleccionado los datos de los varones, copiamos y pegamos los resultados obtenidos en V1 en una hoja nueva. A continuacin repetimos la operacin para las mujeres (valor 1 en la variable sexo). Cuando cambiemos el ttulo de los rtulos el resultado debe ser el mostrado en la figura 38.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

40

Figura 38

Una vez que tenemos los datos organizados conforme a esta estructura o una similar podemos pasar a realizar las distintas pruebas de contreste de hiptesis en Excel, incluidas las referidas al Anlisis de Varianza.
4.2.2. Prueba F para varianzas de dos muestras

Para comprobar el supuesto de homocedasticidad entre las varianzas de dos muestras, procedemos como sigue (el ejemplo se desarrolla para las submuestras de varones y mujeres en V1). 1. En el men Herramientas seleccionamos Anlisis de Datos y a continuacin Prueba F para varianza de dos muestras. En la ventana de dilogo correspondiente indicamos los rangos para la variable 1 (valores en V1 de los varones) y para la variable 2 (valores en V1 para las mujeres). Tras indicar dnde deseamos que se incorporen los resultados (en nuestro caso en una hoja nueva) pulsamos aceptar (figura 39).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

41

Figura 39

Los resultados obtenidos por el programa se muestran en la tabla 5.

Prueba F para varianzas de dos muestras varn Media Varianza Observaciones Grados de libertad F P(F<=f) una cola Valor crtico para F (una cola) Tabla 5 4,6 0,989473684 20 19 1,323943662 0,273379879 2,16824958 mujer 4,3 0,747368421 20 19

4.2.3. Prueba t para dos muestras

Disponemos de tres dos opciones distintas para realizar una prueba t que incluya muestras independientes, cuya seleccin depender de que consideremos las varianzas de las muestras iguales o no estadsticamente. Adems, si contamos con muestras relacionadas deberemos usar la opcin correspondiente a muestras emparejadas. En los tres casos el procedimiento es bsicamente idntico y el cuadro de dilogo presenta los mismos elementos. Ejemplificamos a continuacin el anlisis necesario para comparar las medias de varones y mujeres en la V1 asumiendo varianzas iguales. 1. Seleccionamos en el men Anlisis de Datos la opcin adecuada 2. En el cuadro de dilogo indicamos en el apartado de rango de entrada la disposicin de los datos para los varones (variable 1) y para las mujeres (variable 2). Adems como diferencia hipottica entre las medias introducimos 0. Dispondremos los datos en una hoja nueva (figura 40)

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

42

Figura 40

3. Los resultados ofrecidos por el programa se reproducen en la tabla 6.

Prueba t para dos muestras suponiendo varianzas iguales varn Media Varianza Observaciones Varianza agrupada Diferencia hipottica de las medias Grados de libertad Estadstico t P(T<=t) una cola Valor crtico de t (una cola) P(T<=t) dos colas Valor crtico de t (dos colas) Tabla 6 4,6 0,98947368 20 0,86842105 0 38 1,01801947 0,15755336 1,68595307 0,31510673 2,02439423 mujer 4,3 0,74736842 20

4.3. Test de hiptesis para ms de dos muestras: Anlisis de Varianza (

ANVA.xls) Las opciones disponibles en el programa son: a) b) c) Anlisis de varianza de un factor (muestras independientes) Anlisis de varianza de dos factores con una muestra por grupo (muestras relacionadas) Anlisis de varianza de dos factores con ms de una muestra por grupo (diseo factorial)

A continuacin se ejemplifica el procedimiento y los resultados ofrecidos en cada caso. 4.3.1. Anlisis de varianza de un factor (muestras independientes)

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

43 1. Se disponen los datos en la forma habitual para el clculo manual (tambin se pueden disponer en filas) (tabla 7) G1 G2 G3 12 18 6 18 17 4 16 16 14 8 18 4 6 12 6 12 17 12 10 10 14
Tabla 7

2. Seleccionada la opcin se indican los rangos de entrada (si se incluye una primera fila de etiquetas se debe indicar rtulos en la primera fila) y de salida. Tambin es posible variar el de trabajo (figura 41).

Figura 41

3. El resultado ofrecido, para el ejemplo anterior, es el que muestra la tabla 8:

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

44
Anlisis de varianza de un factor RESUMEN Grupos G1 G2 G3

Cuenta 7 7 7

Suma

Promedio Varianza 82 11,7142857 17,9047619 108 15,4285714 9,95238095 60 8,57142857 20,952381

ANLISIS DE VARIANZA Origen de Suma de Grados de las cuadrados libertad variaciones Entre grupos 164,952381 2 Dentro de 292,857143 18 los grupos Total 457,809524 20

Promedio de F Probabilidad Valor crtico para F los cuadrados 82,4761905 5,06926829 0,01793655 3,55456109 16,2698413

Tabla 8

4.3.2. Anlisis de varianza de dos factores con una sola muestra por grupo (muestras relacionadas) 1. Se disponen los datos como es habitual para el clculo manual (tabla 9) Sujetos 1 2 3 4 5 6 A 10 4 8 3 6 9 B 6 5 4 4 8 7
Tabla 9

C 8 3 7 2 6 8

D 7 4 4 2 7 7

2. Seleccionada la opcin, se indican los rangos de entrada (si se incluyen como en el ejemplo etiquetas para las filas y las columnas se debe indicar rtulos), y de salida. (figura 42).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

45

figura 42 3. El resultado ofrecido por el programa es el presentado en la tabla 10


Anlisis de varianza de dos factores con una sola muestra por grupo RESUMEN 1 2 3 4 5 6 A B C D Cuenta 4 4 4 4 4 4 6 6 6 6 Suma 31 16 23 11 27 31 40 34 34 31 Promedio 7,75 4 5,75 2,75 6,75 7,75 6,66666667 5,66666667 5,66666667 5,16666667 Varianza 2,91666667 0,66666667 4,25 0,91666667 0,91666667 0,91666667 7,86666667 2,66666667 6,66666667 4,56666667

ANLISIS DE VARIANZA Origen de Suma de Grados de las cuadrados libertad variaciones Filas 84,2083333 5 Columnas 7,125 3 Error 24,625 15 Total 115,958333 23

F Probabilidad Valor crtico Promedio de los para F cuadrados 16,8416667 10,2588832 0,00020119 2,9012952 2,375 1,44670051 0,26879848 3,28738281 1,64166667

Tabla 10

4.3.3. Anlisis de varianza de dos factores con varias muestras por grupo (ANOVA factorial) 1. Se disponen los datos como es habitual para el clculo manual (tabla 11)

b1

a1 6 4

a2 4 1

A3 4 2

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

46
2 6 2 8 3 7 5 2 7 6 9 8 5 9 6 8 8 9
Tabla 11

B2

B3

B4

5 2 3 6 6 2 3 8 9 4 8 4 5 7 8 4 7 4

2 1 1 3 1 1 2 3 6 4 3 8 4 6 5 7 9 8

2. En la ventana de dilogo se marcan los rangos de entrada (incluidas las etiquetas deseadas) y de salida. Adems debe especificarse en nmero de filas por muestra (se trata en la prctica de indicar cuntas observaciones hay en cada combinacin, dispuestas efectivamente en filas). En nuestro ejemplo es 5 (figura 43)

Figura 43

3. El resultado ofrecido, para nuestro ejemplo, es el reproducido en la tabla 12.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

47
Anlisis de varianza de dos factores con varias muestras por grupo RESUMEN
b1

a1 5 20 4 4

a2 5 15 3 2,5

A3 5 10 2 1,5

Total 15 45 3 3

Cuenta Suma Promedio Varianza


B2

Cuenta Suma Promedio Varianza


B3

5 25 5 6,5

5 25 5 6

5 10 2 1

15 60 4 6

Cuenta Suma Promedio Varianza


B4

5 35 7 2,5

5 30 6 5,5

5 15 25 90 5 6 4 4,14285714

Cuenta Suma Promedio Varianza


Total

5 40 8 1,5

5 30 6 3,5

5 15 35 105 7 7 2,5 2,85714286

Cuenta Suma Promedio Varianza

20 20 20 120 100 80 6 5 4 5,68421053 5,26315789 6,63157895

ANLISIS DE VARIANZA Origen de Suma de Grados de las cuadrados libertad variaciones Muestra 150 3 Columnas 40 2 Interaccin 20 6 Dentro del 164 48 grupo Total 374 59

F Probabilidad Valor crtico Promedio de los para F cuadrados 50 14,6341463 6,7295E-07 2,79806045 20 5,85365854 0,00531041 3,19072058 3,33333333 0,97560976 0,45198087 2,29459829 3,41666667

Tabla 12

El procedimiento efectuado por el programa corresponde a un modelo de efectos fijos. En la tabla de resultados siempre se denomina Muestras a la fuente de variacin correspondiente al factor dispuesto en las filas de la tabla (en nuestro ejemplo factor B).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

48
5. EL COMPLETO EZANALYZE

Microsoft Excel permite instalar un Complemento que incluye un conjunto de herramientas para el anlisis de datos (denominado EzAnalyze), con un interface de ventanas muy sencillo. Debemos tener las variables construidas en las columnas y la propia Herramienta arroja una tabla de resultados del anlisis solicitado muy similar a la de otros paquetes estadsticos (por ejemplo SPSS). Este Complemento no se adjunta con el Excel, sino que hay que descargarlo de la siguiente pgina web: http://www.ezanalyze.com. A continuacin se detalla la secuencia a seguir para su descarga e instalacin: 4. Entra en la pgina citada y pincha donde se indica (figura 25).

Figura 25

5. Descarga la versin 2.5 que es la permite trabajar en espaol. En esta misma pgina, debajo te pide tu correo electrnico y el lugar que ocupas en la Universidad (alumnos de Universidad). (figura 26). Pregunta si se desea guardar, indica la ruta.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

49

Figura 26

6. Abre Excel y en el men Herramientas elige Complementos y Examinar (figura 27).

Figura 27

7. Busca el archivo descargado y se incluir automticamente en la lista de Complementos (figura 28).

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

50

Figura 28 8. Con un Clic en Aceptar el Complemento aparecer en los botones de del men principal. (figura 29)

Figura 29

Nos centraremos aqu en algunas de las opciones ms habituales, que se indican a continuacin agrupadas como aparece en el programa: 4. Describir Estadstica Descriptiva Porcentajes 5. Grficas 6. Avanzado Correlacin Pruebas t Muestra nica Muestras apareadas

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

51 Muestras independientes ANOVA unifactorial ANOVA medidas repetidas Chi Cuadrado

ACTIVIDADES DEL BLOQUE ANLISIS DE DATOS Cada uno de los procedimientos que se incluyen en este apartado se describe a continuacin con un ejemplo. Los datos correspondientes a cada uno de ellos estn grabados en el fichero Excel que se indica en el epgrafe. Los alumnos deben replicar el proceso descrito en cada caso. Nota importante: para realizar cualquiera de los anlisis es imprescindible que la hoja activa sea la de datos y no cualquier otra.
5.1. Describir (

descriptiva.xls)

5.1.1. Estadstica Descriptiva Estas dos opciones del men Describir son tiles y adecuadas para realizar informes descriptivos completos de variables. La opcin Estadstica Descriptiva facilita de modo automtico un resumen numrico completo de la variable (estadsticos de tendencia central y dispersin) mientras que la opcin Porcentajes permite calcular los porcentajes y las frecuencias de cada variable (ms adecuado para variables discretas). El primer paso es, lgicamente, seleccionar en el men EzAnalyze la opcin Describir, y dentro de ella, Estadstica Descriptiva. Se abrir el cuadro de dilogo correspondiente, donde procederemos a especificar los distintos estadsticos y las variables a analizar, tal y como muestra la figura 30.

Figura 30

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

52 Una vez seleccionados los elementos bsicos del informe (los que habitualmente son de inters), procedemos a Aceptar. Los resultados ofrecidos por el programa a partir de las indicaciones anteriores se copian automticamente en una hoja nueva, a la que denomina EZA1, son los reproducidos en la figura 31.

Figura 31

5.1.2. Porcentajes Para completar el informe descriptivo numrico, podra resultar de inters realizar tambin un clculo de porcentajes de la variable discreta Grupo. Para ello, seleccionamos del men EzAnalyze, describir y porcentajes. De nuevo se nos abre una ventana que nos permite elegir la variable/s a analizar. Una muestra de los resultados, eligiendo la variable Grupo se copia en una hoja nueva EZA2 y se muestra en la figura 32.

Figura 32

5.2. Grficas

Para completar el informe deseamos obtener una representacin grfica de la distribucin de las variables. Esta herramienta nos permite trabajar mltiples opciones, veamos dos de ellas: histograma de cada variable y datos desagregados.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

53 5.2.1. Histogramas Seleccionamos en el men de Grficas la opcin Histogramas, nos aparecer una ventana donde debemos elegir las variables que queremos representar grficamente y el tipo de grfico, marcamos, como ejemplo, lo que se muestra en la figura 33.

Figura 33

Los resultados que arroja en una hoja nueva, se presentan en la figura 34.

Figura 34

Los grficos circulares o de sectores suelen representar bien variables discretas de pocas categoras, como es el caso del ejemplo con la variable Grupo, sin embargo, para variables discretas de varias categoras son ms apropiados los grficos de barras as como los grficos de rea lo sin para las variables continuas. Veamos un ejemplo con la variable Medida. Repetimos el proceso anterior, en este caso seleccionando la variable Medida y la grfica de reas. El resultado se muestra en la figura 35.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

54

Figura 35

El grfico originalmente ofrecido por defecto en la opcin Histograma habitualmente debe ser formateado y modificado para que presente un aspecto adecuado. Como todos los grficos en Excel, seleccionando los distintos elementos del grfico con el botn izquierdo del ratn (ttulos, leyenda, serie de datos, ejes, etc.) podemos modificarlo. 5.2.2. Desagregacin

En ocasiones resulta muy interesante estudiar una variable continua desagregada o agrupada en las categoras de una variable discreta. En el ejemplo presentado nuestra variable continua ser Medida y nuestra variable discreta Grupo. Seleccionando en el men de Grficas la opcin Desagregacin se nos presenta una ventana como la que aparece en la figura 36, all seleccionamos las variables y la opcin de representacin que nos interesa.

Figura 36

Los resultados se guardan en una hoja nueva y muestran en la figura 37.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

55

Figura 37

5.3. Avanzado

5.3.1. Correlacin (

Correlaciones y dos muestras para EzAnalyze.xls)

Esta opcin es til y adecuada para obtener coeficientes de correlacin de Pearson entre dos o ms variables cuantitativas. Para ello seleccionaremos en EzAnalyze la opcin correspondiente a Correlacin y seleccionaremos el par de variables para las que interesa estudiar la correlacin (esta es una de las limitaciones del complemento, no permite trabajar de una vez con ms de un par de variables). En nuestro ejemplo seleccionaremos v1 y v10 y pulsaremos aceptar. Los resultados que arroja son tanto numricos (correlacin, N y probabilidad de ocurrencia asociada al estadstico) como grficos, tal y como puede apreciarse en la figura 38.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

56

Figura 38

5.3.2. Pruebas T (

Correlaciones y dos muestras para EzAnalyze.xls)

Para realizar pruebas t de Student el EzAnalyze nos proporciona tres opciones: Muestra nica, Muestras apareadas y Muestras independientes. Si seleccionamos la primera de ellas, debemos indicar el valor de la Media poblacional, supongamos que es 5 y seleccionar la variable a la que queremos hacer el contraste, por ejemplo v1 (figura 39).

Figura 39

Los resultados obtenidos muestran informacin numrica (Media, desviacin tpica, valores de t y de p) junto con una breve interpretacin sustantiva, as como informacin grfica, como puede observarse en la figura 40.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

57

Figura 40 Si nuestro inters es hacer un contraste de dos medias en muestras relacionadas debemos elegir la opcin de Pruebas T para muestras apareadas. La ventana que aparece nos permite elegir las dos columnas o variables en las que habremos colocado los datos de ambas muestras relacionadas, en nuestro ejemplo V1 y V1bis. Los resultados obtenidos son de caractersticas similares a los de la prueba anterior y se muestran en la figura 41.

Figura 41

En el caso de que las muestras sean independientes, se debe seleccionar una variable dependiente continua (variable a contrastar) y otra de agrupacin (la que crea las dos muestras independientes), los grupos que crea esta ltima variable los obtiene automticamente pulsando el botn obtener grupos, en nuestro caso contrastaremos si existen diferencias significativas en v1 entre los grupos formados por la variable sexo (0: chicos, 1:chicas), ver figura 42.

Dpto. Mtodos de Investigacin y Diagnstico en Educacin

58

figura 42

Los resultados que se obtienen son similares a los de las pruebas anteriores y se muestran en la figura 43.

figura 43

Vous aimerez peut-être aussi