Vous êtes sur la page 1sur 58

VERSION NUEVE

Software para Anlisis de Datos

Sea un auditor excelente!


Usted tiene el conocimiento.
Nosotros las herramientas.

Caso de estudio Mtodos estadsticos avanzados

Caso de estudio
Mtodos Estadsticos
Avanzados de IDEA
Un documento de CaseWare IDEA

Copyright 2013 (v9.1) CaseWare IDEA Inc. Todos los derechos reservados. Este manual y
sus archivos de datos son propiedad registrada y poseen todos los derechos reservados.
Ninguna parte de esta publicacin podr ser reproducida, emitida, transcripta, guardada en
un sistema para su posterior recuperacin o traducida en ningn idioma bajo ningn
concepto sin el permiso de CaseWare IDEA Inc. CaseWare IDEA Inc. es una compaa privada
de desarrollo y comercializacin de software, con oficinas en Toronto y Ottawa, Canad,
compaas subsidiarias en Holanda y China y distribuidores asociados en ms de 90 pases.
CaseWare IDEA Inc. es subsidiaria de CaseWare International Inc., lder mundial en software
de inteligencia de negocios para auditores, contadores y profesionales en sistemas y finanzas
(www.CaseWare-IDEA.com). IDEA es distribuida bajo licencia exclusiva por CaseWare IDEA
Inc, 469 King Street West, 2nd Floor, Toronto, CANADA, M5V 1K4. IDEA es una marca
registrada de CaseWare International Inc.

Contenido

Contenido
Captulo 1

Informacin general ......................................................................... 7


Captulo 2

Correlacin ........................................................................................ 9
Introduccin.................................................................................................9
Uso de la Correlacin para investigaciones de mercado..............................10
Conclusin .................................................................................................21
Captulo 3

Anlisis de tendencias .................................................................... 23


Introduccin...............................................................................................23
Uso del Anlisis de tendencias para investigaciones de mercado ................24
Conclusin .................................................................................................38
Captulo 4

Series de tiempo ............................................................................. 39


Introduccin...............................................................................................39
Uso de las Series de tiempo para analizar datos del mercado laboral..........40
Grfico del resultado ..................................................................................53
Conclusin .................................................................................................54
Apndice

Apndice ......................................................................................... 55

Captulo

Informacin general
Los Mtodos Estadsticos Avanzados de IDEA pueden ser usados para anlisis formando parte de una
serie de rutinas de monitorizacin continua.
Este caso de estudio cubre el uso de los siguientes anlisis estadsticos en IDEA y proporciona ejemplos
acerca de cmo utilizar los mismos.

Correlacin

Anlisis de tendencias

Series de tiempo

Si bien los clculos para estos mtodos estadsticos pueden ser llevados a cabo por otro producto que
posea rutinas estadsticas incluyendo regresin lineal, o a travs del uso de las frmulas de Pearson, o
mediante el uso de las frmulas de los libros de estadstica, en IDEA estos clculos pueden llevarse a
cabo tomando como base grupo por grupo.
En el mdulo Mtodos Estadsticos Avanzados, estos grupos representan una unidad de auditora
determinada. Si bien el trmino unidad de auditora puede ser utilizado para hacer referencia a una
divisin, departamento, franquicia, o alguna otra entidad, las pruebas pueden ser ejecutadas para una
tarea que va ms all de estas unidades como puede ser el caso de proyectar una inversin o predecir
errores significativos o obtener resultados para una investigacin profesional o acadmica.
Si desea seguir las pruebas descriptas en los casos de estudio, los archivos requeridos para las mismas
pueden ser encontrados en C:\Usuarios\<nombreusuario>\Mis documentos\Mis proyectos
IDEA\Tutorial.
Sus comentarios son importantes para nosotros. Por favor enve sus comentarios relacionados con la
documentacin a IDEADocumentation@caseware.com.

Captulo

Correlacin
Introduccin

El Anlisis de Correlacin es una tcnica estadstica utilizada por auditores y otros analistas de datos
para comparar los patrones numricos en dos series de datos. Un alto nivel de correlacin, esto es,
una correlacin cercana a 1, equivale a que los valores elevados de una serie de datos coinciden con
los valores elevados de una segunda serie de datos y, por contraposicin, los valores bajos de la
primera serie coinciden con los valores bajos de la segunda serie. El coeficiente de correlacin es un
nmero nico que nos indica que nivel de coincidencia existe en este sentido. El coeficiente de
Correlacin puede ser desde -1 hasta +1.
La Correlacin originalmente fue utilizada en auditora como un componente de una serie de rutinas
de monitorizacin continua. Por ejemplo para una cadena de restaurantes se calcula el nivel
promedio mensual de ventas, y luego se calcula el anlisis de correlacin entre las ventas de cada
local y las ventas promedio. Una correlacin baja para alguno de los locales indicara que el patrn
estacional de dicho local se encuentra desviado de la norma. Otro ejemplo puede ser el anlisis de
los datos de una votacin en la que se cree que cada candidato debera recibir el mismo porcentaje
de votos en cada distrito. Tomando una presuncin simplista se asume que el candidato #1 recibe el
60 por ciento de los votos, el candidato #2 recibe el 30 por ciento de los votos y el candidato #3
recibe el 10% de los votos. Aqu el Anlisis de Correlacin puede utilizarse para ver, en cada distrito,
que grado de certeza tuvieron los porcentajes pronosticados. Una correlacin baja para algn
distrito indicara que (a) los candidatos fueron ms o menos favorecidos en el distrito o (b) hubo un
error en el recuento de votos.
Las aplicaciones de los anlisis de correlacin no se encuentran limitadas a estos tipos de anlisis,
sino que tambin pueden ser tiles para comparar informes financieros entre dos perodos. De
hecho, esta tcnica puede ser utilizada sobre cualquier serie de nmeros cuando stos deban ser
comparados con una norma o comportamiento. Por ejemplo, puede compararse el consumo de
electricidad de todas las escuelas de un distrito con el consumo promedio, o los incobrables de cada
sucursal de un banco con los patrones promedio establecidos previamente.
Como consecuencia de un anlisis de correlacin puede obtenerse una base de datos o un
resultado. Este resultado podr ser visualizado en forma de cuadrcula o en forma grfica. El grfico
nos muestra los distintos niveles de correlacin, desde el ms bajo hasta el ms alto, pudiendo
observar las proporciones de estos valores para cada unidad de auditora. A su vez el grfico puede
ser personalizado adaptndolo a su preferencia.

10

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

Uso de la
Correlacin para
investigaciones de
mercado

Un investigador de mercado de una compaa que brinda servicios especializados en el control de la


polusin por emisiones de carbn, se encuentra haciendo un anlisis de las emisiones ocurridas en
seis pases de Amrica del Norte, Asia y Europa. La compaa slo opera en los Estados Unidos y el
objetivo del estudio es identificar aquellos pases con mayor polusin para ofrecer los servicios de la
compaa en pos de un control de las emisiones de carbn. Es importante obtener estos datos
rpidamente ya que, en unos das, habr una reunin con la gente del departamento de ventas
para tratar este y otros temas.
El investigador de mercado cuenta con datos confiables de un archivo de Microsoft Excel obtenido
desde el sitio web de la Administracin de Informacin Energtica. Una parte de este archivo se
encuentra en el directorio C:\Usuarios\<nombreusuario>\Mis documentos\Mis proyectos
IDEA\Tutorial\EmisionesEIA.xls, siendo mostrado debajo en la Figura 1.1.

Figura 1.1: Extracto de informacin de emisiones de EmisionesEIA.xls

Captulo 2: Correlacin

11

Para poder usar los datos en IDEA, se llevaron a cabo los siguientes pasos en el archivo de Microsoft
Excel. De todas formas, antes de llevar a cabo estos pasos, el analista de mercado hizo un back up
del archivo original por precaucin.

Fueron eliminados los encabezados, las filas de informacin y las filas en blanco utilizadas
como espacio entre las regiones.

Las columnas ocultas fueron aplicadas a la vista (la planilla empieza en B y luego tiene
visible la columna D).

Aquellas regiones no requeridas para el anlisis en cuestin como Amrica Central,


Amrica del Sur, Africa y Oriente Medio fueron eliminadas.

Los aos 1980 al 1984 inclusive al no ser requeridos para el anlisis fueron eliminados.

Ciertas filas fueron combinadas para reflejar las realidades polticas actuales. Por ejemplo,
los datos desde 1980 hasta 1990 muestran un valor para Alemania Occidental y otro para
Alemania Oriental, y desde 1991 muestran un nico valor para Alemania. La regin del
Bltico posee algunos problemas debido a ciertas unificaciones de pases. El investigador
tom el recaudo de que el anlisis sea basado en los lmites actuales y observ que las
correlaciones bajas se hacan presentes en estos pases formados a principio de los
noventa debido a que las series de datos tenan valores cero para los aos anteriores.

Un extracto del archivo de Excel actualizado con la Regin, el Pas, el Cdigo de Pas (de dos letras) y
los Valores de emisin es mostrada debajo en la figura 1.2 (los datos fueron ordenados en sentido
descendente por los valores del 2004). Este archivo es llamado EmisionesModificado.xls y puede ser
encontrado en C:\Usuarios\<nombreusuario>\Mis documentos\Mis proyectos IDEA\Tutorial.

Figura 1.2: Extracto de los valores de emisin por pas del archivo EmisionesModificado.xls

12

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

En una planilla de Excel es muy comn tener datos de diversos perodos en diferentes columnas. Sin
embargo, para que estos datos sean analizados en IDEA, deberan ser convertidos al formato de
base de datos donde cada fila es el registro de una transaccin. En este caso, las emisiones de un
pas en un determinado ao representan un registro. En este formato todos los valores numricos se
encuentran en un nico campo (columna) llamado Carbn junto con otros campos, en este caso Pas
y Ao, indicando el grupo o unidad de auditora y el perodo. El analista cre una nueva planilla de
Excel (Emisiones por pas.xls) con los datos listos para ser importados y analizados dentro de IDEA.
Estos datos aparecen en la Figura 1.3.

Figura 1.3: Datos en formato sugerido para importar en IDEA

Captulo 2: Correlacin

13

Luego el analista cre otra planilla llamada EmisionesTotales.xls con las emisiones totales a nivel
mundial desde el archivo original (fila 248 del archivo EmisionesEIA.xls) para los aos 1985 - 2004.
Estas cifras representan el total de emisiones anuales para todos los pases, no slo para los 60
pases objeto de estudio. Ver la Figura 1.4 debajo.
NOTA: Al usar la funcin Correlacin de IDEA, no es necesario que los datos a ser examinados sean
comparados con una serie de datos derivada del archivo original. La comparacin puede basarse
sobre cualquier dato relevante. Por ejemplo, el uso de la electricidad de una escuela podra ser
comparado con el patrn medio estacional de las industrias de la zona (asumiendo que este dato se
encuentra disponible).

Figura 1.4: Emisiones anuales totales de todos los pases

14

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

Los ltimos dos archivos EmisionesPas.xls y EmisionesTotales.xls fueron importados individualmente


en IDEA usando el Asistente de Importacin de IDEA con los siguientes pasos. Los archivos en IDEA
poseen la extensin .imd (.idm si utiliza IDEA Unicode) y son importados dentro del proyecto. Si se
encuentra llevando a cabo el anlisis en base a lo descripto en este caso de estudio, especifique su
proyecto en C:\Usuarios\<nombreusuario>\Mis documentos\Mis proyectos IDEA\Tutorial.
1.

En la pestaa Principal, dentro del grupo Importar haga clic en Escritorio.

2.

Seleccione la opcin Microsoft Excel en la lista y luego el archivo Excel a ser importado.

3.

En el dilogo Microsoft Excel marque la casilla Primera fila son nombres de campo y escriba
un nombre para el archivo resultante como en la Figura 1.5.

4.

Haga clic en Aceptar.

Figura 1.5: Apariencia requerida para el dilogo Microsoft Excel

Captulo 2: Correlacin

15

Una vez importado los datos en IDEA el analista combin los datos en dos archivos seleccionando
Archivo > Unir Bases de Datos, tal como aparece en la figura 1.6 con las siguientes especificaciones:

Se incluyeron todos los campos de la base de datos primaria.

Se incluy slo el campo TOTAL de la base de datos secundaria.

El campo clave de coincidencia fue AO.

Figura 1.6: Apariencia requerida para el dilogo Unir Bases de Datos

16

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La base de datos creada luego es ordenada por PAIS en direccin ascendente cambiando su nombre
por Emisiones tal como aparece en la Figura 1.7. La base de datos posee 1200 registros (60 pases,
20 registros por pas).

Figura 1.7: Base de datos resultantes de la funcin Unir Bases de Datos


En las bases de datos de IDEA las columnas son referidas como campos y las filas como registros. El
campo PAIS indica el grupo o unidad de auditora a la que pertenece el registro. El campo AO
indica el ao de las emisiones para asegurarse que los nmeros a ser comparados pertenezcan al
mismo ao. El campo CARBON representa los valores de emisin para el pas y el ao de los
primeros dos campos. Los nmeros del campo TOTAL muestran el total de emisiones a nivel mundial
para el ao. Observe que el total del ao para el primer registro es el mismo que el total
correspondiente al registro nmero 21. La diferencia entre estos dos registros es que uno hace
referencia a 1985 y Albania mientras que el otro hace referencia a 1985 y Australia.

Captulo 2: Correlacin

17

El analista calcul la correlacin para CARBON y TOTAL usando PAIS para formar los grupos. Todas
las unidades de auditora (pases) fueron incluidas. Como salida se marcaron las opciones Crear
resultado y Crear base de datos. Ver la Figura 1.8 debajo.

Figura 1.8: Apariencia requerida para el dilogo Correlacin

18

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

Una porcin de la base de datos es mostrada en la Figura 1.9 con las correlaciones ordenadas de
menor a mayor.

Figure 1.9: Valores de correlacin ordenados de menor a mayor


El resultado de la funcin Correlacin pasa a ser un componente de la base de datos de origen del
mismo. Por consiguiente para ver el resultado, seleccione la pestaa Emisiones, para activar la base
de datos, y luego seleccione el resultado Correlacin en el rea Resultados de la Ventana de
Propiedades. El resultado puede ser visto en forma de cuadrcula o en forma grfica haciendo clic en
el botn correspondiente de la Barra de herramientas de Resultados. El grfico de la correlacin
(desde la menor hasta la mayor) debera aparecer en pantalla de acuerdo a la Figura 1.10.

Figura 1.10: Valores de correlacin mostrados en un grfico

Captulo 2: Correlacin

19

En base a la prueba efectuada el analista incluy las siguientes observaciones en su informe:

Las emisiones totales a nivel mundial mostraron un aumento constante durante el perodo
1985-2004. Si bien en algunos aos se presentan algunas pequeas disminuciones la
tendencia global refleja un aumento.

El rango de correlacin va desde -0,80 (un alto nivel de correlacin negativa) hasta 0,94
(un alto nivel de correlacin positiva). Esto significa que algunos pases tuvieron tendencias
decrecientes a lo largo del tiempo (aquellos con correlacin negativa), otros tuvieron
correlaciones cercanas a cero (lo que indica la no existencia de una tendencia creciente o
decreciente), en tanto que otros tuvieron correlaciones altamente positivas (aquellos con
tendencias crecientes fuertes). La tabla con el detalle de algunos de estos casos se exhibe
a continuacin. No aparece el grfico debido a que la cantidad de pases es mucho mayor
a las emisiones de cada pas, lo que genera un grfico donde el total por pas parece ser
una lnea horizontal en la parte inferior del grfico.

Los siguientes son algunos ejemplos de la correlacin resultante entre las emisiones individuales de
cada pas y la emisin total a nivel mundial.
En el caso de Blgica, se presenta una gran correlacin negativa (-0,799) debido a que las emisiones
de Blgica disminuyeron en tanto las emisiones a nivel mundial aumentaron.

Figura 1.11: Valores de emisin para Blgica

20

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

En el caso de Irlanda, la correlacin es cercana a cero (correlacin dbil) debido a que mientras las
emisiones a nivel mundial aumentaron, las emisiones en Irlanda aumentaron en algunos aos y
disminuyeron en otros.

Figura 1.12: Valores de emisin para Irlanda

Captulo 2: Correlacin

21

Finalmente para el caso de China, se presenta una gran correlacin positiva (0,938) debido a que las
emisiones de China aumentaron al igual que las emisiones a nivel mundial.

Figura 1.13: Valores de emisin para China

Conclusin

Al final del proyecto, el analista advirti que la correlacin tomada en forma aislada no representa la
verdadera historia. Por ejemplo un pas podra tener una gran correlacin positiva (lo que implica un
aumento en sus emisiones), sin embargo si estas emisiones equivalen a nmeros relativamente
pequeos, dicho pas no representara un mercado viable como podra ocurrir con otro pas con una
correlacin menor pero con nmeros relativamente ms grandes. Por lo tanto adems de las
correlaciones es necesario obtener una medida de los valores iniciales y los cambios promedio
(aumento o disminucin) ao a ao. Este anlisis se detalla a continuacin en la seccin Anlisis de
Tendencias.

Captulo

Anlisis de tendencias
Introduccin

El Anlisis de tendencias es una tcnica estadstica utilizada por auditores para obtener tendencias
en el comportamiento de los datos en un determinado perodo, y pronosticar valores futuros
asumiendo que dicha tendencia se repetir en el tiempo. La tcnica de Anlisis de tendencias
utilizada por el mdulo Mtodos Estadsticos Avanzados de IDEA se basa en la regresin lineal
empleando mtodos cuadrados. Esta tcnica obtiene la lnea recta que mejor ajusta los datos y
permite predecir nuevos valores en base a esta lnea. Si los datos poseen un componente estacional
asociado (por ej. valores elevados asociados quizs a ciertos meses, o das de la semana, u horas del
da), entonces el mtodo Series de Tiempo debera ser utilizado en lugar de la tcnica Anlisis de
tendencias.
El Anlisis de tendencias puede ser utilizado en auditora como un componente de una serie de
rutinas de monitorizacin continuo. Por ejemplo puede ser utilizado para prueba de errores
intencionales o no intencionales en los datos de ventas de los locales informados en un informe.
Para este caso un posible indicador de errores podra ser la disminucin en las ventas de un local
cuando, en promedio, existe un crecimiento en las ventas de todos los locales. El Anlisis de
tendencias (o regresin lineal) puede ser utilizado para cuantificar la tendencia en las ventas de cada
local. Una tendencia negativa sera un indicador de potenciales problemas en las ventas registradas.
Otro uso del Anlisis de tendencias puede ser el de proporcionar pronsticos para diversas entidades
contables en un entorno de monitorizacin continua. Estos pronsticos luego podran ser
comparados con los nmeros reales y, de existir diferencias, habra un indicador de que estos
nmeros se han desviado de la tendencia sugerida en el pasado.

24

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

El Anlisis de tendencias puede proporcionar las respuestas a muchas de las preguntas resultantes
de un anlisis:

Uso del Anlisis de


tendencias para
investigaciones de
mercado

Por ejemplo para el dueo de una franquicia: qu locales han disminuido sus ventas si se
toma en cuenta las tendencias de aumento anteriores?

Para un analista de inversin: qu inversiones muestran una tendencias negativa en sus


valores de mercado?

Para una oficina gubernamental: qu entidades muestran un uso de fondos que excede a
sus tendencias del pasado?

Para un hospital: qu secciones muestran un alto nivel, o una tendencia de aumento, en


empleados con parte de enfermo?

Para un servicio de correo, qu localidades muestran los aumentos ms grandes en


gastos por combustible?

Para una universidad: qu facultades muestran una disminucin en la cantidad de


graduados?

Como el resultado de la correlacin de la seccin anterior no le permiti ver la historia completa, el


paso siguiente del analista fue usar el Anlisis de tendencias para estimar tanto el tamao del
mercado como sus modificaciones ao a ao. Para ello el analista us la base de datos Emisiones por
pas - Total carbn tal como aparece en la Figura 2.1. Estos datos fueron importados desde el
archivo EmisinPas.xls (ver Figura 1.5).

Figura 2.1: Extracto de la base de datos de IDEA Emisiones por pas - Total carbn
Al momento del anlisis los datos del 2005 y 2006 no se encontraban disponibles. Por lo tanto el
analista decidi pronosticar los valores del 2004, basndose en los datos del perodo 1985-2003, y
luego comparar el pronstico con los datos reales del 2004.

Captulo 3: Anlisis de tendencias

Para obtener el pronstico, el analista primero cre una nueva base de datos (Pre-2004) no
incluyendo los datos de la emisin de carbn para el 2004. Para ello utiliz la funcin Extraccin
Directa con las opciones detalladas en la Figura 2.2.

Figura 2.2: Apariencia requerida para el dilogo Extraccin Directa

25

26

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

Luego de ejecutar la extraccin de los 1140 registros (60 pases, 19 veces cada uno) obtuvo la base
de datos resultante mostrada en la Figura 2.3 .

Figure 2.3: Base de datos resultante Pre-2004

Captulo 3: Anlisis de tendencias

27

A continuacin el analista utiliz la funcin Anlisis de tendencias del mdulo Mtodos Estadsticos
Avanzados de IDEA tal como muestra la Figura 2.4. Dado que el objetivo del analista era identificar
posibles valores del mercado, slo estableci un pronstico para un perodo.

Figura 2.4: Apariencia requerida para el dilogo Anlisis de tendencias


Como resultado obtuvo un Anlisis de tendencias disponible en el rea de Resultados de la Ventana
de Propiedades. A su vez, se crearon las siguientes tres bases de datos: Anlisis de Tendencias,
Anlisis de Tendencias Pronstico y Anlisis de Tendencias PEAP.

28

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La base de datos Anlisis de Tendencias se detalla en la Figura 2.5 debajo:

Figure 2.5: La base de datos resultante del Anlisis de tendencias


El campo CARBON_REF representa los datos originales. El campo CARBON_TEND representa los
valores de la lnea recta adecuada a los datos. El campo CARBON_DIFERENCIA puede ser ignorado
puesto que es utilizado para el anlisis de Series de Tiempo y no es aplicable para el anlisis de
tendencias. El campo PERIOD_PRONOS cuenta con un valor por grupo y para estos datos muestra
que el pronstico es para el perodo 20 de la serie de nmeros. El campo CARBN_PRONOSTICO
cuenta con un valor relevante para cada grupo, siendo ste la primera lnea para cada grupo. Para
Albania el pronstico para el perodo 20 fue de -0,84. Esta resultado es matemticamente correcto
pero es ilgico debido a que la polucin nunca puede ser negativa.

Captulo 3: Anlisis de tendencias

La Base de Datos Anlisis de Tendencias PRONOSTICO, mostrada en la Figura 2.6, muestra los
nombres de los grupos (en este caso los nombres de los pases del campo PAIS), el nmero de
pronstico (en este caso 20 por el perodo 20) en el campo PERIOD_PRONOS, y el pronstico
numrico para el perodo 20 en el campo CARBON_PRONOSTICO. Esta base de datos es
esencialmente una extraccin de la base de datos Anlisis de Tendencias.

Figure 2.6: La base de datos resultante Anlisis de Tendencias Pronstico

29

30

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La base de datos Anlisis de Tendencias PEAP, mostrada en la Figura 2.7, incluye solamente los
siguientes campos:

PAIS - Identifica las unidades de auditora que forman los grupos.

CARBON_PENDIENTE - La variacin en la lnea recta de perodo en perodo.

CARBON_PEAP - El Porcentaje de Error Absoluto Promedio. Consulte la Figura 2.7 y el


Apndice para obtener una explicacin detallada.

Figura 2.7: La base de datos resultante Anlisis de Tendencias PEAP


El resultado, accesible desde la Ventana de Propiedades para la base de datos sobre la cual fue
ejecutada la funcin (Pre-2004) tambin puede ser visto como un grfico haciendo clic en el botn
apropiado de la Barra de herramientas de Resultados.

Captulo 3: Anlisis de tendencias

31

El resultado para Albania es mostrado como un grfico en la Figura 2.8 debajo.

Figura 2.8: El resultado para Albania mostrado como un grfico


Tenga en cuenta que la letra A en PEAP est haciendo referencia a Valores Absolutos. El valor
absoluto de -5 y+5 es en ambos casos +5.
El PEAP de Albania (ver Figura 2.8) es particularmente elevado debido a que las diferencias (las lneas
de color rojo) son expresadas como un porcentaje de los valores reales, y para los perodos 10 al 19
los valores reales son muy pequeos. La longitud de las lneas de color rojo expresadas como un
porcentaje de los valores reales pequeos resultan en PEAP elevado.

32

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

El analista observ los valores adecuados, los datos histricos y los valores pronosticados para cada
pas analizando los resultados del anlisis en forma grfica. El grfico para India es mostrado en la
Figura 2.9.

Figura 2.9: El resultado para India mostrado como un grfico


El valor pronosticado (la marca en azul en la posicin 20) parece ser un pronstico razonable usando
el modelo de tendencia lineal. El PEAP es relativamente pequeo con un porcentaje del 3,48 por
ciento. Un PEAP pequeo implica que las diferencias entre los valores adecuados (la lnea recta) y los
valores reales es relativamente pequea.

Captulo 3: Anlisis de tendencias

33

Para este proyecto el analista quiso combinar los valores reales y los valores pronosticados en una
misma base de datos. Para ello sigui los siguientes pasos:
Como la comparacin entre los valores reales y los valores pronosticados slo es aplicable al ao
2004, el primer paso fue extraer los registros del 2004 de la base de datos original (Emisiones por
pas_Carbn_Total - ver Figura 2.1) en una nueva base de datos llamada Emisiones 2004 tal como
muestra la Figura 2.10.

Figura 2.10: Apariencia requerida para el dilogo Extraccin Directa

34

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La base de datos Anlisis de Tendencias Pronstico luego fue unida a la nueva base de datos
Emisiones 2004 usando la funcin Unir Bases de Datos de IDEA con las siguientes configuraciones
(ver Figura 2.11).

Se incluy el campo CARBON_PRONOSTICO de la base de datos secundaria.

El campo PAIS fue usado como el campo clave de coincidencia.

Figura 2.11: Apariencia requerida para el dilogo Unir Bases de Datos

Captulo 3: Anlisis de tendencias

35

Finalmente la Base de Datos PEAP del Anlisis de tendencias (con los campos CARBON_PENDIENTE y
CARBON_PEAP) fue unida, como muestra la Figura 2.12 debajo, a la base de datos obtenida en el
paso 2.

Figura 2.12: Apariencia requerida para el dilogo Unir Bases de Datos

36

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La base de datos final, Emisiones reales y pronosticadas, con los campos de diversas bases de datos
es mostrada en la Figura 2.13 debajo. El campo CARBON contiene las emisiones reales mientras que
el campo CARBON_PRONOSTICO contiene los valores pronosticados a travs del Anlisis de
tendencias.

Figura 2.13: La base de datos resultante Emisiones reales y pronosticadas

Captulo 3: Anlisis de tendencias

37

Finalmente, para identificar los candidatos ms prometedores, el analista llev a cabo una extraccin
(ver Figura 2.14) usando el siguiente criterio:

Carbn Pronstico mayor a 10

Pendiente mayor a 0 (esto representa una tendencia creciente ao tras ao)

PEAP menor a 50 (valores elevados de PEAP indicaran una tendencia errtica)

Figura 2.14: Apariencia requerida para el dilogo Extraccin Directa


La frmula para el criterio de extraccin fue CARBON_PRONOSTICO > 10 .AND.
CARBON_PENDIENTE > 0 .AND. CARBON_PEAP < 50 se especific mediante el Editor de ecuaciones.

38

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La base de datos resultante con los candidatos prometedores es mostrada en la Figura 2.15.

Figure 2.5: La base de datos resultante Candidatos prometedores

Conclusin

Se presentaron a la Gerencia los candidatos viables (ver Figura 2.15) junto con un resumen de los
mtodos usados y una descripcin de las fuentes de datos.

Captulo

Series de tiempo
Introduccin

La funcin Series de tiempo es utilizada por auditores y otros analistas de datos para calcular la
tendencia de los datos con un componente estacional a lo largo del tiempo permitiendo predecir
valores en el futuro asumiendo que dicha tendencia seguir presente. El uso de esta tcnica se vio
amenazado por el hecho de que sus pruebas slo podan ser aplicadas mediante programas
estadsticos especializados pudiendo estos programas analizar slo un grupo a la vez. Otro factor
que limitaba el uso de esta tcnica era que los diagnsticos (estadsticas e informes obtenidos) eran
excesivos haciendo dificultosa la tarea del auditor en cuanto a la focalizacin de los datos
importantes. Por ltimo, al usar los paquetes especializados el usuario deba seleccionar entre
diversos modelos puesto que no todos los modelos arrojan los mismos resultados.
A diferencia de la Correlacin o el Anlisis de tendencias, existen varias frmulas para el anlisis de
las Series de tiempo. IDEA opt por el mtodo de Descomposicin de las Series de tiempo debido a
que este modelo era de mayor utilidad para trabajar con datos financieros. A su vez este modelo
tambin fue seleccionado luego de estudiar cuidadosamente cmo tratar los casos donde el patrn
estacional se encuentra en aumento (volvindose cada vez ms extremo) y los casos donde los datos
del pasado contienen algunos valores excepcionalmente altos o bajos. Sus funciones han sido
diseadas para ser ejecutadas en forma simultnea entre diversos grupos de datos (por ejemplo
todos los locales de venta de una compaa) y los diagnsticos obtenidos han sido limitados a
aquellos requeridos para estudios de tipo financiero. Esta tcnica ajusta la mejor curva estacional a
los datos pudiendo pronosticar valores futuros a partir de esta curva estacional.
La funcin Series de tiempo puede ser utilizada para verificar si las ventas de los diferentes locales
cuentan con un componente estacional. Si los datos poseen un componente estacional asociado
(por ej. valores elevados en ciertos meses, das de la semana u horas del da), entonces el mtodo
Series de tiempo debera ser utilizado en lugar de la tcnica Anlisis de tendencias.
Un componente estacional podra darse cuando los encargados de ventas registran ventas mayores
a las usuales al final de cada trimestre. Este fenmeno suele presentarse con bastante frecuencia en
la realidad. Otro uso del Anlisis de tendencias puede ser el de proporcionar pronsticos para varias
entidades contables dentro de un ambiente de monitorizacin continua. Los pronsticos luego
podran ser comparados con los nmeros reales y, en caso de presentarse diferencias significativas,
esto indicara que los nmeros se han desviado de su tendencia pasada y del patrn estacional
asociado.

40

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La funcin Series de tiempo es ms sofisticada que la funcin Anlisis de tendencias (los resultados
sern iguales si el componente estacional es establecido en 1) y permite obtener respuestas a
diversas preguntas como las siguientes:

Uso de las Series de


tiempo para
analizar datos del
mercado laboral

Para el dueo de una franquicia, cules son los locales de venta que estn mostrando una
cada en las ventas comparada con la tendencia del pasado?

Para una lnea area, cules son los aeropuertos que estn mostrando un aumento en el
porcentaje de equipajes robados?

Para un banco, cules son las sucursales que estn mostrando un aumento en la
tramitacin y otorgacin de prstamos?

Para una comuna, cules son las escuelas cuyo abastecimiento excede ao a ao los
niveles presupuestados?

Para un departamento de polica, cules son los empleados que presentan una tendencia
ascendente en horas extras?

Para un hospital: qu secciones muestran un alto nivel, o una tendencia de aumento, en


empleados con parte de enfermo?

Para un servicio de correo, qu localidades muestran los aumentos ms grandes en


gastos por combustible?

Para una universidad, cules son las disciplinas con una tendencia ascendente de
graduados?

Para este caso de estudio nos focalizaremos en una compaa con base en Dallas que ofrece
seminarios de capacitacin a gente sin empleo como parte de un programa del gobierno diseado
para que los desempleados incorporen determinadas habilidades. El programa ha sido fuertemente
subsidiado por el gobierno federal efectundose un pago simblico a quienes completen los
seminarios. Quienes concurren a los seminarios cuentan con algunos beneficios adicionales sin tener
que postularse a nuevos trabajos durante la duracin de los mismos. La compaa posee diversas
oficinas en las distintas regiones geogrficas del pas. Cada regin geogrfica cuenta con
aproximadamente 30 millones de personas. En el caso de California se trata como un nico estado,
en tanto otras regiones del pas fueron divididas hasta en siete estados por regin.
Cada ao los gerentes regionales presupuestan sus ingresos para el ao entrante. En caso de
superar las metas previstas son recompensados con un bono significativo. Como esto puede ser un
motivo para que los gerentes regionales subestimen los valores presupuestados (con el fin de
obtener el bono), el director de la compaa se decidi por investigar tal situacin.

Captulo 4: Series de tiempo

41

Para ello se encarg de hacer un estudio de las ingresos presupuestados por los gerentes. El objetivo
del estudio era determinar si:

Las expectativas de los gerentes regionales fueron subestimadas con el fin de obtener el
bono de recompensa el ao siguiente.

Los gerentes regionales realmente conocan los patrones estacionales del negocio. Esto es,
si tomaron en cuenta en sus estimaciones los distintos perodos (estacionalidad) que
afectan la cantidad de personas desempleadas y, consecuentemente, ver si ajustaron la
cantidad de seminarios ya sea en forma creciente o decreciente debido a las variaciones
dadas por la estacionalidad natural del negocio.

Para el estudio el director emple una estadstica referente al desempleo emitida por el Ministerio de
Trabajo de EE.UU. para el perodo 1998 - 2005. Estos nmeros seran los utilizados para pronosticar
los ingresos del 2006. Estos pronsticos luego seran comparados con los pronsticos de los
gerentes regionales para el 2006, los cuales fueron establecidos en 2005. De esta forma del Director
obtendra un pronstico estadstico para el 2006 comparndolo luego con los valores reales del
2006. Los datos utilizados para el anlisis se encontraban disponibles en un archivo de Excel, el cual
no requera ninguna adaptacin para su uso. El archivo puede ser encontrado en el siguiente
directorio: C:\Usuarios\<nombreusuario>\Mis documentos\Mis proyectos
IDEA\Tutorial\Desempleados.xls.
Los datos fueron importados en IDEA usando la opcin Microsoft Excel del Asistente de Importacin
de IDEA con las especificaciones mostradas por la Figura 3.1.

Figura 3.1: Apariencia requerida para el cuadro de dilogo de Microsoft Excel

42

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La base de datos de IDEA aparece en la Figura 3.2 (ordenada por ESTADO y AO).

Figura 3.2: La base de datos resultante de IDEA ordenada por los campos ESTADO y AO
Es importante tener en cuenta que los datos hacen referencia a perodos de 13 meses anuales,
estando compuesto cada mes por cuatro semanas exactas. El ltimo mes del ao puede contar con
29 o 30 das terminando el mes de Diciembre el da 31. Esto permite una comparacin sencilla a lo
largo de los aos. De no ser as algunos meses contaran con cuatro fines de semana mientras que
otros meses tendran cinco fines de semana.

Captulo 4: Series de tiempo

Para el estudio el Director utiliz la funcin Series de tiempo de IDEA con las especificaciones
detalladas en la Figura 3.3:

Figura 3.3: Apariencia requerida para el dilogo Series de Tiempo


El Director opt por crear un Resultado como salida as como una Base de datos de Series de
tiempo, una Base de datos de Pronsticos y una Base de datos PEAP La cantidad de pronsticos
especificada fue 13 para los 13 meses de cuatro semanas del 2006.

43

44

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La Base de datos de Series de tiempo creada (mostrada en la Figura 3.4) cuenta con algunos
clculos internos. Estos clculos no son aplicables para la mayora de las situaciones, pero podran
ser de inters.

Figura 3.4: Un extracto de la base de datos Series de Tiempo resultante


La Base de Datos de Pronsticos cuenta con 13 pronsticos para cada unidad de auditora (cada
estado). Esto es mostrado en la Figura 3.5 debajo. Esta base de datos es creada para que los valores
reales sean comparados con los valores pronosticados una vez que los valores reales se encuentren
disponibles.

Figure 3.5: La base de datos Series de Tiempo Pronsticos resultante

Captulo 4: Series de tiempo

45

La Base de Datos PEAP (mostrada en la Figura 3.6), proporciona el Porcentaje de Error Absoluto
Promedio para cada clculo. Para obtener mayor informacin acerca del clculo de PEAP, consulte el
Apndice.

Figure 3.6: La base de datos Series de Tiempo PEAP resultante


El Director observ que algunos coeficientes PEAP eran relativamente elevados. El paso siguiente fue
indexar la base de datos por el campo PERSONAS_PEAP en sentido descendente, para obtener los
coeficientes PEAP ms elevados al principio. Las bases de datos pueden ser indexadas haciendo
doble clic sobre el encabezado de campo, en este caso PERSONAS_PEAP. La base de datos indexada
es mostrada debajo en la Figura 3.7.

Figura 3.7: La base de datos resultante Series de Tiempo PEAP con el campo PERSONAS_PEAP en
orden descendente

46

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

La base de datos indexada mostr que 23 estados (cerca de la mitad de los estados) tenan un
coeficiente PEAP superior al 10 por ciento. Esto significa que la desviacin promedio de la lnea
obtenida a partir de los valores reales fue superior al 10 por ciento. El Director tambin not que los
tres estados ms importantes (California, Texas y New York) estaban dentro de los estados con PEAP
ms elevados.
Para ver esto en forma grfica, el Director observ el Resultado creado por la funcin. Este resultado
puede accederse desde el rea Resultados de la Ventana de Propiedades de la base de datos desde
el cual fue obtenido, en este caso "Desempleados". Si el resultado no es mostrado en forma grfica,
haga clic en el botn correspondiente de la Barra de herramientas de Resultados para alternar entre
una cuadrcula o un grfico.
Seleccione el estado a travs del desplegable Unidad auditora. Los grficos para los estados de
Colorado (PEAP elevado), Maine (PEAP medio), y Montana (PEAP bajo) son mostrados en las Figuras
3.8, 3.9 y 3.10 respectivamente.
El resultado para el estado de Colorado con un PEAP de 18.60

Figura 3.8: El resultado para Colorado mostrado como un grfico

Captulo 4: Series de tiempo

El resultado para el estado de Maine con un PEAP de 9.47

Figura 3.9: El resultado para Maine mostrado como un grfico

47

48

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

El resultado para el estado de Montana con un PEAP de 3.49

Figura 3.10: El resultado para el estado de Montana mostrado como un grfico

Captulo 4: Series de tiempo

49

El Director observ los distintos resultados encontrando para el caso de California un grfico
particularmente interesante, de acuerdo a lo mostrado por la Figura 3.11.

Figura 3.11: El resultado para el estado de California mostrado como un grfico


California tena un coeficiente PEAP de 10.69. Esto indicaba que la lnea obtenida (de color rojo)
estaba, en promedio, "alejada" un 10 por ciento de la serie de puntos perteneciente a los datos
reales. De esta forma el grfico para California presentaba un problema para las matemticas de las
Series de tiempo. La serie de valores pertenecientes a California mostraba, primero una tendencia
decreciente, luego un crecimiento y luego una tendencia decreciente nuevamente. Las matemticas
de las Series de Tiempo asumen que la tendencia (el movimiento global ascendente o descendente)
es estable. es decir, se presenta un crecimiento o decrecimiento a lo largo del perodo.
Al extrapolar los valores del grfico para California en el futuro la tendencia global es generalmente
creciente. Esto indica que el anlisis de las Series de tiempo ha identificado correctamente el patrn
estacional (el pico cerca de mitad de ao y al final del ao) sin embargo la altura de los promedios
est identificando la tendencia promedio. Para el caso de California los valores pronosticados
parecen ser demasiado altos.

50

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

De esta forma el Director arrib a las siguientes conclusiones:

El coeficiente PEAP para 23 estados (Figura 3.7) mostr que los pronsticos no eran
confiables debido que la funcin Series de tiempo fue pronosticando una tendencia
promedio mientras que los datos mostraron que el desempleo en 2006 estara
probablemente por debajo que en 2005. Por ejemplo, considerando la serie de datos
{100, 98, 105, 150, 147, 154, 140, 137, 143} con una longitud temporal de 3. El
segundo grupo de tres valores {150, 147, 154} muestra un importante crecimiento sobre
el primer grupo de tres valores pero el ltimo grupo de tres valores {140, 137, 143}
muestra un decrecimiento comparado con la serie media de valores. Debido a que la
tendencia es creciente "en promedio" los pronsticos representan una serie de valores
mayores a la ltima serie de tres valores, incluso la serie final de tres valores es menor a la
serie media de tres valores.

El anlisis de las Series de tiempo muestra correctamente que existe un componente


estacional asociado a los datos.

Los futuros anlisis deberan utilizar datos para cinco aos y no para ocho aos.

En este caso debera efectuarse un ajuste a los pronsticos de las Series de tiempo.

Por lo tanto el Director volvi a efectuar el anlisis basndose en lo siguiente:

El mdulo Series de tiempo identific correctamente el componente estacional.

Un pronstico no influenciado por ningn factor arrojara que el nmero de desempleados


(en total por cada estado) sera igual al nmero de 2005.

Un pronstico confiable tomara los nmeros del 2005 y sobrepondra el patrn estacional
promedio asociado a los mismos.

En consecuencia el Director revis los pronsticos para California del siguiente modo:
En la base de datos original de Desempleados utiliz la funcin Extraccin Directa extrayendo los
registros de California para el 2005 (nmeros de registros 508 - 520) a una nueva base de datos
llamada Desempleados Cal 2005.
Luego extrajo los registros de California de la Base de datos de Pronsticos (nmeros de registros 53
- 65) a una nueva base de datos llamada Pronsticos Cal 2006. En esta base de datos, usando la
funcin Manejo de Campos cambi el Tipo de campo para PERIOD_PRONOS de Caracter a
Numrico.

Captulo 4: Series de tiempo

Luego uni las dos bases de datos, Desempleados Cal 2005 y Pronsticos Cal 2006, creando una
nueva base de datos con el nombre Pronsticos 2006 revisados (Figura 3.12) con las siguientes
especificaciones:

El campo clave de coincidencia fue PERIODO en la base de datos primaria y


PERIOD_PRONOS en la base de datos secundaria.

Solamente incluy el campo PERSONAS_PRONOSTICO de la base de datos secundaria.

Figura 3.12: Apariencia requerida para el dilogo Unir Bases de Datos


Luego en la base de datos Pronsticos 2006 revisados, el nombre del campo
PERSONAS_PRONOSTICO es modificado por PRONOSTICO_2006 usando la funcin Manejo de
Campos.

51

52

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

Haciendo clic en el enlace Estadsticas de campo de la Ventana de Propiedades, el Director cheque


el Valor Medio para los campos Numricos PERSONAS y PRONOSTICO_2006. Los valores promedio
fueron 948.706,62 y 1.121.159,08 respectivamente tal como se muestra en la Figura 3.13.

Figura 3.13: Las estadsticas de campo para los campos PERSONAS y PRONOSTICO_2006

Captulo 4: Series de tiempo

53

El Director insert luego dos campos virtuales, PROMEDIO_2005 con los valores promedio del
campo PERSONAS, y PROMEDIO_PRONOSTICO con los valores promedio del campo
PRONOSTICO_2006.
Luego el Director insert los siguientes dos campos virtuales tal como se muestra en la Figura 3.15:

FACTOR_ESTACIONAL para determinar el patrn estacional promedio. Para este campo


emple la frmula PRONOSTICO_2006 / PROMEDIO_PRONOSTICO.

REVISADO_2006 el cual fue calculado multiplicando el promedio de 2005 con el factor


estacional para imponer el patrn estacional promedio sobre los nmeros pertenecientes
al 2005 (PROMEDIO_2005 * FACTOR_ESTACIONAL).

FACTOR_ESTACIONAL indica cuan lejos se encuentran los valores del perodo (un mes) del valor
promedio. Por ejemplo, el primer factor estacional de 1.062 muestra que los valores del Perodo 1 se
encuentran 6.2 por ciento (1.062 - 1.000) sobre el promedio.
El pronstico revisado del 2006 es, por consiguiente, la cantidad de desempleados promedio del
2005 multiplicada por los factores estacionales calculados por la funcin Series de Tiempo de IDEA.

Grfico del
resultado

Para justificar su informe el Director present el resultado en forma grfica. Para ello sigui los
siguientes pasos:
En la base de datos original de Desempleados extrajo los desempleados de California pertenecientes
al perodo 2002 - 2005 (del 469 al 520) a una nueva base de datos llamada California 2002-2005.
Desde la base de datos Pronsticos revisados 2006 extrajo los campos ESTADO, PERODO y
REVISADO_2006 a una base de datos llamada California 2006.
En la Base de datos California2006 Insert un Campo Numrico Virtual con las siguientes
especificaciones:

Nombre de campo: AO
Tipo: Numrico Virtual
Cantidad de Decimales: 0
Parmetro: 2006

Usando la funcin Manejo de Campos modifique el nombre del campo REVISADO_2006 a


PERSONAS.
Tomando a la base de datos California 2002-2005 como la base de datos activa, usando la funcin
Agregar Bases de Datos agreg la base de datos California 2006 para crear una nueva base de
datos llamada California 2002-2006. Esta base de datos qued conformada por 65 registros.
En la nueva base de datos, usando la funcin Manejo de Campos, modific el Tipo del campo AO
de Numrico a Caracter puesto que los datos de este campo seran utilizados para el eje X del
grfico.
Usando la funcin Graficar Datos obtuvo el grfico detallado debajo en la Figura 3.16.

54

Caso de estudio Mtodos Estadsticos Avanzados de IDEA

Conclusin

El pronstico del 2006 es, por consiguiente, el promedio del 2005 multiplicado por el factor
estacional promedio del perodo bajo revisin (2006).
Usando este mtodo el director de la compaa pudo verificar si los presupuestos de los gerentes
regionales estaban sesgados (demasiado altos o demasiado bajos en forma adrede) y si los gerentes
tenan conocimiento de la manera en que el patrn estacional afecta las ventas.

Apndice

Apndice
La abreviacin de PEAP hace referencia al Porcentaje de Error Absoluto Promedio. Este coeficiente se
basa en la serie de datos reales y la lnea recta de pronsticos y se calcula de la siguiente manera:
1.

Para cada registro del grupo, se calcula la diferencia absoluta entre el valor real y la lnea recta
(valor adecuado) y luego se lo divide por el valor real.

2.

Se suman todas las diferencias absolutas calculadas anteriormente.

3.

Se calcula el promedio (dividiendo por la cantidad de registros de cada grupo).

4.

Se multiplica por 100.

Cuanto ms elevado sea el coeficiente PEAP, mayores sern las diferencias, en promedio, entre los
valores reales y los valores adecuados (lnea recta). Estas diferencias son calculadas como un
porcentaje.
A continuacin se proporciona un ejemplo simple con slo dos valores reales y adecuados:
Real

Adecuado

Diferencia
Absoluta (DA)

DA dividida
por Real

100

98

0,0200

105

110

0,0476

Promedio = (0,0200 + 0,0476) / 2 = 0,0338


Multiplicado por 100 = -.0338 * 100 = 3.38
Porcentaje de Error Absoluto Promedio = 3.38

CASEWARE.COM

CaseWare IDEA Inc.


469 King Street West, 2nd Floor
Toronto, Canada M5V 1K4

Vous aimerez peut-être aussi