Académique Documents
Professionnel Documents
Culture Documents
Tabla de contenidos
INTRODUCTION...................................................................................................................
...........................................2
DATOS
PREPARATION.....................................................................................................................
...............................3
V
Isualize
D
ATA
...................................................................................................................................................
..........3
D
ATA IMPORTACIN
...................................................................................................................................................
...............6
D
ATA EXPORTACIN
...................................................................................................................................................
.............11
F
ILE
F
ORMATS
...................................................................................................................................................
............16
DATOS CVS ARCHIVO
FORMAT...................................................................................................................................
...16
TXT y TVS FORMATO DE DATOS ARCHIVO
.......................................................................................................................17
PRN FORMATO DE DATOS ARCHIVO
.....................................................................................................................................18
DIF FORMATO DE DATOS ARCHIVO
......................................................................................................................................20
G
RAPH
...................................................................................................................................................
...45
Datos
sets.............................................................................................................................................
......................46
Preprocesamiento
methods.....................................................................................................................................
........48
Estndar
methods.....................................................................................................................................
................49
Mtodos de postprocesado
...........................................................................................................................................50
Estadstico
tests............................................................................................................................................
..............51
Visualizacin
modules.....................................................................................................................................
..........52
Connections...............................................................................................................................
...............................53
G
RAPH
M
GESTIN
...................................................................................................................................................
55
LA
LGORITHM PARMETROS DE CONFIGURACIN
..................................................................................................................56
G
Eneration DE
E
Xperimentos
.....................................................................................................................................57
M
ENU BAR
...................................................................................................................................................
..................59
T
OOL BAR
...................................................................................................................................................
...................62
S
STADO BAR
...................................................................................................................................................
................63
CARRERA
KEEL........................................................................................................................................
...............................64
L
AUNCHING
R
Naciones Unidas
K
ANGUILA
..................................................................................................................................................
64
V
RESULTADOS IEW
...................................................................................................................................................
............64
EDUCATIONAL.....................................................................................................................
.........................................65
YO
NTRODUCCIN
...................................................................................................................................................
...........65
M
ENU
B
Arkansas
...................................................................................................................................................
..................65
T
OOL BAR
...................................................................................................................................................
...................68
S
STADO BAR
...................................................................................................................................................
................69
C
ONFIGURACIN DE EXPERIMENTOS
................................................................................................................................70
S
ELECCIN DE LOS CONJUNTOS DE DATOS
..............................................................................................................................................71
E
Xperiment
G
RAPH
...................................................................................................................................................
...73
Datos
sets.............................................................................................................................................
......................74
Preprocesamiento
methods.....................................................................................................................................
........76
Estndar
methods.....................................................................................................................................
................77
Connections...............................................................................................................................
...............................78
G
RAPH
M
GESTIN
...................................................................................................................................................
79
LA
LGORITHM PARMETROS DE CONFIGURACIN
..................................................................................................................80
R
EXPERIMENTO ONU
...................................................................................................................................................
.......81
Pgina 2
2
INTRODUCCIN
QUILLA es una herramienta de software desarrollada para construir y utilizar diferentes
modelos de minera de datos. Nos gustara
remarcar que esta es la primera herramienta de software de este tipo que contiene un cdigo
libre biblioteca de Java
Algoritmos Evolutivos aprendizaje. Las principales caractersticas de la quilla son:
El entorno del QUILLA puede conectarse a Internet para descargar nuevos archivos de
datos para utilizarlos en
futuros anlisis.
Podemos distinguir tres partes en el entorno grfico:
La preparacin de la parte Bases de datos permite a los usuarios crear diferentes particiones
de su propia
bases de datos o las bases de datos disponibles en la web quilla. Adems, es posible editar,
aplicar
transformaciones, generan conjuntos de datos en el formato correcto de los archivos C4.5 o
una vista detallada
parcelas sobre un conjunto de datos concreto.
El Diseo de Experimentos parte tiene el objetivo de disear los experimentos deseados
utilizando
una interfaz grfica. Despus del experimento est diseado, la interfaz genera un archivo
.ZIP
que contiene una estructura de directorio con todos los archivos necesarios necesario para
ejecutar esos experimentos
en el equipo local.
La interfaz tambin permite al usuario aadir sus propios algoritmos para el ser la
experimentacin
diseado. El nico requisito es aceptar el formato de archivo de entrada de la quilla.
Incluso, no es
necesaria para utilizar el lenguaje Java para los propios algoritmos de usuario. Esto
proporciona una muy
de manera flexible para el usuario comparar sus propios mtodos con los que est en quilla.
La Figura 1 muestra la ventana principal de esta opcin. En primer lugar, debe seleccionar
la ruta de datos de origen
conjunto (en formato QUILLA) que desea visualizar (ver Figura 2). Cuando se carga el
archivo, distinta
informacin sobre el conjunto de datos se muestra de acuerdo con la opcin seleccionada.
Figura 2. Cargar conjunto de datos para ver su contenido.
Vista de conjunto de datos. Si selecciona para visualizar esta informacin, usted puede
visualizar el contenido del conjunto de datos
seleccionado. La informacin no puede ser modificado; slo se puede visualizar (ver Figura
3).
Figura 3. Visualizar el contenido del conjunto de datos.
Atributo Info. En esta opcin, se puede obtener informacin detallada sobre los atributos
definidos en
establecen los datos. La informacin mostr en la parte superior de las ventanas es: tipo de
atributo (entero, real o
Nominal) y si el atributo es de entrada o de salida. Aparece Ms informacin en la parte
inferior izquierda de
la ventana. La informacin mostr depende del tipo de atributo, en el caso de entero o real
atribuir los valores de rango, la media y la varianza se muestran. En el caso de atributo
nominal, se
Slo ver sus posibles valores. Por ltimo, en la parte derecha inferior de la ventana, un
cuadro con la
distribucin de los valores del atributo se muestra tambin. La figura 4 muestra la
informacin de un verdadero atributo
y la Figura 5 muestra la informacin de un atributo nominal.
Figura 4. General y la informacin grfica sobre el atributo real.
Pgina 5
5
Figura 5. General y la informacin grfica sobre el atributo nominal.
Grficos 2D. En esta opcin, usted puede comparar los diferentes atributos. En primer
lugar, usted tiene que seleccionar los dos
atributos que desea comparar, para cada atributo que tiene disponible una lista con todos los
atributos de
conjunto de datos (ver Figura 6).
Figura 6. Seleccione los atributos para comparar.
Una vez seleccionados los atributos, lo que tienes que hacer clic en el botn "Ver tabla" y
un grfico se muestra.
Si usted necesita incluir el grfico generado en otro documento, puede utilizar los botones:
"Convertir a
PNG ": esta opcin guarda el grfico como una imagen PNG y" Conver a PDF ": esta
opcin guarda la
grfico como un documento PDF.
Figura 7. Grfico de comparar el atributo dos seleccionados
Figura 8. Grficas Visualizar 2D
Page 6
6
Importacin de datos
Opcin Importar le permite transformar tus archivos en diferentes formatos (txt, Excel,
XML, etc.) para QUILLA
formato. Tenga en cuenta que si usted desea utilizar sus propios conjuntos de datos, el
diseo de los experimentos slo se har
el uso de conjuntos de datos segn el formato QUILLA, se requerir, por tanto, un paso
previo de importacin.
Figura 1. Dos posibilidades para llevar a cabo el proceso de importacin.
La Figura 1 muestra las dos posibles opciones para importar conjuntos de datos. Una
opcin consiste en la importacin de una
conjunto de datos, la otra opcin consiste en la importacin de un conjunto de particiones
que tienes disponible en otra
formatos diferentes a formato quilla. En la continuacin, se muestra el proceso de las dos
opciones.
1. Importe conjunto de datos. Seleccione esta opcin si desea importar un solo archivo
desde otros formatos a
Formato de quilla. La Figura 2 muestra la ventana para esta opcin.
Figura 2. opcin Importar conjunto de datos.
Pgina 7
7
Para importar un conjunto de datos, es necesario los siguientes partes:
Paso 1. Seleccione Formato de entrada. En primer lugar, debe seleccionar el formato de
archivo de origen de la
conjunto de datos. El formato admitido son CVS, TXT, PRN, C4.5, Excel, Dif,
PropertyList y Weka.
Las diferentes opciones se muestran en la Figura 3.
Figura 3. Formato admitido a convertir a formato QUILLA.
El botn "Opciones" le permite configurar si es necesario un cierto separador y nula
valor utilizado en el archivo de origen.
Figura 4. Especifique determinadas opciones de formato de archivo de origen.
Paso 2. Seleccione el archivo de origen. Despus de especificar el formato de archivo
utilizado en el archivo de origen, el camino de
este archivo se debe especificar (un navegador conocido de muchos otros Programms GUI
es
utilizado para definir este camino).
Figura 5. Especifique la ruta del archivo fuente.
Pgina 8
8
Paso 3. Guarde los archivos. Una vez que el tipo de conversin y el archivo de origen han
sido
configurado, debe hacer click en el botn Siguiente y, a continuacin, el original y el
archivo importado es
archivo de destino. Los formatos admitidos son CVS, TXT, PRN, C4.5, Excel, Dif,
PropertyList
y Weka. Las diferentes opciones se muestran en la Figura 4.
Figura 4. Formato admiti convertir de formato de quilla.
El botn "Opciones" le permite configurar si es necesario un cierto separador y nula
valor utilizado en el archivo de origen.
Figura 5. Especifique determinadas opciones de formato de archivo de destino.
Paso 3. Guarde los archivos. Una vez que el tipo de conversin y la ruta del archivo se
han configurado,
debe hacer clic en el botn Siguiente y, a continuacin, se muestra la original y el archivo
exportado (ver Figura
6).
Pgina 13
13
Figura 6. Previsualizacin del archivo original y exportado.
Si estamos de acuerdo con la conversin hecho, hace clic en el botn Guardar y usted
puede seleccionar el
directorio de destino para el conjunto de datos transformado.
2. Exportar particiones. Seleccione esta opcin si ha realizado previamente las particiones
en QUILLA
formatear y desea exportarlos a otro formato. Esta opcin permite seleccionar un conjunto
de entrenamiento
y la prueba de los archivos por separado. La Figura 7 muestra la ventana con respecto a esta
opcin.
Figura 7. opcin Exportar particiones.
Pgina 14
14
Esta opcin consiste en las siguientes partes:
Paso 1. Seleccione los archivos de origen. En primer lugar, se debe especificar la ruta de
acceso del archivo de origen. Usted
tener que usar las flechas para incluir los archivos en la formacin o la prueba
correctamente.
Figura 8. Especifique las rutas de los archivos de origen.
Paso 2. Seleccionar formato de entrada. Despus de elegir el archivo, debe seleccionar el
tipo de conversin.
Los formatos admitidos son CVS, TXT, PRN, C4.5, Excel, Dif, PropertyList y Weka. Los
diferentes opciones se muestran en la Figura 9.
Figura 9. Formato admitido a convertir a formato QUILLA.
El botn "Opciones" le permite configurar si es necesario un cierto separador y nula
valor utilizado en el archivo de origen.
Figura 10. Especifique determinadas opciones de formato de archivo de destino.
Pgina 15
15
Paso 3. Guarde los archivos. Una vez que el tipo de conversin y la ruta del archivo se
han configurado,
debe hacer clic en el botn Siguiente y se muestra la original y el archivo exportado (vase
la Figura 11).
Figura 11. Previsualizacin del archivo original y exportado.
Si estamos de acuerdo con la conversin hecho, hace clic en el botn Guardar y usted
puede seleccionar el
directorio de destino para el conjunto de datos transformado.
Pgina 16
16
Formatos de archivo
Hay diferentes formatos de los datos con los que se puede trabajar en la herramienta
QUILLA. Despus, lo haremos
mostrar los diferentes formatos disponibles.
CVS FORMATO DE DATOS ARCHIVO
El archivo CSV (separados por comas-valores). CSV es una implementacin de un archivo
de texto delimitado,
que utiliza una coma para separar los valores. El formato de archivo CSV es muy simple y
con el apoyo de
casi todas las hojas de clculo y sistemas de gestin de bases de datos
Las caractersticas de estos archivos son los siguientes:
El primer registro en un archivo CSV puede ser un nombre que contiene registro de
encabezado de las columnas.
Cada registro en un archivo puede tener menos campos que el nmero de cabeceras de
las columnas. En este caso,
valores vacos se consideran valores perdidos.
Cada fila debe tener el mismo nmero de campos separados por comas.
Dos comas adyacente o coma al principio o al final de la lnea (espacio-caracteres)
indicar los valores nulos.
La separacin del todo y la parte fraccionaria de los nmeros reales se realiza a travs de
un
punto en lugar de una coma.
El smbolo de la separacin de los nmeros decimales es un punto en lugar de una coma.
iniciales y finales espaciales personajes adyacentes a separadores de campo coma se
ignoran.
Cada registro es una lnea terminada por un carcter de nueva lnea o un retorno de carro.
sern ignorados Las lneas en blanco.
Los campos que contienen caracteres de doble cotizacin debe estar rodeado de comillas
dobles, y
las dobles comillas incrustadas debern estar representados cada uno por un par de doble
consecutivo
citas.
Los campos con espacios iniciales o finales o comas debe delimitarse con comillas
dobles
personajes.
El delimitador de los valores puede ser otro personaje distinto al coma. Muchos
implementaciones de CSV permiten un separador alternativo para ser utilizado, tales como
el carcter pestaa
y el formato resultante es TSV (valores separados Tab).
El ltimo registro de un archivo se puede acabar o no con el carcter de fin de lnea.
Estos archivos se almacenan, por defecto, con la extensin. "CSV".
Pgina 17
17
Los (valores separados por comas-CSV) archivos de datos deben tener el siguiente
formato:
Un ejemplo de archivo CSV vlido es:
En este ejemplo podemos ver el uso de ciertas reglas explic antes, como valor nulo
expresado en dos comas consecutivo, el uso de la coma decimal como separador para los
nmeros reales
y el uso de comillas dobles para utilizar el valor de la coma simple como parte de los datos
y no como una
separador.
Otro ejemplo de archivo CSV vlido es:
TXT y TVS FORMATO DE DATOS ARCHIVO
El TXT (texto separado por aqu) o TSV (Valores separados por tabulaciones), es un dato
de texto simple que
permite a los datos tabulares a intercambiar entre las aplicaciones con un formato interno
diferente. Valores
separados por pestaas se han registrado oficialmente como un tipo MIME (Multipurpose
Internet Mail
Extensiones) bajo el texto / nombre de la ficha de valores separados.
Las caractersticas de estos archivos son los siguientes:
Un archivo en formato TXT consiste en lneas. Cada lnea contiene campos separados el
uno del otro
por el carcter de tabulacin (tab horizontal, HT, control de cdigo 9 en ASCII).
atributo
1
, Atribuir
2
, ..., Atributo
N
valor
11
, El valor
12
, ..., Valor
1N
...
valor
M1
, El valor
M2
, ..., Valor
Minnesota
Nombre, Apellido, Empresa, EmailAddress
Johnathan, Doe, "Compaa ABC", "johndoe@abccompany.com"
Harrie, Wong, "Company Inc.", "Hwong@myprovider.com"
Mara, "Jo Smith", "Cualquier Corp.", "Mjsmith@myprovider.com"
OBS, CAREXPEND, DISPOSINC, DOLLARVALUE, SALARIOS
"1960: 1", 14.2,362,, 270.7
"1960: 2", 14.1,365.9,, 273.4
"1960: 3", 14.6,367.6,, 273.9
"1960: 4", 13.2,369.2,, 273.3
"1961: 1", 10.8,72.9,, 273.7
"1961: 2", 11.7,378.4,, 277.6
"1961: 3", 12.2,385.1,, 282.2
"1961: 4", 13.7,393.2,, 288.4
Pgina 18
18
Los campos puede ser cualquier cadena de caracteres, excluyendo pestaas. Sin
embargo, las pestaas por lo general no aparecen en
elementos de datos que desea para tabular, as que esto es rara vez una restriccin. Hay
varios otros
formatos que son muy similares a TSV, pero utilizan un separador diferente, como por
comas
Valores separados (CSV), que utiliza la coma como separador. Las comas, espacios, y otra
personajes a menudo se utilizan como separadores en formatos aparecen con bastante
frecuencia en los datos para ser
tabulada, al menos en los campos de cabecera.
Cada lnea debe contener el mismo nmero de campos.
La primera lnea contiene el nombre de los campos o atributos, es decir, los encabezados
de columna.
Un valor vaco se muestra como un campo vaco entre las pestaas.
Estos archivos pueden ser ledos y editados por cualquier editor de texto.
Aunque TSV es un formato de texto, este tipo de formato no se espera que aparece con
un bonito
formato tabular cuando se imprime con un editor oa la izquierda de la pantalla.
La extensin de este tipo de archivo es. "Txt" 'o ". Tsv.
El TXT (texto separado por tabuladores) o TSV (valores de texto / Separado Tab)
archivos de datos debe
tener el siguiente formato:
Un ejemplo de TXT vlida o archivo TSV es el siguiente:
PRN FORMATO DE DATOS ARCHIVO
Este formato tiene las mismas caractersticas y limitaciones que el formato CSV, la
diferencia es el
separador entre campos en formato PRN son espacios. Sin embargo, los espacios en
formato PRN tienen una
diferente papel que en los archivos de CVS.
atributo
1
<TAB> atributo <TAB> ... <TAB> atributo
N
valor
11
<TAB> Valor
12
<TAB> ... <TAB> Valor
1N
...
valor
M1
<TAB> Valor
M2
<TAB> ... <TAB> Valor
Minnesota
FirstName <TAB> Apellido <TAB> Empresa <TAB> EmailAddress
Johnathan <TAB> Doe <TAB> Compaa ABC <TAB> johndoe@abccompany.com
Harrie <TAB> Wong <TAB> Empresa <TAB> Inc. hwong@myprovider.com
Mara <TAB> Jo Smith <TAB> Cualquier <TAB> Corp <TAB>
mjsmith@myprovider.com "
Pgina 19
19
Las caractersticas de estos archivos son los siguientes:
El primer registro en un archivo PRN puede ser un nombre que contiene registro de
encabezado de las columnas.
Cada registro en un archivo con las cabeceras de las columnas puede tener menos
campos que el nmero de
cabeceras. En este caso, los valores vacos se consideran valores perdidos.
Cada fila debe tener el mismo nmero de campos separados por espacios.
Varios espacios juntos sern tratados como un solo espacio.
Los espacios al comienzo o al final de la lnea indican valores nulos.
El smbolo de la separacin de los nmeros decimales es un punto en lugar de una coma.
Cada registro es una lnea terminada por un carcter de nueva lnea o un retorno de carro.
sern ignorados Las lneas en blanco.
Los campos pueden contener cita doble, retorno de carro (o cualquier otro carcter).
Los campos que contienen carcter de espacio como valor debe estar rodeado por
comillas dobles.
Un registro con un solo campo sin ningn valor debe tener los requisitos de tipo texto a
prevenir que no se ignora.
El ltimo registro de un archivo se puede acabar o no con el fin del smbolo de lnea.
EOD
0, los datos de
Valor-Indicador
1,0
"Cuerda"
Mes
Semana
Vehculo
Cantidad
Enero
1
Auto
105.000
Enero
1
Camin
1,050
Enero
1
Autobs
1,575
Enero
1
Camin
2,100
Enero
1
Moto 583
Pgina 22
22
El formato de archivo interno DIF generado es el siguiente:
C4.5 FORMATO DE DATOS ARCHIVO
Los archivos se codifican de acuerdo al formato C4.5. Este formato consta de dos archivos,
uno de ellos es un
el nombre de archivo con extensin ".names", el otro es un archivo de datos con extensin
".data".
Las caractersticas de los archivos de nombres son los siguientes:
El archivo .names contiene una serie de entradas que describen las clases, atributos y
valores de
el conjunto de datos. Cada registro se termina con un punto, pero el punto se puede omitir
si sera
han sido el ltimo carcter de una lnea). Cada nombre se compone de una cadena de
caracteres sin
comas, comillas o de colon (a menos que escaparon por una barra vertical, |).
Un nombre puede contener un punto, pero este punto debe ser seguido por un espacio en
blanco.
espacios en blanco incrustados se permite sino mltiples espacios en blanco se sustituyen
por un nico
espacio.
MESA
0,1
"EXCEL"
VECTORES
0,6
""
TUPLAS
0,4
""
DATOS
0,0
""
-1,0
BOT
1,0
"Mes"
1,0
"Wek"
1,0
"Vehculo"
1,0
"Cantity"
-1,0
BOT
1,0
"Enero"
0,1
V
1,0
"Auto"
0,105.000
V
-1,0
BOT
1,0
"Enero"
0,1
V
1,0
"Camin"
0,1.050
V
-1,0
BOT
1,0
"Enero"
0,1
"Bus"
0,1.575
V
-1,0
BOT
1,0
"Enero"
0,1
"Camin"
0,2.100
V
-1,0
BOT
1,0
"Enero"
0,1
V
1,0
"Moto"
0583
V
-1,0
EOD
Pgina 23
23
El primer registro del archivo se enumeran los nombres de las clases, separados por
comas y
terminada por un punto. Cada lnea sucesiva entonces define un atributo, en el orden en que
que aparecern en los archivos .data, con el siguiente formato:
<Atributo de nombre: de tipo atributo>.
El nombre-atributo es un identificador seguido de dos puntos. El tipo de atributo
que debe ser uno de:
continua: si el atributo tiene unos valores continuos.
discreta <n>: la palabra 'discreta' seguido de un nmero entero que
indica cuntos valores puede tomar el atributo.
ignorar: indica que este atributo debe ser ignorada.
A | (barra vertical) significa que el resto de la lnea debe ser considerada como un
comentario.
Estos archivos se almacenan, por defecto, con la extensin. "Nombres".
Cada instancia se representa en una sola lnea, con retornos de carro que denotan el final de
la
instancia.
Los valores de atributo para cada instancia estn delimitados por comas. Deben aparecer en
el orden
que fueron declarados en la seccin de encabezado (es decir, los datos correspondientes a la
n-sima
declaracinattribute es siempre el campo de n-simo del atributo).
Los valores perdidos estn representados por un nico signo de interrogacin, como en:
data
4.4,?, 1,5,?, Iris-setosa
Algunas de las especificaciones de este formato son:
o El nombre de la relacin y los atributos son de tipo cadena. Este tipo de cadena es el
mismo que
tipo de cadena utilizado en Java.
o Si cualquier nombre contiene espacios, es necesario incluir comillas dobles.
o Si usted necesita para indicar un valores perdidos, usted tiene que utilizar el smbolo "?".
o El smbolo de la separacin de los nmeros decimales es un punto en lugar de una coma.
o El smbolo de la separacin de datos en la seccin de datos es @ coma.
o Un smbolo% significa que el resto de la lnea debe ser considerada como un comentario.
o Estos archivos son las tiendas, por defecto, con la extensin ".arff".
Pgina 27
27
Los archivos de datos WEKA deben tener el siguiente formato:
Un ejemplo de un archivo de WEKA vlido es:
XML FORMATO DE DATOS ARCHIVO
XML (Extensible Markup Language) es un conjunto de reglas para definir etiquetas
semnticas que organizan un
documento en diferentes partes. XML es un metalenguaje que define la sintaxis para definir
otra
lenguajes de etiquetas estructurados.
Vamos a explicar el formato XML a seguir para convertir el archivo de datos
correctamente:
La primera lnea debe seguir la siguiente estructura:
<? Xml version = "1.0" encoding = independiente "UTF-8" = "yes">
Usted puede tener varios atributos, algunos obligatorios y otros no lo son:
relation <relacin-name>
attribute <atributo-name-1> <tipo de datos>
...
attribute <atributo de nombre-N> <tipo de datos>
data
valor
11
, El valor
12
, El valor
1N
...
valor
M1
, El valor
M2
, El valor
Minnesota
% Comentario
tiemporelation
perspectivasattribute soleado, nublado, lluvioso
verdadera temperaturaattribute
verdadera humedadattribute
attribute viento VERDADERO, FALSO
juegoattribute s, no
data
soleado, 85,85, FALSO, no
soleado, 80,90, TRUE, sin
cubierto, 83,86, FALSO, s
lluvioso, 70,96, FALSO, s
lluvioso, 68,80, FALSO, s
Pgina 28
28
o Versin: indica la versin XML utilizado en el documento. Este campo es obligatorio.
o codificacin: indica la forma en que se ha codificado el documento. La opcin por
defecto es
UTF-8, pero podra haber otros, como UTF-16, US-ASCII, ISO-8859-1, etc. Este campo no
es
obligatorio salvo.
o independiente: especifica si otros documentos, como un DTD, estn obligados a
procesar el documento. El valor predeterminado es no "..
documentos XML deben seguir una estructura jerrquica por medio de etiquetas.
Elementos XML
puede contener otros elementos. Los elementos tambin pueden tener atributos, estos
siempre se expresan
como pares nombre-valor en la etiqueta de apertura del elemento.
Un documento bien formado debe ajustarse a las siguientes reglas:
Los nombres de elementos entre maysculas y minsculas, es decir, el siguiente es un
juego bien formada
par: <step> ... <step>, mientras que esto no es <step> ... </ paso>.
Los elementos no vacos estn delimitados por tanto una etiqueta de comienzo y una
etiqueta final.
Los valores de atributos siempre deben ser citados, utilizando comillas simples o dobles, y
cada
Todos los documentos XML deben contener un nico par de etiquetas para definir el
elemento raz. Todos los dems
elementos deben estar anidados dentro del elemento raz. Todos los elementos pueden tener
sub (nios)
elementos. Sub elementos deben estar en pares y correctamente anidado dentro de su
elemento padre.
La etiqueta <root> indica el punto de inicio de los datos. Esta etiqueta puede tener
cualquier nombre. Si todo el
hijos de <root> no tienen el mismo nombre en la etiqueta <row>, el usuario debe introducir
el
nombre de esta etiqueta, de lo contrario, se supone que todos los nios tienen el mismo
valor.
Cada etiqueta <row> es padre de que existen etiquetas como atributos. El nombre en la
etiqueta de cada uno de
estos nios sern el nombre del atributo y el valor de la etiqueta es el valor de los datos de
la
atribuir.
Pgina 32
32
El siguiente ejemplo tiene otra estructura XML, pero los mismos datos que el ejemplo
anterior.
Se puede ver que hay 9 atributos y 2 casos de esto.
HTML FORMATO DE DATOS ARCHIVO
HTML, una extensin de Hypertext Markup Language, es el lenguaje de marcado
predominante para la web
pginas. Proporciona un medio para describir la estructura de la informacin basada en
texto en un documento
(Que denota cierto texto como encabezados, prrafos, listas, etc.) y para complementar el
texto con
formularios interactivos , incrustadas imgenes y otros objetos. HTML se escribe en forma
de etiquetas
(Conocidos como etiquetas), rodeado por parntesis angulares.
HTML es una aplicacin del SGML de acuerdo con la norma internacional ISO 8879.
XHTML es una
reformulacin de HTML 4 como aplicacin XML 1.0, y permite la compatibilidad con las
aplicaciones de usuario
ya admitidas HTML 4 siguiendo un conjunto de reglas.
Las etiquetas HTML bsicas son:
<HTML>: es la etiqueta que define el principio del documento.
<HEAD>: define la cabecera del documento, esta cabecera normalmente Contiene
informacin
sobre la pgina, como el ttulo, las etiquetas META para correcta indexacin de motores de
bsqueda, ESTILO
etiquetas, que determinan el diseo de la pgina, y JavaScript de codificacin para los
efectos especiales. Dentro
la cabecera <HEAD> encontramos:
<? Xml version = "1.0" encoding = "UTF-8"?>
<Root>
<Row>
<Field name = "id"> 5 </ field>
<Field name = "supuesto"> 66 </ field>
<Nombre del campo = "nombre"> Mi libro </ field>
<Nombre del campo = "resumen"> resumen del libro </ field>
<Field name = "numeracin"> 2 </ field>
<Field name = "disableprinting"> 0 </ field>
<Campo name = "customtitles"> 1 </ field>
<Nombre del campo = "timecreated"> 1114095924 </ field>
<Nombre del campo = "timemodified"> 1114097355 </ field>
</ Row>
<Row>
<Field name = "id"> 6 </ field>
<Field name = "supuesto"> 207 </ field>
<Nombre del campo = "nombre"> Mi libro </ field>
fila se divide en celdas de datos (con la etiqueta <td>). Las cartas td gradas para "datos de
la tabla", que es el
contenido de una celda de datos. Una celda de datos puede contener texto, imgenes, listas,
prrafos, formas, lneas horizontales,
mesas, etc.
Diferentes etiquetas que definirn la estructura de la tabla para la obtencin de un archivo
de datos vlidos son:
o TR: La etiqueta <TR> nos permitir insertar filas en la tabla.
o TH: La etiqueta <TH> nos permitir definir la mesa principal tabla.
o TD: La etiqueta <TD> nos permitir insertar celdas en cada fila. Podemos insertar
cualquier elemento:
imgenes, listas, texto con formato e incluso otras mesas.
Pgina 34
34
El formato HTML vlido para Quilla es la siguiente:
<Table>
<Tr>
<Th> Encabezado 1 </ th>
<Th> Encabezado 2 </ th>
<Th> Encabezado 3 </ th>
</ Tr>
<Tr>
<Td> Valor 1 </ td>
<Td> Valor 2 </ td>
<Td> Valor 3 </ td>
</ Tr>
<Tr>
<Td> Valor 4 </ td>
<Td> Valor 5 </ td>
<Td> Valor 6 </ td>
</ Tr>
</ Table>
Un ejemplo de un archivo HTML vlido es el siguiente:
<Html>
<Head>
<h1 align = "center"> VEHCULOS </ h1>
</ Head>
<Body>
<Table border = "1" cellspacing = "1" cellpadding = "0">
<Tr align = "center">
<Td> Mes </ td>
<Td> Semana </ td>
<Td> Vehculo </ td>
<Td> Importe </ td>
</ Tr>
<Tr>
<Td> enero </ td>
<Td> 1 </ td>
<Td> Coche </ td>
<Td> 105.0 </ td>
</ Tr>
<Tr>
<Td> enero </ td>
<Td> 1 </ td>
<Td> Camin </ td>
<Td> 1,05 </ td>
</ Tr>
<Tr>
<Td> enero </ td>
<Td> 1 </ td>
<Td> Moto </ td>
Pgina 35
35
<Td> 1.575 </ td>
</ Tr>
<Tr>
<Td> enero </ td>
<Td> 1 </ td>
<Td> Coche </ td>
<Td> 2.1 </ td>
</ Tr>
</ Table>
</ Body>
</ Html>
Pgina 36
36
Particin de datos
Particin de datos le permite realizar particiones de cualquier conjunto de datos de formato
QUILLA existente. Figura 1 muestra
la ventana principal de esta opcin.
Figura 1. Proceso de hacer particiones.
El proceso de particin se compone de las siguientes partes:
Paso 1. Seleccione Archivo. En primer lugar, usted debe elegir el camino del conjunto
completo de datos (en QUILLA
formato) que desea realizar particiones de la misma (ver figura 2).
Figura 2. Elige establecidos para hacer particiones de datos.
Paso 2. Tipo de particin . Una vez seleccionado el archivo, usted tiene que elegir el tipo
de particin.
Los diferentes tipos considerados son:
la celda que desea cambiar. A continuacin, slo tiene que escribir el nuevo valor, y si
es vlida, el contenido de la celda se modifica. De lo contrario, se muestra un dilogo de
error.
Eliminar una instancia : si desea eliminar una instancia, usted tiene que hacer clic en
cualquier celda
que corresponde a la instancia (fila) que desea eliminar. Entonces, un "Borrar
Se activa el botn instace ". Al hacer clic en l, se eliminar la instancia completa.
Aadir una nueva instancia: si desea agregar una nueva instancia, usted tiene que hacer
clic en la opcin "Agregar
Botn de Instancia ". A continuacin, se aade una nueva instancia, si se ha seleccionado
una celda, el nuevo
se aade ejemplo en la parte superior de la instancia en que haca la celda seleccionada. Si
no celular era
seleccionado, se aade una nueva instancia de la parte inferior de la tabla. La nueva
instancia tiene
valores vacos y las diferentes variables pueden ser llenadas haciendo click en los diferentes
las clulas.
2. Edicin de variables. En esta opcin de diferentes modificaciones en las variables
pueden ser llevadas a cabo (ver
La Figura 4).
Figura 4. Variable Edition.
El uso de la mesa y los botones situados sobre ella se pueden realizar las siguientes
operaciones:
Pgina 39
39
Aadir nuevas variables : si desea agregar nuevas variables, el "Agregar variable" botn
tiene
a hacer clic en. A continuacin, se aade una nueva fila a la parte inferior de la mesa y el
diferentes caractersticas pueden ser llenados.
Aadir nuevas variables : si quieres eliminar una variable, primero una variable tiene que
ser seleccionado
y luego en el botn "Eliminar Variable" se tiene que hacer clic.
Cambie los valores de rango : si desea cambiar los valores de rango, un real o entero
variable tiene que ser seleccionado. Si la variable seleccionada es "entero" o "Real", puede
modificar los valores de rango y, a continuacin, haga clic en el botn "Cambiar Range"
para cambiar el
informacin.
Cambie los valores nominales : si desea cambiar los valores nominales, un nominal
variable tiene que ser seleccionado. Si la variable seleccionada es nominal, se puede aadir
o
quitar los valores permitidos para esa variable mediante la lista y "Borrar" y "Agregar"
botn.
Cambio de atributos de tipo : si desea cambiar el tipo de variable, lo que tienes que hacer
clic en
la celda que desea cambiar de la columna "Tipo". A continuacin, puede modificar el
tipo de variable a travs de la lista especificando cualquier otro tipo.
La interfaz permite al usuario aadir nuevos algoritmos para el experimento est diseado.
El nico
requisito es aceptar el formato de entrada y salida del archivo QUILLA (referirse a ellos en
el QUILLA
Manual de referencia ). Esto proporciona una forma muy flexible para el usuario comparar
con nuevos mtodos
los de KEEL 1.0.
Pgina 41
41
Configuracin de los experimentos
Cuando el experimentos se selecciona la opcin, la ventana principal del mdulo de
experimentos aparecer:
En primer lugar, es necesario seleccionar el tipo de experimento y el tipo de particiones
para emplear; la
opciones seleccionadas determinarn el tipo de mtodos y conjuntos de datos que estar
disponible para disear el
experimento.
Los tipos de particiones disponibles son los siguientes:
validacin cruzada k veces (el valor de k se debe especificar)
validacin cruzada 5x2
sin validacin
Pgina 42
42
Actualmente, el mdulo de experimentos KEEL ofrece los siguientes tipos de
experimentos:
Clasificacin
Regresin
El aprendizaje no supervisado
Cuando el tipo de experimento se ha seleccionado, el panel de seleccin de conjuntos de
datos se mostrar,
permitiendo continuar el diseo de experimentos.
Seleccin de conjuntos de datos
El comit de seleccin de conjuntos de datos muestra los conjuntos de datos disponibles
para el experimento actual. Sus contenidos
depender del tipo de experimento ya seleccionado:
Pgina 43
43
El siguiente paso es elegir los conjuntos de datos deseados desde el panel. Los botones
Seleccionar todo y Invertir
permite realizar la seleccin de fcil:
El botn Importar permite importar un puesto en el medio ambiente QUILLA datos
existentes, listo para ser
Pgina 46
46
Los conjuntos de datos
Este mdulo permite al usuario editar los conjuntos de datos actuales seleccionados para el
experimento.
Como en el Select conjuntos de datos de panel, el usuario puede Aadir y Eliminar
conjuntos de datos para el experimento (de
los que ya estn registrados en el entorno QUILLA). Adems, todava es posible importar
nuevos conjuntos de datos.
Adems, el botn Editar permite al usuario indicar que las particiones (formacin y prueba)
deseos
usar. De esta manera, es posible alterar temporalmente los archivos que se incluirn en el
experimento.
Pgina 47
47
Este cuadro de dilogo muestra los archivos iniciales del conjunto de datos. A partir de ella,
es posible Retire un par de la formacin de un
par de archivos de entrenamiento / prueba, para quitar todos los archivos.
Adems, el dilogo permite a Aadir un nuevo pares de archivos de entrenamiento y de
prueba. Para ello, deben ser seleccionados
mediante el uso de los botones de bsqueda:
Por ltimo, tambin es posible aadir un conjunto completo de archivos de validacin
cruzada k-pliegue seleccionando el
nmero adecuado de pliegues y pulsando el botn Aadir cv k veces .
Pgina 48
48
Mtodos de preprocesamiento
Esta categora incluye varios mtodos de preprocesamiento
Transformar datos: Mtodos para transformar el formato de los datos: Nominal a
binario, decimal
escalamiento ....
Discretizers: Mtodo para convertir los datos reales o numricos en datos nominales.
Seleccin de caractersticas: Mtodos para seleccionar caractersticas de los datos.
Generacin Instancia: Mtodos para generar nuevas instancias de los casos originales
del
conjunto de datos.
Seleccin de instancia: Los mtodos para seleccionar los casos de los datos.
Valores perdidos: Mtodos para evaluar los datos que contienen valores perdidos.
Para aadir cualquier mtodo de preprocesamiento para el experimento actual, slo se
necesita para seleccionarla y haga clic en
en el grfico del experimento:
Pgina 49
49
Los mtodos estndar
Esta categora incluye los mtodos de minera de datos incluidos en la herramienta de la
quilla:
Reglas de asociacin : Los mtodos para la extraccin de reglas de asociacin de datos.
algoritmos de agrupamiento : La agrupacin de mtodos
rboles de decisin : Los mtodos para la construccin de rboles de decisin.
Aprendizaje Regla Fuzzy : Los mtodos para realizar el aprendizaje basado en reglas
difusas.
Hyperrectangles Aprendizaje : Los mtodos que utilizan hyperrectangles para extraer
conocimiento a partir de
datos.
Lazy aprendizaje : mtodos que no construyen un modelo en su fase de entrenamiento
Aprender.
Las redes neuronales : redes neuronales artificiales.
Aprendizaje Regla : Los mtodos para realizar el aprendizaje basado en normas.
Los clasificadores estadsticos : clasificadores basados en modelos estadsticos.
Modelos Estadsticos : Construccin de modelos estadsticos basados en datos.
Descubrimiento Subgrupo : Mtodos para el descubrimiento de subgrupos.
SVM : mquinas de vectores soporte.
regresin simblica : Los mtodos para la realizacin de procedimientos de regresin
simblicos.
Para aadir cualquier mtodo para el experimento actual, slo se necesita para seleccionarlo
y haga clic en el grfico de
el experimento:
Pgina 50
50
Mtodos de postprocesado
Esta categora incluye los mtodos de postprocesado incluidos en la herramienta de la
quilla:
postprocesado Regla Fuzzy : Los mtodos para la realizacin de una fase de postproceso
en los resultados
de un mtodo de extraccin Regla Fuzzy
Para aadir cualquier mtodo de postprocesado para el experimento actual, slo se necesita
para seleccionarla y haga clic en
en el grfico del experimento:
Pgina 51
51
Las pruebas estadsticas
Esta categora incluye varios mdulos estadsticos disponibles para contrastar experimentos
realizados con
la herramienta de software QUILLA:
Las pruebas de clasificacin : procedimientos estadsticos para contrastar los resultados
de la clasificacin
experimentos.
Las pruebas de regresin : procedimientos estadsticos para contrastar los resultados de
la regresin
experimentos.
Para aadir cualquier procedimiento estadstico para el experimento actual, slo se necesita
para seleccionarlo y haga clic en
la grfica del experimento:
Pgina 52
52
Mdulos de visualizacin
Esta categora incluye varios mdulos de visualizacin desarrolladas para analizar y
resumir la
resultados obtenidos en los experimentos:
Mostrar resultados (de clasificacin) : Mdulos para que resumen los resultados
obtenidos en la clasificacin
problemas.
Mostrar resultados (regresin) : Mdulos para que resumen los resultados obtenidos en
la regresin
problemas.
Mltiples Resultados (Clasificacin) : Mdulos para analizar los resultados obtenidos en
la clasificacin
problemas con mltiples algoritmos.
Mltiples Resultados (regresin) : Mdulos para analizar los resultados obtenidos en la
regresin
problemas con mltiples algoritmos.
Para aadir cualquier mdulo de visualizacin para el experimento actual, slo se necesita
para seleccionarlo y haga clic en
la grfica del experimento:
Pgina 53
53
Conexiones
Las conexiones permiten terminar el diseo del experimento, mediante la conexin de los
incluidos
mdulos con flujos que representan el flujo de datos en el experimento. Se pueden utilizar
tanto como
entradas o salidas de los mdulos.
1. Inserte conexin: para hacer una conexin, seleccione la
botn de la barra de herramientas de la izquierda. Entonces,
haga clic en el nodo de origen y, finalmente, haga clic en el nodo de destino.
2. Restricciones: hay algunas restricciones que deben ser considerados al realizar las
conexiones
entre los diferentes elementos:
Los algoritmos de pre-procesamiento slo pueden recibir aportaciones de un conjunto de
datos u otro premtodo de proceso.
Pgina 56
56
Configuracin de los parmetros del algoritmo
Una vez que un mdulo ha sido insertado en el grfico, es posible configurar el valor de sus
parmetros.
Para ello, el usuario tiene que hacer doble clic sobre el smbolo algoritmo y un cuadro de
dilogo se mostrar; adems,
este cuadro de dilogo puede demostrar a travs del men emergente que aparecer cuando
el botn derecho del
ratn se presiona (opcin Mostrar parmetros).
En la parte superior de este dilogo es posible establecer el nmero de veces que se
ejecutar el algoritmo
(Slo disponible para los mtodos aleatorios). Cada ejecucin se realizar mediante una
semilla generada a partir de la
semilla inicial. La segunda lista permite especificar en que los datos establece los
parmetros sern cambiados.
En la tabla se encuentra en el centro de la ventana, todos los parmetros del algoritmo se
establecen para su
valores iniciales. Estos valores se pueden modificar, en cuanto a los nuevos valores sern
apropiados para la
mtodo concreto; de lo contrario, aparecer un mensaje de error:
Por ltimo, el Default Values botn permite regresar todos los parmetros a sus valores por
defecto.
Pgina 57
57
Generacin de experimentos
Una vez que un experimento ha sido diseado, el usuario puede generar a travs de la
opcin Experimento Run
del men "Herramientas". Adems, es posible utilizar el botn de herramientas bar.
En este punto, la herramienta de software realizar varias pruebas acerca de la integridad
del experimento.
En primer lugar, si detecta que hay que faltan particiones para algunos de los conjuntos de
datos empleadas, la
siguiente dilogo se mostrar, lo que permite a regenerarlos:
Esta es la ltima oportunidad para generarlos. Else, el experimento se generar de forma
incorrecta.
En segundo lugar, si algunos de los elementos de la grfica no estn conectados por flujos,
la siguiente advertencia
ser pronta, y los nodos aislados sern descartados.
Si todo es correcto, el usuario tendr que seleccionar una ruta para el archivo zip del
experimento:
Pgina 58
58
El proceso de generacin genera un archivo ZIP que contiene todos los elementos
necesarios para ejecutar el
experimento. Si la generacin experimento se ha completado con xito, el siguiente
mensaje ser
se muestra.
El experimento debe ejecutarse mediante el RunKeel archivo jar situada en "experimento /
scripts"
En la siguiente imagen, podemos ver un ejemplo de la estructura de directorios que se crea.
Nosotros
ver que cuatro directorios se crean:
exe directorio : contiene todos los archivos jar de los algoritmos introducidos en el
experimento.
resultados directorio: contiene los archivos de salida generados por cada algoritmo.
Pgina 59
59
Barra de mens
Cada elemento de la barra de men contiene diferentes submens. Estas son las diferentes
opciones disponibles:
Men 1. Archivo
Barra de estado: muestra / oculta la barra de estado (en la parte inferior de las ventanas).
Inicialmente, es
activo.
Conjuntos de datos / Algoritmo: mostrar / disimular el panel que contiene los conjuntos
de datos / algoritmos.
Inicialmente, es activo.
Pgina 60
60
3. Men Editar
Rehacer: con este usuario opcin puede rehacer algunas acciones deshechas.
Inserte flujo de datos: permite la conexin de las salidas del algoritmo (o conjunto de
datos) a las entradas de
otro algoritmo, la creacin de un flujo de datos que se ejecutar despus. Esta opcin es
tambin
disponible en la barra de la izquierda a travs del botn
Experimento Ejecutar: cuando experimento est totalmente diseado, utilice esta opcin
para crear una postal
archivo que contiene una estructura de directorio con todos los archivos necesarios para
ejecutar el diseo
experimento en el equipo local seleccionado por el usuario.
Acerca de ...: muestra un cuadro de dilogo con informacin bsica sobre el programa
como nombre,
autores, versin, etc ...
Pgina 62
62
Barra de herramientas
Para ayudar al usuario a encontrar las operaciones ms relevantes, la herramienta de
software Experimentos KEEL
proporciona una barra de herramientas con accesos directos a ellos.
La mayora de ellos tambin aparecen en la barra de men (por lo tanto, se refieren a la
seccin de la barra de mens para obtener adicional
informacin sobre ellos). La nica opcin que an no aparece en la barra de men es:
Eliminar : Esta opcin permite al usuario eliminar el mdulo seleccionado.
Pgina 63
63
Barra de estado
La barra de estado es una forma sencilla para proporcionar la informacin til de usuario
durante la generacin de
experimentos.
Se encuentra en la parte inferior de la ventana. Aqu aparecer informacin sobre el
bienestar de accin
llevado a cabo, lo que ayuda al usuario a comprender el significado de cada comando o
botn. Varios
ejemplos se muestran a continuacin:
Pgina 64
64
RUN QUILLA
RunKeel Lanzamiento
Cuando el usuario se disea un experimento, se obtendr un archivo .ZIP que contiene
todos los archivos necesarios para
ejecutar el experimento en cualquier equipo que tenga una mquina virtual Java instalada.
Es necesario para
extraer el contenido del archivo comprimido y luego obtendr un directorio llamado
"experimento"
(Como lo haba llamado el experimento). En su interior, hay un nuevo directorio llamado
"scripts" en el que se
puede iniciar la aplicacin RunKEEL escribiendo java -jar RunKeel.jar en una consola.
Entonces la
experimento comienza a correr.
Cuando termine, el usuario obtendr en el smbolo del sistema el mensaje
EXPERIMENTO "
COMPLETADO SATISFACTORIAMENTE "
Ver resultados
Una vez que el plazo de experimento ha terminado, los archivos de resultados se pueden
encontrar en el resultado \ directorio.
Dependiendo del tipo de los mtodos utilizados en el experimento, los siguientes
directorios y archivos sern
disponible:
Mtodos : Para cada combinacin de un mtodo y un conjunto de datos, habr un
directorio, llamado
<MethodName> . <DataSetName>.
En el interior, se pueden encontrar los archivos de salida del mtodo (por lo general, una
formacin y una prueba
archivo de salida para cada particin, adems de todos los archivos de salida adicional
definido por el mtodo). Por
mayor referencia, consulte el Manual de Referencia QUILLA .
Exmenes: Para cada mdulo de prueba empleado, un nuevo directorio llamado con el
nombre de la prueba se
estar disponible. Este directorio contiene los archivos de salida obtenidos como resultado
de la
aplicacin del mtodo de ensayo.
Por otro lado, tenga en cuenta que los nuevos conjuntos de datos obtenidos como resultado
de la ejecucin de una
mtodo de pre-procesamiento se colocar en los conjuntos de datos \ directorio del
experimento, para permitir una mayor
el empleo de ellos con mtodos vinculados en el mismo experimento.
Pgina 65
Sesenta y cinco
EDUCATIVO
Introduccin
QUILLA es una herramienta de software desarrollada para construir y utilizar diferentes
modelos de minera de datos. Nos gustara
remarcar que esta es la primera herramienta de software de este tipo que contiene un cdigo
libre biblioteca de Java
Algoritmos Evolutivos aprendizaje. Las principales caractersticas de la quilla son:
El entorno del QUILLA puede conectarse a Internet para descargar nuevos archivos de
datos para utilizarlos en
futuros anlisis.
Podemos distinguir tres partes en el entorno grfico:
La preparacin de la parte Bases de datos permite a los usuarios crear diferentes particiones
de su propia
bases de datos o las bases de datos disponibles en la web quilla. Adems, es posible editar,
aplicar
transformaciones, generan conjuntos de datos en el formato correcto de los archivos C4.5 o
ver datailed
parcelas sobre un conjunto de datos concreto.
una interfaz grfica. Despus del experimento est diseado, la interfaz genera un archivo
.ZIP
que contiene una estructura de directorio con todos los archivos necesarios necesario para
ejecutar esos experimentos
en el equipo local
La interfaz tambin permite al usuario aadir sus propios algoritmos para el ser
experimentacin
diseado. El nico requisito es aceptar el formato de archivo de entrada de la quilla.
Incluso, no es
necesaria para utilizar el lenguaje Java para los propios algoritmos de usuario. Esto
proporciona una muy
de manera flexible para el usuario comparar sus propios mtodos con los que est en quilla.
Barra de estado: muestra / oculta la barra de estado (en la parte inferior de las ventanas).
Inicialmente, es
activo.
Conjuntos de datos / Algoritmo: mostrar / disimular el panel que contiene los conjuntos
de datos / algoritmos.
Inicialmente, es activo.
4. Men Editar
Rehacer: con este usuario opcin puede rehacer algunas acciones deshechas.
Pgina 67
67
Inserte flujo de datos: permite la conexin de las salidas del algoritmo (o conjunto de
datos) a las entradas de
otro algoritmo, la creacin de un flujo de datos que se ejecutar despus. Esta opcin es
tambin
disponible en la barra de la izquierda a travs del botn
Experimento Ejecutar: cuando experimento est totalmente diseado, utilice esta opcin
para ejecutar la
experimento diseado y ver los resultados.
Pgina 68
68
Acerca de ...: muestra un cuadro de dilogo con informacin bsica sobre el programa
como nombre,
autores, versin, etc ...
Barra de herramientas
Para ayudar al usuario a encontrar las operaciones ms relevantes, la herramienta de
software Experimentos KEEL
proporciona una barra de herramientas con accesos directos a ellos.
Pgina 69
69
La mayora de ellos tambin aparecen en la barra de men (por lo tanto, se refieren a la
seccin de la barra de mens para obtener adicional
informacin sobre ellos). La nica opcin que an no aparece en la barra de men es:
Eliminar : Esta opcin permite al usuario eliminar el mdulo seleccionado.
Barra de estado
La barra de estado es una forma sencilla para proporcionar la informacin til de usuario
durante la generacin de
experimentos.
Se encuentra en la parte inferior de la ventana. Aqu aparecer informacin sobre el
bienestar de accin
llevado a cabo, lo que ayuda al usuario a comprender el significado de cada comando o
botn. Varios
ejemplos se muestran a continuacin:
Pgina 70
70
Configuracin de los experimentos
Pgina 79
79
Gestin Grfico
El grfico permite realizar las siguientes operaciones de ms de sus elementos:
1. Men contextual: es posible acceder al men contextual haciendo clic con el derecho
botn del ratn sobre un determinado nodo en la zona de dibujo. Este men depende de la
seleccionada
objetar y nos permite eliminar los objetos, para configurar los parmetros de algoritmos, etc
...
Seleccin 2. Objetos: con el fin de seleccionar un solo elemento, basta con hacer clic con
el botn izquierdo del
ratn sobre l. Pero es posible seleccionar varios elementos, al hacer clic en una zona vaca
de la
rea y arrastrando el ratn hasta cubrir todos los objetos deseados dibujar.
3. Mover objetos: Es posible mover uno o varios elementos seleccionados con la ayuda de
la
botn izquierdo del ratn, arrastrndolos hasta la posicin deseada. Otra forma es utilizar el
cursores del teclado.
4. Retire los objetos: Para eliminar un mdulo, seleccionarla y pulsar Supr clave. Tambin
es posible
y eliminar por el men de contexto, de la barra de herramientas.
Pgina 80
80
Configuracin de los parmetros del algoritmo
Una vez que un mdulo ha sido insertado en el grfico, es posible configurar el valor de sus
parmetros.
Para ello, el usuario tiene que hacer doble clic sobre el smbolo algoritmo y un cuadro de
dilogo se mostrar; adems,
este cuadro de dilogo puede demostrar a travs del men emergente que aparecer cuando
el botn derecho del
ratn se presiona (opcin Mostrar parmetros).
En la parte superior de este dilogo es posible establecer el nmero de veces que se
ejecutar el algoritmo
(Slo disponible para los mtodos aleatorios). Cada ejecucin se realizar mediante una
semilla generada a partir de la
semilla inicial. La segunda lista permite especificar en que los datos establece los
parmetros sern cambiados.
En la tabla se encuentra en el centro de la ventana, todos los parmetros del algoritmo se
establecen para su
valores iniciales. Estos valores se pueden modificar, en cuanto a los nuevos valores sern
apropiados para la
mtodo concreto; de lo contrario, aparecer un mensaje de error:
Por ltimo, el Default Values botn permite regresar todos los parmetros a sus valores por
defecto.
Pgina 81
81
Ejecutar experimento
Una vez que un experimento ha sido diseado, el usuario puede generar a travs de la
opcin Experimento Run
del men "Herramientas". Adems, es posible utilizar el botn de herramientas bar.
En este punto, nueva ventana nos permite ejecutar el experimento.
Si se pulsa el botn de inicio se llevar a cabo el experimento y los resultados se mostrarn
en el "Informe
seccin de rea ". En esta seccin, la informacin reportada es el porcentaje total de
aciertos
teniendo en cuenta todas las particiones, el porcentaje de aciertos en cada particin y la
matriz de confusin.
Esta informacin est indicada tanto para la formacin y el conjunto de datos de prueba.
Por otra parte, en la seccin de
"rea de particin", se especifica el tiempo de clculo para cada particin. Un ejemplo es la
ejecucin
se muestra en la siguiente figura.
Pgina 82
82