Académique Documents
Professionnel Documents
Culture Documents
Resumen
Abstract
Presents the preliminary results of the development of a graphical interface for viewing
applied to a catalog of academic theses in the field of nutrition. The objective of this
research is based on the generation of an application that enables the retrieval of such
documents from the subjects of research, and relations between them providing the user
with valuable information on the academic discipline in a field. To generate this product
was used a mixed methodology, using analytical techniques of co-occurrence of terms,
represented by social networks and semantic generation of interfaces by Topic maps.
Introduccin
A B
r1 r2 r3
En la representacin, A y B son documentos que han citado las referencias r1, r2, y r3.
Ambos documentos han co-citado (citado conjuntamente) las referencias r1 y r2 en el
caso de A y r2 y r3 en el caso de B (Spinak, 1996). Siguiendo el ejemplo, el principio
bsico que plantea la co-citacin es que si un tercer documento C repitiese entre sus
referencias alguna de las co-citaciones anteriores, por caso r1 y r2, el documento A y C
estaran relacionados temticamente desde la perspectiva de los autores citantes.
Finalmente, en la medida que una o ms co-citaciones (parejas de referencias) se repitan
en un conjunto de documentos las relaciones temticas entre ellos ser ms fuerte.
Los anlisis de co-citacin no se realizan solamente sobre las referencias de un
documento (autor o fuente citada) sino tambin sobre trminos o expresiones (co-word
analysis). Este tipo de estudios permite reflejar la red semntica latente que toda
coleccin de documentos afines guarda en su interior y que es casi imposible de
observar a simple vista. Precisamente, este tipo de anlisis pone en evidencia las
temticas y sus relaciones generando la posibilidad de establecer un anlisis mucho ms
preciso y real de los contenidos de las fuentes consultadas en un dominio temtico dado
(Rip y Courtial, 1984).
Desde la perspectiva de la recuperacin y visualizacin de la informacin la co-citacin
de trminos ha sido ampliamente utilizada. Desde los campos tradicionales de
descripcin del contenido de las bases de datos bibliogrficas (palabras
clave/descriptores y resmenes) e incluso de los ttulos puede generarse un instrumento
JBDU 2008: 6 Jornada sobre la Biblioteca Digital Universitaria
que describa los vnculos existentes entre los contenidos almacenados facilitando la
compresin del dominio a travs de su estructura y alcance (Bhattacharya y Basu, 1998;
Ding et.al., 2000; Fong y Hui, 2004).
Tomando en consideracin el caso que nos ocupa, un listado de tesis del rea de la
nutricin, se ha seleccionado el ttulo de las mismas para el anlisis de co-citacin ya
que la fuente de datos para este estudio es un listado publicado en la web. Volviendo al
ejemplo clsico de co-citacin expuesto ms arriba, el grfico explicativo del proceso
realizado puede expresarse de la siguiente manera:
Trmino A
Autor 1 Autor 2
Trmino B
A
sim
ism
o,e
stem
ode
lod
eda
tosen
riq
uec
esu fun
cion
alid
adco
not
rasc
ara
cte
rs
tic
as:
El universo de tesis de grado recogidas para este estudio es de 146, todas pertenecientes
al rea de Nutricin de la Universidad FASTA de Mar del Plata. Dado que solo se
publica en la web un listado de las mismas (no un catlogo) se recurri a los ttulos para
la extraccin de los trminos representativos de los contenidos. Se asume que el ttulo
de este tipo de documento guarda una relacin directa con el objeto de la investigacin
desarrollado.
Para el anlisis de co-ocurrencia de trminos se cre un archivo de texto ASCII
conteniendo el listado de las expresiones extradas de los ttulos. Posteriormente se
calcularon las frecuencias absolutas y, en base a estos resultados, se procedi a la
lematizacin del ndice de trminos con la intervencin de una especialista en el rea
temtica abordada.
El resultado de este anlisis se proces a fin de calcular la co-ocurrencia de trminos por
medio del software Bibexcel1. El ndice de parejas resultante se utiliz para generar una
red social de representacin semntica a travs del software Pajek2.
Para el diseo y estructuracin del Topic Map se tom como base la red social de co-
ocurrencia de trminos, la cual brind una imagen real de los principales nodos
temticos (topics) y las relaciones (tipos e intensidad) entre los tpicos representados. El
mapa final fue generado con el editor TM4L3 desarrollado por la Departamento de
Informtica de la Universidad Estatal Winston-Salem (EE.UU.) que trabaja con el
estndar XML para Topic Maps (XTM).
Para la visualizacin del topic map se utiliz Omnigator4, uno de los navegadores
(browsers) de topic maps ms difundidos en la comunidad investigadora de la Web
Semntica. Omnigator es un producto que forma parte de OKS (Ontopia Knowledge
Suite), conjunto de herramientas para trabajar con topic maps creada por Ontopia5,
empresa noruega que ofrece servicios de consultoria relacionados con tecnologas de la
web semntica.
Resultados y discusin
El primer paso de este anlisis, entre todos los procesos llevados a cabo hasta llegar a la
conformacin del Topic Map, fue la generacin de un ndice de trminos ordenados por
su frecuencia (tabla 1). Es importante recordar que los mismos fueron extrados de los
ttulos de las tesis con la ayuda de una especialista en el rea lo cual permiti, por un
lado, obtener la precisin necesaria en los conceptos seleccionados y, por otra, realizar
los agrupamientos semnticos adecuados (lematizacin) para su representacin.
1
http://www.umu.se/inforsk/Bibexcel/
2
http://vlado.fmf.uni-lj.si/pub/networks/pajek/
3
http://compsci.wssu.edu/iis/nsdl/
4
http://www.ontopia.net/omnigator/models/index.jsp
5
http://www.ontopia.net
JBDU 2008: 6 Jornada sobre la Biblioteca Digital Universitaria
Expresiones Frec.
Nios 35
Evaluacin-del-estado-nutricional 28
Conducta-alimentaria 25
Mar-del-Plata 21
Alimentos 16
Nutrientes 16
Adolescentes 14
Ingesta-alimentaria 13
Asistencia-alimentaria 12
Teraputica-nutricional 10
Obesidad 9
DBT 9
Adultos-mayores 8
Adultos 8
EAN 8
Embarazo 7
Deportistas 7
Estrato-socioeconmico 6
Productos-alimenticios 6
Antecedentes-maternos 5
Actividad-fsica 4
Bromatologa 4
Ejercicio-profesional 4
Enfermedad-celaca 4
Como puede observarse, muchas expresiones estn unidas con un guin con el fin de
que al momento de ser procesadas cada una de estas entradas sean tomas como
sintagmas y no como trminos simples. La frecuencia obtenida permiti establecer la
centralidad que cada concepto tendra en la representacin.
A continuacin de este proceso se continu con el anlisis de co-citacin de todas las
expresiones utilizadas dando por resultado un ndice con las frecuencias de co-
ocurrencia de todas las parejas de conceptos existentes (tabla 2).
JBDU 2008: 6 Jornada sobre la Biblioteca Digital Universitaria
Parejas de expresiones Frec.
Nios Mar-del-Plata 8
Evaluacin-del-estado-nutricional Nios 8
Conducta-alimentaria Nios 7
Evaluacin-del-estado-nutricional Mar-del-Plata 7
Obesidad Nios 7
Asistencia-alimentaria Mar-del-Plata 6
Asistencia-alimentaria Nios 6
Conducta-alimentaria Nutrientes 6
Conducta-alimentaria Adolescentes 5
Evaluacin-del-estado-nutricional Adultos 4
Ingesta-alimentaria Evaluacin-del-estado-nutricional 4
Adultos-mayores Mar-del-Plata 4
Evaluacin-del-estado-nutricional Asistencia-alimentaria 4
DBT Conducta-alimentaria 3
Conducta-alimentaria Mar-del-Plata 3
Nutrientes Nios 3
Teraputica-nutricional Deportistas 3
Sobrepeso Obesidad 3
6
La centralidad de los nodos o actores de una red social no debe asociarse con la posicin espacial que
stos ocupan sino con el grado de intregacin que tienen con el resto. Existen varias medidas de
centralidad: de grado, de cercana y de intermediacin.
JBDU 2008: 6 Jornada sobre la Biblioteca Digital Universitaria
Figura 2. Topic Map generado a travs del editor TM4L tomando como base
la red social de co-ocurrencia de expresiones.
B
ibl
iog
raf
a
Bh a
ttacharya,S .;B a
su,P .K .(1998 ).M app in gar esea
r cha reaa tthem i c
rolevel
usingcowo rdan alysis.S cien
tom etrics;43(3 ),359 -72.
BorianaD i
t chev a
,D a r
in aD ichev a
. (2007 )
.V isualB row s
ingand Ed it
ingo f
TopicM ap-B asedL earning Repo si
to r
ies.TMRA2006(Top icM apsR ese
arch
and App lication s
),L eipzig,G erm any,O ctober11 -12,2006 .L ectureN otesin
Art
ificia
lIn t el
ligen ce(S ubse
rieso fL ecture No tesin C om pute
rS cience)n
4438,44 -55.
Colm enero Ru iz
, M araJ ess.In troduc cina lm od elotop icm aps
.R evi
sta
Digi
tald eB iblioteconom iaeC inciad aInform aao,l(3 ),77 -102 .
Costa,J.(1998 ).L ae squ em
tica
:v isua l
izarl ainform acin.B ar ce
lon a
:P aids
.
Crosby,A . W .(1997 ). Th eM easureo fR eali
ty: Qu an t
ifica
tionand W e
ste
rn
So c
iety1250 -1600.London ,Cam bridg eUn iversi
tyP res s
.
Dicheva,D ar
in a;D ichev, Ch r
isto. (2006 ). TM4L :C rea
ting and b row s
ing
edu ca
tion a
ltop i cm ap s.B r
it
ishJou rnalo fEdu c
ationalT echnology;37 (3),391-
404.
Ding,Y ;Chowdhu ry
,GG ;Foo,S.(2000 ).Inc o
rp or
atin gther esultsofco -word
an a
lysestoin creases ea
rch v ariety forin form a
tion r e
tr
i eval. Journalo f
Inform at
ionS cien ce
;26(6 ),429-51 .
Fong, AC M ; Hui,S .C .(2004). Do cum entr e
trievalf romac i
tat
iond at
abase
usingcon ceptualc lusteringandco -wo rdan alysis
. On lin eInform at
ion R eview;
28(1 )
.22 -32 .
JBDU20
08:6
Jo
rnad
asob
rel
aBib
lio
tec
aDigi
talUn
ive
rsi
tar
ia
Ibekw e
-S anjuan,F id el
i a
;S anjuan,E ric.( 2002 ).Fromt ermv ariant
st ore search
topic s
.Know ledg eO rgan izat
ion;29(3 /4),181 -197.
Klovdh a
l,A .S .(1981 )
.Ano teo fim ag eso fso cia
ln etwo rks.So cialNetwo rk s3,
197-214.
Liberatore, Gu st avoyo tros.(2004 ).Edu caci nad is
tan ciaytop icm ap s
:un a
aprox ima cinal ap rob lem ticad el aen se anzad el aind i zac
in.B ib lios
:
RevistaE l ect
rn icad eC i
en ciasd elaIn form acin,6(21 /22 ).
Librelot
to ,G iov an i Rub er
t.(2005 ). Top ic M aps:d as intax e s em ntica.
Departam entod eIn form atic a
,E sco lad eEng enh ar
ia, Un ivers
id adedo M inho ,
Braga.(T e sispre sent ad ap arae lttulod edo cto reninform
tica).
Miguel,S.; Moy a-An egn,F .;H er
r e
ro -Solan a,V .(2007 ).E lan l
is
isd eco -citas
com om todod einv e st
ig acinenB ibl
iot ecolog ayC ienciad el aInform acin.
Inve st
iga cinB ibliot ecolg ica,21(43 )
,139 -155 .
Rip,A .P .;Cou r
ti al
,J .P .(1984 ). Co-wo rd m apso fbiotechnology :Anex am pl
e
ofcogn i
t iv es c
ien tom etri
c s,S ci
entom et
rics ,6,381 -400.
Sm a
ll, H . (1973 ). Co c
i tationin s cientif
i cl itera
tur e N ew m e
asur eo f
rela
tion ship b etw een 2 do cum ents. Jou rnalo fd e Am er
ic an So c
iety fo r
Inform ationS cien ce,24(4 )
,265 -269 .
Spinak,E .(1996 )
.D i ccion ar
iod een cic
lopd icod eb ibl
iom et
ra,cienciom e
t rae
inform etr a
.C ar ac as,Un esco.
SteveP epp er
.(2000 ).T heTAOo fTop ic M ap s.InP roceed ingso fXMLEu rope
2000,P a
r is,F ran ce.
Varga s
-Qu esad a
, B en jam n. (2005 ). V isu alizacin y an
lisisd eg rand e
s
dom iniosc ient
fi cos m edianter ed esP athfind er (PFNET )
.T e
sis do ctoral
.
Granad a
,L aUn iv ersid ad.
Wasserm an ,S .
;F au s
t,K .(1998 )
. So c
i a
lN etwork An alysi
s. M e
thods and
Apli
c at
ion s.C am bridg e
:C am b r
idg eUn iver s
ityP ress
.