Vous êtes sur la page 1sur 13

Entre 1960 y 1970, las computadoras tienen

capacidades limitadas de procesamiento y de


almacenamiento. La lectura secuencial de los
archivos era muy comn y se deban recorrer todos
los registros para encontrar el deseado; esta
situacin acarreaba problemas en la velocidad de
respuesta.
Por esta razn, se necesitaba un esfuerzo mayor
que la actual en la programacin de aplicaciones
para acceder a los datos, puesto que el
almacenamiento se centraba en pocos tipos de
datos, por ejemplo, numricos y de texto. Esto
limitaba las capacidades de respuesta a las
necesidades de las empresas y exiga algoritmos de
programacin para un sinfn de situaciones.
En la actualidad, todas las personas interactan con
datos que, de alguna manera se almacenan en un
medio fsico y se asocian a un sistema informtico
que los registra y permite su acceso.
Entonces, Qu es una base de datos? Algunos
podran pensar que son solo datos almacenados en
una computadora como, por ejemplo, una planilla de
clculos. Sin embargo es mucho ms que eso.
James Martin en su obra Computer Data-base
Organization (1975) define base de datos
como: Coleccin de datos interrelacionados
almacenados en conjunto sin redundancias
perjudiciales o innecesarias; su finalidad es
servir a una aplicacin o ms, de la mejor
manera posible; los datos se almacenan de
modo que resulten independientes de los
programas que lo usan: se emplean mtodos
bien determinados para incluir nuevos datos y
para modificar o extraer los datos almacenados.
Es un conjunto de datos estructurados y definidos a travs de un proceso
especifico (Reinosa,2012), que busca satisfacer tratamientos de informacin
implicados en las necesidades de una empresa.

Los Sistemas de Gestin de Base de Datos o SGBD son un tipo de software


muy especfico, dedicado a servir de interfaz entre la base de datos el usuario y
las aplicaciones que la utilizan.
El DBMS puede implementar instrucciones dadas por distintos usuarios, que
tienen distintos efectos en una base de datos. Las instrucciones se agrupan
mnimamente en: DDL (Lenguaje de Definicin de Datos) y DML (Lenguaje de
Manipulacin de Datos), aunque tambin
suele reconocerse al DCL (Lenguaje de
Control de Datos).
La definicin dada por James Martin tambin
incluye el concepto de independencia de
datos que significa que las aplicaciones
deben ser independientes de las
modificaciones que pudieran sufrir los datos, en lo lgico y en lo fsico.

Hay diversas clasificaciones de los usuarios que


actan en entorno de bases de datos, como las
planteadas por grandes autores como C.J Date en
Sistemas de Bases de Datos, Korth en Fundamentos
de Bases de Datos y Ramez Elmasri y Shamkant
Nvathe en Sistemas de Bases de Datos: conceptos
fundamentales. Muchos autores indican diferentes
clasificaciones con diversos roles, en esta monografa
nos enfocaremos en la siguiente divisin:
Administrador de la Base de Datos:
Comnmente es el profesional-ingeniero o analista con perfil tcnico que, en
el ambiente informtico se denomina DBA (Data Base Administrator)
Programador de Aplicaciones:
Conoce los casos que se desarrollan escritos e identificados por el Equipo de
Anlisis y Diseo- , es conveniente aclarar que no hace falta que este usuario
conozca toda la estructura de la base de datos, sino solo lo que necesita para
programar.
Usuario Final:
Es el personal que interacta con las aplicaciones programadas por el usuario
mencionado en el prrafo precedente y es, de entre todos los usuarios el que
menos conocimiento tcnico posee.

La seguridad en la base de datos es un conjunto de funciones manejadas por


el DBA. Este rol es responsable de la creacin de los nuevos usuarios y de la
accesibilidad de los objetos de la base de datos.
Tiene el fin de proteger a la base de Datos contra
Accesos no autorizados, tambin llamado
Privacidad.
Incluye Aspectos de:
- Polticas de la Empresa, niveles de
informacin pblica y privada.
- Aspectos legales sociales y ticos.
- Controles de tipo Fsico, acceso a las
instalaciones.
- Identificacin de Usuarios: voz, retina del ojo, etc.
- Controles del Sistema operativo.
La base de datos ms segura es aquella que no tiene usuarios, pero esta
situacin carece de sentido. Por esta razn, se debe llegar a un balance entre
el permiso de acceso a los usuarios y el control de lo que se les permite hacer
cuando establecen una sesin a travs de una conexin. Para ello existe en
cada base de datos un modelo de seguridad. Por razones de sntesis, nos
dedicaremos a estudiar el que nos ofrece la base de datos de Oracle. Se
recomienda visitar la pgina de documentacin oficial de la empresa en:
http://www.oracle.com/technetwork/database/focus-areas/security/index.html
El modelo de seguridad Oracle consiste en dos
partes:
1. Autenticacin de contraseas, que
puede basarse en el sistema Operativo
que aloja al motor o usar el propio
sistema de autenticacin de la Base.
Cuando la ltima opcin es elegida por
el DBA, la informacin de contraseas
se almacena en un formato encriptado
en el diccionario de la base de datos.
2. Control de que objeto de la base de
datos se puede acceder y por cual grupo
de usuarios. Esta autoridad se transmite
a travs de privilegios que se le asignan
a los usuarios directamente o por medio de roles a grupos de usuarios.

Las bases de datos pueden clasificarse de varias maneras, de acuerdo al


contexto que se est manejando, o la utilidad de la misma.
Segn la variabilidad de los datos almacenados:

Estas son bases de datos de solo lectura, utilizadas primordialmente para


almacenar datos histricos que posteriormente se pueden utilizar para estudiar
el comportamiento de un conjunto de datos a travs del tiempo, realizar
proyecciones y tomar decisiones.

Estas son bases de datos donde la informacin almacenada se modifica con el


tiempo, permitiendo operaciones como actualizacin, borrado y adicin de
datos, adems de las operaciones fundamentales de consulta. Un ejemplo de
esto puede ser la base de datos utilizada en un sistema de informacin de un
supermercado, una farmacia, un videoclub o una empresa.

Modelos de Bases de Datos:


Adems de la clasificacin por la funcin de las bases de datos, estas tambin
se pueden clasificar de acuerdo a su modelo de
administracin de datos.

Un modelo de datos es bsicamente una


"descripcin" de algo conocido como contenedor de
datos (algo en donde se guarda la informacin), as
como de los mtodos para almacenar y recuperar
informacin de esos contenedores. Los modelos de
datos no son cosas fsicas: son abstracciones que
permiten la implementacin de un sistema eficiente
de base de datos; por lo general se refieren a
algoritmos, y conceptos matemticos.
Algunos modelos con frecuencia utilizados
en las bases de datos son:

stas son bases de datos que, como su


nombre indica, almacenan su informacin en
una estructura jerrquica. En este modelo los
datos se organizan en una forma similar a un
rbol (visto al revs), en donde un nodo
padre de informacin puede tener
varios hijos. El nodo que no tiene padres es
llamado raz, y a los nodos que no tienen
hijos se los conoce como hojas.

Una de las principales limitaciones de este modelo es su incapacidad de


representar eficientemente la redundancia de datos.

ste es un modelo ligeramente distinto del jerrquico; su diferencia


fundamental es la modificacin del concepto de nodo: se permite que un mismo
nodo tenga varios padres (posibilidad no permitida en el modelo jerrquico).

Fue una gran mejora con respecto al modelo jerrquico, ya que ofreca una
solucin eficiente al problema de redundancia de datos; pero, aun as, la
dificultad que significa administrar la informacin en una base de datos de red
ha significado que sea un modelo utilizado en su mayora por programadores
ms que por usuarios finales.

Son bases de datos cuyo nico fin es el envo y recepcin de datos a grandes
velocidades, estas bases son muy poco comunes y estn dirigidas por lo
general al entorno de anlisis de calidad, datos de produccin e industrial, es
importante entender que su fin nico es recolectar y recuperar los datos a la
mayor velocidad posible, por lo tanto la redundancia y duplicacin de
informacin no es un problema como con las dems bases de datos, por lo
general para poderlas aprovechar al mximo permiten algn tipo de
conectividad a bases de datos relacionales.
Utilizado en la actualidad para modelar problemas reales y administrar datos
dinmicamente. Su idea fundamental es el uso de "relaciones". Estas
relaciones podran considerarse en forma lgica como conjuntos de datos
llamados "tuplas". Esto es pensando en cada relacin como si fuese una tabla
que est compuesta por registros (las filas de una tabla), que representaran
las tuplas, y campos (las columnas de una tabla). El lugar y la forma en que se
almacenen los datos no tienen relevancia (a diferencia de otros modelos como
el jerrquico y el de red). Esto tiene la considerable ventaja de que es ms fcil
de entender y de utilizar para un usuario espordico de la base de datos.

Son bases de datos ideadas para desarrollar aplicaciones muy concretas.


Bsicamente no se diferencian demasiado de las bases de datos relacionales
(una tabla en una base de datos relacional podra serlo tambin en una base
de datos multidimensional), la diferencia est ms bien a nivel conceptual; en
las bases de datos multidimensionales los campos o atributos de una tabla
pueden ser de dos tipos, o bien representan dimensiones de la tabla, o bien
representan mtricas que se desean estudiar.

Es una base de datos que incorpora todos los conceptos importantes del
paradigma de objetos:

Encapsulacin - Propiedad que permite ocultar la informacin al resto de los


objetos, impidiendo as accesos incorrectos o conflictos.
Herencia- Propiedad a travs de la cual los objetos heredan
comportamiento dentro de una jerarqua de clases.
Polimorfismo - Propiedad de una operacin mediante la cual puede ser
aplicada a distintos tipos de objetos.
Una operacin (llamada funcin) se especifica en dos partes. La interfaz (o
signatura) de una operacin incluye el nombre de la operacin y los tipos de
datos de sus argumentos (o parmetros). La implementacin (o mtodo) de la
operacin se especifica separadamente y puede modificarse sin afectar la
interfaz. Los programas de aplicacin de los usuarios pueden operar sobre los
datos invocando a dichas operaciones a travs de sus nombres y argumentos,
sea cual sea la forma en la que se han implementado. Esto podra
denominarse independencia entre programas y operaciones.

Permiten la indexacin a texto completo, y en lneas generales realizar


bsquedas ms potentes. Tesaurus es un sistema de ndices optimizado para
este tipo de bases de datos.

Un sistema de base de datos deductiva, es un sistema de base de datos, pero

con la diferencia de que permite hacer deducciones a travs de inferencias. Se

basa principalmente en reglas y hechos que son almacenados en la base de

datos. Las bases de datos deductivas son tambin llamadas bases de datos

lgicas, a raz de que se basa en lgica matemtica.

La base de datos y el software SGBD pueden estar distribuidos en mltiples

sitios conectados por una red.


Estas surgen debido a la existencia fsica de organismos descentralizados.
Esto les da la capacidad de unir las bases de datos de cada localidad y
acceder as a distintas universidades, sucursales de tiendas, etctera.
La definicin que daremos es la de Adrin Merv,
vicepresidente de la consultora Gartner, que en la
revista Teradata Magazine, del primer trimestre de
2011, define este trmino como: Big Data excede el
alcance de los entornos de hardware de uso comn y
herramientas de software para capturar, gestionar y
procesar los datos dentro de un tiempo transcurrido
tolerable para su poblacin de usuario.
Big data, datos masivos o datos a gran escala es un concepto que hace
referencia a conjuntos de datos tan grandes que aplicaciones
informtica tradicionales del procesamiento de datos no son suficientes para
tratar con ellos y a los procedimientos usados para encontrar patrones
repetitivos dentro de esos datos. En los textos cientficos en espaol con
frecuencia se usa directamente el trmino en ingls big data, tal como aparece
en el ensayo de Viktor Schnberger: La revolucin de los datos masivos.

Es frecuente dividir las categoras de datos en dos grandes tipos: estructurados


(datos tradicionales) y no estructurados (datos Big Data). Sin embargo, las
nuevas herramientas de manipulacin de Big Data han originado unas nuevas
categoras dentro de los tipos de datos no estructurados: datos
semietrucrurados y datos no estructurados propiamente dichos.

La mayora de las fuentes de datos tradicionales son datos estructurados,


datos con formato o esquema fijo que poseen campos fijos. Son los datos de
las bases de datos relacionales, las hojas de clculo y los archivos,
fundamentalmente. Los datos estructurados se componen de piezas de
informacin que se conocen de antemano, vienen en un formato especificado,
y se producen en un orden especificado. Estos formatos facilitan el trabajo con
dichos datos. Formatos tpicos son: fecha de nacimiento (DD, MM, AA);
documento nacional de identidad o pasaporte (por ejemplo, 8 dgitos y una
letra) nmero de la cuenta corriente en un banco (20 dgitos), etctera.
Los datos semiestructurados tienen un flujo lgico y un formato que puede ser
definido, pero no es fcil su comprensin. Son Datos que no tienen formatos
fijos, pero contienen etiquetas y otros marcadores que permiten separar los
elementos. La lectura de datos semiestructurados requiere del uso de reglas
complejas que determinan como proceder despus de la lectura de cada pieza
de informacin.

Sin duda, los datos ms difciles de dominar por los analistas son los datos no
estructurados, pero su continuo crecimiento ha provocado el nacimiento de
herramientas para su manipulacin como es el caso de MapReduce, Hadoop o
bases de datos NoSQL.
Ejemplos tpicos de datos que no tienen campos fijos: audio, video, fotografas,
o formatos de texto libre como correos electrnicos, mensajes instantneos
SMS, artculos, libros, mensajes de mensajera instantnea tipo Whatsapp,

viber, etctera.
Es crucial para las organizaciones facilitar que los negocios acceden a todos
los datos de modo que se puedan aplicar sobre ellos infraestructuras de Big
Data.
La integracin de datos facilita a su organizacin la combinacin de los Big
Data con los datos transaccionales para generar valor y conseguir la mayor
eficacia posible. Por esta razn uno de los aspectos ms interesantes no es
tanto lo que harn ellos mismos por el negocio, sino lo que se pondr conseguir
para el negocio cuando se combinan con otros datos de la organizacin.
Un buen ejemplo puede ser
enriquecedor: utilizar las
preferencias y rechazos de los
perfiles de los clientes en los
medios sociales con el objetivo de
mejorar la comercializacin de
destino.
Big data al igual que la nube (clound) abarca diversas tecnologas. Los datos
de entrada a los sistemas de Big Data pueden proceder de redes sociales,
logs, registros de servidores web sensores de flujos de trficos, imgenes de
satlites, flujos de audio y de radio, transacciones bancarias. MP3 de msica,
contenido de pginas web, escaneado de documentos de la administracin,
caminos o rutas GPS, telemetra de automviles, datos de mercados
financieros. Todos estos datos son realmente los mismos?
IBM plantea como tambin hizo gartner que Big Data abarca tres grandes
dimensiones, conocidas como el Modelos de las tres v(3 V o v3): volumen,
velocidad y variedad (variety)

VOLUMEN
Las empresas amasan grandes
volmenes de datos, desde terabytes
hasta petabytes. Las cantidades que hoy
nos parecen enormes, en pocos aos
sern normales. Estamos pasando de la
era del petabyte a la era del exabyte, y
para 2015 a 2020, se espera entremos en
le era del zettabyte, IBM da el dato de 12
terabytes para referirse a lo que crea
twitter cada da solo en el anlisis de
productos para conseguir mejoras en la eficacia.

VELOCIDAD
La importancia de la velocidad de los datos o los aumentos crecientes de los
flujos de datos en las organizaciones junto con la frecuencia de las
actualizaciones de las grandes bases de datos son caractersticas importantes
a tener en cuenta. Esto requiere que su procesamiento y posterior anlisis,
normalmente, ha de hacerse en tiempo real para mejorarla toma de decisiones
sobre la de la informacin generada. A veces, cinco minutos es demasiado
tarde en la toma de decisiones; los procesos sensibles al tiempo como pueden
ser los casos de fraude obligan a actuar rpidamente. Imaginemos los millones
de escrutinios de los datos de un banco con el objetivo de detectar un fraude
potencial o el anlisis de millones de llamadas telefnicas para tratar de
predecir el comportamiento de los clientes y evitar que se cambien de
compaa.
VARIEDAD
Las fuentes de datos son de cualquier tipo. Los datos pueden ser estructurados
y no estructurados (texto, datos de sensores, audio, video, flujos de clics,
archivos logs), y cuando se analizan juntos se requieren nuevas tcnicas.
Imaginemos el registro en vivo de imgenes de las cmaras de video de un
estadio de futbol o de vigilancia de calles y edificios.

VARACIDAD
Segn IBM, en su definicin de Big Data, al comentar la caracterstica de
veracidad proporciona un dato estremecedor: uno de cada tres lderes de
negocio (directivos) no se fa de las informaciones que utilizan para tomar
decisiones. Cmo puede, entonces, actuar con esta informacin si no se fa
de ella? El establecimiento de la veracidad o fiabilidad (truth)de big data
supone un gran reto a medida que la veracidad y las fuentes de datos crecen.

VALOR
Adems de las 3 v clsicas con las que todas las
fuentes coinciden, yla cuarta que suele sealar
IBM, existe una quinta caracterstica que tambin
se suele considerar: el valor. Las organizaciones
estudian obtener informacin de los grandes
datos de una manera rentable y eficiente. Aqu es
donde las tecnologas de cdigo abierto tales
como Apache Hadoop se han vuelto muy
populares. Hadoop, es un software que procesa
grandes volmenes de datos a travs de un
clster de centenares. O incluso millares de
computadoras de un modo muy econmico.
Bases de datos, 2012. Reinosa, Maldonado,
Muoz, Damiano, Abrutsky
https://es.slideshare.net/senaticscesar/bases-
de-datos-conceptos-basicos
http://basededatos.over-blog.net/article-tipos-
de-bases-de-datos-68319538.html

Big Data, 2011.


https://es.wikipedia.org/wiki/Big_data#Utilidad

Vous aimerez peut-être aussi