Vous êtes sur la page 1sur 11

CARTILLA #1

Los datos en las organizaciones

La analítica es un proceso fundamental para la toma de decisiones en las empresas, requiere hoy en
día que los asuntos o relaciones entre empresarios y clientes sean de alguna forma sistematizados,
de modo que resulta de vital importancia conocer las características del comportamiento de las
personas frente a los negocios que con estos se entablan.

Los datos no son más que la forma o manera como las empresas conocen lo que hacen, dicen o
hacen sus clientes. Para hacer un registro de estos datos, regularmente se usan encuestas o
reportes de facturas que llevan a identificar un dato.

Los datos en las organizaciones

Dentro de toda organización, sin importar su tipo, siempre encontraremos datos de interés para
cada área funcional, y es por ello que se hace necesaria su clasificación, administración, gestión y
análisis. Observemos en el ejemplo algunos datos que nos permitirán el desarrollo de bases de
datos.

Encontramos varios datos importantes, en la figura anterior, estos son: • Cliente, de la cual
podemos determinar quién es el que compra los productos.

• Dirección, donde se ubica y posiblemente donde realizar el despacho.

• Producto, que compra el cliente como tal.

• Precio, valor que se le cobra usualmente, etc.


De lo anterior si se tiene cierto número de clientes se podrá obtener la prioridad, lo que
comúnmente compran o consumen y con esto tener previsión de inventarios y posiblemente
ahorro en costos de almacenaje. De esto se podrá establecer lo que se conoce como base de
datos. Las bases donde comúnmente

Las bases donde comúnmente se hacen reportes de datos, puede definirse como un compilado de
variables que permiten medir información que arrojan los clientes de las empresas, y se encargan
de organizar y darle estructura a la información de forma simplificada.

Fuentes de datos

Los datos pueden ser obtenidos de manera precisa si estos son propios y que se denominan fuente
primaria, o asumiendo cualquier falencia en la obtención de otras fuentes no propias o conocidas
como fuentes secundarias. La ventaja de la fuente de datos primaria con respecto a las fuentes
secundarias radica en el acceso y en lo que el administrador de la base de datos estipula que se
debe abordar dentro de este proceso. Las fuentes primarias regularmente la realizan las propias
empresas a partir de sus áreas de informática y/o estadísticas. En cambio, aquellas que provienen
de los datos del estado o gobierno e incluso instituciones de propiedad pública o privada (y que
son usadas por las empresas), son las catalogadas como secundarias.

Ejemplo:

Las fuente primarias pueden ser: entrevistas, reportes, sondeos de opinión de la empresa,
minutas, etc. Y las fuentes secundarias: datos del Departamento Administrativo Nacional de
Estadísticas (DANE), Departamento de Planeación Nacional (DNP), Ministerio de Hacienda y
crédito público (Minhacienda), encuestas de otras empresas privadas, etc.

Lo recomendable es siempre poseer información propia y que cada una de las empresas elabore
su propio reporte. Ya cuando es demasiado difícil obtener información, se puede contratar con
alguna empresa consultora especializada en la materia o cuando sea el caso de que resulta
costoso contratar u obtener datos, se recomienda usar información o datos de las instituciones
estatales, teniendo en cuenta que posiblemente algunas veces no tengan información que
requiera la empresa en cuestión de la necesidad del dato.

Tipo de datos

Los datos según su proveniencia pueden ser clasificados como:


Los datos regularmente provienen o son obtenidos por sectores que en cualquier momento
obtienen información de un ciudadano común. Aquellos que provienen del sector transporte
pueden ser como, por ejemplo: el número de accidentes, la cantidad de vehículos que hay en el
parque automotor, número de vías pavimentadas. En otro sector como el financiero se puede
tener: el precio de las acciones y/o derivados financieros, el índice general de la bolsa, la tasa de
interés efectiva y nominal del mercado, etc.

Por otro lado, más en el sentido de la programación los datos regularmente se clasifican en:

• Numérico.

• Carácter o texto.

• Lógicos.

• Nulos.

Los datos de tipo numérico suelen representarse tal como su nombre de clasificación así lo
identifica.}

Ejemplo

Enteros: 34560 o -34560. Puede ser también continuos o de forma decimal, es decir, 2.36; 4.78,
etc. Los primeros lenguajes de programación lo toman como “int (integer)” y los segundos como
“float”.

Debe tenerse en cuenta que los datos numéricos regularmente se usan para descripciones como
precios, ingresos, gastos, numero de contacto, edad, etc. Los de formato carácter o texto son
aquellos que vienen establecidos como cadenas de datos o simplemente estructura de escritos,
algunos programas los referencian como: “A”, hacen referencia a variables que describen
características de los individuos como: estado civil “casado”; “divorciado”; “soltero”. Siempre se
escriben entre comillas. En otros softwares simplemente los resaltan ya sea en negrilla o en color
azul. Los lógicos hacen referencia al lenguaje booleano, es decir, responden de forma binaria,
tienen como respuesta las opciones de verdadero o falso.

Ejemplo 7 > 5, True. 3 = 4, False.

En las bases de datos se opera con ellos para formular referencias condicionantes o lo que un
analista hace o establece para hacer que una relación de un par de variables nos dé como
respuesta una secuencia lógica. Analicemos un caso en Excel de Microsoft: tenemos un par de
variables que son de tipo numérico, para este caso se usan números enteros y a partir de estos
queremos obtener una respuesta lógica:

Línea del tiempo


La tabla quiere demostrar en qué sentido funciona el operador lógico cuando se establece una
comparación con la variable (2). Una visualización del comando o programación a usar es el
comando (SI) con cada una de las filas en que se aplica la fórmula de uso. Para la fila 1, donde se
encuentran los valores de 10, si es mayor estrictamente a 5 la celda respuesta debe ser
condicionada a: = SI (E7 > G7; “Verdadero”; “Falso”) Donde E7 corresponde a la celda que contiene
el valor de 10, se usa el operador “>” mayor estrictamente, G7 hace referencia a la celda donde
está el valor de 5 y la respuesta a la programación específica para hallar la respuesta. Para otros
casos como el de la fila 3 que contiene los valores de 13, el operador “< G9; “Verdadero”; “Falso”)
Si en algún aspecto el estudiante se ve confundido con la programación puede hacerlo de forma
manual cambiando las letras de la ubicación de la celda con los respectivos valores. = SI (13 < 16;
“Verdadero”; “Falso”) La respuesta será “Verdadero”.

El tipo de dato nulo o “NULL” hace referencia que para la observación específica no se manifiesta
ningún tipo de información en la base de datos. Regularmente no se tienen en cuenta porque no
aportan ningún dato o información.
Sistemas de información

Los sistemas de información actuales varían a partir de la estructura de la organización que


maneja o conduce la información de los agentes que interactúan en los negocios. Los sistemas
ayudan a organizar la forma en que se alimentan las bases de datos de la compañía.

Ejemplo Los elementos proveídos por los individuos generan información y con esta se establecen
recursos de operación.

Los sistemas pueden ser más complejos en la medida que se adhieran más fases o áreas dentro de
las organizaciones, como se observa en la figura 6.
Importancia de los datos en la empresa

La información en las empresas permite reducir incertidumbre a la hora de tomar decisiones de


cualquier tipo y sobre todo aquellas que tengan efectos en los costos y gastos operativos. También
permiten tener ventaja sobre la competencia, ya que, al tener información privilegiada de los
clientes, se podrá ofrecer un mejor producto o servicio en particular e incluso innovar en los
procesos de la empresa. Las decisiones que se tomen a partir de un buen análisis de datos serán
mucho mejor que aquellas que no cuenten con este análisis.

Uso y aplicación de los datos

Al usar información que puede ser recopilada de forma diaria, semanal, quincenal, mensual,
semestral o anual, se puede establecer una jerarquía de perfiles de los clientes o proveedores que
participan en el entorno de la empresa. El buen uso de la información genera una disciplina más
precisa en la compañía en lo que tiene que ver con una mejor oferta de servicios. Las áreas de
aplicación de los datos pueden ser:

• Área financiera y contable: balance de resultados, costos, ingresos.

• Área administrativa: portafolio de servicios.

• Área de logística: inventarios, despachos.

• Área de Talento humano: contrataciones, flexibilización laboral.


Análisis de datos como una herramienta para pensar las empresas

El estado de pensamiento de las empresas no solo reposa en la parte más alta que asume la
jerarquía de la compañía, al contrario, parte de las bases que le brinda el área de analítica,
regularmente compuesta con personal con talento en lectura e interpretación de datos, a pesar de
la necesidad de poseer conocimientos de las matemáticas, algebra y estadística, la analítica
intenta hacer una lectura correcta de la información y usarla a favor de los desafíos del mercado.

El análisis de datos soporta el nivel de reputación que puede tener una empresa, cuando la
empresa se desenvuelve en el mercado es porque conoce de algo y eso sin duda provino de un
dato.

¿Qué es análisis de datos?

Una definición muy formal podría darse como el proceso de inspeccionar conjuntos de datos e
información que brindan los agentes del mercado con el único fin de sacar conclusiones que lleven
a mejorar la calidad de la oferta de servicios, hoy en día se hace con la ayuda de sistemas
especializados y de software (muchos de estos con licencia de pago y otros muy pocos de licencia
abierta o gratuita). Las tecnologías y técnicas de análisis de datos se utilizan ampliamente en las
industrias y empresas para permitir tomar decisiones más informadas, también suelen ser usadas
por científicos e investigadores para verificar o refutar modelos científicos, teorías e hipótesis
sobre condiciones que establecen los mercados. El simple análisis de datos parte desde el
conocimiento de las métricas, saber en qué forma o manera se mide la información es el punto de
partida para establecer conjeturas con la información disponible.

Regularmente en las bases de datos las variables se escriben con pocas letras, simplemente se
forman como una sola palabra, incluso a veces solo con iniciales, esto depende -claro está- del
administrador de la base de datos que se familiariza con la información que entra para la
digitación de esta. Hay un establecimiento de etiquetas, que es donde regularmente se hace la
descripción de todo tipo que puede tener la variable. En los organismos estatales incluso se crea
un Tabla 4. Información de variables en métricas Fuente: propia manual de etiquetas para cuando
la base de datos es gigante o usa demasiados datos como lo es la Gran encuesta manufacturera.
Todo lo anterior puede ser denominado como la caracterización de la base de datos y se considera
la primera etapa de la analítica. Muchas veces habrá que crear, codificar y sistematizar la
información que es obtenida a diario y a partir de esto armar el montaje en el software específico
de utilización, las bases de datos.

Hay muchos softwares más como R, Python, Tableau, SAS, que cada uno maneja a disposición de
su interfaz un gran grupo de variables e información. Cada uno tiene sus ventajas y desventajas
con respecto a otro, pero la analítica es la misma. Otra de las fases del análisis de datos viene de
los conceptos aplicados de la estadística, los primeros son de orden descriptivo y los segundos ya
de manera más formal como lo son los inferenciales.
Análisis descriptivo (forma de análisis cuantitativo)

Tal como lo manifiesta el título, hace referencia a la descripción como tal del dato. Tiene en cuenta
los estadísticos más usados o de origen, tal como el número de observaciones o tamaño de la
muestra, muchas veces toma el código de (N), el siguiente es el promedio (Ῡ), su desviación
estándar (SE), los valores máximos y mínimos que toma el dato y algunas veces la suma total de las
observaciones.

El análisis de datos es más directo y compacto y frente a las salidas de los programas y softwares
se puede obtener un análisis completo de forma automática. El trabajo del analista es interpretar
las estadísticas.

Las otras métricas tales como la varianza, curtosis, moda y coeficiente de asimetría, serán
explicadas más adelante en el desarrollo del curso, son complemento del análisis descriptivo
básico, pero de forma más avanzada.

Análisis de inferencia estadística

En los datos cuantitativos se pueden establecer pruebas de hipótesis, un ejemplo de esto suele
pasar cuando queremos mirar si un parámetro es o no significativo con respecto a las
observaciones que se brindan. Ante esto, es bueno presentar una hipótesis nula y una hipótesis
alternativa.

Análisis de datos cualitativos

Los datos cualitativos como no son usados de forma numérica, deben ser analizados de forma
distinta con el uso de las métricas descriptivas. Tal como son muchas veces caracteres o cadena de
textos se suelen codificar de forma binaria para poder ser tomados como números.

CARTILLA #2