Vous êtes sur la page 1sur 20

Sergio Francisco Juárez Cerrillo

Facultad de Estadı́stica e Informática


Universidad Veracruzana

22 de marzo, 2019

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Agradezco la invitación al
Dr. Cristóbal Salas Alfredo por la oportunidad de establecer un
dialogo con sectores importantes de la sociedad (gobierno y
empresarios).

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Plática

1 Mi área de investigación.
2 Mi área de investigación en la solución de problemáticas reales
Gobierno (sus tres niveles)
Empresas de la región (agricultura, ganadera, servicios).
3 Acciones para establecer proyectos conjuntos o contratos de
servicios entre ustedes (gobiernos y/o empresarios) con
nosotros (academia).

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


1. Mi área de investigación
Soy de formación estadı́stico, me desenvuelvo como investigador en la
Facultad de Estadı́stica e Informática de la Universidad Veracruzana,
hago:
Estadı́stica teórica. Desarrollo de la estadı́stica como una área
del conocimiento.
Estadı́stica aplicada. Uso de la estadı́stica para resolver
problemas en cualquier área del conocimiento.

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


2. Mi área de investigación en la solución de
problemáticas reales

Pregunta de investigación:
¿Qué tan desigual es la distribución del ingreso en México?

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Gestionamos datos (INEGI)

Censo. Para todos los municipios de México, por vivienda, variables


explicatorias:
X1 = prophombres, X2 = propentre0y2, X3 = propentre3y5,
X4 = prop65mas, X5 = escol, X6 = hogtrab, X7 = excus,
X8 = drenaje, X9 = pisotierra, X10 = electricidad,
X11 = agua, X12 = radio, X13 = tv, X14 = refrigerador,
X15 = automovil, X16 = computadora, X17 = telefono,
X18 = celular.
Muestra. Para una muestra de municipios de México, por vivienda,
se tienen las mismas variables explicatorias. Además se tiene a la
variable de interés: Y = ingreso total trimestral en la vivienda.

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Análisis estadı́stico

(1). Postulado teórico: El ingreso en la vivienda es una función f


de las variables explicatorias de la vivienda, más algo que no está
determinado por estas:

Y = f (X1 , X2 , . . . , X18 ) + 

(2). Ajustamos el modelo a los datos de la muestra.


(3). Usamos el modelo para predecir al ingreso en las viviendas en
toda la población.
(4). Con las predicciones del ingreso en las viviendas, calculamos el
ı́ndice de Gini para todos los municipios de México.
(5). Visualizamos los resultados.

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Índice de Gini para el ingreso trimestral por vivienda

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Datos: ¿Qué vemos aquı́?

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Estadı́stica = Espada del Augurio

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Ciclo de la estadı́stica aplicada
Todo empieza con una pregunta, que la hace quien entiende el con-
texto de la problemática.

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Estadı́stica Aplicada

Los estadı́sticos aplicados:


(1) Ayudamos a resolver problemas en los cuales se cuenta con datos
para su solución.
(2) Trabajamos con datos, son nuestra materia prima.
(3) Convertimos a los datos en información que sea útil para resolver
problemas.
(4) Usamos matemáticas, computación y principios de metodologı́a
de la investigación.
(5) somos requeridos donde hay datos y problemas que resolver con
estos datos.

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


De un tiempo para acá... Big Data (Datos Grandes)

Conjuntos de datos en la ciencia, tecnologı́a, gobierno, sector privado


que:
1). Tienen un gran Volumen
2). Se acumulan a gran Velocidad
3). Poseen una gran Variedad
4). Poseen una gran Variabilidad
Hecho: Las técnicas desarrolladas para manejar, hacer consultas y
analizar conjuntos grandes de datos no sirven para Datos Grandes.

Conjuntos grandes de datos 6= Datos Grandes.

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


RETOS

1). ¿Cuando, donde y cómo se producen los Datos Grandes?


2). ¿Cómo almacenar a los Datos Grandes?
3). ¿Cómo prepararlos a los Datos Grandes para analizarlos?
4). ¿Cómo analizar a los Datos Grandes?
5). ¿Cómo visualizar a los resultados de analizar a los Datos Grandes?

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


Un nuevo paradigma surge... Ciencia de Datos

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


¿Qué es la Ciencia de Datos

1). Es un campo emergente que aún no está bien definido.


2). Podemos entenderlo como la intersección de

matemáticas ∩ estadı́stica ∩ computación ∩ algún área del


conocimiento = Ciencia de Datos

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


El Proceso de la Ciencia de Datos

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


En el contexto de Ciudades Inteligentes

Problemas cuyo planteamiento determina a la vez problemas de Cien-


cia de Datos:
1) Ustedes plantean las preguntas (los problemas)
2) Nosotros podemos dar parte de la solución desde el paradigma de
la Ciencia de Datos

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


3. Acciones para establecer proyectos conjuntos

1). Los primeros pasos se dan con iniciativas como este evento.
2). En la Universidad Veracruzana tenemos capacidad para integrar
equipos de consultorı́a en Ciencia de Datos: Facultad de Estadı́stica
e Informática: Estadı́stica, Tecnologı́as Computacionales, Ingenierı́a
de Software, Redes y Servicios de Cómputo. Centro de Inteligencia
Artificial (Facultad de Fı́sica). Laboratorio para el Análisis de Redes
Sociales en Internet (Centro de Estudios de Opinión y Análisis).
3). Ustedes tiene la palabra.

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana


FIN
Gracias por su atención

Sergio Francisco Juárez Cerrillo Facultad de Estadı́stica e Informática Universidad Veracruzana

Vous aimerez peut-être aussi