004 - Tecnologías Emergentes

Introducción al
Aprendizaje de
Máquina y al Big Data
Objetivos de Aprendizaje
• Analizar en contexto las diferentes tecnologías que conforman el

aprendizaje de máquina y el Big Data.
• Entender al aprendizaje de máquina dentro del contexto de ciencias y
tecnologías afines.
• Dentro del aprendizaje supervisado, estudiar los fundamentos de las redes
neuronales y los support vector machines.
Aprendizaje de Máquina
• Es el estudio de técnicas/algoritmos que permitan al computador

aprender, inducir o generalizar patrones o características de un conjunto
de datos.
• Tipos:
• Supervisado
• Cuando se entregan ejemplos específicos de un tipo de datos que se busca generalizar
su patrón o características de forma automática.
• No-supervisado (clustering)
• Cuando no se entregan ejemplos específicos de ningún tipo de dato y se intenta deducir
cierta estructura o característica de forma automática de los datos.
En contexto de otras ciencias
• Data Science
• Aprendizaje de Máquina (cognitivo).
• Minería de Datos:
• Recolectar, Limpiar, Procesar, Analizar y, obtener información útil de un conjunto
de datos.
• BigData: procesamiento de grandes volúmenes de datos a gran velocidad y
disponibilidad. (Volumen + Velocidad).
Aprendizaje Supervisado
• Sea, 𝑋 un set de datos de la forma, 𝑋𝑖 = (𝑥𝑖1 , 𝑥𝑖2 , 𝑥𝑖3 , … , 𝑥𝑖𝑛 ) y 𝑌 el set de

categorías, 𝑌𝑖 = 𝑦𝑖 , de forma que en la presencia de un algoritmo, 𝐴 que
recibe como datos un 𝑋𝑛𝑒𝑤 , 𝑋, 𝑌, produce como resultado un 𝑌𝑛𝑒𝑤 con las
categorías de 𝑌.
• El set de categorías 𝑌 es el que supervisa el aprendizaje del algoritmo 𝐴.
Redes Neuronales (Artificiales)
• Son un modelo computacional inspirado en el funcionamiento biológico de

las neuronas en el cerebro.
• Una red neuronal es un procesador paralelo distribuido conformado de
unidades simples de procesamiento que tiene la capacidad de guardar
conocimiento basado en experiencias y ponerlo a disposición para su uso.
• El conocimiento es adquirido por la red desde el entorno a través de un proceso
de aprendizaje.
• La conexión entre neuronas, o pesos sinápticos, son usados para almacenar el
conocimiento adquirido.
Neuronas
Perceptrón
Ejercicio de Programación
Support Vector Machines
• Es un algoritmo lineal de clasificación similar a las redes neuronales

(perceptrón), que intenta maximizar el margen entre dos sub-espacios.
• De tal forma que dado:
• Se busca maximizar:
Support Vector Machines
Procesamiento de
Lenguaje Natural
Objetivos de Aprendizaje
• Estudiar cómo se modela y procesa el lenguaje natural.

• Utilizar herramientas para obtener bases de datos de texto que nos
permitan utilizar algoritmos que procesan lenguaje natural.
• Aprender cómo conectarse al API de Twitter.
• Empezar la construcción del algoritmo bag of words para usarlo en
análisis de sentimientos.
Procesamiento de Lenguaje Natural
• Es el modelado e interpretación del lenguaje natural (usado por

humanos) a través del uso de algoritmos computacionales.
• Dificultades:
• Ambigüedad
• Detección de separación entre las palabras
• Recepción imperfecta de datos
Aplicaciones
• Síntesis de discurso
• Análisis de sentimiento
• Reconocimiento del habla
• Traducción automática
• Comprensión del lenguaje
Ejercicio de Programación
Próxima Clase
• Control de Lectura del paper:

• A generative vision model that trains with high data efficiency and breaks text-
based CAPTCHAs.
• Lectura:
• Bishop - Pattern Recognition And Machine Learning
• Redes Neuronales: Capítulo 5.
• Support Vector Machines: Capítulo 7.

004 - Tecnologías Emergentes

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

004 - Tecnologías Emergentes

Transféré par

Droits d'auteur :

Formats disponibles

Introducción al

• Analizar en contexto las diferentes tecnologías que conforman el

• Es el estudio de técnicas/algoritmos que permitan al computador

• Sea, 𝑋 un set de datos de la forma, 𝑋𝑖 = (𝑥𝑖1 , 𝑥𝑖2 , 𝑥𝑖3 , … , 𝑥𝑖𝑛 ) y 𝑌 el set de

• Son un modelo computacional inspirado en el funcionamiento biológico de

• Es un algoritmo lineal de clasificación similar a las redes neuronales

• Estudiar cómo se modela y procesa el lenguaje natural.

• Es el modelado e interpretación del lenguaje natural (usado por

• Control de Lectura del paper:

Vous aimerez peut-être aussi