Vous êtes sur la page 1sur 17

Introducción al

Aprendizaje de
Máquina y al Big Data
Objetivos de Aprendizaje

• Analizar en contexto las diferentes tecnologías que conforman el


aprendizaje de máquina y el Big Data.
• Entender al aprendizaje de máquina dentro del contexto de ciencias y
tecnologías afines.
• Dentro del aprendizaje supervisado, estudiar los fundamentos de las redes
neuronales y los support vector machines.
Aprendizaje de Máquina

• Es el estudio de técnicas/algoritmos que permitan al computador


aprender, inducir o generalizar patrones o características de un conjunto
de datos.
• Tipos:
• Supervisado
• Cuando se entregan ejemplos específicos de un tipo de datos que se busca generalizar
su patrón o características de forma automática.
• No-supervisado (clustering)
• Cuando no se entregan ejemplos específicos de ningún tipo de dato y se intenta deducir
cierta estructura o característica de forma automática de los datos.
En contexto de otras ciencias

• Data Science
• Aprendizaje de Máquina (cognitivo).
• Minería de Datos:
• Recolectar, Limpiar, Procesar, Analizar y, obtener información útil de un conjunto
de datos.
• BigData: procesamiento de grandes volúmenes de datos a gran velocidad y
disponibilidad. (Volumen + Velocidad).
Aprendizaje Supervisado

• Sea, 𝑋 un set de datos de la forma, 𝑋𝑖 = (𝑥𝑖1 , 𝑥𝑖2 , 𝑥𝑖3 , … , 𝑥𝑖𝑛 ) y 𝑌 el set de


categorías, 𝑌𝑖 = 𝑦𝑖 , de forma que en la presencia de un algoritmo, 𝐴 que
recibe como datos un 𝑋𝑛𝑒𝑤 , 𝑋, 𝑌, produce como resultado un 𝑌𝑛𝑒𝑤 con las
categorías de 𝑌.
• El set de categorías 𝑌 es el que supervisa el aprendizaje del algoritmo 𝐴.
Redes Neuronales (Artificiales)

• Son un modelo computacional inspirado en el funcionamiento biológico de


las neuronas en el cerebro.
• Una red neuronal es un procesador paralelo distribuido conformado de
unidades simples de procesamiento que tiene la capacidad de guardar
conocimiento basado en experiencias y ponerlo a disposición para su uso.
• El conocimiento es adquirido por la red desde el entorno a través de un proceso
de aprendizaje.
• La conexión entre neuronas, o pesos sinápticos, son usados para almacenar el
conocimiento adquirido.
Neuronas
Perceptrón
Ejercicio de Programación
Support Vector Machines

• Es un algoritmo lineal de clasificación similar a las redes neuronales


(perceptrón), que intenta maximizar el margen entre dos sub-espacios.
• De tal forma que dado:

• Se busca maximizar:
Support Vector Machines
Procesamiento de
Lenguaje Natural
Objetivos de Aprendizaje

• Estudiar cómo se modela y procesa el lenguaje natural.


• Utilizar herramientas para obtener bases de datos de texto que nos
permitan utilizar algoritmos que procesan lenguaje natural.
• Aprender cómo conectarse al API de Twitter.
• Empezar la construcción del algoritmo bag of words para usarlo en
análisis de sentimientos.
Procesamiento de Lenguaje Natural

• Es el modelado e interpretación del lenguaje natural (usado por


humanos) a través del uso de algoritmos computacionales.
• Dificultades:
• Ambigüedad
• Detección de separación entre las palabras
• Recepción imperfecta de datos
Aplicaciones

• Síntesis de discurso
• Análisis de sentimiento
• Reconocimiento del habla
• Traducción automática
• Comprensión del lenguaje
Ejercicio de Programación
Próxima Clase

• Control de Lectura del paper:


• A generative vision model that trains with high data efficiency and breaks text-
based CAPTCHAs.

• Lectura:
• Bishop - Pattern Recognition And Machine Learning
• Redes Neuronales: Capítulo 5.
• Support Vector Machines: Capítulo 7.

Vous aimerez peut-être aussi