Vous êtes sur la page 1sur 17

DATA SCIENCE

Programa de estudio

digitalhouse.com
Quiénes somos
Somos un centro de formación de habilidades digitales
DIGITAL HOUSE
que desafía a pensarlo todo otra vez, aprendiendo a pasar
de la idea a la acción. Incorporamos el concepto de Coding
School, ofreciendo cursos intensivos de 3 ó 5 meses sobre
desarrollo de aplicaciones web, móvil, marketing digital y
diseño UX, data analytics, data science e inteligencia artifi-
cial, entre otros.

Sabemos que la mejor forma de enseñar estas disciplinas es


con una metodología de “aprender haciendo” que integre
la parte teórica a casos prácticos de forma permanente.
Nuestros estudiantes traen sus ideas a nuestra comunidad y
aquí encuentran las respuestas a sus desafíos, teniendo un
feedback constante de parte de los docentes e instructores,
que al ser expertos en la industria actual pueden guiarlos en
el camino al éxito.

Sabemos que todos podemos pasar de usar tecnología a


crearla nosotros mismos. Por eso, en Digital House forma-
mos las nuevas generaciones de coders y profesionales digi-
tales para que imaginen, innoven y creen lo que siempre
soñaron.

Buscamos entrenar e impulsar a nuestros estudiantes para


que se sumen rápidamente a equipos de empresas globales,
inicien su start-up o que trabajen como freelancers desde
cualquier lugar del mundo.

digitalhouse.com
Descripción del Curso
La necesidad de contar con analistas de datos calificados
DATA SCIENCE
crece rápidamente en todos los sectores empresariales e
industriales, así como en aquellos ámbitos donde se
desarrollan nuevos paradigmas educativos, sociales y
científicos.

El programa de Data Science de DH ofrece conocimientos


sólidos en el proceso de extracción, procesamiento y análisis
de grandes cantidades de datos, con el objetivo de dar
soporte a la toma de decisiones estratégicas en todo tipo de
organizaciones.

El curso está estructurado en base al ciclo de vida completo


de los datos, desde su recolección y preparación, hasta su
análisis y visualización efectiva.

Vas a aprender las habilidades y conocimientos


fundamentales para desempeñarte en tu primer trabajo
como analista de datos.

Y vas a descubrir los posibles caminos para continuar tu


aprendizaje en aquellos temas de especialización que más te
interesan.

digitalhouse.com
A quién va dirigido
Estudiantes, profesionales de diversas disciplinas
PERFIL DEL ESTUDIANTE
(economistas, administradores de empresas, ingenieros,
científicos sociales, físicos, químicos, médicos, etc.) que
desee aprender ciencia de datos para sumar nuevas
habilidades, crear nuevos proyectos y mejorar su
comunicación con los Ingenieros de Big Data o Especialistas
en Machine Learning.

Profesionales de marketing que quieran incorporar


herramientas de análisis de datos para innovar en sus
estrategias de segmentación, personalización de la oferta y
predicciones de todo tipo sobre los clientes.

Ingenieros informáticos y analistas de sistemas que


quieran especializarse, incorporar el conocimiento en
estadística, machine learning y adquirir habilidades
prácticas con las herramientas específicas de análisis de
datos.

Emprendedores que quieran crear su propio negocio en


base a datos y/o a técnicas de Inteligencia Artificial.

Programadores que necesiten actualizarse y conocer las


técnicas principales de la ciencia de datos.

Científicos de cualquier disciplina que busquen


herramientas más sofisticadas para realizar sus análisis de
datos.

digitalhouse.com
Programa de estudio
Al final del curso, los participantes
serán capaces de:
Extraer, consultar, limpiar y agregar datos para su
análisis.
Realizar análisis visuales y estadísticos de datos,
usando Python y sus bibliotecas asociadas
Construir, implementar y evaluar problemas de
Data Science usando los algoritmos apropiados
de machine learning
Usar las herramientas de visualización adecuadas
para comunicar sus conclusiones.
Crear reportes claros y reproducibles para los
stakeholders.
Investigar, modelar y validar procesos de resolu-
ción de problemas aplicados a datasets prove-
nientes de diversas industrias para proveer expe-
riencias en distintos tipos de problemas y solucio-
nes del mundo real.
Contenidos mínimos

01 Introducción a Data Science


Módulo 1: Módulo 2:
Fundamentos: Numpy, Stats, SQL y Exploratory Data Analysis (EDA), Pandas &
Visualización SciPy

*Python y Numpy: Demostrar conceptos de *Pandas y Tablas Pivot: Introducción a Pandas


programación usando Python y Numpy como (librería para leer, limpiar, parsear y graficar
herramientas para navegar fuentes de datos y datos usando funciones booleanas, indexación,
colecciones. series, joins y otras funcionalidades).

*Estadística Descriptiva: Repasar y aplicar los *Limpieza de datos: Conceptos de “tidy data”,
fundamentos de estadística descriptiva. estructuras de datos adecuadas, introducción
al problema de missing data, nociones de
*SQL y Bases de Datos: Introducirse a Regular Expressions.
diferentes tipos de bases de datos, revisar
expresiones SQL y realizar prácticas obteniendo *Estadística Inferencial: Nociones de
datos de una base remota. probabilidad, distribuciones muestrales,
intervalos de confianza, pruebas de hipótesis.
*Introducción a Gráficos y Visualización: Uso de librería SciPy.
Realizar prácticas usando notebooks iPython y
plot.ly para visualizar datos. -

- Desafío 2 - Usando un dataset crudo de hits de


Billboard, los participantes usarán Pandas para
Desafío 1 - Provistos de un dataset de puntajes limpiar los datos. Luego plantearán
SAT de todo EEUU, los participantes realizarán formalmente un problema y realizarán análisis
un análisis exploratorio utilizando Numpy y exploratorio para un publisher de música.
Matplotlib aplicando técnicas básicas de
estadística descriptiva.

digitalhouse.com
Contenidos mínimos

02 Introducción a Machine Learning, Regresión, Evaluación de Modelos, Web Scraping


Módulo 3: Módulo 4:
Introducción a Machine Learning. Regresión Problemas de Clasificación, Tunning de
Lineal, StatsModels y Scikit-Learn Hiperparámetros y Web Scraping

*Machine Learning: Introducción a conceptos *Introducción a los Problemas de


nodales: sesgo, varianza, overfitting, underfitting. Clasificación: Problema de los K-Nearest
Identificación de diferentes tipos de algoritmos de Neighbours.
Machine Learning (supervisados y no supervisados).
Formas de estimación del error de generalización *Algoritmos usados para problemas de
(train-test split. cross-validation). Presentación clasificación: Regresión Logística. Naïve Bayes,
general de las técnicas más utilizadas. Support Vector Machines. Evaluación de
algoritmos de clasificación: métricas de error,
*Regresión Lineal Simple y Múltiple: Interpretación, Accuracy, limitaciones de accuracy. Precision,
estimación de coeficientes beta, supuestos, medidas recall, F1-Score, Curva ROC, Area Under the
de ajuste. Introducción de no linealidades en el Curve (AUC).
modelo.
*Tunning de hiperparámetros: Definición de
*Statsmodels y Sklearn: Introducción al uso de hiperparámetro. Métodos de búsqueda:
ambas librerías para la estimación de modelos búsqueda exhaustiva (grid search), búsqueda
estadísticos y algoritmos de Machine Learning en aleatorizada (random search), búsqueda por
Python. API, clases y objetos en Scikit-Learn. algoritmos genéticos. Curse of dimensionality.

*Regularización y Optimización: Nociones genera- *Web Scraping: Nociones de HTML (tags,


les de regularización. Regresión LASSO y Ridge. árboles). Uso de librerías urllib2 y BeatifulSoup
Feature scaling. para scrapear sitios web.

- -

Desafío 3 - Dado el acceso a ciertos datos de ventas, Desafío 4 - Actuando como un contratista del
los participantes tendrán la posibilidad de elegir gobierno, los participantes van a hacer scraping
entre realizar una investigación de marketing o de un sitio web y van a utilizar Pandas,
llevar adelante una auditoría impositiva, usando Statsmodels y NLTK para analizar datos, realizar
Pandas, Statsmodels y Sklearn para transformar los regresión logística y evaluar coeficientes de
datos, realizar una regresión lineal y visualizar los correlación.
resultados.

digitalhouse.com
Contenidos mínimos

03 APIs y Machine Learning Avanzado: Análisis de Series de Tiempo, Métodos de Ensamble


Módulo 5: Módulo 6:
Series de tiempo, Clasificación y Pipelines APIS, Árboles y Ensamble Learning

*JSON y APIs: Estructura de Datos JSON.


*Series de Tiempo: Preprocesado de series. Enfoque Paralelismo con dicts en Python. Uso de una
clásico (tendencia, ciclo y residuo). Estacionariedad. API.
Modelos básicos: media constante, tendencia
determinísitica, media móvil, suavizamiento expo- *Árboles de Decisión: Construcción de árboles a
nencial simple. Modelos avanzados: procesos AR, través del algoritmo CART. Evitando el
MA, ARMA, ARIMA y ARIMAX. overfitting y underfitting en Árboles.

*Pipelines y Custom Transformers en Scikit-Learn: *Modelos de Ensamble: Noción de Ensamble


Pipelines: automatización y encapsulado de estapas Learning. Diferencias y ventajas. Presentación
del workflow. Custom Transformers: noción de del meta-algoritmo Bagging y de dos
objeto y clase en Python. aplicaciones para árboles de decisión: Random
Forest y ExtraTrees. Presentación del
*Feature Selection: Motivación de Feature Selection. meta-algoritmo de Boosting y de AdaBoost y
Filter Methods, Wrapper Methods, Embedding Gradient Boosting. Entrando a la caja negra:
Methods. feature importance y partial dependency plots
en modelos de ensamble.
-
-
Trabajo Integrador - Etapa 1: Los asistentes debe-
rán realizar una charla relámpago ante el curso y Trabajo Integrador - Etapa 2: Los asistentes
exponer la definición del problema y la selección de deberán realizar una presentación de un
dataset(s) adecuado(s) para abordarlo. informe de resultados preliminares (de carácter
técnico) y una charla no técnica en la cual
expongan: a) un planteo claro de un problema;
b) un análisis exploratorio del dataset
seleccionado y c) una exploración preliminar de
técnicas de modelado.

digitalhouse.com
Contenidos mínimos

04 Aprendizaje No Supervisado
Módulo 7:
Clustering & Dimensionality Reduction

*Clustering: Algoritmo K-Means, clustering jerárqui-


co, métricas para evaluación de algoritmos de
clustering.

*Dimensionality Reduction: Introducción a PCA.


Presentación de Multiple Corresponance Analysis.
Manifold Learning: Técnicas para la reducción de
dimensionalidad no lineales: Multidimensional
Scaling (MDS), Locally Linear Embeddings e IsoMaps.
Diferencias con PCA. Métricas de distancia utilizadas.

Trabajo Integrador - Etapa 3: Exposición del Trabajo


Integrador. Deberán entregar un notebook iPython
con código, visualizaciones y notas técnicas para los
colegas del curso. A su vez, deberán realizar una
exposición de las conclusiones, con terminología no
técnica, para una audiencia no experta.

digitalhouse.com
Requisitos Mínimos
Para poder ingresar y aprobar el Programa los aspirantes deberán mostrar conocimiento
sólido de estadística descriptiva (nivel de medición de variables, medidas de tendencia
central y dispersión, etc.) y nociones de programación (estructuras de datos y de control,
definición de funciones, etc.). Es recomendable (pero no excluyente) tener nociones de
estadística inferencial (muestreo, intervalos de confianza, pruebas de hipótesis, distribu-
ciones de probabilidad) y haber tenido contacto con la programación en Python.

digitalhouse.com
Nuestro Campus

Contamos con dos campus en lugares estratégicos de la


ciudad de Buenos Aires: Belgrano y Centro.
Nuestro Campus Belgrano es un espacio innovador,
diferente a lo que estás acostumbrado en instituciones
educativas. Enmarcado en una ex-fábrica completa-
mente refaccionada, con espacios amplios y luminosos.
Nuestro Campus Centro está pensado para conectarse
con el mundo digital; en un edificio sustentable ubicado
en una zona clave, que se conecta con distintos accesos
a través de autopistas y transportes públicos.
Todas las aulas están equipadas para aprender hacien-
do y en los espacios de colearning vas a poder trabajar
en proyectos de la cursada, proyectos propios, y hacer
networking con tus pares.

Queremos ser una comunidad que se extienda más allá del


tiempo de clase, desde donde surjan los próximos proyectos
que transformarán las industrias.
Proceso de admisión
La disponibilidad de vacantes para cada programa es limitada y para poder
obtener tu cupo en el curso tendrás que completar el siguiente proceso de
admisión:

01 POSTULACIÓN
✓ Completá la solicitud de inscripción.

02 ENTREVISTA
✓ Agendá una entrevista para que podamos conocer tu perfil, intereses y
expectativas con respecto al programa.

03 DESAFÍO
✓ Resolvé un ejercicio real que te daremos para poder entender tu forma de
pensar y de resolver situaciones.

digitalhouse.com
FAQs
¿PUEDO HACER EL CURSO Si. En Digital House vas a aprender a analizar datos desde
SIN TENER EXPERIENCIA cero. Vamos a enviarte un contenido previo online para que
Y/O CONOCIMIENTOS lo revises antes de que comience el curso y así aproveches al
PREVIOS?
máximo los 5 meses.

¿LAS VACANTES SON Sí, todos los cursos tendrán una capacidad máxima de 30
LIMITADAS? personas.

¿CÓMO ES LA ENTREVISTA La entrevista consiste en conocer tu interés por aprender


DEL PROCESO DE ciencia de datos, cuáles son tus motivos y objetivos. Si
ADMISIÓN? creemos que coincide con lo que estamos buscando y
podemos brindarte, evaluaremos cuál tu capacidad para
resolver problemas y situaciones complejas, dándote a
resolver algunos ejercicios de lógica y haciéndote algunas
preguntas técnicas básicas.

¿NECESITO TENER Aunque en algunos cursos de tecnología no sea


CONOCIMIENTOS estrictamente necesario tener conocimientos de
MATEMÁTICOS? matemática, en el caso de ciencias de datos necesitamos
que tengas incorporados algunos conceptos de cálculo y
álgebra (nivel secundario).

digitalhouse.com
FAQs
SI YA TENGO Si. En nuestro curso vas a integrar metodologías y
CONOCIMIENTOS BÁSICOS herramientas para tus proyectos, guiado por los mejores
DE PROGRAMACIÓN Y especialistas de la industria y la academia. Además,
ESTADÍSTICA
compartirás el aula con personas que vienen de distintas
¿VALE LA PENA TOMAR
disciplinas lo que agrega un valor inmenso y te permite
IGUAL EL CURSO?
crear relaciones laborales a futuro.

¿NECESITO COMPRAR O No es necesario que traigas tu propia computadora todos


LLEVAR UNA NOTEBOOK los días ya que en las aulas vas a tener los equipos
PROPIA PARA REALIZAR necesarios. De todos modos es recomendable que cuentes
EL CURSO?
con una notebook o computadora de escritorio en tu casa
para practicar, y si querés traerla para sentirte más cómodo,
podés hacerlo.

¿QUÉ CLASE DE En Digital House vas a cursar 10 horas y media por semana
COMPROMISO SIGNIFICA durante 5 meses, lo que significa un total de 196 horas. Pero
ESTUDIAR EN DIGITAL no termina ahí. Para aprovechar al máximo el curso, vas a
HOUSE?
tener (y querer) practicar fuera del horario de cursada, hacer
las tareas y trabajar en los proyectos que te vayamos asig-
nando.

¿HAY ALGÚN EXAMEN Hay ciertos conocimientos básicos que podés aprender
PREVIO A ENTRAR? online y por tu cuenta (con nuestra guia) para que nosotros
¿EN QUÉ CONSISTE? a partir de ahí compartamos y sumemos conocimientos. Te
¿ES OBLIGATORIO?
vamos a tomar un examen o asignar un desafío previo al

digitalhouse.com
FAQs
ingreso para evaluar conocimientos y habilidades básicas
como programación en python y conceptos de estadística.

¿QUIÉNES SERÁN MIS Uno de nuestros principales activos son nuestros


INSTRUCTORES? instructores. Se trata de reconocidos profesionales de la
industria, motivados y con ganas de enseñar bajo estos
nuevos modelos de educación. Además, son
constantemente capacitados por nuestro equipo de
pedagogía y directores académicos para que los contenidos
y el abordaje pedagógico estén siempre alineados.
Durante la cursada, también participan de las clases
distintos especialistas profesionales referentes de la

¿PUEDO LLEVAR Podrás traer amigos y compañeros a la sede de Digital


INVITADOS? House, pero sólo van a poder acompañarte en los espacios
comunes y de co-learning, no en las aulas

Ante cualquier duda o inquietud, solo tenés que comunicarte con nosotros.
¡Estamos para ayudarte!

digitalhouse.com
Av. Monroe 860. Belgrano, Capital Federal
Lima 1111, Sede Centro, CABA
Horario administrativo de 09:00 a 18:00 hs

digitalhouse.com
facebook.com/digitalhouse.edu
twitter.com/_digitalhouse

+54 11 5263 7400


contacto@digitalhouse.com

Vous aimerez peut-être aussi