Vous êtes sur la page 1sur 11

Build the Skills You Need to be a

MODERN DATA SCIENTIST


For IT & Business Users
www.dqlab.id

About DQLab Program

Sebagai seorang Data Scientist, Anda dituntut bisa bekerja dengan berbagai
format data, memiliki pengetahuan tentang algoritma, memahami teknik
pengolahan, dan manajemen data yang disesuaikan dengan kasus bisnis.

Program DQLab memberikan learning journey practical menjawab


kebutuhan Industri dengan memanfaatkan rangkaian ilmu statistik,
pemrograman, dan bisnis yang dapat secara langsung diterapkan secara
aplikatif berbasis project.

Cocok bagi pemula (programmer & non-programmer) yang ingin


menerapkan teknik Data Science untuk menghasilkan insight bisnis atau
sedang mengejar karir dibidang ini.

www.dqlab.id

DQLab Data Science Program trains you


along an industry recommended learning
path to succeed in the field of applied Data Science

Key Features

Industry recommended learning path Hands on project execution in DQLab Platform


(Say goodbye to complicated installations)

Certified upon modules & project completion Work on real case scenario projects in various
retail, distribution, finance, and media Industries

Technical, project, programming support by data & industry experts


www.dqlab.id www.dqlab.id

Learning Roadmap

Applied Applied Data Applied Python 3


TRACK Data Science Science for Finance/ Media Analytics R Programming Programming
Introduction
COURSE Banking with R Track to SQL Track
for Retail with R Track with R Track

Fudamental
Introduction to R

Basic Database and SQL

Introduction to Python

Core

Introduction to Statistics with R

Data Wrangling with R

Data Visualization with ggplot2 in R

Advanced Visualization

Advanced SQL

Basic Programming with R

Basic Programming with Python

Data Wrangling with Python

Applied/Speciallist
Machine Learning for Retail with R: Market Basket Analysis

Machine Learning for Marketing with R: Customer Segmentation

Machine Learning for Finance with R: Decision Tree for Credit Scoring

Machine Learning for Finance with R:


Principal Component Analysis for Credit Scoring

Machine Learning for Finance with R: Fraud Detection

Advanced Data Visualizations for Media with ggplot2 in R

Machine Learning with R: Market Forecasting

Stored Procedure Programming with MySQL

Developing Packages in R
www.dqlab.id

Introduction to SQL Track


Available: August 2018

Seluruh sistem IT di dunia saat ini dipastikan menggunakan sistem database seperti MS SQL Server,
Oracle, MySQL, dan lain-lain - untuk melakukan penyimpanan datanya, mulai dari data profil customer
sampai seluruh transaksi yang dilakukan.
Untuk mengolah seluruh data ini, terdapat satu konstruksi bahasa standar yang disebut dengan SQL
(Structured Query Language).
Dengan standar ini, SQL telah terbukti mampu meningkatkan produktivitas dan memungkinkan
berbagai aplikasi yang dibangun dapat “berbicara” dengan baik ke database dan SQL bahkan
diterapkan di dunia Big Data, sehingga adopsi terhadap bahasa ini semakin tinggi.

Ini artinya jika Anda ingin berkarir di area data - SQL adalah syarat mutlak yang harus dikuasai.
Track ini disusun untuk Anda yang ingin mengerti SQL secara fundamental dengan menggunakan
MySQL / MariaDB sebagai database untuk praktek, dengan dataset ritel yang mudah dimengerti
seperti pelanggan dan transaksi penjualan.

Learning Outcome
Setelah menyelesaikan track ini, setiap peserta akan mampu:
- Mengerti konsep database, table, kolom dan tipe data
- Mengambil dan filter data dengan perintah SELECT …. WHERE ….
- Menggabungkan data dengan perintah JOIN dan UNION
- Memasukkan data baru dengan perintah INSERT
- Merubah data dengan perintah UPDATE
- Membuat query untuk menghasilkan beberapa laporan penting seperti laporan penjualan dan
laporan pengeluaran
www.dqlab.id

R Programming Track
Available: August 2018

R adalah tool dan language yang sangat powerful untuk bidang data science. R adalah requirement
skillset utama untuk lowongan data engineer dan data scientist dari perusahaan-perusahaan besar di
Indonesia maupun dunia.
Jika kita bicara mengenai R, maka ada dua definisi yaitu:
1. R adalah suatu software yang kaya fitur pengolahan data seperti proses membaca,
melakukan perhitungan atau kalkulasi matematis, melakukan analisa dan visualisasi data.
Sebagai contoh: R bisa digunakan untuk membaca file Excel, mencari korelasi antara inflasi
dengan munculnya produk baru, dan menghasilkan visualisasi menarik dan kompleks.
2. R adalah bahasa pemograman yang lengkap, sehingga kita bisa membuat proses otomatisasi
di dalamnya. Sebagai contoh: kita bisa membuat script untuk membuat crawling website
media otomatis per menit.
R sangat mudah digunakan, cepat dan sangat kaya modulnya - karena sifatnya yang open source saat
ini terdapat ribuan package yang dibuat oleh para ahli di dunia.

Track ini akan mempersiapkan Anda menjadi developer R dengan pendekatan praktis dan
step-by-step - mulai dari tipe data dasar, konstruksi program, sampai dengan object oriented
programming (OOP) di R.

Learning Outcome
Setelah menyelesaikan track ini, setiap peserta akan mampu:
- Mengerti dan menggunakan tipe dasar
- Mengerti dan menggunakan konstruksi programming seperti flowpercabangan IF dan
perulangan / loop
- Mengerti function dan cara pembuatannya
- Mengerti object oriented programming (OOP)
- Mengerti fungsi dan pembuatan package
www.dqlab.id

Python 3 Programming Track


Available: September 2018

Python adalah general purpose programming language yang saat ini sangat populer di dunia data
science.
Dengan penggunaan konstruksi yang singkat, rapi, jelas dan dengan dukungan library yang
dikhususkan untuk membantu para data engineer dan data scientist seperti pandas, NumPy,
Scikit-learn, dan lain-lain yang menjadi alasan kenapa python banyak digunakan.
Selain itu, dari awal python juga bersifat open source sehingga adopsinya lebih cepat dan telah
banyak dimasukkan sebagai bahasa yang didukung oleh platform data science on the cloud oleh
Microsoft, Amazon, Google dan berbagai perusahaan teknologi besar lainnya.

Track ini akan mempersiapkan Anda menjadi developer Python dengan pendekatan praktis dan
step-by-step - mulai dari tipe data dasar, konstruksi program, sampai dengan object oriented
programming (OOP) di Python 3.

Learning Outcome
Setelah menyelesaikan track ini, setiap peserta akan mampu:
- Mengerti dan menggunakan tipe dasar dan variable di Python
- Mengerti dan menggunakan konstruksi programming seperti flow percabangan IF dan
perulangan/loop
- Mengerti function dan cara pembuatannya
- Mengerti object oriented programming (OOP)
www.dqlab.id

Applied Data Science for Retail with R


Available: May 2018

Pahami penerapan Data Science di Industri Retail menggunakan studi kasus dan dataset yang dibuat
mencerminkan kondisi retail Indonesia untuk memecahkan masalah inventory, meningkatkan
efektifitas promosi, dan mendorong omzet bisnis!
Manfaatnya?
Sebagai seorang data scientist, Anda akan dituntut untuk membantu top management dalam
menyusun strategi peningkatan revenue untuk dipresentasikan ke CEO perusahaan. Dengan
pemahaman teknik pengolahan data yang tepat, Anda dapat menggunakan Market Basket Analysis
(MBA) untuk membuat paket produk, melakukan segmentasi konsumen guna meningkatkan
efektifitas kegiatan marketing/promosi, serta melakukan product positioning yang tajam dan tepat
bagi perusahaan.

Learning Outcome
Setelah menyelesaikan track ini, setiap peserta akan mampu:
- Memahami tahapan ‘Data Preparation’, permasalahan yang penting untuk dihadapi dan
bagaimana menghindari kesalahan yang tidak perlu, sehingga data digunakan dengan baik
pada tahap penerapan solusi ‘Data Analytics’
- Menghasilkan visualisasi yang impactful pada bisnis dan menghindari jebakan statistik data
yang sering terjadi
- Melakukan identifikasi paket produk yang efektif berdampak langsung pada peningkatan
revenue
- Melakukan customer segmentation yang tepat dan bisa digunakan untuk mempromosikan
suatu produk (e.g. produk yang akan dipromosikan untuk millenials pasti akan berbeda
dengan Gen-X)
www.dqlab.id

Applied Data Science for Finance/Banking with R


Available: August 2018

Industri perbankan adalah industri yang highly regulated - dalam arti diatur dan diawasi dengan
sangat ketat oleh Otoritas Jasa Keuangan (OJK).
Dengan bisnis penuh resiko dalam menerima dan menyalurkan kredit ke masyarakat, industri
perbankan sangat bergantung kepada analisa data terutama data nasabah untuk manajemen resiko
pada saat mengambil berbagai keputusan. OJK sebagai otoritas yang mengatur perbankan juga
selalu meminta laporan berkala dari perbankan - tanpa otomasisasi manajemen dan analisa data
yang baik - hal ini tentunya akan memakan biaya besar di perbankan. Data scientist dapat
memainkan peran dengan baik dalam membantu perbankan.

Track DQLab ini disusun membangun kemampuan mengolah data di perbankan dengan kasus credit
scoring, customer data cleansing dan enrichment untuk keperluan KYC (Know Your Customer), fraud
detection dengan menggunakan R - tool yang sangat powerful di area data science.

Learning Outcome
Setelah menyelesaikan track ini, setiap peserta akan mampu:
- Membaca database relasional dengan menggunakan SQL
- Melakukan data cleansing (standarisasi data), data enrichment (pengkayaan data) dan
deduplication (menghilangkan duplikat data)
- Mempersiapkan data untuk machine learning
- Memodelkan machine learning untuk credit scoring dan fraud detection
- Mengoperasionalkan model machine learning
www.dqlab.id

Applied Media Analytics Track with R


Available: August 2018

Media adalah sumber informasi di luar perusahaan atau organisasi yang sangat penting. Trend
peluang maupun ancaman bagi bisnis bisa didapatkan dari informasi media.
Sebagai contoh, berita mengenai kebijakan pemerintah daerah yang mengeluarkan peraturan upah
minimum regional dengan kenaikan signifikan. Ini bisa jadi ancaman untuk bisnis yang tidak siap.
Atau munculnya berita mengenai banyaknya lowongan di daerah tertentu, ini bisa menjadi indikator
bahwa pertumbuhan ekosistem bisnis disana berjalan dan menjadi peluang baru bisnis.
Saat ini media cetak sudah banyak bertransformasi menjadi online. Dan banyak sekali media yang
dari awal muncul secara online dengan kredibilitas yang baik, sehingga dapat menjadi informasi
terpercaya. Belum lagi ini ditambah dengan perkembangan sosial media seperti Facebook, LinkedIn,
Twitter dan Instagram yang juga berpotensi memberikan informasi berharga. Ini menjadi sumber data
yang baik untuk dapat diolah lebih lanjut oleh berbagai organisasi dan bisnis.
Walaupun seluruh informasi ini bersifat publik namun datang dalam bentuk teks, gambar, suara dan
video - menjadi tantangan sendiri untuk mengolahnya.

Track DQLab ini mencoba menjawab tantangan tersebut dengan materi online praktis secara step by
step - mulai dari mengambil teks dengan crawling, memisahkan menjadi data dengan entitas yang
jelas, dan kemudian menganalisanya dengan pendekatan text mining menggunakan R.

Learning Outcome
Setelah menyelesaikan track ini, setiap peserta akan mampu:
- Mengambil (crawling) dan mengenali teks (entity extraction) dari artikel media online
- Menyimpan hasil identifikasi pada database
- Menyusun grafik dengan menggunakan ggplot2 untuk menunjang cerita berdasarkan data
(data storytelling)
- Mengidentifikasi sentimen positif dan negatif dengan machine learning
Let us guide you to be a
MODERN DATA SCIENTIST
Register at: dqlab.id

Contact Us:
Yovita - 0817 018 2889