Vous êtes sur la page 1sur 34

Table

of Contents
1. Introduction 1.1
1. Objectifs 1.1.1
2. Enseignant 1.1.2
2. Contenu 1.2
1. Semaine 01 - Syllabus 1.2.1
2. Semaine 02 - Histoire 1.2.2
3. Semaine 03 - UNIX 1.2.3
4. Semaine 04 - Python 1 1.2.4
5. Semaine 05 - Python 2 1.2.5
6. Semaine 06 - Python 3 1.2.6
7. Semaine 07 - Python 4 1.2.7
8. Semaine 08 - Relche 1.2.8
9. Semaine 09 - SQL 1 1.2.9
10. Semaine 10 - SQL 2 1.2.10
11. Semaine 11 - Visualisation 1 1.2.11
12. Semaine 12 - Visualisation 2 1.2.12
13. Semaine 13 - Visualisation 3 1.2.13
14. Semaine 14 - Tutorat 1.2.14
15. Semaine 15 - Prsentations 1.2.15
3. Travaux 1.3
4. Annexes 1.4
1. Politique #16 1.4.1
2. Rglement #18 1.4.2
3. Politique #23 1.4.3

2
Introduction

Introduction
EDM5240
Technologies de l'information appliques au journalisme - Session
d'automne 2016
Ce syllabus est accessible en ligne partir de l'URL jhroy.gitbooks.io/edm5240-a2016/
Certains lments de ce document, dans ses versions en ligne ou PDF, sont en anglais. Veuillez
m'en excuser, je n'ai pas trouv la faon de les franciser sur le service dont je me suis servi pour
le diffuser.

L'informatique est partout. Dans le creux de vos mains. Au bout de vos doigts. Du matin jusqu'au
lendemain, vos vies dpendent d'interminables suites de 0 et de 1 enregistres sur des supports
numriques. Vos choix de cours, votre compte de banque, votre dossier mdical, les contrats de votre
municipalit, votre journal, votre Facebook ont tous le mme point commun: ce sont des bases de
donnes.

L'information, aujourd'hui, se trouve dans des bases de donnes et y puiser est de plus en plus
considr comme une comptence fondamentale du mtier. Les news-getters de demain sont ceux
qui seront capables d'aller chercher l'information numrique l o elle se trouve.

Ce cours va vous y aider en vous montrant quelques-unes des technologies de l'information qui
peuvent tre appliques au journalisme.
Il aurait pu s'intituler Journalisme de donnes . Mais nous craignions que cette appellation
vieillisse mal, un peu comme Journalisme assist par ordinateur , qui fait trs 1990.

Le contenu de ce cours, en fait, colle davantage ce qu'on appelle, dans le monde anglo-saxon, du
Computational journalism. C'est l'application de l'informatique au journalisme. Ce syllabus mme est
un exemple de ce qu'on peut faire avec ces technologies. Il repose sur un systme appel git, qui
permet de collaborer plusieurs sur un mme projet. C'est l'une des nombreuses technologies que l'on
verra au cours de la session.

3
Objectifs

Objectifs
Objectifs du cours
L'objectif principal de ce cours est donc de vous initier aux techniques et technologies utiles dans le
journalisme informatique, ou de donnes , tel qu'il est actuellement pratiqu partout dans le
monde, incluant dans un nombre de plus en plus important de mdias au Qubec.

Plus concrtement, vous apprendrez :

Les principes fondamentaux de la programmation avec le langage Python.


Comment analyser d'imposantes bases de donnes en vous servant de MySQL.
faire des visualisations simples, grce diffrents outils en ligne dont se servent plusieurs
mdias.

4
Enseignant

Enseignant
Enseignant
Nom Jean-Hugues Roy
Local J-4185
Courriel roy.jean-hugues@uqam.ca
Tl. 514/987-3000, 6102
Cell 514/778-6102
Twitter @jeanhuguesroy
Local du cours J-4315
Horaire du cours Mercredi, de 14h00 17h00
Du 7 septembre au 14 dcembre 2016

5
Contenu

Contenu
Calendrier
Dans les prochaines pages, on verra comment le cours est structur et comment la matire sera
dispense au fil des semaines. En voici le rsum dans un magnifique tableau :

# Date Contenu Travail faire ou remettre (s'il y a lieu)


01 7 sept. Syllabus
02 14 sept. Histoire du journalisme quantitatif Abonnement Cloud9
03 21 sept. Intro UNIX
04 28 sept. Python 1
05 5 oct. Python 2
06 12 oct. Python 3
07 19 oct. Python 4
Script python,
08 26 oct. Semaine de relche abonnement Github et
installation de SQL
09 2 nov. SQL 1
10 9 nov. SQL 2
11 16 nov. Visualisation 1
12 23 nov. Visualisation 2
13 30 nov. Visualisation 3
14 7 dc. Tutorat
Travail final +
15 14 dc. Prsentations
Making-of

Le graphique ci-dessous montre tous les outils mentionns par des journalistes informatiques
qubcois lors d'entrevues que j'ai ralises en 2015. Il est impossible de les voir tous. On abordera
cependant les plus importants. En passant - histoire de vrifier si vous lisez rellement ce syllabus - si
vous trouvez le clin d'il gnrationnel que j'ai cach dans sa version en ligne, tel un easter egg ,
prvenez-moi par courriel et hop! deux points boni seront ajouts votre total la fin de l'anne. Or,
donc, voici le graphique dont je parlais :

6
Contenu

7
Semaine 01 - Syllabus

Semaine 01 - Syllabus
Cours 01 - Le syllabus
7 septembre 2016

J'y dcrirai le syllabus, mais je compte galement sur vous pour me dire quelles sont vos attentes.

J'ai dj donn des lments de journalisme informatique dans un cours appel Initiation au
technologies numriques (EDM5050), qui ne fait plus partie du programme de journalisme. J'ai
souvenir que certains tudiants avaient beaucoup de difficult suivre...

Reste que les deux tiers du contenu de ce cours sont donns pour la premire fois cette session-ci. Je
vais pousser les apprentissages assez loin. Qui plus est, on va commencer par ce qu'il y a de plus
difficile.

L'avantage, c'est qu'au fur et mesure qu'on va avancer dans le cours, la matire devrait
progressivement devenir moins complique. Vous aurez en quelque sorte t initis dans la
premire moiti de la session.

J'ai confiance que vous pourrez y arriver. Dites-moi si le rythme est trop intense (ou trop lent). Je ne
veux pas vous assomer. Je veux vous accompagner sur la route du journalisme informatique.

Je vais tcher d'adapter mon rythme au vtre. Dites-moi, aussi, ce que vous tes curieux d'apprendre
et je vais tenter de vous aider. Mon objectif, c'est de vous fournir des outils qui, j'ose le croire, vous
serviront durant toute votre vie professionnelle, mme si vous choisissez de faire autre chose que du
journalisme.

Retour au calendrier

8
Semaine 02 - Histoire

Semaine 02 - Histoire
Cours 02 - L'histoire du journalisme quantitatif
14 septembre 2016

Mme si le journalisme informatique est une pratique rcente, il s'inscrit dans une longue histoire de
ce qu'on peut appeler le journalisme quantitatif .

On verra notamment que cette pratique remonte au XIXe sicle, comme le montre ce graphique des
pertes de l'arme de Napolon au cours de la campagne de Russie, ralis en 1869.

Dans ce deuxime cours, je vous montrerai aussi quelques exemples qubcois, nord-amricains et
europens. Je vous demanderai de m'en montrer, galement!

On verra enfin les diffrentes tapes du journalisme informatique, tapes qui structurent le contenu de
ce cours.

Retour au calendrier

9
Semaine 03 - UNIX

Semaine 03 - UNIX
Cours 03 - UNIX
21 septembre 2016

Avec son interface hrite de l'poque de vos grands-parents, j'avoue qu'UNIX est premire vue
compltement rbarbatif.

C'est pourtant un outil puissant qui aide encore de nombreux journalistes dans leurs tches de tous les
jours.

On va y voir les commandes les plus utiles dans le mtier que vous avez choisi, dont, entre autres:

cd
ls
cat
grep
curl
wget

Comme ce n'est pas tout le monde qui a accs un ordinateur MacOSX et son application Terminal
(illustre ci-dessus), nous allons nous servir d'un outil en ligne trs bien fait appel Cloud9. Il nous
permettra d'avoir tous le mme environnement, ce qui sera utile tout au long de la session.

10
Semaine 03 - UNIX

Retour au calendrier

11
Semaine 04 - Python 1

Semaine 04 - Python 1
Cours 04 - Python 1
28 septembre 2016

partir de votre compte sur Cloud9, nous allons nous tremper les orteils dans le langage de
programmation Python). On va commencer par les concepts de base:

variables et types de variables


listes et dictionnaires
boucles et conditions

Retour au calendrier

12
Semaine 05 - Python 2

Semaine 05 - Python 2
Cours 05 - Python 2
5 octobre 2016

On poursuit notre apprentissage de python:

lecture et criture de fichiers


interaction avec des API

Retour au calendrier

13
Semaine 06 - Python 3

Semaine 06 - Python 3
Cours 06 - Python 3
12 octobre 2016

La moisson. Julien Dupr. 1882. Muse Mildred Lane Kemper, Washington University, Saint-Louis (MO).

Ce qu'on appelle en anglais du scraping peut tre traduit en franais par du moissonnage. On va
rapidement voir des outils simples pour moissonner des donnes, comme import.io.

14
Semaine 06 - Python 3

Mais on va s'y mettre surtout l'aide de la bibliothque Python BeautifulSoup.

Retour au calendrier

15
Semaine 07 - Python 4

Semaine 07 - Python 4
Cours 07 - Python 4
19 octobre 2016

On termine par quelques exercices avec Python en vue du travail pratique remettre aprs la
traditionnelle semaine non-officielle de soi-disant relche (description du travail la prochaine page).

On va galement apprendre les bases du systme git. Je vais vous demander de vous abonner Github
et de faire un fork de mon rpertoire EDM5240. Ce fork vaut lui seul 5 autres magnifiques
points!

16
Semaine 07 - Python 4

ATTENTION

Il y a autre chose que j'attends de vous durant cette semaine-l. Voir la page suivante.

Image: Professortocat, par James Kang

Retour au calendrier

17
Semaine 08 - Relche

Semaine 08 - Relche
Semaine de relche
26 octobre 2016

Deux activits durant la relche.

D'abord, rdigez un script python qui fait du moissonnage de donnes directement sur un site web ou
par le biais d'un API. Plus de dtails dans la section Travaux.

Tombe: Avant 23h59, le 31 octobre 2016. Pour me remettre votre script, crez sur votre compte
Github un repo appel EDM5240. Je vais automatiquement forker votre repo 23h59 le
31 octobre. Ce qu'il contiendra sera votre travail.

Pour se faciliter la vie dans les cours suivants, je vais vous demander d'installer MySQL sur votre
ordinateur.

Mais ATTENTION, votre installation dpendra du type d'ordinateur que vous avez.

Sous WINDOWS:

Installez MySQL en suivant les instructions se trouvant ici (en ingls, disclpame...). Assurez-
vous de cocher l'option vous permettant d'installer galement un utilitaire appel MySQL
Workbench, reconnaissable par l'icne ci-dessous (si l'utilitaire ne s'installe pas
automatiquement, vous pouvez aller le chercher partir de sa page de tlchargement):

18
Semaine 08 - Relche

Sous MacOSX:

Installez le Community Server de MySQL partir de sa page de tlchargement. Vous aurez


galement l'option d'utiliser MySQL Workbench. Mais je prfre, de loin, un autre utilitaire
appel Sequel Pro (tlchargement). On le reconnat par son icne ressemblant une pile de
crpes avec du beurre fondu. Miam!

Un courriel avec une ou des capture(s) d'cran me prouvant que vous avez install ces logiciels vaut 5
points si vous me l'envoyez avant le 31 octobre! Re-miam!

Notez qu' ce stade, il n'est pas ncessaire de les faire fonctionner. Rien ne vous interdit d'essayer. Je
vous demande seulement de les installer.

Je vous demande de procder ces installations au pralable, car les activits avec SQL seront un peu
plus longues vu que je devrai constamment faire des aller-retour entre la version Windows et la
version Mac (les options de MySQL Workbench ne sont pas les mmes dans les deux versions; une
option importante est absente de la version MacOSX, par exemple...)

Retour au calendrier

19
Semaine 09 - SQL 1

Semaine 09 - SQL 1
Cours 09 - SQL 1
2 novembre 2016

Aprs avoir vrifi si tout le monde a pu installer MySQL, on va d'abord voir:

Comment une base de donnes SQL fonctionne.


Les interfaces de MySQL Workbench et de Sequel Pro.
Comment on y importe des donnes.

Retour au calendrier

20
Semaine 10 - SQL 2

Semaine 10 - SQL 2
Cours 10 - SQL 2
9 novembre 2016

Les principales commandes du langage SQL:

SELECT
UPDATE
GROUP BY
ORDER BY

Et si on a le temps:

JOIN

Comment exporter, aussi, des donnes et des bases de donnes. Dumper , disent les spcialistes.

Retour au calendrier

21
Semaine 11 - Visualisation 1

Semaine 11 - Visualisation 1
Cours 11 - Visualisation 1
16 novembre 2016

Outils simples de visualisation interactive, dont:

Infogr.am
Datawrapper
Plot.ly

Peut-tre qu'on aura le temps de voir Tableau.

Retour au calendrier

22
Semaine 12 - Visualisation 2

Semaine 12 - Visualisation 2
Cours 12 - Visualisation 2
23 novembre 2016

Cartographie interactive l'aide de Carto (autrefois connu sous le nom de CartoDB).

Mais auparavant, je vous demanderai quelques minutes pour remplir le formulaire en ligne
d'valuation des enseignements.

Retour au calendrier

23
Semaine 13 - Visualisation 3

Semaine 13 - Visualisation 3
Cours 13 - Visualisation 3
30 novembre 2016

Nous aurons l'honneur d'avoir la visite de Nal Shiab, diplm du programme de journalisme
l'UQAM en 2011 et journaliste de donnes L'actualit.

Dans la premire moiti du cours, il viendra vous faire une dmonstration de la bibliothque de
visualisation Data-Driven Documents, ou D3 pour les intimes, crite en JavaScript.

Dans la seconde moiti, j'aborderai ensuite quelques bibliothques Python pour faire de l'analyse de
donnes et de la visualisation :

24
Semaine 13 - Visualisation 3

Matplotlib
Pandas
Seaborn

Voici d'ailleur un exemple de ce que peut faire Seaborn:

Retour au calendrier

25
Semaine 13 - Visualisation 3

26
Semaine 14 - Tutorat

Semaine 14 - Tutorat
Semaine 14 - Tutorat
7 dcembre 2016

Cette semaine-l, je donne une sance dans le cours EDM1400 (Mthodologie de la recherche en
journalisme) avec les tudiants de premire anne. Il y a conflit d'horaire puisque ce cours a lieu les
mercredis aprs-midi...

Je serai cependant disponible durant toute la semaine pour rpondre vos questions sur votre travail
final et/ou pour vous pauler dans sa ralisation.

Retour au calendrier

27
Semaine 15 - Prsentations

Semaine 15 - Prsentations
Semaine 15 - Prsentations
14 dcembre 2016

Vous prsentez, en moins de 10 minutes, votre projet final.

Retour au calendrier

28
Travaux

Travaux
lments d'valuation
Les travaux remettre ont t mentionns brivement dans les pages prcdentes. Je vous donne, ci-
dessous, un peu plus de dtails sur chacun de ces lments d'valuation.

Abonnement Cloud9
Il suffit de me prouver que vous avez votre compte en vous rendant sur la page suivante
(https://ide.c9.io/jeanhuguesroy/edm5240-test) et de me faire signe en cliquant sur les mots Request
Access , en haut, droite de la page. Faites-le avant 23h59, le 18 octobre 2016.

Abonnement Github
Ne tardez pas trop. Forkez mon repo EDM5240 avant 23h59, le 23 octobre 2016.

Installation de MySQL
Envoyez-moi votre capture d'cran avant 23h59, le 30 octobre 2016.

Script python
Vous devrez rdiger un script python qui moissonne des donnes d'un site de votre choix ou qui se
connecte un API de votre choix. Il faut, bien sr, que le site ou l'API soient diffrents de ceux qu'on
a vus en classe. Votre script doit :

Contenir suffisamment de commentaires pour que je comprenne ce qu'il fait

Afficher suffisamment d'information dans le terminal pour qu'on puisse en suivre le


droulement

Produire un fichier CSV

Vous devez dposer votre script (fichier .py) dans votre compte Github. Plus prcisment, placez-le
dans un repo que vous baptiserez EDM5240. Tombe : avant 23h59 le 31 octobre 2016.

Projet final
Pour votre projet final, vous avez deux options. Vous pouvez faire :

un reportage ou
un outil

Si vous choisissez l'option reportage, vous pouvez le faire sur un sujet de votre choix (conditonnel
mon approbation). Vous avez aussi le choix de la forme de ce reportage: il peut s'agir d'un article,
d'un reportage radio, d'un reportage tl ou d'un reportage web.

29
Travaux

Dans la production de ce reportage, vous devrez utiliser au moins deux des trois grandes comptences
qu'on a apprises au cours de la session :

Programmation
Gestion et/ou traitement d'une base de donnes avec SQL
Visualisation

Si vous choisissez l'option outil, vous avez aussi une grande latitude. Un outil est quelque chose que
vous avez programm vous-mme et qui peut avoir une utilit dans un contexte journalistique. Il peut
s'agir d'un robot sur Twitter, d'un processus qui permet faciliter le travail de vos collgues, d'une
bibliothque python originale; vous n'tes limits que par votre imagination. Parlez-m'en auparavant
et si c'est l'option qui vous tente, je pourrai vous offrir un coup de main dans la mesure de mes
capacits. Ici, il est impratif qu'il y ait de la programmation, mais il n'est pas ncessaire que vous
vous serviez de SQL ou que vous fassiez de la visualisation.

Making-of
Votre travail final doit tre accompagn d'un texte (en format PDF) comptant entre 3 000 et 6 000
caractres et dcrivant votre dmarche :

Pourquoi ce sujet?
Quelles technologies avez-vous utilises?
Pourquoi les avoir choisies?
Comment vous ont-elles servi?
Quels problmes avez-vous prouvs (s'il y a lieu).

Ce texte devra tre accompagn de :

Tous les scripts (fichiers .py ou .rb ou .js) que vous avez crits et/ou
Un fichier dump (format .sql) de toutes les bases de donnes que vous avez utilises.

Vous m'envoyez tout cela par courriel avant le dbut du dernier cours (14h00, le 14 dcembre 2016).

Ventilation des lments d'valuation


lment Points
Abonnement Cloud9 5
Abonnement Github 5
Installation de MySQL 5
Script python 25
Projet final 40
Making-of 20

30
Annexes

Annexes
Annexes
Diffrents services et units de l'UQAM nous demandent d'ajouter les informations qui suivent dans
nos plans de cours afin de vous rappeler certains rglements et politiques de l'Universit.

31
Politique #16

Politique #16
Politique #16
Harclement sexuel

Les comportements suivants sont considrs par la Politique #16 de l'UQAM comme du harclement
sexuel :

Manifestations persistantes ou abusives dun intrt sexuel non dsires


Remarques, commentaires, allusions, plaisanteries ou insultes persistants caractre sexuel
portant atteinte un environnement propice au travail ou ltude
Avances verbales ou propositions insistantes caractere sexuel non dsires
Avances physiques, attouchements, frlements, pincements, baisers non dsirs
Promesses de rcompense ou menaces de reprsailles, implicites ou explicites, reprsailles lies
lacceptation ou au refus dune demande dordre sexuel
Actes de voyeurisme ou dexhibitionnisme
Manifestations de violence physique caractre sexuel ou imposition dune intimit sexuelle
non voulue
Toute autre manifestation caractre sexuel offensante ou non dsire.

Pour plus dinformation :

http://www.harcelement.uqam.ca/

Pour rencontrer quelqu'un ou effectuer un signalement :

514-987-3000, poste 0886.

32
Rglement #18

Rglement #18
Rglement #18
Infractions de nature acadmique

Tout acte de plagiat, fraude, copiage, tricherie ou falsification de document commis par une tudiante,
un tudiant, de mme que toute participation ces actes ou tentative de les commettre, loccasion
dun examen ou dun travail faisant lobjet dune valuation ou dans toute autre circonstance,
constituent une infraction au sens de ce rglement.

La liste non limitative des infractions est dfinie comme suit :

la substitution de personnes;
lutilisation totale ou partielle du travail dautrui en le faisant passer pour sien ou sans
indication de rfrence;
la transmission dun travail pour fins dvaluation alors quil constitue essentiellement un
travail qui a dj t transmis pour fins dvaluation acadmique lUniversit ou dans une
autre institution denseignement, sauf avec laccord pralable de lenseignante, lenseignant;
lobtention par vol, manuvre ou corruption de questions ou de rponses dexamen ou de tout
autre document ou matriel non autoriss, ou encore dune valuation non mrite;
la possession ou lutilisation, avant ou pendant un examen, de tout document non autoris;
lutilisation pendant un examen de la copie dexamen dune autre personne;
lobtention de toute aide non autorise, quelle soit collective ou individuelle;
la falsification dun document, notamment dun document transmis par lUniversit ou dun
document de lUniversit transmis ou non une tierce personne, quelles que soient les
circonstances;
la falsification de donnes de recherche dans un travail, notamment une thse, un mmoire, un
mmoire-cration, un rapport de stage ou un rapport de recherche.

Les sanctions relies ces infractions sont prcises larticle 3 du Rglement no 18. Elles peuvent
aller jusqu' l'expulsion de l'UQAM.

33
Politique #23

Politique #23
Politique #23
valuation des enseignements

Une priode d'une quinzaine de minutes devra tre consacre en classe l'valuation du cours durant
la prochaine session. Cette priode devra avoir lieu la douzime ou la treizime semaine. Comme
pour l'valuation papier qui tait faite auparavant, l'valuation en ligne sera faite en classe par les
tudiants prsents, mais l'aide d'un ordinateur, d'une tablette ou d'un tlphone intelligent. Les
tudiants absents au cours pourront cependant faire cette valuation durant le reste de la priode
prvue cette fin. Il sera important de prvoir et d'inscrire cette sance d'valuation des
enseignements lors de la ratifcation de l'entente d'valuation conclue avec les tudiants en dbut de
session.

Pour remplir le formulaire d'valuation et dire votre faon de penser l'enseignant, c'est par ici.

34

Vous aimerez peut-être aussi