Académique Documents
Professionnel Documents
Culture Documents
(a) Lancez Orange Canvas et cliquez sur New pour créer un nouveau workflow.
(b) Importer le fichier scopus.csv téléchargé précédemment et paramétrer les variables (widget CSV
File Import).
D’après l’image précédente on retrouve dans les données 03 données qualitative et 04 numérique.
(e) Afficher sur une carte de chaleur le nombre d’articles publiés par pays (Document Map) et
interpréter.
On utilise ainsi le document Map pour pouvoir avoir la plus grande fréquence de production de livre
ce qui donne une idée sur les zones géographique qui produisent énormément d’œuvre.
(f) Certains articles peuvent ne pas avoir de lient avec la thématique traitée mais se retrouvent dans
la liste par erreur. Sélectionner et filtrer ces documents (Corpus ; Corpus viewer).
Grace à corpus et a corpus viewer on peut ainsi visualiser tous les éléments les titres d’œuvres les
plus fréquents parmi toutes les productions. Corpus permet d’analyser et de ressortir les éléments les
plus fréquents d’une liste.
2. Text Mining
a. A partir des documents filtrés dans la partie précédente, faire un prétraitement des données
(Preprocess Text ).
b. Affiche le nuage des mots clés (Word cloud) et interpréter.
c. Afficher les 100 mots les plus fréquent (data table, ...).
(a) Authors;
(b) Organizations ;
(c) Countries ;
Entre les pays on remarque beaucoup plus de liaisons qu’entre les auteurs et les organisation ce qui
laisse paraitre que les pays à travers des œuvres son connecté car en effet par exemple un tiers
auteur d’un pays x peut réaliser une œuvre pour un pays y ce qui crée automatiquement un lien entre
le pays d’où les liaisons importante.