Académique Documents
Professionnel Documents
Culture Documents
Ressources Pour L'analyse de Données Textuelles - Frédéric Pierron
Ressources Pour L'analyse de Données Textuelles - Frédéric Pierron
Frédéric Pierron
(https://www.fredericpierron.com/)
Innovations & créations digitales
Ressources ▾
Podcast Chatbot-Stratégie (https://www.diolag.ai/podcast-chabot-
strategie/)
Blog ▾
Contact (https://www.fredericpierron.com/pour-me-contacter/)
Outils logiciels
R.TeMiS [R Text Mining Solution] est un environnement graphique de
travail sous R permettant de créer, manipuler et analyser des corpus
de textes. Il a été conçu pour limiter les effets de « boîte noire »,
souvent inhérents aux logiciels de statistique lexicale, et favoriser la
réflexivité dans l’usage sociologique des données
textuelles. http://rtemis.hypotheses.org (http://rtemis.hypotheses.org)
Hyperbase [10.0-2015]
Hyperbase permet de réaliser des bases hypertextuelles et des
traitements statistiques à partir des textes qui lui sont fournis – bruts,
lemmatisés ou étiquetés : navigation plein texte, index sélectifs ou
systématiques, dictionnaires fréquentiels, concordances, sélection de
contextes élargis, calcul de spécificités, richesse lexicale,
cooccurrences, distances intertextuelles, … http://logometrie.unice.fr
/pages/logiciels/ (http://logometrie.unice.fr/pages/logiciels/)
Adaptation R (https://cran.r-project.org/web/packages/tidytext
/vignettes/tidytext.html) de Tidy Text (nettoyage des textes).
Library python
Python est un excellent langage de programmation pour traiter les
textes en langage naturel.
Articles, documents
Les Journées internationales d’Analyse statistique des Données
Textuelles (JADT) réunissent tous les deux ans, depuis 1990, des
chercheurs travaillant dans les différents domaines concernés par les
traitements automatiques et statistiques de données textuelles. Elles
permettent aux participants de présenter leurs résultats, de confronter
leurs outils et leurs expériences. http://www.aftal.fr/jadt2014
/?page_id=140 (http://www.aftal.fr/jadt2014/?page_id=140)
Revue Texto! est une revue de sémantique des textes tissant son
contenu sur la toile depuis 1996. On y trouve plus de 500 articles
scientifiques et plusieurs archives de revues de linguistiques
éteintes. http://www.revue-texto.net (http://www.revue-texto.net)
Analyses textuelles
Analyse des tweets de campagne de Donald Trump
(http://varianceexplained.org/r/trump-tweets
/?utm_campaign=Data%2BElixir&utm_medium=email&
utm_source=Data_Elixir_92) via les outils proposés par R. Où il est
démontré que Trump tweete sur son Samsung Android des messages
emotionnels et négatifs et son staff tweete sur iPhone les messages
conventionnels.
Newsletters
• Vidhya Analytics http://feedburner.google.com
/fb/a/mailverify?uri=analyticsvidhya
(http://feedburner.google.com
/fb/a/mailverify?uri=analyticsvidhya)
• Data Science Weekly http://www.datascienceweekly.org
/newsletters (http://www.datascienceweekly.org/newsletters)
• O’Reilly Data Newsletter http://www.oreilly.com
/data/newsletter.html (http://www.oreilly.com
/data/newsletter.html)