Vous êtes sur la page 1sur 2

Gazouilloire est un logiciel serveur pour faire tourner des collectes massives de données Twitter au

long terme.

Collecter en direct et contenu (et jusque 7jours en arrière)

Les Tweets citant des mots clés /hastags

Les Tweets contenant certains morceaux d’URL

Les Tweets de certains utilisateurs ainsi que ceux les mentionnant

Filtrer par langue, par période temporelle ou par la géolocalisation

Remonter le fil des conversations


Collecter les médias embarqués dans les Tweets (image et vidéos)

Résoudre les redirections des URL partagées

Exporter les fichiers tableurs de métadonnées, de textes

Calculer les agrégats (sites ou url partagées, etc.)

Collecter des données sur Twitter en utilisant son API est relativement aisé pour les développeurs en
utilisant les nombreuses librairies prévues à cet effet. En revanche maintenir de telles collectes sur le
long terme en vue de constituer de gros corpus longitudinaux peut s’avérer complexe.

Une API aide les développeurs à connecter plusieurs types d’applications web ou des API services
entre eux. Une API peut également être créée dans plusieurs langages de programmation, cela
permet d’économiser du temps et de l’argent tout en optimisant les processus de développement
d’un projet data. L’API (Application programming interface) qui connecte des logiciels, des services et
des applications aux environnements différents afin qu’ils puissent connecter les données.

Gaezouilloire permet de simplifier la mise en place de telles collectes en assurant le maximum


d’exhaustivité par l’emploi combiné de l’API de recherche ; ceci tout en offrant une variété de
fonctionnalités complémentaires et d’options de configuration de la collecte, notamment

Collecter tous les tweets matchant un ensemble de mots clés, d’utilisateurs ou de morceaux d’url

Limiter la collecte de certains mots clés à des périodes de temps définis

Filtrer sur la langue employée dans les Tweets (telle que détectée par les algorithmes de Twitter)

Filtrer sur une zone géographique d’envoi des Tweets

Résoudre automatiquement les url raccourcies partagées

Remonter intégralement le fil d’une conversation lorsqu’un Tweet collecté répond à un autre

Remonter dans le temps au maximum sur 8 jours comme le permet l’API gratuit de Twitter

Collecter systématiquement les contenus images et vidéos embarqués dans les Tweets collectés
Equipe : Benjamin Ooghe Tabanou (Directeur technique de recherche)

Béatrice Mazoyer (Ingénieure de recherche)

Jules Farjas (Ingénieur de recherche)

Vous aimerez peut-être aussi