Vous êtes sur la page 1sur 12

Le google hacking

Loic FONTAINE 8 juin 2011

/!\ ATTENTION : Cet article est purement théorique, je ne suis pas responsable de ce que vous

faites en lisant celui-ci /!\

Le Google Hacking est l’art de créer des requêtes complexes sur le moteur de recherche Google afin

de pouvoir filtrer à travers plusieurs résultats publiques des informations relatives à la sécurité. Il peut

être utilisé pour détecter des sites internet sensibles à certaines vulnérabilités, pour trouver des

informations sensibles (par exemple : un dump de base de données, une interface d’admin, un

numéro de sécurité social…).


Les bases du Google Hacking
L’anonymat

Les caches de Google sont des pages web qui ont été gardées en mémoire par les serveurs de

Google. Si vous souhaitez accéder au cache, vous pouvez garder l’anonymat car vous pourrez

récupérer la totalité du site internet sans envoyer aucun packet au serveur.

Cliquez sur "Cached" (en français "En cache")

pour accéder au cache de google

De même, vous pouvez utiliser Google en tant que « serveur proxy », en effet, lorsque vous faites

traduire une page web par google, c’est Google qui solicite le serveur à votre place afin de pouvoir

récupérer les pages web. Pour faire traduire votre page web : http://translate.google.com
Lister les dossiers avec Google
Les listings de dossiers sont des types de pages web qui listent les fichiers et les dossiers qui existent

sur un serveur Web (souvent cela est le cas pour les serveurs web qui n’ont pas de pages d’index).

Cela permet de fournir des accès faciles aux fichiers qui sont stockés sur le serveur. De cette façon le

hacker peut récupérer des fichiers sensibles et parcourir les dossiers pour récupérer des informations.

Afin de pouvoir faire une recherche des Directory listings sur Google, tapez :

intitle:index.of

intitle:index.of « parent directory »

Ou pour trouver un fichier spécifique (ici le fichier sauvegarde.backup) :

intitle:index.of sauvegarde.backup
Traquer les serveurs web
Pour pouvoir déterminer la meilleure méthode pour attaquer un serveur Web il faut trouver la version

exacte de celui-ci.
Un attaquant peut retrouver ces informations en se connectant au port Web de ce serveur et trouver

une requête pour les http headers.

Sur Google pour récupérer les versions des serveurs nous allons utiliser la commande suivante :

Intitle: »index of » intext: »server at »

Si vous utilisez un serveur Apache, pour éviter ce type de « Server Versionning » et de « Directory

Listing », vous devez rajouter un fichier .htaccess à la racine de votre site internet, celui-ci doit

contenir :

Options -Indexes

Ce qui permet d’empêcher à vos pages de type « Index of » d’exister.


Les opérateurs de recherche
Les sites

Pour faire une recherche sur un site internet :

site:www.lolokai.com

Une recherche sur un domaine :

site:*.lolokai.com

Les titres

Pour faire une recherche dans un titre :

intitle: »Recherche dans mon titre »

Le texte

Pour faire une recherche dans du texte (par défaut) :

intext: »Recherche dans le texte »

L’URL

Pour faire une recherche dans l’URL (par exemple vous recherchez toutes les pages index.php) :

inurl: »index.php »

L’extension

Pour faire une recherche sur un fichier spécifique (par exemple vous recherchez des fichiers .docx) :

ext:docx

Il est bien entendu possible de « coupler » les opérateurs entres eux pour faire des recherches plus

complexes.
Trouver des cibles vulnérables
Trouver par exemple les CMS et ainsi pouvoir trouver les exploits qui permettent de casser des failles,

en l’occurrence en cherchant le mot : Powered By. Par exemple je recherche un blog WordPress :

intext: »Powered By WordPress » inurl: »index.php?p= »

Pour rechercher un site Joomla! :


inurl: »option com_ » intext: »Powered by Joomla! »
Traquer les portails de login
Pour trouver les portails par défaut comme Outlook Web Access Default Portal :

inurl: »exchange/logon.asp »

Pour continuer avec les CMS, trouvez une page de login WordPress :

inurl: »wp-login.php » intext: »Mot de passe » ext:php

ou en anglais :

inurl: »wp-login.php » intext: »Password » ext:php

Trouvez une page de login Joomla! :

intitle: »Joomla! Administration » inurl: »administrator » intext: »username »


Conclusion
Pour conclure, nous avons vu que des opérateurs dans google permettent de créer des recherches

complexes pour la recherche d’informations sensibles à travers internet (la liste de tous les opérateurs

est ici). Ces opérateurs bien utilisées permettent de récupérer pas mal d’informations sur beaucoup de

serveurs, c’est pourquoi il est nécessaire de s’en protéger. Nous avons vu une des façons de se

protéger du server versionning et du directory listing. Il est aussi possible de se protéger via ce fichier :

robots.txt. Un article y est consacré sur commentçamarche, je vous invite à le lire : ici.

/!\ ATTENTION : Cet article est purement théorique, je ne suis pas responsable de ce que vous

faites en lisant celui-ci

12 ASTUCES DE GOOGLE HACKING


 Eric DELORD  23 novembre 2016  Trucs & Astuces  Pas de commentaire

Share

A LA PÊCHE AUX INFORMATIONS CACHÉES


Depuis le début des moteurs de recherche un problème s’est posé : celui du référencement d’informations
confidentielles. C’est le principe de la technique du “Google Hacking” qui utilise certaines expressions de
recherche pour retrouver des fichiers et détails qui n’auraient pas dus être indexés. Certaines recherches ont
été plus ou moins filtrées par Google au fil des années, mais d’autres restent activent et permettent de
retrouver des contenus intéressants ! Quelques exemples….

ACCÉDER À DES CAMÉRAS IP


Avec le développement des caméras “IP” et leur connexion au réseau Internet, il est désormais possible de
tomber sur certains flux vidéos plus ou moins privés. Voici les expressions à utiliser pour différents types
de caméras :

Axis :  inurl:/view.shtml or inurl:view/index.shtml
Canon : sample/LvAppl/
MOBOTIX : control/userimage.html
FlexWatch : /app/idxas.html
JVC : intitle:”V.Networks [Motion Picture(Java)]”
RÉCUPÉRER DES LISTES D’ADRESSES E-MAILS
Si vous vous êtes déjà demandé comment certaines sociétés récupères des millions d’adresses e-mails
qu’elles revendent au plus offrant à des spammeurs, voici une des techniques qu’elles utilisent. Grâce à
cette recherche n’importe qui peut accéder à une liste de fichiers Excel qui contiennent au total les
coordonnées de milliers, voire millions d’individus.

filetype:xls inurl:”email.xls”
ENVIE D’UN FILM OU D’UNE MUSIQUE ?
GeekOrama vous recommande de ne pas télécharger illégalement, mais il est bon de savoir que si vous
stockez des films ou fichiers sur Internet, même si personne n’est censé avoir l’adresse, vous devenez
coupable de piratage et diffusion de contenus protégés. Pour exemple, voici comment trouver des morceaux
de Green Day par exemple

-inurl:(htm|html|php) intitle:”index of” +”last modified” +”parent


directory” +description +(wma|mp3) “green day”
Pour les films, utilisez quelque chose de ce genre :

-inurl:(htm|html|php) intitle:”index of” +”last modified” +”parent


directory” +description +(avi|mkv) “dvdrip fr”
MÊME DES MOTS DE PASSE !
Qui vous a raconté que vos mots de passe sont gardés précieusement ? On lit quasiment toutes les semaines
dans la presse que telle ou telle compagnie s’est fait pirater des milliers de comptes. Les techniques des
pirates sont souvent plus sophistiquées, mais pas toujours. Une simple recherche Google peut ouvrir la
porte à beaucoup de chose :

“Login: *” “password =*” filetype: xl


filetype:dat “password.dat”
filetype:sql (“values * MD5″ | “values * password” | “values * encrypt”)
date:12
Le terme “date:12″ utilisé dans la dernière expression indique au moteur de recherche que vous ne
souhaitez que les résultat de moins de 12 mois.
Une liste plus exhaustive de Google Hacks pour retrouver des mots de passe est diponible ici, mais les
possibilités sont infinies.
MAIS QUE FAIT GOOGLE ?
Ces types de requêtes sont bien connus et existent
depuis le début des moteurs de recherche et des critères de recherche avancée. Lors de la rédaction de cet
article nous sommes tombés sur une page d’avertissement qui nous suspectait d’être un robot et nous
demandait d’entrer un code captcha ?!
Voilà les protections que vous avez, en temps que webmasters, contre les petites oreilles indésirables des
moteurs de recherche. En espérant que cet article vous sera utile pour mieux protéger vos informations sur
le web.

Google hacking
Sauter à la navigationSauter à la recherche

Le Google hacking est une technique consistant à utiliser un moteur de recherche,


généralement Google, en vue de chercher des vulnérabilités ou de récupérer des données
sensibles. Cette technique s'appuie sur les résultats de l'exploration et de l'indexation des sites
internet par le robot Googlebot.
Dans la pratique, le Google hacking se fait en entrant des requêtes spéciales dans le moteur de
recherche, qui possède de nombreuses fonctionnalités souvent méconnues, parmi lesquelles :

 site:abc permet de chercher un site internet contenant le mot abc


 cache:abc.com ira chercher le site abc.com dans le cache de Google
 intitle:abc permet de chercher un site internet dont le titre contient le mot abc
 inurl:abc permet de chercher un site internet dont l'url contient le mot abc

Exemples[modifier | modifier le code]
 Rechercher des fichiers sur le thème de la Sécurité au format PDF : filetype:pdf sécurité
 Rechercher des pages pointant le site internet de Wikipedia : link:fr.wikipedia.org
 Rechercher des serveurs web autorisant le directory listing : intitle:"index of /"

Qu’est-ce que sont les Google Dorks ?


Une requête Google Dork est l’utilisation de terme de recherche qui
intègre des opérateurs de recherche avancés pour trouver des
informations sur un site internet qui ne sont pas disponibles à l’aide
d’une recherche classique.
Le Google dorking, aussi appelé Google hacking, peut retourner des
informations qu’il est difficile de localiser grâce à des recherches dîtes
simples. Bien souvent, les résultats de recherche renvoyés par Google
sont des informations que le propriétaire du site internet n’avait pas
l’intention de dévoiler au public.
Mais ces informations n’ont pas été protégées de manière adéquates
pour prévenir ces risques.

En pratiquant ce type d’attaque passive, les Googles dorks peuvent


fournir les informations suivantes :

 Des noms d’utilisateurs et les mots de passe


 Des listes d’email
 Des documents sensibles
 Des renseignements personnels, transactionnels ou financiers
(PIFI)
 Les vulnérabilités des sites internet, des serveurs ou des plugins
Ces informations obtenues peuvent être utilisées à de nombreuses
fins illégales incluant le cyber-terrorisme, l’espionnage industriel, le vol
d’identité, piratage du compte Facebook et le cyber-harcèlement.
Afin de réaliser ces attaques passives, les pirates informatiques
utilisent des opérateurs de recherches spécifiques, mais comme vous
allez le voir, cela ne nécessite pas de connaissance en programmation
spécifique et ils sont à la portée de n’importe quel utilisateur de
Google.

Les principaux opérateurs de recherche


Opérateur Description Exemple d’utilisation

site retourne site:funinformatique.com VPN trouvera toutes les pages


les contenant
fichiers le mot VPN dans leur texte et se trouvant dans le
localisés domaine funinformatique.com
sur un
domaine
particulier

suivi sans
espace
par
l’extensio
n du
fichier
souhaité
comme
DOC, PDF,
XLS ou
autre.
Limite les
résultats
à un type
de
Filetype document filetype:pdf anonymat retournera les documents PDF
ext donnée contenant le mot anonymat

Inurl suivi par inurl:VPN trouvera les pages contenant le mot VPN dans
une l’adresse URL
phrase
donnée
retourne
tous les
résultats
avec
cette
même
phrase
placée
dans
l’URL.

suivi du
mot ou de
la phrase
que vous
recherche
z renvoie
tous les
résultats
ou la
phrase ou
le texte
sont
présents
dans le
texte
d’une
page intitle:VPN trouvera les pages contenant le mot VPN
Intext web. seulement dans le texte

Vous pouvez effectuer des recherches en combinant tous ces


opérateurs afin de pouvoir fait des recherches extrêmement précises
et ciblées.

Par exemple si vous voulez rechercher des documents PDF ou le mot


« top secret » est inclus sur le site funinformatique, vous aurez
certainement à effectuer une recherche de ce type: « top secret »
filetype:pdf site:funinformatique.com
Liste non exhaustive de Google Dorks
 Recherche des mots de passe

Question Résultat
les mots de passe pour la page
« site » enregistrés comme
«
http://username:password@ww
« http://*:*@www » site w… »

les copies de sauvegarde de


fichiers pouvant contenir des
filetype:bak inurl: »htaccess|passwd| informations
shadow| sur des noms d’utilisateurs et
htusers » des mots de passe

les fichiers de type mdb qui


filetype:mdb inurl: »account|users|admin| peuvent contenir des
admi informations sur
nistrators|passwd|password » les mots de passe

les fichiers pwd.db peuvent


contenir des noms d’utilisateurs
et des
intitle: »Index of » pwd.db mots de passe chifrée

les fichiers de configuration du


logiciel WS_FTP pouvant
contenir
« Index of/ » « Parent Directory » « WS _ des mots de passe pour des
FTP.ini » filetype:ini WS _ FTP PWD serveurs FTP

Le fichier wp-config du CMS


WordPress contient le login et le
inurl:wp-config -intext:wp-config mot de passe de l’administartion
« ‘DB_PASSWORD' » du site

Recherche des données personnelles et des documents confidentiels

Question Résultat
des fichiers email.xls
pouvant contenir des
filetype:xls inurl: »email.xls » adresses

« phone * * * » « address * » « e-mail »


intitle: »curriculum
vitae » des documents CV

des fichiers
finances.xls pouvant
contenir des
informations
sur des comptes
bancaires, des
rapports financiers et
des
numéros de cartes
intitle:index.of finances.xls de crédit

des fichiers maillog


pouvant contenir des
intitle: »Index Of » -inurl:maillog maillog size messages e-mail

des fichiers
contenant des
informations
intext: »Dumping data for table ‘orders' » personnelles

Cette recherche
Google révèle les
noms des
utilisateurs, les mots
filetype:reg reg +intext: »internet account manager »
de passe pop3, les
adresses e-mail, les
serveurs connectés
et plus encore. Les
adresses IP des
utilisateurs peuvent
également être
révélées dans
certains cas.

Les dorks Google sont apparu en 2004, ils sont toujours d’actualité et
chaque jours de nouveau dorks voient le jour ! Pour consultez toute la
liste des dorks google, regardez ce lien: http://www.exploit-
db.com/google-dorks/
Comment se protéger des Google dorks ?
Comme vous pouvez le voir, il est donc relativement facile pour les
hackers de retrouver des documents sensibles sur internet.
Alors comment vous protéger ?
Eviter de mettre en ligne des informations sensibles

Les moteurs de recherche scannent inlassablement l’internet indexant


et contrôlant chaque appareil, port, adresse IP, pages etc…Alors que la
publication de la plupart de ces données collectées ne pose pas de
problème à être dévoilées publiquement.

Une partie des données est mise à disposition publiquement de


manière non-intentionnelle par l’intermédiaire des robots de
recherche. Par conséquence, un réseau intranet mal configuré peut
faire fuiter des documents confidentiels involontairement.

Donc trivialement, le moyen le plus simple de se protéger de ce genre


de fuite est de ne pas mettre des informations sensibles en ligne.
Assurez-vous que vos sites ou pages web contenant des informations
sensibles ne peuvent être indexés par les moteurs de recherche. Par
exemple, GoogleUSPER fournit des outils pour retirer des sites entiers,
des URLs ou des copies caches de l’indexation de Google.
Une autre option est d’utiliser le fichier robots.txt pour prévenir les
moteurs de recherche d’indexer des sites.
Testez et contrôlez régulièrement les vulnérabilités de vos sites

Profitez des google dorks pour mettre en place pro activement des


procédures de test de vulnérabilité régulièrement. Vous pouvez utiliser
pour cela la Google Hacking Database qui répertorie le nombre
croissant de requêtes qui permettent de trouver les fichiers incluant
les noms d’utilisateurs, les serveurs vulnérables ou même les fichiers
contenant les mots de passe.
Donc comme vous pouvez le voir, le mythe du hacker génial en
programmation n’est pas forcément une réalité. De simples requêtes
sur Google peuvent permettre d’accéder à des mots de passe, des
documents confidentiels ou trouver des serveurs ou plugins
présentant des failles connus de tous. Alors soyez vigilant. 😉

Vous aimerez peut-être aussi