SEQUENCE 1
Recherche d’informations avec le moteur de recherche Google
Objectifs de la Séquence
Connaître le moteur de recherche Google
Utiliser Google pour la recherche documentaire
Plan de la Séquence 1. 2. 3. 4. 5. 6. 7. 8.
Présentation Généralités Recherche simple Recherche avancée Champs indexés Affichage Fonctions annexes Exercices corrigés
1 - Présentation Ce cours a pour but de fournir certains éléments pour l’utilisation du moteur de recherche Google. Quelques références : Google France : http://www.google.fr (Fenêtre pour pratiquer en suivant le cours) Conseils pour la recherche : http://www.google.fr/intl/fr/help.html
2 - Généralités A- Les chiffres (Source OneStat : http://www.onestat.com) 1998
date de création de la Société Google par Larry Page et Sergey Brin. 4,3 milliards de pages indexées (estimation faite en octobre 2004). 56, 4 % des parts des moteurs de recherche dans le monde (Mai 2004) grâce à un index plus large que celui des autres (Altavista, Lycos, Netscape, Free…).
B- Fonctionnalités Recherche en texte intégral sur l’index constitué régulièrement par un robot ou spider. Utilisation de l’indice de popularité (ou Page Rank) qui assure une bonne pertinence des résultats. Inconvénients : les
pages les plus récentes risquent de ne pas apparaître ; les pages dont le sujet est extrêmement pointu risquent de ne pas apparaître en bonne place.
C- Autres fonctionnalités 1.
2.
3.
Google Desktop (http://desktop.google.com ) - Recherche de fichiers (Word, Excel, Outlook, Acrobat…) stockés sur l’ordinateur Version Béta : Google Scholar (http:// scholar.google.com/) – Recherche de littérature scientifique, articles, thèses, preprints…) Google Print (http://books.google.com) – Recherche dans des ouvrages en provenance de bibliothèques ayant numérisé des livres ou d’ouvrages dans le commerce
3 - Recherche simple A - Comment écrire les mots dans le formulaire ?
Majuscules et caractères accentués : Google ne tient pas compte des majuscules/minuscules et des accents et autres signes diacritiques. Utiliser le signe + devant le terme pour rechercher avec une orthographe particulière. Ex : [+bâtiment] ne recherchera que bâtiment
Recherche des expressions : L’emploi des guillemets est nécessaire pour rechercher une phrase ou une expression. Ex : [“la gestion des services communaux au Sénégal”]
Opérateurs booléens : ET, OU, SAUF (AND, OR, NOT en anglais)
Les mots ignorés : Google ignore dans l’indexation les mots vides (ex, le, la, les du, des, car, donc, etc.) ainsi que les chiffres et lettres d’un seul caractère.
Pour inclure un mot vide dans une recherche, il faut le faire précédé du signe + (lui même précédé d’un
espace) pour l’inclure dans une recherche. Ex : [+les eaux +de pluie].
B – Différents types de recherche sont possibles
Recherche par langue : A partir de n’importe quelle page de Google, http://www.google.fr ou http://www.google.com grâce au menu déroulant.
Recherche sur le nom du site : Possibilité de limiter sa recherche aux pages spécifiques à un site. Ex : [+hydraulique +site:www.2ie-edu.org] permet de rechercher les pages contenant le mot « hydraulique » et faisant partie du site de l’institut 2iE.
Recherche directe : L’utilisation du bouton « J’ai de la chance » ou « I’m Feeling Lucky » (en anglais) permet d’afficher la page qui serait apparue en premier dans la liste des résultats.
4 - Recherche avancée Page de recherche accessible dès la page d’accueil. A – Fonctionnalités propres
Recherche par langue Recherche par type de fichiers (doc, ppt, pdf…) Recherche par période spécifique de mise à jour des pages web Recherche en fonction de l’emplacement du terme de recherche Recherche aux pages d’un site ou d’un domaine.
B – Recherches de pages spécifiques
Recherche les pages similaires Recherche les pages liées à cette page
NB : Tout en étant un moteur de recherche, Google offre aussi une fonctionnalité d’annuaire de type Yahoo ou Répertoire.
5 - Champs indexés 1. 2. 3. 4.
Titre de la page Texte intégral de la page Fichier principal Eléments constitutifs de l’URL, Ex : http://www.2ie-edu.org/cours/geotechnique/Index.html, seront indexés « 2ie », « edu », « cours », « géotechnique » et « Index » Critères pour l’indexation et le classement des pages : 1. Indice de popularité de la page 2. Titre de la page et texte intégral de cette même page
6 - Affichage des résultats Page des résultats
F. G. H. I. J. K. L. M.
N. O.
Barre d’état Conseil Résultats OneBox Titre de la page Texte suivant le titre URL : Adresse de la page trouvée Taille (en ko) du texte de la page trouvée. Information non indiquée pour les sites pas encore indexés par Google En cache : Google met en cache le texte de toutes les pages explorées (8 milliards de pages actuellement) ce qui permet d’afficher le contenu de ce résultat tel qu’il se présentait lors de la dernière exploration – même si la page HTML est inaccessible pour une raison quelconque. Pages similaires Résultats affichés en retrait
7 - Fonctions annexes
Recherche dans les groupes (forums de discussion) avec plus de 850 millions de messages extraits des groupes de discussion. Recherche simple avec mots clés ou arborescence des forums. Ex : catégorie fr pour les listes en français et en fonction du sujet, sci pour les sciences. Recherche avancée avec différentes options, par exemple, date du message, auteur du message, titre du message, la langue du message…
Recherche des images : Plus de 800 millions d’images sont indexées par Google. Option de recherche avancée pour mieux cibler sa recherche d’images en choisissant, le format de l’image (gif, jpg…), la couleur, la taille de l’image et le site ou le domaine. Possibilité d’utiliser une syntaxe particulière pour la recherche. Ex : [paysage filetype:jpg] pour rechercher les images au format jpg avec « paysage » comme mot clé.
Actualités : Google Actualités présente des nouvelles (news) collectées auprès de 500 sources d’information dans le monde. Alertes Google Actualités (Nouveauté depuis 2004) permet de disposer par courrier électronique l’ensemble des articles publiés en ligne et correspondant aux sujets indiqués.
Fonctionnalités intéressantes
Traduction automatique : Existence d’un lien « traduire cette page » ou « translate this page » (en anglais) dans la page résultats permettant une traduction automatique de la page web en anglais ou en français.
Définition d’un terme : L’opérateur « define » permet d’obtenir une liste de définition d’un mot ou d’une expression. Ex : [define:hydraulique]
Calculatrice : Il suffit de rentrer une formule et de cliquer sur le bouton rechercher. Ex : [(15*12)*14/100]
Exercices corrigés Questions 1.
Google est-il ?
1.
Google France indexe ?
1.
annuaire moteur de recherche base de données les pages web écrites en français les pages des sites avec un nom de domaine .fr les pages de serveurs français
Quelle formulation est la plus restrictive et trouve le moins de résultats ?
service technique service OR technique “service technique” service AND technique
4.
A quoi correspond la recherche : service technique ?
service AND technique service OR technique Si vous tapez ingenierie, quels termes seront recherchés ? uniquement ingénierie toutes les occurrences de ingenierie avec ou sans majuscules et accents uniquement ingenierie avec ou sans majuscules (ex, ingenierie et INGENIERIE) Il est possible de limiter la recherche en fonction des formats de fichiers ? Vrai Faux
5.
6.
Réponses 1. 2. 3. 4. 5.
6.
moteur de recherche les pages web écrites en français “service technique”, limitation à l’expression service AND technique toutes les occurrences de ingenierie avec sans majuscules et accents, Google ne distingue pas entre minuscules/majuscules, lettres accentuées ou pas. vrai, on peut limiter la recherche en fonction de certains types de fichiers, Word, Acrobat, PowerPoint…
Merci de votre attention. Questions ? Remarques ?