<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <title>Artisan Numérique</title>
  <link rel="alternate" type="text/html" href="http://artisan.karma-lab.net/node/1226"/>
  <link rel="self" type="application/atom+xml" href="http://artisan.karma-lab.net/node/1226/atom/feed"/>
  <id>http://artisan.karma-lab.net/node/1226/atom/feed</id>
  <updated>2008-09-30T19:28:55+02:00</updated>
  <entry>
    <title>Optimiser ses recherches dans Google</title>
    <link rel="alternate" type="text/html" href="http://artisan.karma-lab.net/node/1226" />
    <id>http://artisan.karma-lab.net/node/1226</id>
    <published>2008-07-21T12:44:52+02:00</published>
    <updated>2008-09-30T19:28:55+02:00</updated>
    <author>
      <name>Ulhume</name>
    </author>
    <category term="Le Bureau" />
    <category term="OK" />
    <category term="Planet Libre" />
    <category term="Tutoriel" />
    <summary type="html"><![CDATA[<p>
  Google est une mine d'information, ce n'est un secret pour personne. Et autant il m'arrive de taper sur certaines dérives du géant de la recherche, autant je dois bien avouer que leur moteur est d'une rare puissance. Il est rapide dans ses résultats, écume le web à une vitesse étourdissante (il n'est plus rare de voir un contenu indexé dans les heures qui suivent sa mise en ligne), et dispose d'un langage de formulation des demandes aussi vaste que méconnu. Et c'est cet aspect paradoxalement un peu obscure que je vais essayer de couvrir dans ce tutoriel : la recherche de documents sur le WEB, et seulement ça... 
</p>
    ]]></summary>
    <content type="html"><![CDATA[<p>
  Google est une mine d'information, ce n'est un secret pour personne. Et autant il m'arrive de taper sur certaines dérives du géant de la recherche, autant je dois bien avouer que leur moteur est d'une rare puissance. Il est rapide dans ses résultats, écume le web à une vitesse étourdissante (il n'est plus rare de voir un contenu indexé dans les heures qui suivent sa mise en ligne), et dispose d'un langage de formulation des demandes aussi vaste que méconnu. Et c'est cet aspect paradoxalement un peu obscure que je vais essayer de couvrir dans ce tutoriel : la recherche de documents sur le WEB, et seulement ça... 
</p>
<!--break-->
<div class='inline-box attention'>
  <p>Certaines techniques de recherche permettent de mettre à jour la bêtise de nombre de sociétés, d'organismes ou de particuliers qui mettent en ligne, souvent sans le savoir, un volume impressionnant de données. Je ne peux donc être tenu responsable de ce que vous ferrez des résultats de ces recherches.</p>
  <p>De mon point de vue, ce tutoriel s'arrête à la page de résultat de Google. Ce que vous faites des liens qui s'y trouvent est de <strong>votre</strong> responsabilité.</p>
  <p>Je vous rappelle seulement, à toutes fins utiles, que lorsque vous téléchargez un fichier protégé par des droits d'auteurs, le fait qu'il soit mis à disposition sur le net, ne vous rend pas moins coupable de recèle. Quant aux document confidentiel, dits <q>à ne pas diffuser</q>, qui sont paradoxalement disponibles à profusion sur le net, je n'ai aucune idée du risque encouru à les parcourir. J'imagine que cela doit varier si ces derniers proviennent de la petite PME du coin, ou du ministère de la défense... Si un juriste a des informations à ce sujet, je suis preneur.</p>
  <p>En tout cas pour moi c'est ceinture/bretelle, vous savez ce que vous faites.</p>
</div>


	<a name='chapter_1'></a>
  <h2>De la question à la requête</h2>
	
<p>
  De temps en temps, lorsque je n'ai rien de plus intelligent à faire, je jette un oeil aux statistiques de mes sites (qui n'utilisent pas de <a class='external' target='_blank' href='http://artisan.karma-lab.net/comment-ne-plus-etre-trace-par-google-analytics' >scripts externes</a> ;p ) et plus particulièrement à la très instructive liste des phrases qui, données à manger aux automates de recherche, aboutissent chez moi. Et il n'est pas rare, de tomber sur des formulations d'un académisme aussi irréprochable qu'inefficace. Comme par exemple :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=Comment+rendre+mon+Windows+XP+l%C3%A9gal+%3F" target="_blank">Comment rendre mon Windows XP légal ?</a>
  </div>
  </p>
<div class='inline-box note'>
<u>Petite note pratique:</u> Toutes les requêtes données en exemples sont clickables, n'hésitez pas à les essayer...
</div>

<p>
  Alors, il y a plusieurs choses remarquables concernant la personne qui a soumit cette phrase à Google :
  <ol>
    <LI>Elle pose <b>une question</b> à M. Google et met en conséquence toutes les ponctuations d'usage.</LI>
    <LI>Elle spécifie bien qu'il s'agit de <strong>Son</strong> Windows et pas celui du voisin.</LI>
    <li>Enfin, elle met bien la majuscule en début de phrase et sur le nom-propre.</li>
  </ol> 
</p>

<p>
  La personne qui a écrit cela doit j'imagine s'attendre à une réponse du type <q>Pour rendre Ton Windows XP légal, cher ami, il faudrait tout d'abord songer à l'acheter...</q>. Malheureusement, M. Google n'est pas aussi humain et ne comprend rien à la grammaire et encore moins au sens des mots. Voyons donc un peu ce que Google comprend vraiment...
</p>

<h3>De la question à la liste de mots</h3>
<p>
  En prenant l'exemple de cet utilisateur qui a tapé <q>Comment rendre mon Windows XP légal ?</q>, il ne s'agit pas de se moquer mais bien au contraire de comprendre ce que Google fait dans la vie. Son métier est de lire le web de A à Z. Chaque lien, chaque page, chaque image est lu et stocké dans sa grande ba-base. Ceci fait, il va analyser chaque <strong>mot</strong> de chaque <strong>page</strong> et alimenter ainsi d'énormes <strong>indexes</strong>, comme celui d'une bibliothèque. Il sait donc qu'il connait très exactement <strong>30 700 000</strong> pages qui contiennent le mot <q>fenêtre</q>. Il ne sait en revanche rien du sens de ce mot, et encore moins du contexte sémantique de son utilisation. Une <q>publicité pour remplacer les fenêtres d'un pavillon</q> ou un <q>tutoriel traitant de la manipulation des fenêtres dans un ordinateur</q> parlent pour lui de la même chose... Ainsi les ponctuations, les mots comme <q>Comment, Pourquuoi, etc..</q> peuvent être sans trop de risque éliminés. 
</p>
<p>  
  Dans la même idée, Google ne fait aucune différence entre majuscules et minuscules. Mieux, il ne comprends même pas les accents et le mot <q>été</q> et <q>ete</q> sont pour lui identiques. 
</p>

<p>
  Et même les mots eux-mêmes ne sont pas tous logés à la même enseigne. A chaque mots d'une phrase, Google va associer un <q>poid</q>. Et les "petits" mots, typiquement les pronoms (un, le, mon, etc.) sont pour lui des mots faibles, presque inexistant. Autant ne même pas les taper tant ils ne servent à rien. 
</p>

<p>
  Fort de tout cela, notre phrase d'introduction peut donc, avec le même résultat, être reformulé de la manière suivante :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+windows+xp+legal" target="_blank">rendre windows xp legal</a>
  </div>
  </p>
<p>Tout simplement...</p>

<h3>Les expressions avancées</h3>
<p>
  Pour l'instant, avec cette formulation, google cherche individuellement chacun des mots que nous lui avont donnés. Or dans cet exemple, c'est bien <b>Windows XP</b> qui est au centre de notre recherche. Nous n'avons pas envie d'avoir, même dans une seule page, un <b>Windows</b> d'un côté et un <b>XP</b> trente kilomètres plus loin... Heureusement, nous avons la possibilité de <strong>grouper</strong> ces deux mots en une seule expression. Ce groupement s'écrit en plaçant les mots entre double-guillements.
</p>
<p>
   Une formulation plus efficace sera donc :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%22windows+xp%22+legal" target="_blank">rendre "windows xp" legal</a>
  </div>
  </p>

<p>
  Pour améliorer encore notre demande, nous avons aussi la possibilité de demander à Google de garder nos expressions (mots ou groupes de mot) les plus proches possibles les unes des autres grâce au symbole <kbd>*</kbd>. En langage Google ce symbole signifie en gros <q>un ou plusieurs mots, peu importe lesquels</q>. 
   </p>
<p>Nous obtenons ainsi la version finale de notre demande à Google qui va donc permettre d'obtenir la liste des pages contenant les expressions <q>rendre</q> <q>windows XP</q> <q>légal</q> les plus proches possibles les unes des autres :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%2A+%22windows+xp%22+%2A+legal" target="_blank">rendre * "windows xp" * legal</a>
  </div>
  </p>


<h3>Conclusion</h3>
<p>
  En allant de la formulation d'origine <q>Comment rendre mon Windows XP légal ?</q> à la phrase finale <q>rendre * "windows xp" * legal</q>, nous comprenons bien que l'on ne pose plus une <q>question</q> à Google mais que nous lui formulons une <strong>requête</strong> sous la forme d'une <em>liste de mot ou d'expressions</em> à rechercher. Un requête pour l'instant très simple mais que nous allons rapidement pousser beaucoup plus loin. 
</p>


<div class='inline-box note'>
<u>Notes complémentaires:</u>
  <p>1. Google se fiche de l'ordre des mots pour ses résultats. En revanche, l'ordre des mots va influencer l'ordre dans lequel les résultats sont classés en donnant ainsi plus de "force" au premier mot, un peu moins au second, etc... S'il n'y a que 10 résultats cela n'a pas beaucoup d'importance, mais lorsqu'il y en a des milliers, cela peut changer la donne ;-) C'est ainsi que les "petits" mots, ils ne seront pas vraiment ignorés, mais pondéré plus faiblement. </p>
 <p>2. Google ne comprend pas les accents, mais comprends les ligatures. Ainsi le mot <kbd>bœufs</kbd> donnera le même résultat que <kbd>boeuf</kbd>.</p>
  <p>3. A chaque requête, Google affiche le nombre de résultat total trouvé, dans la petite zone bleue qui se trouve entre la zone de saisie et le résultat. Dans notre exemple, il y a 708 000 réponses et Google affiche les 10 premières. Si vous allez dans les préférences (à droite de la zone de saisie), vous pouvez afficher non pas 10, mais 20, 30, 50 ou 100 réponses par page. Mais cela sera un peu plus long à arriver.</p>
 <p>4. A noter aussi que le nombre maximal de membre dans une requête Google est de 10. Les autres seront ignorés.</p></li> 
  <p>5. Mis à part un mot, et une expression, Google connaît encore un autre type de chose qu'il peut chercher, les intervalles de nombre. Je ne sais pas bien à quoi cela peut servir mais ça existe et vous saurez peut-être en faire quelque chose. Ainsi si vous tapez <kbd>Présidentielles 1980..2020</kbd>, vous aurez toutes les pages contenant <b>présidentielles 2000</b>, <b>présidentielles 2001</b>, etc.. jusqu'à <b>présidentielles 2020</b>. </p>
  <p>6. Autre aspect intéressant, Google est meilleur en orthographe que vous (en tout cas clairement que moi). Ainsi si un mot est mal orthographié, il vous proposera de corriger votre requête avec la bonne syntaxe.
</div>



	<a name='chapter_2'></a>
  <h2>Les opérateurs logiques</h2>
	
<h3>Des ET et des OU...</h3>
<p>
  Comme nous l'avons vu, une requête Google est composée d'<strong>expressions</strong> à chercher (ex. legal ou "windows xp"). Nous allons voir maintenant comment ces expressions sont liées entre elles. 
</p>
<p>
  Par défaut, Google cherche <strong>toutes</strong> les expressions que vous saisissez sur une même page. Il place implicitement des <kbd>ET</kbd> invisibles entre chacun d'entre eux. En anglais <kbd>ET</kbd> s'écrivant <kbd>AND</kbd>, notre requête peut aussi s'écrire de la manière suivante  :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+AND+windows+AND+legal" target="_blank">rendre AND windows AND legal</a>
  </div>
  </p>
<p>
  Ou encore (AND et & étant synonymes)
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%26+%22windows+xp%22+%26+legal" target="_blank">rendre & "windows xp" & legal</a>
  </div>
  </p>

<p>
  <strong>AND</strong> est ce que l'on appelle un <em>opérateur logique</em>. Un opérateur logique va lier... logiquement une expression à une autre. L'autre opérateur logique évident est le <strong>OU</strong>. Par exemple, si nous voulons améliorer la recherche précédente et chercher les documents qui contiennent <kbd>légal</kbd> OU <kbd>valide</kbd>, nous formulerions notre requête ainsi (OU s'écrit "OR" en anglais) :

    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+AND+%22windows+xp%22+AND+legal+OR+valide" target="_blank">rendre AND "windows xp" AND legal OR valide</a>
  </div>
  </p>

<p>
  Et comme les AND peuvent être sous-entendus, cela nous donne :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%22windows+xp%22+legal+OR+valide" target="_blank">rendre "windows xp" legal OR valide</a>
  </div>
  </p>

<p>
  Pour faire encore plus compacte, le OR qui peut aussi s'écrire par le symbole <b>|</b>. Ce qui nous donne la requête  :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%22windows+xp%22+legal+%7C+valide" target="_blank">rendre "windows xp" legal | valide</a>
  </div>
  </p>
  
<p>
  Enfin, il est possible de grouper les opérateurs avec des parenthèses pour lever les ambiguïtés, comme par exemple :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%22window+xp%22+%28legal+%7C+valide+%7C+cool%29" target="_blank">rendre "window xp" (legal | valide | cool)</a>
  </div>
  </p>

<h3>L'exclusion</h3>
<p>
  Nous savons maintenant comment indiquer à Google ce que nous voulons dans les résultats. Essayons maintenant de lui signifier ce que nous ne voulons pas. En logique c'est ce que l'appelle l'opérateur <b>NON</b> qui s'écrit en langage Google par le signe <kbd>-</kbd> suivi de l'expression (mot ou group de mot) à exclure. Donc si par exemple, je ne veux pas qu'apparaisse le mot <kbd>téléchargement</kbd>, cela donne :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%22window+xp%22+%28legal+%7C+valide+%7C+cool%29+-t%C3%A9l%C3%A9chargement" target="_blank">rendre "window xp" (legal | valide | cool) -téléchargement</a>
  </div>
  </p>


	<a name='chapter_3'></a>
  <h2>Les modificateurs</h2>
	
<p>
  Nous savons déjà construire des requêtes complexes, avec des opérateurs logiques, des expressions et des termes exclus. Nous allons maintenant aborder la partie la plus intéressante du système de recherche de Google, <em>les modificateurs</em>.
   </p>
<p>
   De manière générale, les modificateurs permettent d'altérer la manière dont une expression est prise en compte dans la recherche. Cela peut changer son importance, inclure ses synonymes, et spécifier précisement où l'expression doit être trouvée. 
</p>

<h3>La modification de l'importance d'une expression</h3>
<p>
  Comme nous l'avons vu plus haut, certains mots ont moins d'importance que d'autres et ceci même si Google place des ET invisibles dans la requête. Ainsi un mot trop court, ou trop peu significatif par rapport aux autres, risque d'être zappé de la recherche. La plupart du temps c'est un comportement pratique, mais il arrive que l'on <em>tienne</em> à un mot, même si Google le trouve sans intérêt. C'est là qu'intervient le signe <kbd>+</kbd> suivi de l'expression à forcer.
</p>
<p>
  Si par exemple nous désirons forcer le mot <kbd>mon</kbd> dans la requête précédente, cela donnerait :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%2Bmon+windows+legal" target="_blank">rendre +mon windows legal</a>
  </div>
  </p>

<h3>Les synonymes</h3>
<p>
  Google peut vous permettre de "flouter" un peu vos recherches en lui demandant de chercher un mot ET ses synonymes. Parler de synonymes n'est pas totalement exact. Il s'agit plutôt d'une relation statistique généralement constatée par Google entre des mots. Par exemple si vous tapez :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=%7Ebateau" target="_blank">~bateau</a>
  </div>
  </p>
<p>
  Vous aurez aussi des résultats concernant les.. croisières !! De l'influence du web marchand sur Google ;-) ...
</p>

<h3>Spécifier où chercher</h3>
<p>
  D'abord une page web c'est quoi exactement ? Et bien c'est tout d'abord une adresse (url). Puis un titre (title) et un contenu. Enfin ce sont des liens composés chacun d'un texte (anchor) et d'une adresse de destination (link). 
</p>

<p>
  Toutes les requêtes que nous avons vues précédemment portaient exclusivement sur le <em>contenu</em> de la page (ou du document). Mais il est possible de demander à Google que certaines expressions soient recherchées dans une des parties spécifiques de la page comme le titre, l'url, un lien, ou le texte d'un lien. 
</p>
<p>
  Pour prendre un exemple, imaginons que nous voulions rechercher toutes les pages qui contiennent le mot <b>drm</b> et dont le <b>titre</b> contient le mot <kbd>DADVSI</kbd>. Nous formulerons alors la requête suivante :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=drm+intitle%3Adadvsi" target="_blank">drm intitle:dadvsi</a>
  </div>
  </p>

<p>
  La première partie est classique, elle indique que <b>drm</b> doit être cherché dans le contenu de la page. La seconde expression en revanche, utilise le modificateur <kbd>intitle:</kbd> qui restreint la recherche du mot <b>dadvsi</b> aux seuls titres (title). Et si nous voulons trouver non pas un mot simple mais un groupe de mot dans ce titre, nous allons utiliser le modificateur <kbd>allintitle:</kbd> :
  
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=drm+allintitle%3A%22loi+dadvsi%22" target="_blank">drm allintitle:"loi dadvsi"</a>
  </div>
  </p>

<p>
  De la même manière si nous voulons chercher dans le texte d'un lien, nous utiliserons le modificateur <kbd>inanchor:</kbd>,  ou <kbd>allinanchor:</kbd> s'il s'agit d'un groupe de mots. 
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=allanchor%3Adadvsi" target="_blank">allanchor:dadvsi</a>
  </div>
      <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=allinanchor%3A%22dadvsi+drm%22" target="_blank">allinanchor:"dadvsi drm"</a>
  </div>
  </p>


<p>
  Pour cherche mot ou un group de mot dans <strong>l'adresse</strong> même des pages, nous utiliserons les modificateurs <kbd>inurl:</kbd> et <kbd>allinurl:</kbd>. Ansi, pour partir à la chasse aux étourdis, nous pouvons tester ce modificateur avec cette requête :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=inurl%3Auserfiles" target="_blank">inurl:userfiles</a>
  </div>
      <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=allinurl%3A%22userfiles+media%22" target="_blank">allinurl:"userfiles media"</a>
  </div>
  </p>

<p>
  Enfin, si nous voulons chercher les pages qui contiennent au moins un lien qui pointe vers une autre page nous utiliserons le modificateur  <kbd>link:</kbd>. Par exemple, si nous voulons connaître tous les sites qui référencent la page <kbd>http://moutons.karma-lab.net/node/10</kbd>, nous écrirons la requête suivante :
  
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=link%3Amoutons.karma-lab.net%2Fnode%2F10" target="_blank">link:moutons.karma-lab.net/node/10</a>
  </div>
    
</p>
<p>
  Bien évidement, tous ces modificateurs peuvent être combinés par des liens logiques. Par exemple, au hasard balthazar, essayons ceci :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=intitle%3A%22index+of%22+%28+link%3Amp3+%7C+link%3Aogg%29+" target="_blank">intitle:"index of" ( link:mp3 | link:ogg) </a>
  </div>
    
</p>
<p>
  Un grand classique qui je l'espère vous est maintenant facile à comprendre et à décortiquer ;-)
</p>
<p>
  Un autre exemple amusant est de rechercher ces petites caméras connectées à internet et que beaucoup semblent oublier de protéger. Or si l'on sait ce que contient l'écran de contrôle d'une de ces caméras, il devient alors très simple d'en obtenir la liste :
  
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=inurl%3A%22MultiCameraFrame%3FMode%3D%22+OR+inurl%3A%22ViewerFrame%3FMode%3D%22+OR+inurl%3A%22%2Fview%2Fview.shtml%3Fvideos%3D%22" target="_blank">inurl:"MultiCameraFrame?Mode=" OR inurl:"ViewerFrame?Mode=" OR inurl:"/view/view.shtml?videos="</a>
  </div>
    
</p>

<p>
  C'est comme cela, en faisant gogoter une caméra collée sous leur nez, que je me suis amusé 10 bonnes minutes à affoler les girafes dans un Zoo quelque part sur la planète ;-)
</p>


	<a name='chapter_4'></a>
  <h2>Les expressions spéciales</h2>
	
<h3>Le type de document</h3>
<p>
  Google indexe à peu prés tout ce qu'il trouve et même s'il était à l'origine limité aux pages web, son action c'est vite étendue aux documents de traitement de texte, aux feuilles de calcul, etc. A ma connaissance, les types de document indexés sont les suivant.
  
  <ul><u>Pour les documents texte, les formats reconnus sont :</u>
    <li>Simples (ANS, TXT)</li>
    <li>OpenDocument (ODT)</li>
    <li>Portable Document File (PDF)</li>
    <li>PostScript (PS)</li>
    <li>Lotus WordPro (LWP)</li>
    <li>Microsoft Word (DOC)</li>
    <li>Microsoft Write (WRI)</li>
    <li>Rich Text Format (RTF)</li>
    <li>MacWrite (MW)</li>
  </ul>
  <ul><u>Pour les feuilles de calcul :</u>
    <li>OpenCalc (ODS)</li>
    <li>Lotus 1-2-3 (WK1, WK2, WK3, WK4, WK5, WKI, WKS, WKU)</li>
    <li>Microsoft Excel (XLS)</li>
  </ul>
  
  <ul><u>Les présentations :</u>
    <li>OpenPresentation (ODP)</li>
    <li>Microsoft PowerPoint (PPT)</li>
  </ul>
  
  <ul><u>Et divers autres :</u>
    <li>Shockwave (SWF)</li>
    <li>Autodesk (DWF)</li>
    <li>Google Earth (KLM,KMZ)</li>
    <li>Microsoft Works (WDB, WKS, WPS)</li>
  </ul>
</p>
<p>
  Sachant cela, il est possible d'ajouter à notre recherche un ou plusieurs types de document désiré. Par exemple, imaginons que nous voulions connaître les documents PDF ou DOC que des étourdis ont mis en ligne et qui ont le malheur d'être confidentiels :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=%2B%22document+provisoire%22+%2B%22ne+pas+diffuser%22+filetype%3Adoc+%7C+filetype%3Apdf" target="_blank">+"document provisoire" +"ne pas diffuser" filetype:doc | filetype:pdf</a>
  </div>
  </p>
<p>
  C'est à ce stade que l'on se rend compte du travail qu'il y a encore à réaliser en terme d'éducation... Car google lui, ne pardonne pas...
</p>
<p>
  De la même manière il est possible d'enlever des types de documents à une recherche en utilisant l'opérateur d'exclusion. Ainsi l'exemple suivant permet de rechercher tous les documents qui ont comme titre <q>Spécifications techniques</q> en excluant les fichiers .pdf :
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=allintitle%3A%22specifications+techniques%22+-filetype%3Apdf" target="_blank">allintitle:"specifications techniques" -filetype:pdf</a>
  </div>
  </p>

<h3>Le domaine d'une page</h3>
<p>
  Google sait évidement d'où viennent les documents qu'il indexe. Et il est possible grâce à l'expression <kbd>site:</kbd> d'utiliser cette information dans ses recherches. Par exemple si nous voulons connaître la liste des documents PDF mis en ligne via le site <kbd>unesco.org</kbd> OU <kbd>europa.eu</kbd>, nous fabriquerons la requêtes suivante :  
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=%2Bfiletype%3Apdf+site%3Aunesco.org+%7C+site%3Aeuropa.eu" target="_blank">+filetype:pdf site:unesco.org | site:europa.eu</a>
  </div>
  </p>

<p>
  Le modificateur <b>site:</b> permet de recherche tous les noms de sites se terminant par l'expression qu'il désigne (ici unesco.org ou europa.eu). En étant plus précis, il est donc possible de limiter encore la recherche au seul documents du site <kbd>unesdoc.unesco.org</kbd> :  
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=%2Bfiletype%3Apdf+site%3Aunesdoc.unesco.org" target="_blank">+filetype:pdf site:unesdoc.unesco.org</a>
  </div>
  </p>

<p>
  Dans la même idée, il est possible non pas d'inclure mais d'éliminer toutes les pages venant d'un domaine donnée:
    <div class='code-container' style='margin-left:10px; padding-left:10px; font-size:12px;'>
    <a href="http://www.Google.fr/search?q=rendre+%2A+%22windows+xp%22+%2A+legal++-site%3Amicrosoft.fr+-site%3Amicrosoft.com" target="_blank">rendre * "windows xp" * legal  -site:microsoft.fr -site:microsoft.com</a>
  </div>
  </p>


	<a name='chapter_5'></a>
  <h2>Les sous-moteurs</h2>
	
<p>
   Récemment je suis tombé sur un sous-moteur dédié à Linux. Après quelques recherches, ils sont finalement plus nombreux que je l'imaginais. Alors en plus de ce que vous avez classiquement (texte, images, news, etc..), nous avons aussi :
<ul>
  <li><a class='external' target='_blank' href='http://www.google.com/linux' >Les recherches pour Linux</a>, par exemple <a class='external' target='_blank' href='http://www.google.com/linux?hl=fr&amp;q=atheros&amp;btnG=Rechercher&amp;lr=' >Atheros</a>.</li>
  <li><a class='external' target='_blank' href='http://www.google.com/bsd' >Les recherches pour *BSD</a>, par exemple <a class='external' target='_blank' href='http://www.google.com/bsd?hl=fr&amp;q=atheros&amp;btnG=Rechercher&amp;lr=' >Atheros</a>.</li>
  <li><a class='external' target='_blank' href='http://www.google.com/mac.html' >les recherches pour MacOS</a>, par exemple <a class='external' target='_blank' href='http://www.google.com/mac?hl=fr&amp;q=atheros&amp;btnG=Rechercher&amp;lr=' >Atheros</a>.</li>
  <li><a class='external' target='_blank' href='http://www.google.com/microsoft.html' >les recherches pour Microsoft</a>, par exemple <a class='external' target='_blank' href='http://www.google.com/microsoft?hl=fr&amp;q=atheros&amp;btnG=Rechercher&amp;lr=' >Atheros</a> (Rhoo, le premier lien est un plantage ;-) ).</li>
</ul>
</p>
<p>
  Il existe aussi des sous-moteurs dédiés à des fonds documentaires particuliers :
  <ul>
  <lI><a class='external' target='_blank' href='http://www.google.com/patents' >Les recherches sur les brevets</a>. Il est possible de chercher les brevets en texte simple ou par l'utilisation de modificateurs comme <kbd>patent:</kbd> pour trouver par numéro. Par exemple, le célèbre brevet de British Telecom sur <a class='external' target='_blank' href='http://www.google.com/patents?q=patent%3A4873662' >l'hyperlien</a>.</li>
  <li>Pour les Fox Mulder en herbe, <a class='external' target='_blank' href='http://www.google.com/unclesam' >les recherches sur les documents gouvernementaux américains</a>. Par exemple <a class='external' target='_blank' href='http://www.google.com/search?site=unclesam&amp;restrict=unclesam&amp;hl=fr&amp;output=unclesam&amp;q=roswell+ufo' >Roswell UFO</a>.</lI>
  <li>Enfin, pour rechercher exclusivement dans les <a class='external' target='_blank' href='http://news.google.com/archivesearch' >articles de journaux</a>, par exemple <a class='external' target='_blank' href='http://news.google.com/archivesearch?q=nabot+pr%C3%A9sident' >ceci</a>. Donc ça marche très bien ;-).</li>
  <li><a class='external' target='_blank' href='http://www.google.com/books' >Recherches de livres</a>, par exemple <a class='external' target='_blank' href='http://www.google.com/books?q=guerre+et+paix&amp;hl=fr&amp;spell=1&amp;oi=spell' >Guerre et Paix</a>.</li>
  <li><a class='external' target='_blank' href='http://blogsearch.google.com/' >Recherche parmi les blogs</a>. Mais il n'est absolument pas pertinent !! La preuve avec <a class='external' target='_blank' href='http://blogsearch.google.com/blogsearch?hl=fr&amp;q=artisan' >cet exemple</a> alors qu'il est clairement écrit en slogan de ce site, que ce n'est pas un blog !!!.</li>
</ul>
 
</p>

	<a name='chapter_6'></a>
  <h2>Conclusion</h2>
	
<p>
  Voilà, fin du petit tour d'horizon de ce qu'il est possible de faire comme recherche sur le WEB avec Google. Comme vous l'avez vu, les possibilités sont nombreuses et juste limité, comme beaucoup de choses en ce domaine, par l'imagination. 
</p>    ]]></content>
  </entry>
</feed>
