twitter facebook rss
Imprimer Texte plus petit Texte plus grand

Moteurs de recherche : Les outils pour aller vite et en profondeur

lundi 30 octobre 2000

Pour regarder le web avec un œil acéré et fouiller les pages dans leur tréfonds, des centaines de moteurs de recherche se tiennent à la disposition des internautes. Quelques uns d’entre eux séduisent de plus en plus les millions de surfeurs dans le monde.

De par son envergure (il existe plus de 100 millions de sites web), Internet donne l’impression dès fois qu’il est impossible d’y trouver l’information recherchée. Il peut être souvent frustrant de devoir rechercher une information dans l’urgence. C’est pour permettre aux internautes de trouver rapidement les informations dont ils ont besoin sans trop se triturer les méninges que des moteurs de recherches ont été inventés. Il en existe des centaines et chacun tente de tenir un registre détaillé du web. Cela grâce à des robots logiciels qui cataloguent les sites et enregistrent les adresses. Leur performance vient de là : tel moteur enregistrera l’intégralité des textes de chaque site, tel autre n’indexera que l’adresse (URL), le titre et un sommaire du site. Aussi performant qu’il soit, aucun moteur ne dispose d’un indexe complet de tous les sites du fait simplement que chaque jours des dizaines de sites se créent ou meurent. L’efficacité d’un moteurs varie en fonction de sa "vitesse de rafraîchissement", c’est-à-dire du temps qu’il met pour actualiser sa base de données.

La capacité de calcul et de recherche est, certes prodigieuse mais à condition qu’on leur présente une requête précise et sans la moindre erreur. C’est cela aussi travailler avec des robots. C’est la syntaxe booléenne (inventée dans les années quarante par le mathématicien George Boole), et qui utilise les mots "AND" (et), "OR" (ou), "NEAR" (près de), et "NOT" (et non), que la plupart des moteurs de recherche adaptent. Ces quatre mots devant être écrits en majuscule.

AND exige la présence des deux éléments séparés par AND. Si par exemple un internaute veut avoir sous ses yeux l’ensemble des pages web sur Internet en Afrique, il demande au moteur de recherche de son choix : "Afrique AND Internet". Le moteur listera les pages web qui contiennent ces deux mots.

OR exige la présence d’au moins un des deux éléments spécifiés. "Afrique Or Internet" par exemple va répertorier les documents qui contiennent l’un ou l’autre de ces deux mots (pages sur Internet ou sur l’Afrique).

NEAR exige la présence d’un élément à condition qu’il se situe assez près (à une dizaine de mots au maximum) d’un ou plusieurs autres éléments déterminés.

NOT exclut un élément d’une requête. Si vous cherchez des éléments sur Jacques Diouf, le directeur de la FAO, mais pas sur Abdou Diouf, l’ancien président de la République du Sénégal, "Diouf NOT Abdou" est la requête qui convient.

Croisement : il est aussi possible dans une recherche de faire des croisements en utilisant simultanément deux ou plusieurs opérateurs booléens. Par exemple "Mandela AND Mbeki NOT Winnie" affichera les pages qui parlent de Mandela et de Mbeki, mais pas de l’ex-épouse du président sud-africain.

Signes + et - : Presque tous les moteurs de recherche acceptent les signes + et - comme équivalents respectifs de AND et de NOT. Par exemple +Mandela +Mbeki -Winnie (le signe + ou le signe - doit être accolé à l’élément qu’il détermine).

Guillemets : ils indiquent que les mots entre guillemets forment une expression entière et indivisible. Par exemple, "Internet en Afrique" recherchera tous les documents où l’on retrouve cette expression précise dans son intégralité. A noter que les moteurs de recherche n’acceptent pour seuls guillemets que les ``guillemets dactylo``.

Majuscules : de nombreux moteurs, mais pas tous, sont sensibles à la casse, du moins en ce qui concerne les majuscules. Autrement dit, ils chercheront les occurrences demandées sans distinction de minuscules ou de majuscules si la requête est présentée en toutes minuscules ; au contraire, ils vont chercher les textes comportant précisément la ou les majuscules demandées si l’internaute introduit une ou plusieurs majuscules dans sa requête.

Accents : Le même type d’observation s’applique aux accents et aux signes diacritiques. Certains moteurs n’y prêtent aucune attention, mais la plupart y sont sensibles. Cette fonctionnalité est très utile lorsqu’on utilise un moteur de recherche qui n’offre aucun tri par langue. Si les documents demandés sont en français (ou dans toute langue européenne autre que l’anglais), il ne faut pas hésiter à inclure, le cas échéant, les accents dans le texte de la requête. Exemple : "télévision" exclura d’office son équivalent anglais "television" et l’internaute aura ainsi de fortes chances de se voir proposer des pages en français.

A l’inverse, il peut être utile de ne pas faire figurer l’accent dans la requête. L’exemple type est celui du mot média, que beaucoup de gens écrivent en latin au pluriel (media), voire en mauvais latin au pluriel (medias) comme au singulier (media) ! dans ce cas, le plus simple est de taper "+media". Pour éviter toutes les occurrences comprenant des mots anglais comme "immediate" et "immediately" ou des mots français comme "immédiat" et "immédiatement", on affinera ainsi la requête : "+media -immediat".

Mots clés

Inscrivez-vous a BATIK

Inscrivez-vous à notre newsletter et recevez toutes nos actualités par email.

Navigation par mots clés

INTERNET EN CHIFFRES

- Bande passante internationale : 172 Gbps
- 4 FAI (Orange, Arc Télécom, Waw Télécom et Africa Access)
- 12 045 735 abonnés Internet

  • 11 779 800 abonnés 2G+3G+4G (97,8%)
    • 2G : 25,88%
    • 3G : 53,06%
    • 4G : 21,06%
  • 108 945 clés et box Internet (0,90%)
  • 152 047 abonnés ADSL/Fibre (1,29%)
  • 1766 abonnés bas débit (0,02%)
  • 3 177 abonnés aux 4 FAI
  • Internet fixe : 1,30%
  • Internet mobile : 98,70%

- Liaisons louées : 22 060

- Taux de pénétration des services Internet : 74,31%

(ARTP, 31 décembre 2019)

- 7 260 000 utilisateurs
- Taux de pénétration : 58,20%

(Internet World Stats 31 décembre 2018)

- 5800 noms de domaine actifs en .sn

(NIC Sénégal, décembre 2019)

TÉLÉPHONIE EN CHIFFRES


Téléphonie fixe

- 3 opérateurs : Sonatel, Expresso et Saga Africa Holdings Limited
- 207 592 abonnés
- 165 915 lignes résidentielles (79,92%)
- 41 677 lignes professionnelles (20,08%)
- Taux de pénétration : 1,28%

(ARTP, 31 décembre 2019)


Téléphonie mobile

- 3 opérateurs (Orange, Tigo et Expresso)
- 17 880 594 abonnés
- Taux de pénétration : 110,31%

(ARTP, 31 décembre 2019)

FACEBOOK

- 3 171 000 utilisateurs

- Taux de pénétration de Facebook : 18,6%

(Facebook, Juin 2019)