OSIRIS

Observatoire sur les systèmes d’information, les réseaux et les inforoutes au Sénégal

Show navigation Hide navigation
  • OSIRIS
    • Objectifs
    • Partenaires
  • Ressources
    • Société de l’Information
    • Politique nationale
    • Législation et réglementation
    • Etudes et recherches
    • Points de vue
  • Articles de presse
  • Chiffres clés
    • Le Sénégal numérique
    • Principaux tarifs
    • Principaux indicateurs
  • Opportunités
    • Projets

Accueil > Articles de presse > Archives 1999-2024 > Année 2000 > Octobre > Sud NTIC n° 3 du lundi 30 octobre 2000 > Moteurs de recherche : Les outils pour aller vite et en profondeur

Moteurs de recherche : Les outils pour aller vite et en profondeur

lundi 30 octobre 2000

Internet

Pour regarder le web avec un œil acéré et fouiller les pages dans leur tréfonds, des centaines de moteurs de recherche se tiennent à la disposition des
internautes. Quelques uns d’entre eux séduisent de plus en plus les millions de surfeurs dans le monde.

De par son envergure (il existe plus de 100 millions de sites web), Internet donne l’impression dès fois qu’il est impossible d’y trouver l’information
recherchée. Il peut être souvent frustrant de devoir rechercher une information dans l’urgence. C’est pour permettre aux internautes de trouver
rapidement les informations dont ils ont besoin sans trop se triturer les méninges que des moteurs de recherches ont été inventés. Il en existe des
centaines et chacun tente de tenir un registre détaillé du web. Cela grâce à des robots logiciels qui cataloguent les sites et enregistrent les adresses.
Leur performance vient de là : tel moteur enregistrera l’intégralité des textes de chaque site, tel autre n’indexera que l’adresse (URL), le titre et un
sommaire du site. Aussi performant qu’il soit, aucun moteur ne dispose d’un indexe complet de tous les sites du fait simplement que chaque jours des
dizaines de sites se créent ou meurent. L’efficacité d’un moteurs varie en fonction de sa « vitesse de rafraîchissement », c’est-à-dire du temps qu’il met
pour actualiser sa base de données.

La capacité de calcul et de recherche est, certes prodigieuse mais à condition qu’on leur présente une requête précise et sans la moindre erreur. C’est
cela aussi travailler avec des robots. C’est la syntaxe booléenne (inventée dans les années quarante par le mathématicien George Boole), et qui utilise
les mots « AND » (et), « OR » (ou), « NEAR » (près de), et « NOT » (et non), que la plupart des moteurs de recherche adaptent. Ces quatre mots devant être
écrits en majuscule.

AND exige la présence des deux éléments séparés par AND. Si par exemple un internaute veut avoir sous ses yeux l’ensemble des pages web sur
Internet en Afrique, il demande au moteur de recherche de son choix : « Afrique AND Internet ». Le moteur listera les pages web qui contiennent ces deux
mots.

OR exige la présence d’au moins un des deux éléments spécifiés. « Afrique Or Internet » par exemple va répertorier les documents qui contiennent l’un ou
l’autre de ces deux mots (pages sur Internet ou sur l’Afrique).

NEAR exige la présence d’un élément à condition qu’il se situe assez près (à une dizaine de mots au maximum) d’un ou plusieurs autres éléments
déterminés.

NOT exclut un élément d’une requête. Si vous cherchez des éléments sur Jacques Diouf, le directeur de la FAO, mais pas sur Abdou Diouf, l’ancien
président de la République du Sénégal, « Diouf NOT Abdou » est la requête qui convient.

Croisement : il est aussi possible dans une recherche de faire des croisements en utilisant simultanément deux ou plusieurs opérateurs booléens. Par
exemple « Mandela AND Mbeki NOT Winnie » affichera les pages qui parlent de Mandela et de Mbeki, mais pas de l’ex-épouse du président sud-africain.

Signes + et - : Presque tous les moteurs de recherche acceptent les signes + et - comme équivalents respectifs de AND et de NOT. Par exemple
+Mandela +Mbeki -Winnie (le signe + ou le signe - doit être accolé à l’élément qu’il détermine).

Guillemets : ils indiquent que les mots entre guillemets forment une expression entière et indivisible. Par exemple, « Internet en Afrique » recherchera tous
les documents où l’on retrouve cette expression précise dans son intégralité. A noter que les moteurs de recherche n’acceptent pour seuls guillemets
que les guillemets dactylo.

Majuscules : de nombreux moteurs, mais pas tous, sont sensibles à la casse, du moins en ce qui concerne les majuscules. Autrement dit, ils
chercheront les occurrences demandées sans distinction de minuscules ou de majuscules si la requête est présentée en toutes minuscules ; au
contraire, ils vont chercher les textes comportant précisément la ou les majuscules demandées si l’internaute introduit une ou plusieurs majuscules
dans sa requête.

Accents : Le même type d’observation s’applique aux accents et aux signes diacritiques. Certains moteurs n’y prêtent aucune attention, mais la plupart y
sont sensibles. Cette fonctionnalité est très utile lorsqu’on utilise un moteur de recherche qui n’offre aucun tri par langue. Si les documents demandés
sont en français (ou dans toute langue européenne autre que l’anglais), il ne faut pas hésiter à inclure, le cas échéant, les accents dans le texte de la
requête. Exemple : « télévision » exclura d’office son équivalent anglais « television » et l’internaute aura ainsi de fortes chances de se voir proposer des
pages en français.

A l’inverse, il peut être utile de ne pas faire figurer l’accent dans la requête. L’exemple type est celui du mot média, que beaucoup de gens écrivent en
latin au pluriel (media), voire en mauvais latin au pluriel (medias) comme au singulier (media) ! dans ce cas, le plus simple est de taper « +media ». Pour
éviter toutes les occurrences comprenant des mots anglais comme « immediate » et « immediately » ou des mots français comme « immédiat » et
« immédiatement », on affinera ainsi la requête : « +media -immediat ».

Fil d'actu

  • TIC ET AGRICULTURE AU BURKINA FASO Étude sur les pratiques et les usages Burkina NTIC (9 avril 2025)
  • Sortie de promotion DPP 2025 en Afrique de l’Ouest Burkina NTIC (12 mars 2025)
  • Nos étudiant-es DPP cuvée 2024 tous-tes diplomés-es de la Graduate Intitute de Genève Burkina NTIC (12 mars 2025)
  • Retour sur images Yam Pukri en 2023 Burkina NTIC (7 mai 2024)
  • Quelles différences entre un don et un cadeau ? Burkina NTIC (22 avril 2024)

Liens intéressants

  • NIC Sénégal
  • ISOC Sénégal
  • Autorité de régulation des télécommunications et des postes (ARTP)
  • Fonds de Développement du Service Universel des Télécommunications (FDSUT)
  • Commission de protection des données personnelles (CDP)
  • Conseil national de régulation de l’audiovisuel (CNRA)
  • Sénégal numérique (SENUM SA)

Navigation par mots clés

  • 6653/7158 Régulation des télécoms
  • 522/7158 Télécentres/Cybercentres
  • 4876/7158 Economie numérique
  • 2547/7158 Politique nationale
  • 7065/7158 Fintech
  • 771/7158 Noms de domaine
  • 2607/7158 Produits et services
  • 2172/7158 Faits divers/Contentieux
  • 1104/7158 Nouveau site web
  • 7158/7158 Infrastructures
  • 2475/7158 TIC pour l’éducation
  • 280/7158 Recherche
  • 372/7158 Projet
  • 4725/7158 Cybersécurité/Cybercriminalité
  • 2645/7158 Sonatel/Orange
  • 2427/7158 Licences de télécommunications
  • 430/7158 Sudatel/Expresso
  • 1403/7158 Régulation des médias
  • 2069/7158 Applications
  • 1523/7158 Mouvements sociaux
  • 2385/7158 Données personnelles
  • 205/7158 Big Data/Données ouvertes
  • 887/7158 Mouvement consumériste
  • 542/7158 Médias
  • 971/7158 Appels internationaux entrants
  • 2470/7158 Formation
  • 188/7158 Logiciel libre
  • 2994/7158 Politiques africaines
  • 1534/7158 Fiscalité
  • 249/7158 Art et culture
  • 862/7158 Genre
  • 2349/7158 Point de vue
  • 1477/7158 Commerce électronique
  • 2331/7158 Manifestation
  • 478/7158 Presse en ligne
  • 192/7158 Piratage
  • 307/7158 Téléservices
  • 1329/7158 Biométrie/Identité numérique
  • 453/7158 Environnement/Santé
  • 489/7158 Législation/Réglementation
  • 505/7158 Gouvernance
  • 2864/7158 Portrait/Entretien
  • 217/7158 Radio
  • 1070/7158 TIC pour la santé
  • 451/7158 Propriété intellectuelle
  • 87/7158 Langues/Localisation
  • 1799/7158 Médias/Réseaux sociaux
  • 2962/7158 Téléphonie
  • 285/7158 Désengagement de l’Etat
  • 1555/7158 Internet
  • 174/7158 Collectivités locales
  • 658/7158 Dédouanement électronique
  • 1687/7158 Usages et comportements
  • 1539/7158 Télévision/Radio numérique terrestre
  • 828/7158 Audiovisuel
  • 4503/7158 Transformation digitale
  • 579/7158 Affaire Global Voice
  • 230/7158 Géomatique/Géolocalisation
  • 585/7158 Service universel
  • 991/7158 Sentel/Tigo
  • 262/7158 Vie politique
  • 2360/7158 Distinction/Nomination
  • 52/7158 Handicapés
  • 1036/7158 Enseignement à distance
  • 1011/7158 Contenus numériques
  • 883/7158 Gestion de l’ARTP
  • 269/7158 Radios communautaires
  • 2557/7158 Qualité de service
  • 636/7158 Privatisation/Libéralisation
  • 199/7158 SMSI
  • 742/7158 Fracture numérique/Solidarité numérique
  • 4176/7158 Innovation/Entreprenariat
  • 1983/7158 Liberté d’expression/Censure de l’Internet
  • 69/7158 Internet des objets
  • 255/7158 Free Sénégal
  • 1107/7158 Intelligence artificielle
  • 291/7158 Editorial
  • 33/7158 Yas

2025 OSIRIS
Plan du site - Archives (Batik)

Suivez-vous