Ce carnet traite des principes et des méthodes de la terminologie ainsi que de techno-langagerie. Yvan Cloutier, terminologue

Rechercher sur ce blogue

Cyber-langagerie

samedi 6 décembre 2008

L'agrégation des contenus ou une recherche structurée

Dans mon billet précédent je traitais du moteur à agrégation de contenus Xclustering. Mednar est un autre moteur qui pré-élague en thèmes et sous-thèmes les résultats d'une recherche. Même si ce moteur n'est pas généraliste (il est médical) certaines de ses particularités méritent d'être soulignées. 

conceptual clustering <->agrégation conceptuelle
Organisation d'objets, d'événements ou de faits en classes caractérisées, au moyen de concepts descriptifs simples. 

CITATIONS
  • Using ... federated search technology from Deep Web Technologies, Mednar accelerates your research by returning the most relevant results from across the World Wide Web, including blogs, wikis, mainstream searches and deep web sources to one, easily navigable page.

    Federated Search <-> Recherche fédérée
    Recherche effectuée en une seule requête dans plusieurs sources de données hétérogènes de différents formats. (GDT)


    Invisible Web <-> Web caché
    Partie du Web correspondant à l'ensemble des documents Web qui ne sont pas indexés par les outils de recherche traditionnels. (GDT)


    COMMENTAIRE
    Un métamoteur qui interroge plusieurs bases de données dans le Web caché (par définition mieux structuré) : voilà une solution face à l'abondance de la toile et à la tendance de plus en plus mercantile des moteurs commerciaux.

  • Each search is done in real-time, searching the sources you select as if you were entering the search term on each individual website yourself. Duplicates are removed, the results weighed for relevance and then ranked according to how closely it matches your search word or phrase.

    ranking <-> classement
    Attribution d'un rang aux pages Web d'un site par un outil de recherche, de façon à ce que, à la suite d'une requête spécifique par mot-clé, les sites les plus appropriés apparaissent les premiers dans la page des résultats. (GDT)

    COMMENTAIRE
    Il suffit de savoir sur quels critères on se base pour identifier les doubles, pour établir le degré de pertinence et pour fixer le degré de proximité entre la requête et le bilan de recherche.  Il y a toujours un jugement machine qui s'insère dans le couple requêtes-résultats d'un moteur de recherche. Dans le cas de ce moteur on peut cependant noter qu'entre la requête et son résultat il y a un souci de se baser sur des règles de référencement reconnues.

  • Each Mednar source is chosen for its outstanding contributions to the medical search world.
  • Dans la recherche avancée, il est possible de choisir le sources consultées. L'une de celles-ci est la World Health Organization. On trouve une liste de sources cochable ici que l'on peut sauvegarder. Il est possible d'être alerté sur des sujets précis. Le formulaire de recherche est muni d'un filtre temporel comprend les champs suivants : plein texte, titre et auteur.
Scénario de recherche

Je recherche « blood test ».  Par défaut le moteur recherche plein texte. Si on veut fait une recherche plus thématisée on peut choisir la recherche avancée et opter pour  « Title ». Ceci fait la différence entre une recherche dans laquelle on veut avoir des mentions contextuelles du terme ou des textes de fond portant sur le terme « blood test ». Remarquer qu'en cochant dans les préférences de sources WHO on ne recherche que dans le site de cette organisation dans lequel il y a éventuellement des bitextes.

Il est possible de ciseler le filtrage du terme puisque l'arborescence à gauche de l'écran se décline jusqu'à trois sous-thèmes, et cela, avant même d'avoir consulté le contenu du bilan de recherche. Une fois le bilan affiché, il est possible de trier par auteurs, par titre et par date, de relancer la requête avec filtrage par sources, de poster le bilan détaillé formaté par courriel et de créer des alertes. Pour aider à choisir les sources à consulter celles-ci sont mentionnées à droite de l'écran et des cases à cocher permettent de les sélectionner.





Noter que certaines options ne sont accessibles que par identification comme c'est le cas par exemple pour « Get Updates on This Search ». Rien n'est vraiment gratuit. 


Ressources

Other free Federated Search Research Sites : 

Scitopia.org- Scitopia.org is a free federated vertical search portal to the digital libraries of leading worldwide science and technology societies.

The Science.gov Alliance- Science.gov is a gateway to over 50 million pages of authoratative selected science information provided by U.S. government agencies, including research and development results.

WorldWideScience.org- WorldWideScience.org is a global science gateway-accelerating scientific discovery and progress through a multilateral partnership to enable federated searching of national and international scientific databases. 

Suivis

À mon sujet

Ma photo
Carleton-sur-Mer, Gaspésie, Canada
Cyber-terminologue