Ce carnet traite des principes et des méthodes de la terminologie ainsi que de techno-langagerie. Yvan Cloutier, terminologue

Rechercher sur ce blogue

Cyber-langagerie

dimanche 2 novembre 2008

Une mémoire de traduction gigantesque sur le Web, les bitextes

Du point de la recherche d'équivalents, les bitextes sont beaucoup plus

prolifiques que les banques de terminologie. La raison est que les textes

explicatifs « tronqués » servant à attester les fiches dans les banques de

terminologie sont « découpés » à partir de mégatextes inaccessibles lors de

l'interrogation. 


Les bitextes donnent accès à l'intégralité des contenus comme le mentionnent

Claude Bédard et Catherine Arrouart : « Un bitexte constitue en quelque

sorte un «lexique dilué», qui contient implicitement d'innombrables fiches

qu'on n'a jamais pris de temps de créer. Prenant ainsi le relais du fichier

terminologique en bonne et due forme, le bitexte participe à une petite

révolution... On peut puiser dans un bitexte de précieux renseignements de

linguistique et de stylistique contrastives (comment on s'exprime dans tel

domaine, tournures stéréotypées, préférences de tel client, solutions de

traduction, etc.). » (Revue Circuit, numéro 73, automne 2001, p. 30)


Les bitextes existent en quantité impressionnante sur le Web, lieu

incontournable de diffusion des connaissances. Les auteurs de pages Web

doivent avoir recours de plus en plus à la traduction afin de défoncer les

barrières linguistiques sur la toile qui, par définition, se veut sans

frontières. La langue est un obstacle qui résiste encore à l'universalité du

Web, d'où l'offre croissante des travaux de traduction et la prolifération

des logiciels et applications langagiers.


Certes, l'apport des bitextes dans le processus de recherche terminologique

s'impose dans la mesure où la qualité des traductions est assurée. Or la

plupart des grandes organisations mondiales ainsi que certaines sociétés

d'importance ont leur propre services de traduction et de terminologie qui

veillent à la qualité des textes.


Ce qui caractérise la mémoire de traduction du Web c'est qu'elle contient un

langage qui décrit de très près une réalité en perpétuel mouvement. Le Web

n'est-il pas le lieu par excellence de l '« actualité » qui change au même

rythme que les découvertes scientifiques et techniques. La langue du Web

constitue un gigantesque corpus archivé qui témoigne de la vitalité de la

langue.


Les moteurs de recherche indexent constamment le Web : la même page

interrogée deux fois peut avoir été modifiée et Google en tiendra compte

dans les résultats. Les moteurs générateurs de bitextes ne font pas

exception.


À ce titre, le principal avantage de Wapiti sur les mémoires de traduction

est qu'il permet d'interroger « en temps réel » les bitextes plutôt que des

bitextes « déconnectés » stockés dans des bases de données.


Wapiti a été conçu par des langagiers dans le but de faciliter la

comparaison et l'alignement de contenus, la recherche terminologique, la

révision ainsi que le travail de traduction en général. Certaines de ses

fonctions sont identiques à celles que l'on retrouve dans les navigateurs,

le but de ses concepteurs étant qu'il devienne autant que possible un

navigateur langagier.


*Le mot « bitexte » est employé ici dans le sens des textes traduits bien

qu'habituellement il s'agisse de textes traduits alignés automatiquement. »



SITE DE TÉLÉCHARGEMENT DE WAPITI

http://wapiti.net.googlepages.com/download_wapiti_split_browsers

Aucun commentaire:

Suivis

À mon sujet

Ma photo
Carleton-sur-Mer, Gaspésie, Canada
Cyber-terminologue