Du point de la recherche d'équivalents, les bitextes sont beaucoup plus
prolifiques que les banques de terminologie. La raison est que les textes
explicatifs « tronqués » servant à attester les fiches dans les banques de
terminologie sont « découpés » à partir de mégatextes inaccessibles lors de
l'interrogation.
Les bitextes donnent accès à l'intégralité des contenus comme le mentionnent
Claude Bédard et Catherine Arrouart : « Un bitexte constitue en quelque
sorte un «lexique dilué», qui contient implicitement d'innombrables fiches
qu'on n'a jamais pris de temps de créer. Prenant ainsi le relais du fichier
terminologique en bonne et due forme, le bitexte participe à une petite
révolution... On peut puiser dans un bitexte de précieux renseignements de
linguistique et de stylistique contrastives (comment on s'exprime dans tel
domaine, tournures stéréotypées, préférences de tel client, solutions de
traduction, etc.). » (Revue Circuit, numéro 73, automne 2001, p. 30)
Les bitextes existent en quantité impressionnante sur le Web, lieu
incontournable de diffusion des connaissances. Les auteurs de pages Web
doivent avoir recours de plus en plus à la traduction afin de défoncer les
barrières linguistiques sur la toile qui, par définition, se veut sans
frontières. La langue est un obstacle qui résiste encore à l'universalité du
Web, d'où l'offre croissante des travaux de traduction et la prolifération
des logiciels et applications langagiers.
Certes, l'apport des bitextes dans le processus de recherche terminologique
s'impose dans la mesure où la qualité des traductions est assurée. Or la
plupart des grandes organisations mondiales ainsi que certaines sociétés
d'importance ont leur propre services de traduction et de terminologie qui
veillent à la qualité des textes.
Ce qui caractérise la mémoire de traduction du Web c'est qu'elle contient un
langage qui décrit de très près une réalité en perpétuel mouvement. Le Web
n'est-il pas le lieu par excellence de l '« actualité » qui change au même
rythme que les découvertes scientifiques et techniques. La langue du Web
constitue un gigantesque corpus archivé qui témoigne de la vitalité de la
langue.
Les moteurs de recherche indexent constamment le Web : la même page
interrogée deux fois peut avoir été modifiée et Google en tiendra compte
dans les résultats. Les moteurs générateurs de bitextes ne font pas
exception.
À ce titre, le principal avantage de Wapiti sur les mémoires de traduction
est qu'il permet d'interroger « en temps réel » les bitextes plutôt que des
bitextes « déconnectés » stockés dans des bases de données.
Wapiti a été conçu par des langagiers dans le but de faciliter la
comparaison et l'alignement de contenus, la recherche terminologique, la
révision ainsi que le travail de traduction en général. Certaines de ses
fonctions sont identiques à celles que l'on retrouve dans les navigateurs,
le but de ses concepteurs étant qu'il devienne autant que possible un
navigateur langagier.
*Le mot « bitexte » est employé ici dans le sens des textes traduits bien
qu'habituellement il s'agisse de textes traduits alignés automatiquement. »
SITE DE TÉLÉCHARGEMENT DE WAPITI
http://wapiti.net.googlepages.com/download_wapiti_split_browsers