Ce carnet traite des principes et des méthodes de la terminologie ainsi que de techno-langagerie. Yvan Cloutier, terminologue

Rechercher sur ce blogue

Cyber-langagerie

vendredi 31 octobre 2008

jeudi 30 octobre 2008

The MultiSemCor parallel corpus

Mon engouement pour les corpus alignés vous est certainement apparu évident depuis que je publie des messages. J'avais établi dans liste Eurêka un ordre de priorité pour la consultation des ressources lorsqu'un problème terminologique se présente. En voici les grandes lignes :
  1. Banques de terminologie (pour trouver une traduction)
  2. Corpus multilingues alignés (pour trouver une traduction)
  3. Dictionnaires de traduction (pour trouver une traduction)
  4. Dictionnaires généraux définitoires (pour chercher à cerner les concepts)
  5. Les textes spécialisés en ligne ou écrits (pour rechercher un contexte explicatif)
Les textes traduits par des traducteurs professionnels ont une valeur certaine lorsque les problèmes terminologique qu'ils contiennent ont été résolus selon règles de la recherche terminologique, c'est pourquoi je place le corpus alignés au deuxième rang. La mémoire de traduction du monde est devenue gigantesque depuis que le Web existe et on ne peut la négliger. 

MultiSemCor est une corpus aligné de textes anglais<->italien et anglais<->roumain. Je n'ai trouvé aucune mention sur le site qui indique que les textes passent par un moteur commercial avant d'être traités comme c'est le cas par exemple pour les concordanciers WebCorp et WebAsCorpus.

Je ne connais pas de sites qui alignent « live » les bitextes mais ce serait très intéressant que l'on développe ce genre d'interface. Par  « live (en temps réel) » j'entends les applications qui passent par des moteurs commerciaux comme Google ou Alta Vista avant d'établir une liste d'occurrences finale (WebCorp, WenAsCorpus). 

Imaginons par exemple les pages anglaises et françaises des sites du Gouvernement canadien qui, après une interrogation, s'aligneraient à gauche et à droite de l'écran. Il serait alors facile de repérer les traductions « phrases à phrases » en ne perdant rien des subtilités d'expression dans les deux langues.

MultiSemCor est un bel exemple de corpus aligné offrant une intéressante présentation des données réparties et échangées entre les quatre cadres d'un seule page.


Adresse utiles

WebAsCorpus

mercredi 29 octobre 2008

WebAsCorpus.org

Voir aussi mon billet sur WebCorp.
Rechercher dans le Web avec WebAsCorpus me semble plus convivial que de le faire avec Google. Cependant, contrairement à WebCorp qui passe par Google, WebAsCorpus utilise le moteur Live Search de Microsoft.
Voici ce que je retiens des possibilités de ce concordancier qui est susceptible de faciliter le travail des langagiers.
  • son temps de réponse est acceptable, presqu'aussi rapide que Google.

  • il donne accès à des contenus textuels déformatés (sans images, sans scripts, etc.) donc une fois le texte chargé la navigation intra-textuelle se fait beaucoup plus rapidement.

  • options de l'interface :
    @le nombre de caractères avant et après le terme interrogé peut aller jusqu'à 1000 ; sinon on peut accéder au texte complet.
    @le nombre de pages Web que le moteur explore peut être déterminé d'avance soit de 10 à 500.
    @le nombre d'occurrences repérées pour chaque page Web peut être réglé de 10 a 100.
    @le filtre des pays permet de limiter l'interrogation à un ou plusieurs pays.



    Les préférences qui précèdent peuvent être sauvegardées par défaut sur un ordinateur donné pour chaque séance d'interrogation.

  • l'utilisateur peut choisir la langue d'interrogation.

  • le formulaire de recherche avancée comporte des cases d'inclusion et d'exclusion de descripteurs par rapport au terme faisant l'objet de l'interrogation. Il peut être efficace d'inscrire dans ces cases des termes décrivant des domaines généraux afin de limiter le nombre de pages dans le cas de termes polysémiques. La structuration de requêtes avec filtrage par domaines est donc possible comme dans une banque terminologique. Exemple : si on veut trouver les pages portant sur les indiens Cherokee américains et non celles concernant la jeep de marque Cherokee, inscrire le mot « jeep » dans la case Exclude du formulaire de recherche avancée. Beaucoup de formats d'interrogation sont possibles à partir des cases Include et Exclude.

  • le bilan de recherche surligne te terme recherché, exemple : « La bio-informatique est un champ de recherche multi-disciplinaire où travaillent de concert biologistes, informaticiens, mathématiciens et physiciens, dans le but de résoudre un problème scientifique posé par la biologie. Le terme bio-informatique peut également décrire (par abus de langage) toutes les applications informatiques résultant de ces recherches[1]. Cela va de l'analyse du génome à la modélisation de l'évolution d'une population animale dans un environnement donné, en passa... »

  • selon les options sélectionnées le bilan de recherche affiche au début ce qui suit : « Live Search reports 107,000 total hits for "bio-informatique" in French... displaying concordances from up to 50 matching webpages and 30 matches per page, starting with page 1. »

  • affichage des options suivantes au haut de l'écran : « continue this search | zipfile of HTML files | text files | both | search for other concordances 58 docs seen ... when this page is complete, links to download the HTML and / or text files in zipped format will appear above (instant minicorpus!) » donnant la possibilité de constituer un corpus sur un sujet donné.

lundi 27 octobre 2008

WebCorp Linguist's Search Engine (LSE)


Réference et notes

Citation

« WebCorp Linguist's Search Engine is a specially tailored search engine for the study of language on the web. Due to the inadequacies of commercial search engines for studying language on the web it was obvious that a specialised search engine, understanding these needs, is required. 

Armed with years of knowledge in the field of corpus linguistics we developed the WebCorp prototype, which uses commercial search engines to extract results from the web and organises the information for linguistic study. Due to the limitations of the prototype we know that a fully-tailored linguistic search engine, built from top to bottom with these needs in mind, is necessary. We are currently developing the WebCorp Linguist's Search Engine to fulfil this need.  

WebCorp LSE is a search engine formed from a unique architecture to facilitate linguistic study of the web. Web content is downloaded, processed and stored to eventually form a 10 billion word corpus. Source.
 »

Commentaire

Bien que les objectifs des auteurs du LSE soient plutôt du côté de la linguistique informatique, on retrouve ici un intérêt certain pour une forme d'utilisation des outils du Web axée sur les besoins des langagiers. 


dimanche 26 octobre 2008

Concordancier du journal Le Monde

« Bienvenu au concordancier "Le Monde". C'est un outil linguistique gratuit. Le concordancier peut être utilisé à la fois comme un vérificateur d'orthographe, une banque lexicographique des collocations, ou encore comme un recueil des paradigmes morphologiques et de leurs réalisations contextuelles. »

Mon commentaire : la notoriété de la publication et la variété des sujets d'actualités traités apportent une valeur certaine à ce corpus.



Bien que le format de sortie ne soit pas très polyvalent le moteur donne tout de même accès à l'essentiel. Par contre il est impossible d'accéder au texte original. Personnellement je ne comprends pas l'utilité des boutons suivants :






http://www.bultreebank.org/french/login.html

lundi 20 octobre 2008

WebCorp Live et Wapiti


WebCorp est en ligne depuis longtemps mais avait des problèmes de temps de réponse. Étant donné le nombre d'opérations qu'il doit effectuer à la suite d'une requête et son taux de fréquentation il n'arrivait pas à satisfaire la demande. La version actuelle que les auteurs décrivent comme : « An improved version of the original WebCorp, designed to search the web for concordances in real time » est effectivement plus rapide et vaut la peine d'être utilisée.

Voir la liste des améliorations apportées ici.

WebCorp est un concordancier que Wikipedia définit comme suit : « Le concordancier ou logiciel de concordance est un outil de référence très utile aux linguistes qui permet de faire la recherche dans un corpus d'un mot accompagné de son contexte, que ce soit pour attester son usage ou l'étudier. » Le concordancier est un outil inégalé pour déterminer le sens des termes à traduire. Dans le cas de WebCorp l'attrait est que l'on se sert de la puissance de Google et des autres moteurs pour les adapter à une interrogation plus langagière.

Voici des citations sélectionnées du menu d'aide de WebCorp :

« WebCorp is a suite of tools which allows access to the World Wide Web as a corpus - a large collection of texts from which facts about the language can be extracted. »

Mon commentaire : il n'y a pas de corpus plus vaste que celui du Web et le fait de pouvoir l'interroger avec un concordancier est vraiment un atout. Cet outil est plus polyvalent que l'interface des moteurs courants puisqu'il présente comme résultat le mot ou l'expression interrogés dans leur contexte (sans les images, etc.). Une sélection peut être faite du nombre de mots en aval et en amont du terme interrogé (20 mots, maximum de mots ou la phrase est entièrement affichée).








« WebCorp works 'on top of' the search engine of your choice, taking the list of URLs returned by that search engine and extracting concordance lines from each of those pages - examples of your chosen word or phrase in context. All of the concordance lines are presented on a single results page, with links to the sites from which they came ... »

Voici un exemple d'interrogation dans WebCorp :

http://en.wikipedia.org/wiki/Heat_detector
Plain Text Word List
  • Wikipedia, the free encyclopedia Jump to: navigation, search Mechanical heat detector, both rate of rise and fixed temperature operation. A heat detector is a device that responds to changes in ambient temperature. Typically, if the ambient temperature rises above a predetermined threshold
  • normal baseline condition. Any sudden temperature increase that matches the predetermined alarm criteria will cause an alarm. This type of heat detector can react to a lower threshold condition than would be possible if the threshold were fixed. A typical alarm may
  • detectors are not meant to replace smoke detectors in the bedrooms or in the hallway outside of the bedrooms. A heat detector will nonetheless notify of a fire in a kitchen or utility area (i.e., laundry room, garage, or attic), where
  • detectors are not interconnected, heat activation identifies the location of the fire, facilitating evacuation from the home. Each type of heat detector has its advantages, and it cannot be said that one type of heat detector should always be used instead of
  • that one type of heat detector should always be used instead of another. If you were to place a rate-of-rise heat detector above a large, closed oven, then every time the door is opened a nuisance alarm could be generated due to
  • fixed threshold detector would probably be best. If a room filled with highly combustible materials is protected with a fixed heat detector then a fast-flaming fire could exceed the alarm threshold due to thermal lag. In that case the rate-of-rise heat detector
  • heat detector then a fast-flaming fire could exceed the alarm threshold due to thermal lag. In that case the rate-of-rise heat detector may be preferred. [edit] See also Fire alarm Flame detector Aspirated smoke detector Carbon monoxide detector Manual
Mon commentaire : les coupures de textes qui précèdent proviennent de pages Web. Le terme demandé est en contexte et selon le format de sortie choisi le texte peut être plus ou moins brut (en partcilulier format .txt). À remarquer les deux formats de sortie : Plain Text et Word List. Ce dernier format génère un liste de la fréquence d'emploi des mots dans le texte.








Dans l'exemple qui précède, toutes les occurrences du terme interrogé « heat detector » sont hyperliées et cliquables. Chaque lien renvoie à tout le texte original dans lequel le terme est mis en surbrillance. Voici un exemple :

« Each type of heat detector has its advantages, and it cannot be said that one type of heat detector should always be used instead of another. If you were to place a rate-of-rise heat detector above a large, closed oven, then every time the door is opened a nuisance alarm could be generated due to the sudden heat transient. In this circumstance the fixed threshold detector would probably be best. If a room filled with highly combustible materials is protected with a fixed heat detector then a fast-flaming fire could exceed the alarm threshold due to thermal lag. In that case the rate-of-rise heat detector may be preferred. »

Voici d'autres textes du menu d'aide de WebCorp :

« WebCorp is designed to retrieve linguistic data from the Web: concordance lines showing the context in which the user's search term occurs. In response to a user query, standard search engines return a list of URLs (page addresses), along with a description of or some text from each page to help the user decide which pages are most useful. To view the pages, the user must click on each of the links individually ... »

« Google is an excellent search engine but it is not designed as a corpus linguistics tool and is not ideal for this purpose. WebCorp contains options (customisable concordance span, output format, etc) specifically designed for linguistic research. »

Mon commentaire : WebCorp utilise des métacaractères (wildcards) très utiles pour l'interrogation terminologique. On trouvera une liste et des explications ici. Google offre de moins en moins de possibilités pour l'interrogation terminologique par l'utilisation de certains tiers entre le moment du lancement de la requête et la présentation du bilan. Pour ne citer qu'un exemple Google ne tient pas compte des majuscules, ce qui n'est pas le cas pour WebCorp.





Dans le but de limiter l'interrogation à une domaine précis, il est possible possible d'utiliser des filtres.

« Site Domain: This option, when used with the Google, AltaVista, Live Search or Ask search engines, allows you to restrict your search to all of the pages on an individual website or all sites with a given domain.

To search all of the pages on an individual site enter the URL without the 'http://' part. For example, enter www.bbc.co.uk to search all pages on the BBC web site.

To restrict the search to sites with a given domain, enter part of a URL. For example, entering .ac.uk will restrict the search to UK academic institutions, while entering .fr will restrict the search to web sites in France.

Newspaper Domains: This option allows you to restrict your search to a pre-defined set of newspaper websites (currently UK broadsheets, UK tabloids, French newspapers, US newspapers). If selected, these choices override any filter entered into the Site Domain box.

Textual Domain: This option allows you to restrict your search to web pages included in a particular category in the Open Directory (the Yahoo-like web index at http://www.dmoz.org). »
















Le menu d'aide de WebCorp est à découvir je vous invite à le lire pour mieux profiter de cet outil très utile.


Et Wapiti alors ! Wapiti est un navigateur qui permet d'afficher trois pages différentes en même temps de manière à pouvoir comparer des données terminologiques. On peut télécharger Wapiti ici. Voici une manière de combiner WebCorp et Wapiti qui peut être intéressante.

Afficher Wapiti en mode deux fenêtres avec WebCorp à gauche et à droite.



Le terminologue qui rédige une fiche multilingue doit attester l'équivalence des termes en se basant sur la correspondance des définitions dans chacune des langues. Il est donc possible avec l'affichage qui précède de rechercher des occurrences du terme de la langue de départ et de les comparer avec des équivalents possibles de la langue d'arrivée à droite. Exemple : on peut déduire par exemple que l'équivalent possible de « bookmark list » est « liste de signets » : demander les deux termes à gauche et à droite afin de repérer des définitions ou contextes que l'on peut recouper.

http://www.webcorp.org.uk/wcadvanced.html?

portail de recherche terminologique

Le Portail de recherche terminologique Eurêka que je créais en 2006 est ici

Il n'a pas été mis à jour depuis au moins deux ans. J'ai intention de le relancer en apportant des corrections à l'interface de présentation et au contenu. Je pense qu'il est très important de collectionner les nombreuses ressources terminologiques disséminées sur le Web et surtout de les rassembler dans une seule page afin de rendre leur consultation plus conviviale.

Concernant l'interface il me semble que la présentation actuelle (ou tout autre qui pourrait y ressembler) est efficace, le principe étant « choisissez votre ressource terminologique dans le cadre gauche et affichez-la dans le cadre droit pour l'y consulter ».

Un affichage monopage est à mon avis plus utile qu'une liste de signets à cause du nombre réduit de manipulations de la souris et du clavier. La portail de recherche terminologique accessible dans le lien ci-haut m'apparaît sans égal du point de vue de facilité de consultation ; si quelqu'un a d'autres idées, prière de faire un commentaire dans la section commentaire de cette page.

Je suis personnellement constamment à la recherche de ressources langagières pour les besoins de la liste Eurêka. D'autres membres diffusent aussi des adresses fort utiles dans la liste. Dans toute cette abondance il importe de colliger, d'ordonner, de mettre à jour, etc. 

Je pense aussi qu'il faut se servir de la force que représente les 700 membres de la liste Eureka et offrir dans cette page multi-interrogations un formulaire qui rende plus facile la soumission de ressources à inclure dans le portail. Une seule personne ne peut arriver à circonscrire aujourd'hui les ressources du Web, même pour un sujet précis, c'est pourquoi la collaboration de tous est capitale.

Sur le contenu je compte me limiter aux ouvrages exclusivement langagiers comme les banques de terminologie, les dictionnaires généraux unilingues ou multilingues, etc. et laisser tomber certains sites actuellement dans le portail.

Mon but ultime est que cette page devienne naturellement par son efficacité «la page préférée » des langagiers.

Je vous invite à faire vos commentaires sur ce sujet qui m'apparaît comme très important.

-----------------------------------------

Abonnez-vous à la liste Eureka  



jeudi 16 octobre 2008

Robert Dubuc, père de la terminologie au Canada

Je reproduis ici des extraits de l'allocution de Robert Dubuc à
l’occasion de la Journée mondiale de la traduction.
M. Dubuc a parlé de la passion des pionniers de la terminologie pour leur profession et de la nécessité de veiller au grain pour éviter le babélisme.

« Ces deux initiatives [la création de l’Office de la langue française et du Comité de linguistique de Radio-Canada] ont entraîné une fièvre d’actualisation du français d’ici et une prise de conscience de la nécessité de le mettre au diapason du français utilisé ailleurs dans le monde. Il est vite devenu évident que cette opération de mise à jour n’était pas réalisable sans un travail terminologique systématique et rigoureux. Il fallait pouvoir nommer en français les réalités du monde professionnel, technique et administratif. »

« Ce besoin de l’efficacité de la communication a été à l’origine des mouvements de normalisation et de mise en ordre des terminologies. Les terminologues ont ressenti plus que quiconque les risques du babélisme au sein des langues de spécialité. Aussi ont-ils été à l’origine des comités de terminologie dans de nombreux domaines : comptabilité, relations professionnelles, droit, médecine, pharmacologie et autres. Dans ces comités, terminologues et spécialistes ont joint leurs efforts pour rationaliser leur terminologie. »

« Le premier effet [de la terminologie] est, sans contredit, la création d’une école de terminologie dont le rayonnement s’est fait sentir de par le monde. Cette école se distingue d’abord par son enracinement dans la réalité même des spécialités en intégrant les spécialistes au travail terminologique, ensuite par l’importance accordée à la situation de communication et enfin par la nécessité de la validation rigoureuse des données. »

« Un dernier effet a été l’encadrement professionnel de la pratique au sein des professions langagières, grâce auquel la terminologie est devenue une profession dûment reconnue. »

« La grande révolution dans le travail terminologique est sans conteste l’arrivée de l’informatique et de son rejeton Internet. Ces innovations technologiques ont non seulement permis l’accélération du travail de recherche, mais encore ont donné un accès illimité à la documentation et ouvert des possibilités inespérées de diffusion et d’utilisation des données terminologiques. »

« Par contre, elles comportent aussi des risques. Elles donnent également accès au meilleur et au pire et, tentation de la facilité aidant, on peut escamoter volontiers la validation des sources. Il peut s’en suivre l’implantation d’une terminologie de calque qui risque de parasiter et même de détruire la terminologie de souche. Le cas échéant, il en résulterait un babélisme insidieux, car il est dans la nature même des langues de nourrir leurs terminologies de leur humus culturel. De ce fait, la transparence interlangue des termes devient impossible. »

« Prenons un exemple terre à terre emprunté au vocabulaire des outils de cuisine. La petite brosse dont on se sert pour recueillir les miettes laissées sur la nappe par les convives s’appelle en anglais silent butler. On décèle dans ce terme l’importance accordée aux serviteurs dans la culture anglo-saxonne. En français, ce dispositif se nomme ramasse-miettes, terme qui met l’accent sur sa fonction. Le calque, dans l’un ou l’autre sens, n’aurait plus aucun enracinement réel. La terminologie de calque connote donc une artificialité difficilement compatible avec la vie du langage. Les terminologies doivent avoir un nécessaire enracinement culturel. »

« Pour conjurer ces dangers, tout en profitant des avantages de la technologie informatique, il faut pouvoir compter sur des terminologues bien formés et tout aussi passionnés que les pionniers. »

« Il faut donc lancer à la relève le défi de la passion! »


SOURCE : dermier bulletin de nouvelles de l'OTTIAQ (L'antenne)

Dépouillement terminologique machine














Je me souviens il y a quelque années d'avoir assisté à une démonstration du logiciel Nomino qui m'avait beaucoup impressionné. Ce dépouilleur peut consigner en un temps record les unités terminologiques d'un texte sans aucune intervention humaine.

Voici des exemples d'unités terminologiques relevées par Nomino :

volaille
volaille_cuite
volaille_d_élevage
volaille_domestique
volailles_domestiques
volailles_domestiques_infectées
volailles_infectées
------
maladie_fréquente
maladie_infectieuse
maladie_respiratoire
maladie_respiratoire_fréquente
--------------------

influenza_aviaire
influenza_aviaire_H5N1
influenza_H5N1

---------------------------

pandémie
pandémie_de_grippe
pandémie_de_grippe_aviaire

------------------------------


Dans ces exemples on peut voir en gras des unités terminologiques pertinentes qui pourraient faire l'objet d'un choix humain. Tout de même impressionnant pour une machine !

Sur les bitextes et les multitextes

Les bitextes et les multitextes sont des sites qui permettent une navigation multilingue et en texte intégral. Les pages multitextes contiennent des libellés hyperliés vers une ou plusieurs langues d'arrivée. Ils sont souvent présentés sous forme de moteurs de recherche, à navigation thématisée ou par mots clés, qui repèrent les termes dans des pages où on trouve des liens qui conduisent aux pages équivalentes dans diverses langues d'arrivée. Le site du moteur de recherche principal du Gouvernement canadien est un excellent exemple de ce type d'interface.

L'avantage des multitextes par rapport aux sites spécifiquement langagiers comme les banques de terminologie et les dictionnaires est que l'on y a accès à tout le texte (tournures de phrases, phrasèmes, périphrases, etc.) et non pas seulement à certaines parcelles de textes idélimitées par les règles de rédaction d'une fiche terminologique. Dans la plupart des banques de terminologie et dictionnaires les fiches sont produites à partir d'un découpage de texte qui prive l'utilisateur du macrocontexte.


Les multitextes devraient être interrogés après les banques de terminologie du point de vue de l'importance à accorder aux ressources lors d'une démarche terminologique visant à trouver des équivalents.

mercredi 15 octobre 2008

Le travail concret du terminologue

Note : Les citations (entre guillemets et en italiques) de ce texte proviennent de la publication suivante : Le Pavel, didacticiel de terminologie une publication du Bureau de la traduction sur les méthodes de recherche terminologique utilisées par cet organisme.

«La terminologie est une branche multidisciplinaire de la linguistique appliquée qui étudie les concepts et leur représentation en langues spécialisées. »

Le travail du terminologue commence souvent lorsque les dictionnaires généraux (Petit Robert, Larousse) ne donnent pas de solutions satisfaisantes aux usagers d'une langue qui doivent, dans les domaines spécialisés, décrire la réalité. On peut penser par exemple au terme « signet » dont le sens s'est étendu par analogie au marquage d'une page Web. Ce terme n'est pas apparu immédiatement dans les dictionnaires généraux mais plutôt dans les banques de terminologie dont la mise à jour est instantanée.

Le terminologue doit sans cesse suivre l'évolution de la langue qui décrit une réalité qui change constamment. Le terminologue doit consigner tous les néologismes de sens et tous les néologismes lexicaux au profit des traducteurs qui sont sur la ligne de feu de la langue spécialisée. Voici essentiellement en quoi consiste le travail du terminologue :

  • « délimiter et extraire les unités terminologiques dans une documentation spécialisée sélectionnée selon des critères communément acceptés dans le domaine d'emploi concerné
  • établir des dossiers terminologiques pour les termes repérés en vue d'élucider les cas problèmes
  • analyser les caractéristiques des concepts désignés par ces termes et les structurer en systèmes conceptuels
  • rédiger des définitions concises et précises pour les concepts ainsi systématisés
  • participer dans des comités de normalisation qui adoptent par consensus les termes recommandés pour chacun des concepts étudiés
  • créer des produits terminologiques (fiches, normes, vocabulaires, bases de données) pour partager et diffuser la terminologie retenue ou recommandée »
Le terminologue est un enquêteur de la langue spécialisé, il constate l'usage, il l'atteste. Concrètement il effectue les tâches suivantes :

  • « le dépouillement terminologique de textes spécialisés,
  • le repérage de termes,
  • la recherche terminologique ponctuelle ou thématique,
  • l'établissement de dossiers terminologiques aux fins de la normalisation,
  • le travail en comité de normalisation,
  • l'enregistrement systématisé des données pertinentes sur des fiches terminologiques,
  • la gestion de contenus terminologiques et leur diffusion. »

Ferdinand de Saussure

Ferdinand de Saussure, linguiste suisse, fait la distinction entre la langue, le langage et la parole.

La langue est l'ensemble des signes linguistiques ou l'empreinte psychique du mot (mots écrits ou parlés, phonèmes, intonations, lettres) utilisés par les usagers. Le langage est la faculté de pouvoir s'exprimer au moyen de signes. La parole est l'utilisation concrète des signes linguistiques dans un contexte précis. De la parole d'un ensemble d'individus provient le langage social et culturel d'une communauté à partir d'un système arbitrairement établi de signes que l'on nomme la langue.

Saussure a traité de l'arbitrarité du mot. Ce n'est que par convention que le mot « table » désigne la notion que l'on connaît. Le jumelage du signifiant et du signifié n'a de valeur que si les usagers d'une langue le reconnaissent. Ils doivent aussi accepter les règles qui régissent les relations entre les mots c'est-à-dire la syntaxe, la grammaire, etc..

La grande innovation de Ferdinand de Saussure a été de distinguer le signifiant et le signifié. Le signifié est le concept c'est-à-dire la représentation mentale d'une chose, ce qui fait qu'on peut savoir ce dont il s'agit sans être en présence concrète de cette chose. Le signifiant c'est le mot écrit ou parlé qui nous permet de communiquer des signifiés. Le signifiant et le signifié sont étroitement reliés et destinés à véhiculer les messages qui permettent la communication.

lundi 13 octobre 2008

Souvenirs d'une époque

Les principes de base de la terminologie n'ont pas réellement changés. Les moyens pour accomplir le travail du terminologue ont cependant beaucoup évolués.

Je me souviens de mes premiers pas comme terminologue au Bureau de la traduction. Parallèlement à des cours de terminologie timidement structurés, nous relisions les fiches cartonnées de traducteurs afin de créer un fonds terminologique pour la première version de TERMIUM. Nous étions jeunes et notre passion était grande à l'idée d'être les initiateurs d'une des premières banques de terminologie au monde. Chaque traducteur avait alors son propre fichier personnel annoté et le but de la banque était de mettre le travail de recherche terminologique de chacun à la portée de tous. Il paraît illogique, au niveau d'une organisation, de ne pas pouvoir profiter du travail, de l'expérience et des compétences de tous.

samedi 11 octobre 2008

Buts et objectifs de ce carnet

Ce carnet traite de la terminologie dans ses principes et ses méthodes. Il pourrait donc répondre à la question suivante : Qu'est-ce que la terminologie ? Comme il est impossible aujourd'hui d'être terminologue sans passer par le Web une grande place sera faite à la techno-langagerie. Yvan Cloutier, terminologue

Suivis

À mon sujet

Ma photo
Carleton-sur-Mer, Gaspésie, Canada
Cyber-terminologue