Structuration de l’analyse sémique

En dépit des notions de dimension, de domaine et de taxème, le grand problème de l’analyse sémique paraît être de disposer de règles, de repères permettant de construire les sémèmes de façon à peu près homogène et systématique.

Robert Martin a bien montré le caractère souvent approximatif de l'analyse sémique.

Les approximations de l'analyse sémique selon Robert Martin

Une analyse des définitions données dans les dictionnaires fait apparaître une multiplicité de techniques utilisées pour donner le sens des mots, différences de techniques qui peuvent révéler des différences de contenu.

Robert Martin distingue ainsi deux grandes catégories de définitions : les définitions métalinguistiques, qui consistent dans un commentaire sur le signe linguistique, (ex.: définitions commençant par des formules du type "se dit de...", "marque...", "exprime...", "En parlant de...") et les définitions paraphrastiques qui portent sur les contenus, sur les désignations, qui constituent la grande majorité des définitions.

Les définitions paraphrastiques, contrairement aux définitions métalinguistiques, permettent sans trop de difficulté la substitution dans la phrase du mot de référence par sa paraphrase. Néanmoins, la paraphrase dissimule des formes logiques variées. Ainsi :

  • l'hyperonymie définit un terme par rapport à un autre de niveau de généralité plus élevé, tel que ce qui est vrai pour le plus général est également vrai pour le plus spécifique. On appelle hyperonyme d'un vocable D un vocable d tel que la substitution de d à D dans p, sans autre modification, conduit à une phrase q telle que p implique q (p  q). Ainsi le verbe aguicher se définit par rapport au verbe provoquer.

  • La synonymie définit un terme par un autre dont la signification est strictement ou presque identique.

  • L'antonymie définit un terme par son contraire.

  • La conjonction ou intersection définit un terme à partir de deux autres termes, ou plus. Voler résulte à la fois du fait de se soutenir dans l'air au moyen d'ailes et d'y effectuer un déplacement. De même circuler est équivalent à aller et venir, la notion d'orientation étant absente de la définition du verbe circuler.

  • La définition comme partie (et non comme élément) d'un ensemble. Ex. bras comme partie du corps, manche comme partie d'un habit,...

  • La définition par énumération, que l'on pourrait qualifier d'extensionnelle. En fait, il s'agit d'un type de définition par hyponymie consistant énumérer les termes se trouvant dans la dépendance de l'hyperonyme. Ainsi les membres du corps humain comportent entre autres les pieds et les mains. Et les pieds et les mains sont des membres du corps humain.

  • La définition dérivationnelle se fonde sur l'analyse morphologique. Ainsi la jovialité est dérivée par nominalisation de l'adjectif jovial. L'adjectif juridictionnel est dérivé du nom juridiction.

Nous ne sommes pas certain que l'inventaire de Robert Martin soit tout à fait exhaustif. On pourrait y ajouter une distinction entre des définitions à caractère descriptif telles que toutes celles qui viennent d'être énoncées et des définitions fonctionnelles, définissant un objet non par ses caractéristiques mais par son usage. Un tournevis sera ainsi un outil servant à visser une vis dans un matériau, ce qui permet d'englober dans une même catégorie le tournevis manuel et le tournevis électrique.

De cette profusion de techniques ou d'usages définitoires, on peut déduire assurément que les traits définitoires tels que l'on pourraient les extraire des définitions des dictionnaires ne permettent pas de construire directement un lexique structural assis sur des traits sémantiques stables et universellement admis.

Faut-il partager le jugement que portait en 1972 (p. 184) Georges Mounin sur l'état de la recherche sémantique?

"On peut affirmer que le point qui reste le plus faible est l'analyse du signifié de l'unité lexicale minimale : monème (ou mot dans certaines théories). Tout le monde convient, après Hjelmslev, que cette analyse est la condition première de toute construction d'un dictionnaire structural du lexique, ou de toute structuration du lexique sous une autre forme. Mais les "atomes opérationnels sémantiques" de Ceccato, les marqueurs et les différenciateurs sémantiques de Katz et Fodor, les "unités minimales de sens" des sémanticiens soviétiques ne sont rien d'autre et rien de plus que les traits sémantiquement distinctifs de Bloomfield à Prieto, que les figures de contenu de Hjelmslev. Ces atomes de contenu ne dépassent guère le genre prochain et la différence spécifique des définitions d'Aristote (jument =cheval + femelle, etc.); et surtout les procédures esquissées pour les extraire n'ont guère vraiment fait de progrès linguistiquement parlant. Or, ce sont des critères linguistiques qu'il faudrait trouver pour cette analyse de base."

Si l'on définit l'analyticité comme étant la propriété d'un énoncé exprimant une relation qui est vraie pour tout locuteur, indépendamment de la situation, en tout lieu et en tout temps, pour R. Martin, l'analyticité n'est pas strictement déterminable. "La définition, du fait de la diversité de ses formes et la variabilité de ses contenus, confère à l'analyticité un caractère imprécis; cela revient à dire que les conditions de vérité constituent des sous-ensemble flous, que les signes linguistiques sont le lieu de propriétés inégalement pertinentes,..."

Ainsi, même si l'on parvient à mettre un peu d'ordre dans la diversité des formes définitoires recensées, ce que nous croyons possible, il y a une part d'arbitraire dans le fait de retenir un contenu plutôt qu'un autre pour un terme donné. Le choix n'est sans doute pas illégitime, et les auteurs de dictionnaires sont bien obligés de le faire. Sans que soit mis en question la légitimité des dictionnaires, la pertinence des choix effectués sera toujours relative.

Entre autres sources du flou du sens du signe linguistique, il y a les hésitations des linguistes eux-mêmes à identifier de manière certaine les oppositions entre vocables, et Martin de citer l'exemple de émeute, soulèvement et insurrection. "En général l'émeute paraît plus spontanée, plus localisée1. Mais ailleurs elle est vue sans plus comme un "soulèvement populaire"2. Ici insurrection et émeute sont définies par soulèvement3. Ailleurs, le soulèvement apparaît comme un "début de révolte4",...

Autre difficulté sur le chemin de la construction d'un dictionnaire sémique ou structural : le fait que les dictionnaires sont, par structure, voués dans les définitions qu'ils donnent à la circularité. Comment pourrait-il en être autrement puisque les termes du dictionnaire sont définis par d'autres termes qui sont eux-mêmes définis dans le dictionnaire à l'aide des autres termes du dictionnaire ?

Seul le choix de vocables primitifs, donnés a priori, permettrait de sortir du cercle. Ainsi en partant de l'exemple des mots les plus généraux se rapportant à la perception du son : entendre, ouïe, audible, son, auditif, acoustique, oreille, R. Martin propose de ne retenir comme termes primitifs ou noèmes que perception, capacité, organe ou partie du corps, son et non harmonique, à partir desquels les autres peuvent être définis, le noème son occupant une place centrale dans le dispositif. Par le choix du noème son, dit R. Martin, "le graphe à boucle est devenu arborescence. La voie s'ouvre ainsi à une axiomatisation lexicale." (1992 p. 98)

Toutefois R. Martin émet des réserves sur la légitimité de la traduction des noèmes par des vocables du lexique. En effet, le noème son ne correspond pas au mot son. Dans tous ses emplois en langue, le mot son va prendre des significations différentes du noème. En changeant de sens en fonction de son contexte d'énonciation, le mot son cesse d'être un noème. "Dans tous ses emplois le mot son a une valeur résultative et suppose une médiation instrumentale : ainsi le cristal n'a pas de son en soi; en parlant du son du cristal, on suppose qu'il a été heurté (légèrement!); c'est ce heurt qui le rend sonore. On fait du bruit, on ne fait pas de son. Mais quelque chose rend un son ou on en tire un son. Si donc les noèmes étaient (au moins partiellement) des universaux, de toute manière il n'en irait pas de même des vocables dont, par facilité, on leur attribue la forme, et dont les signifiés sont toujours plus complexes."(opus cit.)

B. Pottier rejoint tout à fait l'observation de R. Martin. En effet, pour B. Pottier, le noème n'appartient pas au domaine de la linguistique mais relève du niveau conceptuel.

"Le noème est un trait de sens posé indépendamment de toute langue naturelle. Il est absolu (et non relatif à un ensemble) et son existence est décidée par l'analyste."

"La noémique est l'étude de l'ensemble des éléments conceptuels et de leurs relations, considérée comme un instrument d'analyse nécessaire pour décrire le fonctionnement de base de la sémantique des langues naturelles." (Pottier 1992 p. 67-68).

F. Rastier pose à son tour le problème en des termes presque identiques :

"Le caractère circulaire des définitions ne serait regrettable que si l'on voulait constituer la sémantique des langues en une axiomatique qui briserait cette circularité, en négligeant que la relation de définition instaure une équivalence (de modulo conventionnel) mais non une identité." (1994 p. 50)

Nous ne pouvons qu'être d'accord avec F. Rastier en ce que le processus de communication ne nécessite aucunement la construction d'un échafaudage conceptuel supérieur au niveau linguistique, le sens n'existant pas en soi, mais résultant, selon la tradition saussurienne, de la confrontation des signes linguistiques.

Par contre, et nous espérons le démontrer, le traitement informatique impose de sortir de la circularité et de poser les fondements conceptuels de la structuration du lexique. Toute compréhension automatique implique que l'on puisse établir l'équivalence de sens entre des formulations formellement différentes, mais identiques ou équivalentes par leur contenu. Or, il est évident que deux termes synonymes qui seraient définis l'un par l'autre ne peuvent avoir le même sémème, ce qui rend impossible la constatation de leur identité ou de leur équivalence même relative.

Nous rejoignons une préoccupation exprimée vingt ans plus tôt par Georges Mounin lorsqu'il invitait à poursuivre la recherche en sémantique structurale :

"Tenter de déceler la véritable structuration du lexique, et celle des signifiés d'une langue, est donc une entreprise raisonnable; et raisonnable aussi parce que tout, depuis l'apprentissage du lexique par l'enfant jusqu'à l'analyse saussurienne des valeurs, nous suggère que les mots ne sont pas des unités isolées. Mais on peut se demander légitimement si les tentatives structuralistes connues jusqu'ici ont abouti à fournir des résultats aussi solidement acquis que dans les autres domaines linguistiques - et répondre que la structuration du lexique, et moins encore celle de la sémantique, n'ont pas livré leur secret.

"On a cherché ici à vérifier si le lexique d'une langue possède une structuration discernable dans la mesure où il décalquerait une structuration d'un autre ordre, introduite par la praxis humaine dans l'expérience qu'elle se fait du monde non linguistique. Le lexique alors ne serait pas structurable en vertu de ses propriétés strictement linguistiques, pour des raisons propres à la linguistique (sauf dans la zone rarement complète des séries dérivationnelles), mais uniquement parce qu'il serait le reflet plus ou moins exact d'une autre, ou de beaucoup d'autres structures non linguistiques."(1972, p. 161)

Il semble donc qu'il y ait un double accord : sur l'impossibilité d'un système axiomatique unique; et sur l'utilité de concevoir des systèmes noématiques.

"Dans la langue tout est mouvance, tout est flou. Et, du fait même, les axiomatisations possibles sont en grand nombre - aussi artificielles les unes que les autres, ce qui ne signifie d'aucune façon qu'elles soient dénuées d'intérêt, car chacune éclaire le réel sous un certain angle. Mais aucune n'en reflète la véritable complexité." (R. Martin 1992, p. 99)

Cette remarque laisse entière la question de la méthode pour structurer le lexique en évitant un relativisme débridé.

R. Martin nous ouvre plusieurs voies.

La première concerne la mis au jour d'universaux d'expérience. R. Martin se garde bien de parler d'universaux tout court. Il observe à juste titre que certaines notions peuvent apparaître a priori comme des universaux, mais que rien en fait n'en garantit l'universalité. Ainsi la notion de perception correspond plus à une abstraction qu'à une expérience élementaire. On perçoit un son, une image, une odeur, une saveur, mais rien ne dit que la conscience de la perception, notion abstraite, soit elle-même universelle.

D'où l'idée des universaux d'expérience. "Primitifs d'une autre nature, ils ne visent pas, en tant que tels, l'axiomatisation d'un système sémantique. Ils viennent plutôt de l'idée que certaines données du monde, physiques, physiologiques, anthropo-culturelles, exercent sur la vie des hommes une si forte contrainte qu'il est impensable qu'elles ne laissent aucune trace dans la langue. Et ces traces, du fait même, ont toute chance d'être des universaux." (1992, p. 101)

Ainsi, comme exemple, en prenant entendre comme primitif du sous-système de la perception des sons, R. Martin obtient les définitions suivantes qui constituent une arborescence échappant à la circularité :

audible : que l'on peut entendre

son : ce qui est audible

acoustique : qui se rapporte au son

bruit : son + non harmonique

ouïe : capacité (possibilité + être animé) d'entendre

oreille : organe (partie du corps + fonction) de l'ouïe

auditif : qui se rapporte à l'ouïe

La représentation schématique est la suivante :

Schema perception

Ce résultat tangible appelle diverses questions.

Notons d'abord qu'il n'est pas exhaustif. On pourrait ajouter écouter, auditoire, audition, auditorium, écoute, .... Mais cela n'altère pas le principe de la méthode employée.

On sera attentif en second lieu à la nature des relations qui unissent les divers éléments ainsi identifiés.

La relation hyperonymique ou hyponymique est très minoritaire. On la trouve entre son et bruit, indirectement entre oreille et organe, mais précisément organe est étranger au sous-système de perception des sons. On la trouverait entre entendre et écouter si écouter était inclus dans le schéma.

La relation partie de est absente.

Les dérivés syntaxiques sont bien représentés : ouïe, auditif, audible, etc. Mais les dérivés syntaxiques sont porteurs de relations spécifiques que l'on peut retrouver entre deux vocables sans qu'il y ait dérivation. Ainsi, entre ouïe et auditif nous avons la relation "se rapporte à", que l'on retrouve entre son et acoustique alors qu'il n'y a pas entre ces deux termes dérivation syntaxique.

Nous en déduisons que la dérivation syntaxique n'a pas sa place dans la description d'un sous-système sémantique. Par contre, on pourrait utilement rechercher une classification des types de relations qui sont établies entre les divers éléments d'un sous-système sémantique.

Une autre question que l'on peut se poser est de savoir s'il y a équivalence entre le sous-système sémantique ainsi identifié et la notion de taxème telle que B. Pottier et F. Rastier se sont attachés à la définir. Nous reviendrons sur cette question plus loin.

Par ailleurs, au-delà de la question de savoir comment échapper à la circularité, se pose la question de savoir comment il est possible de limiter le nombre de traits sémantiques entrant dans la constitution des sémèmes. R. Martin nous met sur la voie par une analyse extrêmement fine des contenus définitionnels.

R. Martin opère une première grande distinction entre les définitions conventionnelles et les définitions naturelles. (1992, p. 67 et s.)

Les définitions naturelles concernent les objets naturels que sont les vocables du langage ordinaire.

Les définitions conventionnelles sont des définitions a priori ou a posteriori.

Les définitions conventionnelles a priori déterminent, au moment même de la dénomination d'un objet, les caractéristiques qu'on lui assigne. Les définitions mathématiques, logiques, métalinguistiques sont de ce type.

Les définitions conventionnelles a posteriori délimitent conventionnellement le sens, par nature vague, des mots du langage ordinaire lorsque ceux-ci sont voués à un usage technique. Les définitions juridiques et plus généralement les définitions normatives sont de ce type.

Qu'elles soient a priori ou a posteriori, les définitions conventionnelles relèvent d'une activité prescriptive. Elles échappent au jugement de vérité dans la mesure où elles sont vraies par définition. On dit qu'elles sont "analytiquement vraies", c'est-à-dire vraies en vertu de leur sens. Elles échappent aussi à l'évolution du temps, et restent vraies tant qu'elles n'ont pas été remplacées par d'autres définitions. Elles sont dans leur formulation strictement limitées au sens qu'elles posent, aux nécessités de la définition.

A l'inverse, la définition naturelle vise à saisir le contenu des mots. Elle a une vocation descriptive et non prescriptive ou stipulatoire. Elle est plus ou moins juste et évolue avec l'objet qu'elle essaie de cerner. Elle est plus ou moins détaillée dans les propriétés qu'elle recense.

A cet égard, R. Martin distingue la définition minimale qui ne retient que les propriétés qui sont strictement nécessaires à l'identification de l'objet désigné, à la pertinence des traits recensés, et la définition stéréotypique qui vise à donner au-delà de la pertinence linguistique, une représentation de l'objet dénommé suffisante pour en permettre l'identification effective.

Il est évident que pour les besoins d'un dictionnaire destiné au grand public, la définition stéréotypique est légitime, dans une démarche de modélisation des connaissances, la définition minimale devra être préférée.

Pour passer de la définition stéréotypique à la définition minimale, R. Martin, analyse les différents types de propriétés que l'on rencontre dans les définitions stéréotypiques :

  • les propriétés universelles que sont satisfaites par tous les objets dénommés;

  • les propriétés généralement vérifiés, c'est-à-dire satisfaites par la plupart des objets dénommés;

  • les propriétés de nature symbolique, plus ou moins conventionnellement attachées aux objets dénommés.

  • parmi les propriétés universelles, certaines sont des propriétés typiques, c'est-à-dire distinctives ou discriminatoires, et les propriétés universelles mais non typiques, c'est-à-dire satisfaites également par d'autres types d'objet.

  • Par ailleurs, parmi les propriétés universelles, typiques ou non typiques, certaines sont reconnues par la plus grande généralité des locuteurs, d'autres ne le sont que par des publics plus restreints. Ce sont des propriétés encyclopédiques. Par exemple, pour un oiseau, on citera des propriétés comme celles-ci : que c'est un vertébré à sang chaud, à respiration pulmonaire, qu'il possède un jabot et un gésier et non un estomac, etc.

La sélection des propriétés à retenir à fin de modélisation des connaissances dépendra évidemment du but recherché. Le contexte peut imposer par exemple de sélectionner les propriétés universelles typiques et encyclopédiques ou un sous-ensemble de ces propriétés.

Toutefois, dans un traitement linguistique qui vise essentiellement à dégager le sens des énoncés et à comparer des énoncés entre eux, seuls sont à considérer les traits qui sont strictement indispensables à la correcte identification des lexies. On devrait donc se limiter aux propriétés universelles typiques. Ce qui n’enlève rien à l’intérêt d’une identification des savoirs encyclopédiques relatifs à un objet ou à un concept donné. Nous verrons au contraire, que ces savoirs encyclopédiques jouent un rôle déterminant dans les mécanismes de la compréhension, car ils sont à la base de la compétence des locuteurs. Dans le cas des textes normatifs, il s’agit de la compétence de celui auquel s’adresse le texte normatif, qu’il s’agisse du sujet de droit à qui la norme s’impose ou qu’il s’agisse des autorités tenues de veiller à son application ou encore des juridictions amenées à dire le droit, c’est-à-dire à donner l’interprétation « exacte ». Sujets de droit, autorités, et juridictions, chacun à son niveau interprète la norme en fonction de sa propre compétence, or cette compétence est directement déterminée par ce que Pottier appelle « l’environnement du message », lequel ne saurait se réduire aux définitions du dictionnaire.

Nous pensons qu’il existe un niveau de traitement où il est nécessaire de s’en tenir aux définitions minimales. Nous nous attachons donc pour l’instant aux moyens d’établir des définitions minimales nécessaires à une reconnaissance non ambiguë des termes du texte.

Pour constructive qu’elle soit, l’approche de R. Martin ne donne pas toutes les clés permettant de construire les définitions minimales c’est-à-dire les sémèmes.

Pottier (TAL, 1992) ouvre un certain nombre de pistes à travers les modèles sémantiques, les noèmes et nous le verrons plus loin, la théorie des voix.

Pour progresser dans cette voie, il est indispensable de s’arrêter préalablement sur la question de la catégorisation. Elle occupe une place centrale en psychologie des connaissances, mais aussi en linguistique au travers des théories qui ont impulsé des recherches importantes dans les années soixante dix et quatre-vingt, en particulier la théorie du prototype qui a profondément évolué au cours de la période au point que G. Kleiber (1990) a pu parler de théorie standard et de théorie étendue.

1 Littré

2 DFC

3 Robert

4 Littré

 

Téléchargement

La théorie du prototype

Nous reprendrons dans les grandes lignes les analyses particulièrement précises et développées de G. Kleiber (1990), en y apportant un éclairage supplémentaire grâce à la redécouverte du grand psychologue russe Lev Vygotski. Nous intégrerons dans la réflexion la notion de domaine notionnel mise en exergue par Antoine Culioli pour formuler quelques propositions non sans un retour sur certains aspects à nos yeux incontournables de l’analyse sémique et de la sémantique interprétative, et par conséquent sur B. Pottier et F. Rastier.

La question centrale de la catégorisation

La question des catégories est à la croisée de la philosophie, de la logique, de la psychologie et de la linguistique dans la dimension cognitive de ces disciplines scientifiques.

L’approche qui sera utilisée se situera essentiellement sur le terrain linguistique, selon le choix de base qui convient à notre recherche, ce qui ne nous empêchera pas, tout en réaffirmant l’autonomie de la linguistique, de souligner les interactions des niveaux conceptuel et linguistique.

Il y a comme une sorte de banalité à dire que la catégorisation constitue la base même de toute activité mentale et de tout raisonnement.

« Cette opération mentale, qui consiste à ranger ensemble des « choses » différentes se retrouve dans toutes nos activités de pensée, de perception, de parole, dans nos actions aussi… Chaque fois que nous percevons une chose comme une espèce de chose, nous sommes en train de catégoriser. Lorsque nous voulons effectuer une action, soit chanter par exemple, il s’agit d’une catégorie d’action qui se trouve activée. Ainsi, catégorisation et catégories sont les éléments fondamentaux, la plupart du temps inconscients, de notre organisation de l’expérience. Sans elles, c’est-à-dire, sans cette capacité de dépasser les entités individuelles (concrètes comme abstraites) pour aboutir à une structuration conceptuelle, « l’environnement perçu serait (…) perpétuellement chaotique et perpétuellement nouveau » (E. Causeville-Marmèche, D. Dubois et J. Mathieu, 1988)… » Nous serions submergés par la diversité absolue de notre expérience et incapables de nous souvenir plus d’une fraction de seconde de ce que nous rencontrons » (E. Smith et D. Medin, 1981, p. 1) » (cité par G. Kleiber, 1990, p. 12-13). On verra plus loin quel relief tout à fait particulier L. Vygotski a donné à cette question dans ses recherches psychologiques dont l’aboutissement est Pensée et Langage publié en 1934.

L’étude de la catégorisation en tant que processus relève de la psychologie. Toutefois, la catégorisation transitant par le langage et nécessitant l’utilisation du mot comme outil et aboutissant au mot comme résultat, l’étude du langage est sinon impossible , du moins incomplète si elle fait abstraction de la catégorisation. La linguistique, si elle doit faire appel à des méthodes qui lui sont propres en raison de la spécificité de son objet, ne saurait donc être complètement indépendante de la psychologie.

Toute l’inspiration de la sémantique du prototype repose sur la notion de catégorisation et l’ambiguïté de ses résultats, qui équivaut à un échec au plan scientifique, vient de la difficulté de distinguer la catégorie en tant que résultat d’un processus purement conceptuel et le mot, qui en est l’indissociable outil et messager, et qui est de nature strictement linguistique, ce que permettent de faire la psychologie de Vygotski d’une part et la sémantique interprétative de F. Rastier d’autre part. Entre l'une et l'autre, nous opérerons un rapprochement sans doute inattendu du fait qu’aucun lien, aucune filiation ne les unissent a priori.

La théorie du prototype est née d’une critique fondée d’une psychologie et d’une linguistique trop directement dérivées de la théorie aristotélicienne des catégories.

Nous reprenons ci-après, très résumés, mais en conservant une attitude critique, les trois temps de l’analyse de G. Kleiber, en ne retenant que les points que nous jugeons essentiels pour notre objet.

La théorie classique des conditions nécessaires et suffisantes

Dans la conception aristotélicienne, une catégorie est identifiée par un certain nombre de propriétés caractéristiques. Appartient à ladite catégorie toute entité possédant au moins ces propriétés.

Il est évident, en première approximation, qu’un nombre tout à fait important d’objets , de phénomènes, d’idées, de pensées, de sentiments, de faits du monde réel, s’offrent à des définitions en termes de conditions nécessaires et suffisantes, ce qui règle correctement à la fois la question de l’identification de la catégorie et celle de l’appartenance à la catégorie. Plus clair est l’identification, plus simple est le rattachement.

Ainsi, l’identification de la tête, du nez, de la bouche, etc. ne pose guère plus de problème que celle du rectangle, du triangle ou du cercle.

Toutefois, la généralisation de la théorie rencontre des difficultés impliquant des remises en cause discutables. Nous en avons retenu trois.

La première difficulté vient de la multiplicité des définitions possibles, situation déjà évoquée, et que nous ne pouvons considérer comme une vraie difficulté pour deux raisons essentielles. La première est que si la multiplicité des définitions possibles avait valeur d’objection, cette objection pourrait être opposée tout autant aux théories standards et étendues du prototype. La seconde raison, plus fondamentale, est que la multiplicité des définitions est au cœur même des processus de communication. Entre deux individus la communication s’effectue par le mot ou par un équivalent fonctionnel tel que le geste. Or, la signification du mot qui assure la communication n’est jamais strictement identique d’un interlocuteur à l’autre. Une certaine correspondance suffit à la communication. Mais l’efficacité sociale n’interdit en rien, et recommande même, la recherche de définitions communes.

Le second type de difficulté vient de phénomènes de continuité dont l’identification par conditions nécessaires et suffisantes paraît peu adéquate. Quand le jour cède t-il la place au crépuscule et le crépuscule à la nuit ? Comment passe t-on du glacial au froid, du froid au tiède, de tiède à chaud, de chaud à bouillant ou étouffant ? Qui peut dire non pas ce qui fait la différence, mais où se trouve la séparation entre la brochure et le livre, entre la carnet et le cahier, le gravillon et le gravier, le gravier et le caillou, le caillou et la pierre, etc. Et pour clore sur un exemple souvent utilisé, celui de la couleur, comment définit-on en termes de conditions nécessaires et suffisantes ce qu’est le bleu ou le rouge.

Il n’y a rien dans ce type de difficulté qui justifie une remise en cause de la théorie classique. Des concepts qui comportent en eux-mêmes l’idée de gradation (cf. ex : grand, chaud, rapide, etc.) se définissent par des conditions nécessaires et suffisantes (pour grand : x est grand si et seulement si x a une taille supérieure à la taille moyenne attendue pour la catégorie à laquelle appartient x) qui impliquent le flou (où se trouvent la limite ? est-ce qu’un homme de 1,70 m est grand ? etc.) (Kleiber, 1990, p. 145)

Un troisième type de difficulté vient de l’existence de cas marginaux pour lesquels la catégorisation par CNS peut sembler mise en échec.

L’exemple le plus souvent cité est celui de l’autruche qui tout en possédant certains traits essentiels de la catégorie oiseau (avoir deux pattes, deux ailes, des plumes, un bec, pondre des œufs, etc.) ne vole pas. On peut en dire autant des pingouins. Pourtant, la quasi totalité des oiseaux volent. Et tout commun des mortels à qui nous demanderions quelle est la première caractéristique d’un oiseau répondrait que c’est l’aptitude à voler. L’application de la catégorisation par CNS impose cependant d’écarter l’aptitude à voler comme trait distinctif de la catégorie oiseau, sauf à exclure de la catégorie oiseau les oiseaux qui ne volent pas, ce qui est une solution plus intenable que la précédente.

Il faut donc choisir entre appauvrir la définition de la catégorie en écartant des propriétés pourtant ordinairement admises et exclure des éléments dont l’appartenance à la catégorie, même s’ils ne sont pas les plus représentatifs, est cependant incontestable, à moins que d’autres voies, impliquant ou non une remise en cause de la conception classique, ne soient envisagées.

Une solution élégante est de maintenir dans le cadre définitoire des traits non nécessaires (ou non inhérents) en en précisant la portée. Solution admise par B. Pottier qui intègre de telles propriétés dans le virtuème. Ainsi, le coffre sera dit le plus souvent bombé (G. Kleiber, 1990, p. 36, B. Pottier, 1964, p. 125), et l’on dira de même que l’oiseau possède généralement l’aptitude à voler. Solution également retenue par R. Martin, comme on l’a vu, la propriété généralement vérifiée étant une composante de la définition stéréotypique (cf. p. Erreur : source de la référence non trouvéeErreur : source de la référence non trouvée)

La précision de la définition d’un terme n’implique pas une stricte conformité des éléments de la réalité. Il faut se faire une raison : il y a des « choses » qui entrent plus ou moins bien dans les catégories lexicales. Mais ce n’est pas pour autant que les catégories lexicales sont floues et n’admettent pas de définition par CNS.

G. Kleiber souligne l’erreur consistant à penser que la définition d’une terme ne peut être précise qu’à condition que les éléments de la réalité le soient aussi, c’est-à-dire s’y conforment. (1990, p. 145).

Outre donc le flou qui est inscrit dans le concept même (et qui n’est pas incompatible avec une définition par CNS), le flou provient aussi, selon G. Kleiber, du décalage entre la réalité et les catégories discontinues, et cite A. Wierzbicka (1985) qui plaide pour une telle conception :

« Il est important de se rendre compte que, pour ainsi dire, toute chose n’est pas quelque chose, c’est-à-dire que toute chose ne tombe pas sous l’une ou l’autre catégorie lexicale. Il y a des choses entre les cups et les mugs qui ne sont ni des cups ni des mugs, comme il y a des choses entre les skirts et les trousers. Les choses de ce type, pour lesquelles il n’existe pas d’étiquette lexicale standard, peuvent fort bien être décrites par référence à l’expèce lexicalement reconnue la plus proche, et appelées, par exemple, a sort of cup, funny cup ou cup-like thing. Elles peuvent se voir attribuer des noms semi-techniques tels que divided skirt. Il est essentiel de distinguer de telles catégories intermédiaires des vraies espèces, des espèces conceptuelles lexicalement reconnues comme telles. » (1985, p. 38)

La situation se durcit cependant lorsque au lieu que nous ayons un nom pour la catégorie et un autre nom pour chacun des éléments constitutifs (ainsi oiseau pour la catégorie, moineau, corbeau, aigle, autruche, etc. pour les éléments), le même nom sert pour des usages multiples avec des significations sensiblement sinon totalement différentes. Ainsi, le lit (pour dormir) et le lit de la rivière ont des significations suffisamment éloignées pour que la catégorie lit soit réduite à sa plus simple expression.

Nous précisons d’emblée que la théorie standard du prototype ne répond aucunement à ce type de question et que c’est justement ce facteur qui explique son abandon ou son dépassement par ses propres fondateurs au profit de la théorie étendue.

La théorie standard

Nous évoquerons rapidement la théorie standard, moins intéressante par ses résultats que par les problèmes qu’elle pose. Nous avons déjà vu que les difficultés principales opposées par ses promoteurs à la conception classique des CNS étaient insuffisantes pour invalider cette dernière. La théorie standard du prototype n’a pas été la révolution que certains ont cru.

Cette théorie tend à substituer au nom de la catégorie répondant parfois à un nombre réduit de traits ayant valeur de conditions nécessaires et suffisantes, un élément jugé le plus représentatif appelé prototype.

Le prototype se définit lui-même par un certain nombre de propriétés identifiées comme les propriétés les plus typiques de la catégorie, mais aucune de ces propriétés n’est posée comme devant être nécessaires et suffisantes.

Il s’ensuit une structure de la catégorie très différente de la structure hiérarchique en CNS.

En ce qui concerne en particulier la question de l’appartenance d’un élément à la catégorie, l’appréciation n’est pas fondée sur un examen propriété par propriété, mais sur une impression d’ensemble découlant de la possession d’un plus ou moins grand nombre de propriétés du prototype. Il s’ensuit donc non pas une appartenance ou une non appartenance, mais un degré d’appartenance.

Nous avons donc une sorte de disposition radiale des éléments autour du prototype sans dépendance mutuelle et sans que des éléments aient toujours entre eux des éléments communs, mais seulement des éléments communs avec le prototype. Les limites de la catégorie sont donc structurellement floues et n’ont pas de raison particulière de correspondre aux limites d’une catégorie définie en CNS, sauf cas exceptionnel où le prototype serait identique au nom de la catégorie en CNS.

Avant de donner les raisons qui condamnent cette théorie , il est utile de souligner celles qui la rendent séduisantes et d’évoquer certains éléments de problématique qui ont une valeur indépendamment de la théorie elle-même.

Il nous semble que deux éléments sont fondamentalement justes et doivent être conservé dans un cadre ou dans un autre. D’abord, il peut exister des différences sensibles entre l’idée que l’on se fait communément d’un type donné ou d’une catégorie et sa définition par CNS ou sa définition conceptuelle, au sens du concept scientifique selon la formulation de Lev Vygotski, sur laquelle nous reviendrons.

De ceci, nous pouvons apporter une preuve scientifique au plan linguistique.

Le fait que l’oiseau vole est un topos au sens aristotélicien ou, de préférence, au sens repris et modernisé par O. Ducrot et J-C Anscombre dans le cadre de la théorie de l’argumentation que nous retrouverons en troisième partie, c’est-à-dire une assertion généralement vraie et le plus souvent implicite qui donne sa cohérence logique au discours ou simplement à l’énoncé.

Ainsi, il est sémantiquement impossible de dire :

c’est un oiseau, mais il vole

il est au contraire naturel de dire :

c’est un oiseau, mais il ne vole pas

(Exemple donné par G. Kleiber, 1990, p. 37)

Nous ajouterons au commentaire de G. Kleiber la remarque suivante : en rendant apparent le topic un oiseau vole, on obtient l’énoncé complet suivant, sémantiquement et logiquement parfaitement cohérent :

C’est un oiseau, un oiseau vole, or j’observe que cet oiseau ne vole pas.

Le fait que tous les oiseaux ne volent pas n’enlève rien à la validité sémantique de l’énoncé.

Le second élément dont la pertinence ne peut être mise en doute est le fait que le processus de compréhension n’est pas en principe analytique, mais global et synthétique. L’emploi de mots provoque des images globales et synthétiques qui assure l’efficacité de la communication. L’analyse ne vient qu’après si elle est nécessaire à la compréhension.

Il en faut évidemment plus pour assurer la validité d’une théorie.

La théorie standard a par ailleurs rencontré la problématique de la catégorisation qu’elle n’a pas su distinguer de celle du prototype. D’où vient ou comment se crée une catégorie et quels sont les critères qui la définissent, sont deux types de questions auxquels la théorie standard n’a pu répondre que partiellement.

S’agissant de la première question, il n’y a pas lieu d’en être surpris, car elle ne relève pas à vrai dire de la linguistique, mais bien plutôt de la psychologie. Ainsi, asserter qu’une catégorie est fondée sur des traits distinctifs, même en rattachant cette assertion à une construction théorique aussi élaborée que celle de la cue validity, n’offre aucune valeur explicative concernant l’émergence des catégories ou des concepts et leurs processus de développement.

La cue validity est le critère – nous verrons qu’il n’est pas exclusif – sur lequel E. Rosch et les chercheurs travaillant dans la même direction ont fini par faire reposer la notion de prototype. La cue validity est le dégré de prédictibilité pour une catégorie donnée d’une propriété ou d’un attribut d’un objet. E. Rosch et C. Mervis (1975, p. 575) la définissent comme correspondant à la fréquence de l’attribut associé à la catégorie en question divisé par la fréquence totale de cet attribut pour toutes les autres catégories pertinentes. Un attribut présente donc une cue validity élevée pour une catégorie si un grand nombre de membres de la catégorie la possèdent et si, en revanche, peu de membres de catégories opposées le vérifient. Cette définition permet de produire une interprétation quasi arithmétique de la notion de degré de ressemblance de familles. Entant donné les membres d’une catégorie et les attributs de cette catégorie mis en relief par les sujets, on attribuera à chaque attribut un nombre qui correspond au nombre de membres qui possèdent cet attribut. Un attribut ou propriété possède donc un pouvoir de discriminabilité variable pour la catégorie. On peut ainsi calculer le degré de ressemblance de famille de chaque membre : ce sera la somme totale des nombres de chacun de ses attributs. Le degré de ressemblance de famille d’un membre variera ainsi selon le nombre pondéré d’attributs partagés avec d’autres membres de la catégorie. Plus élevé sera le nombre pondéré d’attributs en commun et plus grand sera le degré de ressemblance de famille. Il en résulte que les membres prototypiques sont ceux qui d’une part partagent le plus de propriétés avec les autres membres de la catégorie et qui, d’autre part, ont le moins de propriétés en commun avec les membres des catégories opposées Selon le principe de discriminabilité maximale, le prototype peut alors être conçu comme le lieu de regroupement des attributs ayant la validité maximale et la catégorie. (G. Kleiber, 1990, p. 75-76 et p. 88-92).

Cette construction brillante et séduisante explicite sans aucun doute le prototype même de la notion de prototype. Elle permet de mettre en évidence des phénomènes prototypiques, mais ne saurait en aucune manière expliquer scientifiquement la formation des catégories et prototypes, comme l’ont cru E. Rosch et C. Mervis. Il s’agit d’une simple hypothèse qui n’est fondée sur aucune donnée expérimentale à laquelle on serait bien en peine de trouver une quelconque référence, comme le montre le texte suivant :

« Les prototypes semblent n’être précisément que les membres de la catégorie qui reflètent le mieux la structure de redondance de la catégorie envisagée dans son ensemble. C’est dire que les catégories se forment de manière à maximaliser l’information de riches conglomérats d’attributs dans l’environnement, et, de ce fait, à maximaliser la cue validity des attributs des catégories ; lorsque les prototypes des catégories se forment à partir du principe de ressemblance de famille, ils maximalisent encore plus ces conglomérats et cette cue validity au sein des catégories (E. Rosch et C. Mervis, 1975, p. 602, cités par G. Kleiber, 1990, p. 76).

Ce texte est particulièrement remarquable non en raison de la valeur explicative qu’il prête à tort au principe de cue validity ou de discriminalité maximale mais de la confusion qu’il entretient entre prototypie et catégorie sans interdire complètement la disjonction, et du fait que le principe de ressemblance ainsi interprété n’apparaît pas comme le moyen exclusif de formation des prototypes de catégorie.

Il faut donc évoquer rapidement les autres manifestations de prototypie, et non la formation des catégories, ce qui est une autre affaire.

Un premier critère possible de prototypicalité est celui de la fréquence d’usage des termes nommant les catégories et différents du terme générique, tel que moineau pour nommer la catégorie oiseau.

Un second critère est celui de la familiarité (à distinguer de l’air de famille). Il a été écarté dans le cadre de la théorie standard au profit de celui de la typicalité que nous avons vu plus haut, alors qu’il apparaît comme une source alternative des phénomènes de prototypie. Ainsi, « si myrtille ou mirabelle, par exemple, sont de moins bons exemplaires de fruits en ce qu’ils occupent le bas de l’échelle de représentativité dressée par F. Cordier (1980), ce n’est pas parce qu’ils ne partagent pas les traits ayant une cue validity élevée pour la catégorie des fruits -…- mais c’est parce qu’ils sont moins familiers aux sujets : lorsqu’on évoque la catégorie fruits, l’on pense plus vite aux pommes et aux oranges ou aux poires qu’aux myrtilles ou aux mirabelles, sur la base de la familiarité et non tellement sur la base de la typicalité.

Le classement de poussin comme exemplaire non prototypique de la catégorie oiseau a au contraire comme assise, non un sentiment de familiarité, mais un jugement de typicalité qui fait intervenir les propriétés. » (G. Kleiber, 1990, p. 134)1 Les critères de familiarité et de typicalité coexistent donc de manière certaine. Leur action peut être convergente, en positif (familier et typique) ou négatif (peu familier et peu typique) ou divergente typique non familier, familier non typique). Ce qui signifie que les phénomènes de prototypie sont encore plus complexes que tels qu’ils ont été systématisés par la théorie standard. Quoiqu’il en soit, il est essentiel de souligner que les sources des effets prototypiques ne peuvent être de même nature que celles des activités de catégorisation, même si elles se trouvent en interaction dans le processus de communication.

La notion de prototype ne peut donc servir de base à la définition des catégories, ce que la sémantique du prototype finira bien par constater : « Les prototypes ne constituent pas une théorie de la représentation des catégories (E. Rosch, 1978, p. 40, G. Kleiber, 1990, p. 150). Elle ne saurait pas davantage aider autrement que de manière superficielle à la connaissance des structures cognitives des catégories.

« Les canards et les vautours ne sont pas des oiseaux prototypiques, mais n’en sont pas moins des oiseaux. » (G. Lakoff, 1986, p. 43) et G. Kleiber, se fondant sur un raisonnement logique sans appel, de mettre très exactement le doigt sur la contradiction interne qu’il peut y avoir à faire dépendre la catégorisation de la prototypie : « Pour être un « meilleur oiseau », il faut évidemment déjà être un oiseau » (1990, p. 144).

Utilisant par ailleurs un argument que l’on verrait bien sous la plume d’O. Ducrot ou J-C Anscombre (1988, 1995), G. Kleiber constate que le raisonnement suivant :

Si x est un oiseau, et s’il n’y a pas d’information contraire, alors x peut voler

Ne peut être tenu correctement que si x est préalablement rangé dans la catégorie oiseau. Or, ceci vaut pour chaque propriété prototypique, puisqu’elles ne sont pas nécessaires (1990, p. 140).

Les arguments linguistiques ne manquent pas qui montrent que l’organisation catégorielle ne peut se passer de traits qui sont autant de conditions nécessaires.

L’organisation hiérarchique du lexique s’appuie fondamentalement sur des relations d’implication comme l’a montré abondamment R. Martin (1992, p. 24-25, 59-61). L’inférence qui mène de C’est un chat à C’est un animal ou de C’est du rouge à C’est une couleur n’est pas une inférence plausible.

Parmi de nombreux tests possibles , on peut noter entre autres le caractère étrange d’un énoncé tel que : « Tous les chats sont des animaux » qui ne se trouverait pas dans un texte où l’on explique ce qu’il faut entendre par catégorie, car il s’agit d’un énoncé parfaitement tautologique. (G. Kleiber, 1990, p. 122)

Dépourvue de la plupart de ses fondements théoriques, la théorie du prototypique a du évoluer vers une théorie étendue dans laquelle G. Kleiber voit plutôt une nouvelle théorie qu’une évolution de la théorie standard.

La théorie étendue du prototype

La théorie étendue, tout en relativisant l’importance de la prototypicalité réduite à un ensemble d’effets superficiels, masquant en partie la richesse des modèles cognitifs sensés être à la base des catégories (G. Lakoff, 1987, p. 41), recherche pour celles-ci de nouveaux fondements qu’elle pense avoir trouvés dans la notion « d’air de famille ».

Il s’agit de la notion d’air de famille déjà utilisée par la théorie standard mais réinterprétée de façon plus conforme à l’idée initiale développée par Wittgenstein. « Wittgenstein (1953) a postulé que les référents d’un mot n’ont pas besoin d’avoir d’éléments en commun pour être compris et employés dans le fonctionnement normal du langage. Il a suggéré qu’il s’agissait plutôt d’une ressemblance de famille qui reliait les différents référents d’un mot. Une structure de ressemblance de famille prend la forme AB, BC, CD, DE. C’est-à-dire que chaque item a au moins un et probablement plusieurs éléments en commun avec un ou plusieurs autres item, mais aucun ou peu d’éléments sont communs à tous les items .» (E. Rosch et C. B. Mervis, 1975, p. 574-575, G. Kleiber, 1990, p. 55)

Ce texte, fondamental, voire fondateur pour la théorie du prototype, appelle plusieurs observations.

La première est d’appeler l’attention sur le fait que le phénomène évoqué par Wittgenstein est bien connu sous le concept de polysémie de la sémantique structurale et componentielle, notamment dans ses versions modernes, telle qu’elle est développée notamment chez R. Martin ou F. Rastier.

La structure de ressemblance de famille s’analyse en effet comme l’expression d’une polysémie de type métonymique ou métaphorique. Sans se livrer à une analyse fine de la polysémie, disons que la métonymie et la métaphore impliquent, entre deux sémèmes porteurs de sens différents d’un même mot, l’existence d’au moins un sème spécifique commun.

Ainsi, le blaireau, petit animal carnassier d’Europe et d’Asie du Nord possède un poil raide très apprécié en brosserie. D’où l’utilisation du terme blaireau pour désigner une type de pinceau employé par les doreurs ou par les peintres en porcelaine, ou encore la brosse en poils fins avec laquelle on savonne encore parfois la barbe avant de la raser. Il s’agit d’un cas typique de métonymie dans lequel les trois significations du mot blaireau ont comme seul point commun le sème poil raide très apprécié en brosserie, fait culturel et linguistique incontestable.

S’agissant de l’idée selon laquelle «les référents d’un mot n’ont pas besoin d’éléments en commun pour être compris et employés dans le fonctionnement normal de la langue », on doit noter le caractère rudimentaire au plan sémantique de la formulation qui fait abstraction de l’existence des significations indispensables à la compréhension des relations entre mots et référents, comme nous le verrons plus loin à propos de l’apport de l’œuvre de Lev Vygotski à la sémantique. Par ailleurs, l’idée s’éclaire à la lumière de la notion de domaine, domaine d’expérience selon B. Pottier ou domaine tout court chez F. Rastier, que tout interlocuteur est en mesure d’identifier en fonction du contexte ou du cotexte de l’énonciation. Le domaine qui est un des sèmes génériques fondamentaux, ainsi que nous l’avons déjà vu, remplit la fonction essentielle de sélecteur de sens en cas de polysémie : selon que l’on évoque la faune, la toilette du corps, la peinture ou la dorure, le mot blaireau prendra une signification différente. Lorsque l’identification du domaine n’est pas claire, on est alors dans l’ambiguïté qui est un sujet d’étude linguistique à part entière.

Aussi important que soit la polysémie en tant que phénomène linguistique, il est douteux que la structure de ressemblance de famille soit une notion suffisante comme critère d’organisation catégorielle. On peut même contester que ce type de structure permette de fonder une catégorie. C’est ce que pense G. Kleiber (1990, p. 174-175) qui voit une différence irréductible entre une catégorie linguistique référentielle fondée sur un item non polysémique comme oiseau et une catégorie linguistique polysémique, « catégorie naturelle de sens », qui regroupe sans être elle-même une « catégorie conceptuelle », des sens ou des catégories différents.

Quatrième et dernière observation sur la théorie étendue : on serait bien en peine de lui découvrir une base scientifique précise. Il y a à la base non une conception linguistique, mais seulement une intuition sur les sources cognitives d’un phénomène linguistique important mais partiel.

Or, la structure de ressemblance de famille présentée par Wittgenstein en1951 reproduit une des formes de la pensée par complexes étudiée et exposée par Lev Vygotski en 1934 dans une œuvre postérieurement et très tardivement diffusée en Occident.

Un regard sur les sources psychologiques des effets linguistiques des processus de catégorisation n’apparaît pas du tout comme un détour inutile.

1 Nous pensons qu’un jugement catégorielle sur la base de CNS permet le même classement.

Les sources psychologiques de la catégorisation : l’apport de Lev Vygotski

L’ambition de ce paragraphe est tout à fait modeste. Il s’agit de tirer quelque profit au plan linguistique d’une œuvre majeure en psychologie cognitive dont l’influence est grandissante mais particulièrement tardive. Pensée et langage, achevée au printemps 1934 sur son lit de mort à l’âge de 37 ans, est le bilan critique et synthétique de dix années de recherches intenses et fécondes. Après 20 années d’éclipse pendant la période stalinienne de 1936 à 1956, l’ouvrage n’a pénétré en Occident qu’au début des années soixante. Il ne sera traduit en France qu’en 1985.

Il n’est donc pas surprenant que dans un ouvrage de référence tel que catégorisation et développement cognitif d’Olivier Houdé, publié en 1992, il n’en soit pas même fait mention.

Notre motivation n’est pas ici de traiter de psychologie cognitive, mais d’utiliser deux des aspects les plus originaux et les plus fondamentaux de l’œuvre de Vygotski, dont notre connaissance se limite à Pensée et langage, qui sont les rapports entre d’une part le développement des fonctions psychiques supérieures et d’autre part le langage et la structuration catégorielle des connaissances, deux aspects intimement liés même s’ils peuvent relever d’approches scientifiques différentes.

Accessoirement, l’œuvre de Vygotski nous conduit à une prise de distance par rapport tant aux théories sémantiques du prototype qu’à la conception classique.

Nous limiterons le propos à la théorie des stades de développement de la pensée enfantine, sans souci de correspondance avec les travaux de Piaget, dont l’intérêt du point de vue où nous nous plaçons vient de la survivance et de l’imbrication de ces divers stades dans la pensée de l’adulte et corrélativement de leur influence sur la formation et l’évolution du langage.

Vygotski a mis en évidence trois stades majeurs de la pensée de l’enfant, la pensée par tas, la pensée par complexes, puis la pensée par concepts, stades eux-mêmes décomposables en étapes plus subtiles, dont le déroulement n’a rien de parfaitement linéaire mais comporte au contraire des superpositions variables plus ou moins marquées et dont l’aboutissement final, si tant est qu’il existe, n’atteint nullement la pureté théorique.

La pensée de l’enfant passe donc par un premier stade de la formation du concept caractérisé par la constitution et le rattachement à un mot d’une masse indistincte et sans ordre, d’un tas d’objets quelconques lorsqu’il se trouve devant un problème. « La signification du mot à ce stade de développement consiste en un enchaînement syncrétique informe, complètement flou, d’objets divers qui sont liés les uns aux autres d’une manière quelconque dans la représentation et la perception de l’enfant et fondus en une image unique…

« … la troisième étape, l’étape supérieure de ce stade, qui marque son achèvement et le passage au deuxième stade est celle où l’image syncrétique, équivalent au concept, se forme sur une base plus complexe : les représentants des différents groupes, déjà réunis antérieurement dans la perception de l’enfant, sont ramenés à une signification unique.

« …Derrière la signification d’un mot enfantin, on découvre à présent non plus un plan mais une perspective, une double série de liaisons, une double construction de groupes, cependant cette double série et cette double construction ne vont pas encore au-delà de la formation d’une masse désordonnée, ou pour user d’un terme plus ordinaire, d’un tas. » (Vygotski, 1997, p. 212-214)

« Le deuxième grand stade dans le développement des concepts comprend de nombreux types différents, sous le rapport fonctionnel, structural et génétique, d’un mode de pensée par nature unique. Ce mode de pensée, comme tous les autres, conduit à la formation de liaisons, à l’établissement de rapports entre les différentes impressions concrètes, à la réunion et à la généralisation d’objets divers, à l’organisation et à la systématisation de toute l’expérience de l’enfant.

« Mais le mode de réunion des différents objets concrets en groupes généraux, le caractère des liaisons qui s’établissent lors de ce processus, la structure des unités qui se constituent sur la base de cette pensée, structure qui est caractérisée par le rapport de chaque objet entrant dans la composition du groupe avec tout le groupe dans son ensemble, tout cela se distingue profondément par son type et son mode d’action de la pensée par concepts, qui ne se développent qu’à l’époque de la puberté. »

Pour souligner l’originalité de ce mode de pensée Vygotski l’appelle pensée par complexes.

« Cela signifie que les généralisations qui s’opèrent à l’aide de ce mode de pensée représentent par leur structure des complexes d’objets concrets, ou de choses, réunis non plus sur la base des seules liaisons subjectives de l’enfant, mais sur la base de liaisons objectives existant réellement entre ces objets.

« … Ce passage à un type supérieur de pensée consiste en ce que, au lieu de la « cohérence incohérente » qui est à la base de l’image syncrétique, l’enfant commence à réunir des objets similaires en un groupe commun, à les assembler en complexes selon les lois des liaisons objectives qu’il découvre entre les choses. » (ibid. p. 215)

Les recherches de Vygotski et de ses collaborateurs ont dégagé cinq types de complexes qui correspondent à des structures de données et des organisations catégorielles très spécifiques qui ne sont pas sans évoquer les structures prototypiques, qu’il s’agisse des structures de la théorie standard ou de celles par air de famille selon la conception initiale de Wittgenstein.

Le complexe associatif a pour base « n’importe quelle liaison associative avec n’importe lequel des traits distinctifs remarqués par l’enfant dans l’objet, qui est au cours de l’expérience le noyau du futur complexe. Autour de ce noyau, l’enfant peut construire tout un complexe, en y incluant les objets les plus différents, les uns parce qu’ils ont une couleur identique à celle de l’objet donné, d’autres une forme identique ou une dimension identique ou une dimension identique ou encore un quelconque trait distinctif qui frappe l’enfant. Tout rapport concret que découvre l’enfant, toute liaison associative entre le noyau et un élément du complexe s’avère un motif suffisant pour que l’objet soit rattaché au groupe constitué par l’enfant et désigné par le nom de famille commun. » (ibid. p. 218)

Comme dans la structure prototypique standard , on voit bien que le complexe a bien un centre, mais également que les éléments peuvent ne pas avoir en commun les mêmes caractéristiques partagées avec le noyau.

Une seconde forme de complexe est le complexe-collection. « Ici, les objets concrets différents sont réunis sur la base de leur mutuelle complémentarité par rapport à un trait distinctif quelconque et forment un tout composé d’éléments hétérogènes, se complétant les uns les autres…Une telle construction donne naissance à une collection d’objets différents par la couleur ou la forme, qui représente un assortiment de couleurs et de formes fondamentales présentes dans le matériel expérimental… Le verre, la soucoupe, la cuiller, le couvert composé de la fourchette, du couteau et de l’assiette ; les vêtements – tout cela représente des modèles de complexes-collections, formant un tout fonctionnel unique, que l’enfant rencontre dans sa vie de tous les jours…

« … Nous verrons plus loin que même dans la pensée de l’adulte, et surtout dans celle des malades nerveux et mentaux, ces formes de complexes, constituées sur le type de la collection, jouent un rôle extrêmement important. Très souvent, dans le langage concret, lorsque l’adulte parle de vaisselle ou de vêtements, il a à l’esprit non pas tant le concept abstrait correspondant que des assortiments de choses concrètes formant une collection. » (ibid. p. 220)

Le complexe en chaîne, troisième forme de pensée par complexe, « se construit selon le principe de la réunion dynamique et temporaire de maillons isolés en une chaîne unique et du transfert de signification d’un maillon de la chaîne à un autre. Dans les conditions de l’expérience, ce type de complexe se présente de la manière suivante : l’enfant assortit à un modèle donné un ou plusieurs objets selon une certaine liaison associative ; puis il continue à rassembler des objets concrets en un complexe unique en se guidant alors sur un autre trait distinctif subsidiaire de l’objet auparavant sélectionné, trait distinctif qui n’est absolument pas dans le modèle.

« Par exemple, l’enfant assortit au modèle – un triangle jaune – plusieurs figures comportant des angles, puis, si la dernière des figures sélectionnées est de couleur bleue, il lui assortit d’autres figures de couleur bleue, par exemple des demi-cercles. Cela suffit à son tour pour qu’il passe à un nouveau trait distinctif et se mette alors à sélectionner les objets de forme ronde. Dans le processus de formation du complexe, il y a sans cesse passage d’un trait distinctif à un autre.

« Par là même, la signification du mot se déplace en suivant les maillons de la chaîne du complexe. Chaque maillon est rattaché, d’un côté, au précédent, et, de l’autre, au suivant, mais ce qui distingue le plus ce type de complexe, c’est que le caractère de la liaison ou le mode de rattachement d’un même chaînon au précédent et au suivant peut différer du tout au tout.

« …Dans le complexe en chaîne, le centre de la structure peut faire totalement défaut. Des éléments concrets particuliers peuvent se lier entre eux sans passer par l’élément central ou le modèle et donc n’avoir rien de commun avec d’autres éléments tout en appartenant au même complexe, puisqu’ils ont un trait distinctif commun avec un autre élément qui, à son tour, est lié à un troisième, etc. » (ibid p. 221-222)

Malgré le caractère très proche des conditions de l’expérimentation de la description ici donnée, il est possible de rendre compte de deux observations importantes pour l’analyse sémantique sur cette forme de complexe.

D’abord, on reconnaîtra sans peine le modèle de la ressemblance de famille proposé par Wittgenstein en 1952, soit une vingtaine d’années après les travaux de Vygotski, et que nous avons déjà évoqué (cf. p. Air de famille).

Le schéma est bien le suivant :

Langue3 4 Structuration Vygotski schéma1

Par ailleurs, le complexe en chaîne est la racine de la forme la plus répandue de polysémie qu’est la métonymie.

Vygotski donne comme exemple remarquable en langue russe le mot sutki. « A l’origine, il signifiait « couture », « endroit où s’assemblent deux morceaux de tissu », « deux choses tissées ensemble ». Puis, il désigne n’importe quelle jointure, le coin de l’isba, l’endroit où deux murs se rejoignent. Par la suite, il désigna au sens figuré le crépuscule, point de jonction du jour et de la nuit, et, enfin, englobant le temps qui va du crépuscule du matin à celui du soir, il se mit à signifier « le jour et la nuit », c’est-à-dire vingt quatre heure, sens qu’il a aujourd’hui. » (ibid. p. 245)

On peut rapprocher de cet exemple celui donné par G. Lakoff (1986, 1987) cité par G. Kleiber (1990, p. 163) à propos des mots bayi, balan, balam, et bala en Dyirbal, langue aborigène d’Australie. Ainsi bayi rassemble les hommes (mâles), les kangourous, les opossums, les chauve-souris, la plupart des serpents, la plupart des poissons, quelques oiseaux, la plupart des insectes, la lune, les tempêtes, l’arc-en-ciel, les boomerangs, certains javelots, etc.

G. Lakoff, grâce à la structure de ressemblance de famille, arrive à montrer que ce regroupement n’est pas arbitraire : chaque membre est au moins relié à un autre par une propriété commune.

A côté de ces exemples presque spectaculaires par leur étendue et de portée soit synchronique (bayi) soit diachronique (sutki), on peut voir dans le langage courant des créations lexicales parfaitement significatives de la vivacité de ce type de procédé. Ainsi, il y a une dizaine d’années avant l’invention du disque compact, le disque usuel portait le nom de disque microsillon que l’on réduisait par métonymie à microsillon. Aujourd’hui, le même microsillon est devenu vinyle du nom du matériau qui le compose. Il y a bien phénomène métonymique de transfert de sens du matériau constitutif sur l’objet, de la partie sur le tout.

Le quatrième type de complexe est le complexe diffus. Il a « pour caractéristique essentielle que le trait distinctif lui-même, réunissant associativement les éléments concrets isolés et les complexes, semble être diffus, imprécis, fluide, confus, ce qui conduit à la formation d’un complexe réunissant à l’aide de liaisons diffuses, indéterminées, des groupes intuitifs – concrets d’images et ou d’objet. »(Vygotski, 1997, p. 224-225). Le rapprochement des traits distinctifs s’effectue souvent moins sur la base de la ressemblance effective que sur celle d’une vague et lointaine impression de communauté entre eux.

« Par exemple, l’enfant assortit à un modèle donné – un triangle jaune – non seulement des triangles, mais aussi des trapèzes, parce qu’ils lui rappellent des triangles amputés de leur sommet. Des trapèzes sont ensuite rapprochés les carrés,…

D’où la mise en évidence d’une « nouvelle caractéristique essentielle de la pensée par complexes : l’imprécision de ses contours et son extension par principe illimitée. » (ibid. p. 225).

Nous sommes ici encore très près de l’idée de ressemblance de famille chère à la sémantique du prototype, dans sa version étendue, dès lors que le prototype est inexistant, et que l’on a plutôt une nébuleuse de sens apparentés pour un même mot.

Nous pensons pour notre part que l’analyse du mot lit faite par J.J Franckel et Daniel Lebaud (1991, p. 95-105) et destinée à illustrer la notion dégagée par Antoine Culioli de domaine notionnel est susceptible d’être rattachée à cette forme de complexe, comme le confirme la caractérisation suivante de la notion de domaine notionnel : « Un domaine notionnel est ouvert et déformable, il correspond à des représentations variables et créatives et ne peut s’assimiler à un inventaire fini. »

Les significations du mot lit se déforment ainsi au gré de ses emplois multiples et l’on cherchera en vain une substance sémantique consistante leur servant de dénominateur commun : lit à baldaquin, lit de mousse, lit de feuilles, lit d’oignons, lit du fascisme, lit de souffrance, etc. Point n’est besoin d’une analyse détaillée pour convenir de l’absence de prototype, de centre, mais plutôt du constat d’une nébuleuse dont les éléments restent liés par des associations diverses, à la fois ténues et changeantes.

Nous ajouterons ici deux remarques.

D’abord, l’assimilation du domaine notionnel au quatrième type de complexe, le complexe diffus, est légitime, mais on peut se demander si le recouvrement entre domaine notionnel et complexe ne s’étend pas à toutes les formes de complexe, en y incluant, comme un cas particulier, le concept.

Par ailleurs, nous ne sommes pas du tout d’accord avec les auteurs quand ils concluent que la réponse à la question de savoir si le mot lit a un sens est négative dès lors que l’on appréhende ce sens comme décomposable en sèmes et en paramètres sémantiques. Comme nous le verrons plus loin, les outils mis en place par F. Rastier en sémantique interprétative, en particulier la notion de domaine, sème générique fondamental à ne pas confondre avec la notion de domaine notionnel, et l’introduction des sèmes afférents, par opposition aux sèmes inhérents, fournissent les moyens conceptuels d’une analyse satisfaisante du mot lit et d’une façon générale de la structure, même instable et évolutive, de tout domaine notionnel.

La cinquième et dernière forme de pensée par complexe a pour base le pseudo concept. Le pseudo concept a cette particularité de désigner les mêmes objets que le concept, mais par des voies totalement différente. "Il s’agit d’une réunion d’objets concrets, qui phénotypiquement, c’est-à-dire par son apparence extérieure, par l’ensemble de ses particularités externes, coïncide parfaitement avec le concept mais qui par sa nature génétique, par les conditions de son apparition et de son développement, par les liaisons causales-dynamiques qui en sont la base, n’est nullement un concept. Extérieurement c’est un concept, intérieurement c’est un complexe." (Vygotski, 1997, p. 225)

Le pseudo complexe qui est la forme de complexe la plus répandue chez l’enfant d’âge préscolaire, montre l’importance du mot comme pont entre la pensée de l’enfant et la pensée de l’adulte, comme moyen fondamental de communication entre l’enfant et l’adulte et enfin l’importance fonctionnelle du mot comme guide des développements psychiques ultérieurs de l’enfant dont la pensée sera dirigée par les significations constantes et stables des mots.

Cependant, de par sa coïncidence au plan référentiel avec le concept, le pseudo concept n’a pas, du point de vue qui retient présentement notre attention, c’est-à-dire la formation et l’évolution du langage, la même portée que les autres formes de pensée par complexe extrêmement prégnantes dans la pensée enfantine, dans les pensées primitives et dans celle même de l’adulte normal civilisé. Vygotski annonce ainsi que « si nous nous référons à l’histoire du développement de notre langue, nous verrons qu’il est fondé sur le mécanisme de la pensée par complexe avec toutes les particularités qui lui sont propres. » (1992, p. 243)

Mais comme la pensée conceptuelle est le dernier stade de développement de la pensée enfantine et la forme par excellence de la pensée de l’adulte, il convient d’en marquer en quelques mots les différences profondes avec la pensée par complexes.

Alors que le concept a pour base des liaisons de type unique, logiquement identiques entre elles, le complexe repose sur des liaisons empiriques des plus variées, qui souvent n’ont entre elles rien de commun. Dans le concept, les objets sont généralisés selon un trait distinctif unique, dans le complexe ils le sont selon des critères empiriques divers. C’est pourquoi le concept reflète la liaison et le rapport essentiels, uniformes entre les objets alors que le complexe reflète liaison de fait, fortuite, concrète. » (1997, p. 217)

Il faut ajouter une autre différence de base entre concept et complexe, c’est le fait « qu’à la différence du concept, l’élément concret entre dans le complexe en tant qu’unité de base intuitive, réelle, avec tous ces traits distinctifs et liaisons de fait. Le complexe n’est pas supérieur à ses éléments comme l’est le concept par rapport aux objets qui le composent. Le complexe se confond avec en fait avec les objets concrets qui le constituent en se liant entre eux…Aussi le complexe, inséparable en fait du groupe concret des objets qu’il réunit et se confondant immédiatement avec ce groupe intuitif, prend-il souvent un caractère indéterminé et en quelque sorte fluide. » (ibid. p. 223)

Autrement dit, ce qui fait le concept, ce sont les propriétés communes rigoureusement identifiées des objets qui le composent, ce qui induit que le contenu du concept est extensible à tous les objets qui possèdent ou acquièrent lesdites propriétés, tandis que ce qui fait le complexe, c’est l’assemblage souvent hétérogènes d’objets divers.

Il est clair qu’il y a équivalence entre le concept ici défini en termes de psychologie cognitive et la catégorie constituées d’entités satisfaisant à des conditions nécessaires et suffisantes dans la tradition aristotélicienne que l’on retrouve dans le schéma hjelmslévien. Comme le rappelle F. Rastier (1988, p. 68), deux sémèmes sont distincts dans le système fonctionnel de la langue s’ils diffèrent par au moins un sème inhérent.

On peut tirer de ce qui précède une première conclusion tout à fait fondamentale : à savoir que si le concept s’exprime par le mot, le mot ne se ramène pas au concept, et en tant que signe, il exprime, plus exactement, comme le dit Vygotski (1997, p. 431), il réalise diverses formes de pensée qui peuvent le cas échéant être les équivalents fonctionnels que sont en particulier les pseudo concepts. Or, si ces formes de pensée ont été plus particulièrement mises en évidence et analysées par Vygotski dans le cadre de l’étude de la pensée enfantine, ces formes de pensée sont également dominantes dans les pensées des peuples primitifs, elles sont caractéristiques de certaines pathologies de l’adulte. Nous ajoutons pour notre part, sans le support expérimental de Pensée et langage, que la pensée par concepts est probablement loin de mobiliser l’activité psychique des adultes et qu’entre le manuel, l’artiste et l’intellectuel, si l’on veut bien pardonner cette typologie un peu grossière, les modes de pensée peuvent différer sensiblement, observation en rapport direct avec la vie du langage.

Cette remarque n’est pas faite pour ouvrir un nouveau chantier de recherche que nous n’avons pas les moyens d’entreprendre, mais pour introduire une seconde remarque destinée à souligner le fait que certains domaines comme les mathématiques, les sciences, la technologie ou le droit, sont exclusivement réservés à la pensée par concepts. Et cette observation a une traduction immédiate au plan sémantique donnée par F. Rastier en ces termes (1987, p. 160) : "Privée de son rapport aux sciences, la vérité devient un phénomène purement linguistique, l’effet d’une cohésion sémantique."

"…On note (en effet) des différences entre sémèmes "ordinaires" et un sémème-"concept" d’un texte scientifique ou technique, différences qui sont dues au fonctionnement propre des discours scientifiques et techniques : un sémème‑"concept" n’est constitué que de traits inhérents. »

Ainsi, scientifiquement ou juridiquement, un énoncé pourra être dit absolument vrai ou absolument faux, alors que linguistiquement, le même énoncé pourra être dit plutôt vrai ou plutôt faux.

Le droit repose, tout en usant du langage ordinaire, sur un langage de type scientifique ou technique. La pensée juridique est une pensée conceptuelle qui utilise donc essentiellement des sémèmes-"concepts" et non des concepts "ordinaires", organisés en taxinomies scientifiques et non en taxinomies vulgaires et, dans le cas de termes flous – certains le sont de manière irréductible – tout son effort sera de les transformer en concepts.

Notre troisième et dernière observation en conclusion de ce développement sur les fondements psychologiques de la catégorisation, est que l’on aperçoit nettement une double dissociation, fortement soulignée au demeurant par Vygotski (1997, p.243) qui est un des fondements de la linguistique moderne : d’une part entre mot et signification, puisqu’un même mot est susceptible non seulement de changer de signification avec le temps mais de prendre simultanément plusieurs significations identifiables en fonction du contexte ou du cotexte de l’énonciation ; d’autre part entre signification et référent puisqu’à un même référent désigné par un même mot ou par plusieurs mots peut correspondre une seule ou plusieurs significations, l’une résultant d’une pensée par concept et les autres d’une pensée par complexes sous la forme de pseudo-concepts.

On peut de cette double dissociation tirer plusieurs schémas :

langue3 4 Structuration Vygotski schéma2 1

langue3 4 Structuration Vygotski schéma2 2





La question du rapport entre signification(s) et référent(s) n’est pas le problème de la linguistique. Par contre, il nous apparaît important de souligner que la question du rapport entre signification(s) et mot(s) qui est la base de la sémantique paraît bien maîtrisée par la sémantique interprétative, contrairement à la conclusion à notre sens erronée à laquelle étaient parvenus J-J Frankel et Daniel Lebaud dans l’étude précédemment citée.

Il existe une notion sous-estimée par le courant linguistique né autour d’Antoine Culioli qui est celle de domaine sémantique ou domaine d’expérience dont la fonction est totalement différente de la notion de domaine notionnel selon Culioli. Culioli. Celle-ci cherche avant tout à appréhender le déformable et le transcatégoriel (1990, p. 12), alors que Rastier a pour but de maîtriser la signification dans la dynamique du langage en dépit de son instabilité naturelle et des phénomènes transversaux de transfert de sens ou de signification (nous ne faisons pas ici de différence entre les deux termes). La conception du domaine selon Rastier, « groupe de taxèmes, lié à l’entour socialisé, et tel que dans un domaine déterminé il n’existe pas de polysémie » (1987, p. 274), indique très nettement la fonction sémantique de réducteur d’ambiguïté du domaine. Le domaine est le sème générique assurant pour un mot polysémique le rôle de connecteur vers l’un des sens communément acceptés. Et l’identification du domaine résulte du contexte et du cotexte de l’énonciation.

Les modèles sémantiques

Il s’agit de poursuivre l’exploration du sémème. Nous indiquons les définitions et quelques exemples principalement empruntés à Bernard Pottier (TAL, 1992)

La partition fondamentale

Toute détermination d’un élément A suppose un reste qui n’y entre pas ou non-A. Etre ou ne pas être.

On peut dire que la dimension, telle que définie par Rastier dont les termes sont dans des relations de disjonction exclusive, se rattache à ce modèle : animé/vs/inanimé, continu/vs/discontinu ou discret, permanent/vs/intermittent, matériel/vs/immatérielle, humain/vs/non humain, etc.

Mais, a priori de nombreux traits sémantiques n’appartenant pas à la catégorie de généralité supérieure, obéissent à cette partition fondamentale, puisque Pottier y inclut à titre d’exemple quelques distinctions du domaine de la linguistique : focalisé/vs/non focalisé, Thématisé/vs/non thématisé, spécifié/vs/non spécifié.

Le modèle binaire continu

Il s’agit d’une gradation continue d’une certaine quantité entre deux pôles.

Ex. : exclu...possible...probable...certain

un peu...beaucoup...passionnément...à la folie

minuscule...petit...moyen...grand...énorme

Le modèle ternaire continu

La détermination est relative à deux pôles, mais le mélange des deux est possible. Ainsi :

avant ... pendant... après

Le modèle ternaire discontinu

Le troisième terme s’exclut des deux termes de référence. Il n’est ni l’un ni l’autre, tout en appartenant à la catégorie, ce qui laisse un quatrième terme, qui est la négation de la catégorie. Ex. : je, tu , il , il impersonnel ou ça; ici, là, ailleurs...

On se demande pourquoi, théoriquement, l’on ne pourrait pas avoir des modèles quaternaires, à cinq termes ou plus basés sur le même principe.

Le modèle cyclique

C’est une amélioration du modèle binaire continu. Ex. : être grand...rapetisser...être petit...grandir...être grand...

Deux variantes :

- polarisation à une période répétable :

être chaud...refroidir...être froid...se réchauffer...être chaud

amour...désintérêt...indifférence...(mouvement d’antipathie) ...répulsion ...haine ...indifférence ...attirance...affection...(mouvement de sympathie)...amour

- polarisation ordonnée :

être sec...se mouiller...être mouillé...sécher...être séché

Au plan méthodologique, il est évidemment très intéressant, lorsque l’on établit le sémème d’un lexème ou d'une lexie, d’utiliser ce type de construction.

La noémique

Alors que le sème est le trait distinctif sémantique d’un sémème, relativement à un petit ensemble de termes réellement disponibles et vraisemblablement utilisables chez le locuteur dans une circonstance donnée de communication, le noème est un trait de sens posé indépendamment de toute langue naturelle. Il est absolu (et non relatif à un ensemble) et son existence est décidée par l’analyste.

Pottier cite en exemple que le sexe, illustré par mâle ou femelle, est un noème permettant de différencier la jument du cheval, tandis que le nombre de roues pour différencier, l’auto, la moto et le vélo est lié à un type de civilisation et de culture.

Si l’affinité entre sème générique et noème est évidente, on ne saurait donc les confondre. Il s’agit d’une distinction supplémentaire qui se superpose à celle des sèmes génériques et spécifiques. Le sémème renferme des sèmes génériques et spécifiques qui peuvent être soit des noèmes (Sn), soit des sèmes pragmatiques (Sp). Ainsi, nous avons deux formules qui se superposent :

sème = {x Sg + y Ssp)

et

sème = {x’ Sn + y’ Sp)

Nous conviendrons de signaler les sèmes noémiques par un astérisque.

Pottier propose une présentation de l’ensemble des noèmes en cinq grandes classes, classification inspirée de divers linguistes contemporains (Kl. Heger, R. Martin, M. Metzeltin, H. Sebag) et aussi du mathématicien René Thom :

- EXISTENCE

- CARACTERISATIONS

- LOCALISATIONS

- HIERARCHIES

- MODULATIONS

Nous renvoyons à TAL pour les développements relatifs à chacune de ces classes. Nous les évoquerons en cours d’analyse.

Nous donnerons ici seulement un exemple. S’agissant de la classe EXISTENCE, les noèmes peuvent se rapporter à la vie et à la durée de vie d’une entité, et nous avons alors trois possibles existentiels : l’inchoatif (naître, apparaître, créer, dessiner,...), le continuatif (vivre, demeurer, être, faire vivre, maintenir,...) et le terminatif (mourir, disparaître, tuer, détruire,...).

Les noèmes peuvent représenter les types de coexistence entre entités, et nous avons trois hypothèses : la coexistence, le rapprochement, spatial ou notionnel (attrait, attraction, attirance, accord, union collusion,...), la distanciation (se séparer, se fendiller, casser, lancer, vendre, émettre,...).

Nous aurons tendance à placer « vendre » dans une catégorie de noèmes qui serait « l’échange » qui correspondrait peut-être à une quatrième sous-type de coexistence entre entités.. Néanmoins, on voit la richesse de cette approche et son caractère structurant pour l’analyse sémantique.

Pratiquement, la structure des sémèmes que nous avons décrite dans le premier rapport d’étape n’est pas à modifier. Seulement, et le progrès est considérable, on peut dire que tout lexème doit se rattacher à au moins une classe noémique, et donc posséder au moins un sème générique qui soit un noème, ce qui ne veut pas dire que tout sème générique sera un noème et qu’il est exclu que des sèmes spécifiques soient eux-mêmes des noèmes. Il conviendra de démontrer expérimentalement la présente proposition. Quoi qu’il en soit la possibilité de structuration de l’analyse sémique par les noèmes est des plus précieuses et est d’application immédiate pour la conception du module d’analyse sémique.

Retour au sème et au sémème

Reste à traduire ces organisations au moyen de sèmes.

Rappelons d’abord la définition du sème dont Pottier a donné plusieurs formulations. Il est l’unité minimale distinctive d’un sémème par rapport à d’autres sémèmes associés dans un ensemble d’expérience (TAL, p. 66), à comparer à la formulation que nous avons donnée p. 205.

De ce fait, l’expression du sème est relativement libre. Selon Pottier, le sème « doit se dire avec autant de mots de la langue naturelle qu’il faut pour bien mettre en relief le trait distinctif relatif à l’ensemble considéré. Et de préciser (TAL, p.73) que la « dénomination du sème est un discours paraphrastique à vocation métalinguistique. Cette liberté n’autorise bien évidemment pas toutes les fantaisies.

Inversement, seuls sont requis pour composer le sémème, les sèmes strictement nécessaires pour différencier un sémème d’autres sémèmes associés dans un même ensemble d’expérience. C’est dire que si le sémème exprime un contenu, il n’exprime pas tous les contenus (signifiés) possibles d’un signifiant ni la totalité d’un contenu.

Selon le locuteur et/ou le contexte d’énonciation, tel terme pourra avoir des significations plus ou moins différentes.

Pottier prend par exemple le cas de pont. « Dans une statistique économique qui relèvera le nombre de ponts dans une région, on aura le cas limite de l’objet lui-même, hors fonctionnement. Mais en général, chaque objet est lié à un certain nombre de fonctions privilégiées dans un milieu socioculturel déterminé. Ainsi, l’ingénieur des Ponts et Chaussées verra le pont comme l’objet d’une activité constructrice, alors que le touriste y verra un lieu de passage. » (TAL p.79). Le sémème de pont peut donc varier en fonction de ces contextes différents.

Par ailleurs, il n’est pas nécessaire que le sémème comprennent la liste de tous les sèmes impliqués par le terme.

S’il s’agit d’opposer libraire à disquaire, l’élément distinctif est le sème /livre/ ou /disque/ :

libraire : {/homme  vendre  livres /}

disquaire : {/homme  vendre  disques /}

De leur côté, les sémèmes de livre et de disque, qui sont l’un et l’autre un type de média, se distinguent par le type de support et par la fonction de sens qui s’exerce :

livre : {/support papier, avec message, pour lire/}

disque : {/support plastique, avec message, pour entendre/}

Pour autant, le fait de considérer que le sème /livre/ que l’on trouve dans le sémème de libraire intègre les sèmes du signe livre pose problème. Comme le soutient B. Pottier (1974, p. 102), le sème /livre/ n’a pas à être décomposé au niveau du signe libraire, car globalement il suffit à définir libraire par rapport à disquaire. Cependant, le sémème ne peut intégrer en tant que sème, le sémème, c’est-à-dire l’ensemble des sèmes, de livre, mais l’énoncé vend des livres, car le libraire, ne saurait hériter aucune des propriétés de livre.

On ne peut donc pas dire que libraire, par son sémème, implique le sème /livre/ (et non le signe livre).

Cette approche différentielle s’oppose radicalement à celle proposée par J. SOWA (1984 p.110) et citée par F. RASTIER (1991 p.144) qui utilise les graphes conceptuels pour modéliser des contenus linguistiques.

Ainsi, SOWA propose le graphe suivant pour to buy :

langue3 7 structuration retourauxsèmes

A l’opposé de ce type de représentation, le sémème de vendre peut se ramener à quatre sèmes :

vendre : {/échange, rapport à droit de propriété, avec monnaie, rapport à origine/}

En effet, ce qui distingue la vente du troc, c’est la présence de monnaie dans les termes de l’échange. Ce qui distingue la vente de la location, c’est le fait que l’objet de l’échange est un droit de propriété. Ce qui distingue la vente de l’achat, c’est la vision de l’acte qui est le même. Dans la vente on se place du point de vue du détenteur initial du bien, dans l’achat on se place du point de vue du nouveau détenteur du même bien. Donc, nonobstant la complexité intrinsèque des sèmes /échange/ et /propriété/, les sémèmes correspondants sont :

troc : {/échange, sans monnaie, rapport à droit de propriété, bien, rapport à origine/}

location : {/échange, avec monnaie, droit d’usage, rapport à origine/}

achat : {/échange, avec monnaie, rapport à droit de propriété, rapport à destination/}

Il est clair que les sèmes /échange/ et /propriété/ sont des sèmes complexes qui sont susceptibles d’une analyse particulière. On remarquera que le graphe conceptuel proposé par SOWA n’est pas davantage explicite en ce qui concerne la notion de propriété qui n’apparaît que de manière implicite à travers le terme « seller ».

L’échange peut être représenté par un sémème. Il peut l’être aussi symboliquement en tant que noème en s’inspirant des schémas proposés par René Thom et repris par B. Pottier (TAL p.84 à 87), ce qui donnerait le schéma suivant :

 langue3 7 structuration retourauxsèmes2

Nous sommes ici en présence de plusieurs modes de représentation.

Le modèle des graphes conceptuels repose en réalité sur une approche ensembliste incluant le schéma entité-relation. Il a une finalité plus descriptive que linguistique. Limité au schéma entité-relation, il ne rend nullement compte de la source différentielle du sens. Ce qui importe linguistiquement, c'est de différencier la vente de la location ou du don. La description du sens par une liste de sèmes appartenant non à un ensemble, mais à un sous-ensemble, le sémème, d'un ensemble de définition, le taxème, répond beaucoup mieux à ce que l'on doit considérer comme un contrainte forte au niveau de la représentation. Ajoutons également que la représentation du sens n'implique pas nécessairement la présence de relations.

En réalité, la représentation par graphes conceptuels dans sa formulation complète, et non dans sa forme vulgarisée, répond aux objections ici présentées. Toutefois, les graphes conceptuels restent un mode de représentation graphique sans application directe et immédiate au plan informatique. Même au plan graphique, son pouvoir d'évocation n'est pas supérieur à celui de la représentation en arbre dès lors qu'il s'agit de positionner un taxe dans un taxème. Que l'on en juge :

langue3 7 structuration retourauxsèmes3

La représentation symbolique ne permet que la représentation d'atome (morphème) ou de molécule (lexie) de signification, et malgré sa puissance d'expression, ne peut faire oublier que l'écriture est elle-même symbolique, et le graphisme de René Thom, s'il nous permet de progresser dans la découverte des structures des sémèmes, n'apporte rien quant au traitement informatique des formes linguistiques.

Le mode componentiel s’appuie sur les mécanismes élémentaires de la mémorisation et de la compréhension et ne comporte que les traits strictement nécessaires à la correcte identification dans un contexte d’énonciation déterminé des lexèmes utilisés, c’est-à-dire à la mobilisation par les locuteurs de leur compétence linguistique. On ne saurait se dissimuler cependant les limitations attachées à la représentation componentielle classique fondée sur des listes de sèmes.

F. Rastier signale ainsi que pour le lexicologue, la définition est la description des unités sémantiques dont se compose le sens des unités lexicales. Cette description comporte deux aspects corrélatifs : l'identification des traits de sens pertinents, que l'on appelle les sèmes, et l'identification des relations entre ces sèmes, qui permet de décrire le sens comme une structure et non comme un inventaire de traits. (1994, p.48).

Cette remarque est à rapprocher de l'annotation de R. Martin (1992, p.79) se rapportant à l'un des sémèmes attachés au mot blaireau qui est le suivant :

2 : "Pinceau /S2/ fait de poils/s21/ de/s22'/ blaireau/s22/ dont se servent les peintres, les doreurs.../s23/

R. Martin souligne que la proposition "de" est notée s22', car elle n'exprime pas un sème à proprement parler, mais une relation entre sèmes. Et d'ajouter : "On ne tient pas compte ici - et c'est évidemment une grande faiblesse - de la structure syntaxique interne à la définition.

Relevons que cette observation s'applique de la même façon à dont se servent qui exprime une relation entre pinceau et les peintres, les doreurs,...

Pottier est également parfaitement conscient de la difficulté quand il précise qu'un sème ne se réduit pas nécessairement à un seul mot mais doit au contraire comprendre tous les mots nécessaires pour l'exprimer. (TAL, p. 73)

Au niveau de la représentation, on se trouve inéluctablement conduit à inclure dans la structure du sémème les relations entre sèmes, quitte à choisir entre la transcription non structurée de la relation, comme dans dont se servent les peintres, ou de développer ce sème complexe si nécessaire en individualisant la relation et ses deux arguments.

Ajoutons une considération théorique de la plus grande d'importance : Pottier relève que "le sème n'existe pas plus à l'état isolé que le phème (/nasalité/ ou / alvéolaire/). L'unité d'existence sémantique, en langue naturelle, est le sémème, ou ensemble de sèmes coexistants". (TAL, p. 66)

Nous proposons donc de considérer le sémème comme un objet complexe dans lequel les sèmes sont soit des attributs simples, soit des sémèmes réductibles à leur nom (livre), sous la réserve que nous avons faite plus haut p. 2 , soit encore des relations entre sèmes, également réductibles à leur nom de relation.

De la sorte, nous réduisons sensiblement l'écart souligné par F. Rastier entre la représentation par graphes conceptuels et la représentation de type componentielle. Nous nous donnons les moyens également d'un traitement informatique à l'aide des langages et des bases de données orientées objet.

Nous pensons que le domaine du droit constitue à lui seul un contexte d’énonciation suffisamment stable pour assurer pleine validité et efficacité à la sémantique componentielle.

Sémèmes composés ou sémie

Si l’on s’en tient à la définition initiale donnée par B. Pottier, le sémème est formé de l’ensemble des sèmes d’un signe au niveau du morphème.

La question est donc posée de la légitimité des sémèmes aux niveaux supérieurs, soit celui du lexème, du groupe, voire du syntagme.

Nous ne voyons pas pour notre part d’objection à ce que l’on établisse le sémème d’un lexème qui est lui-même le résultat d’une combinaison de un ou plusieurs morphèmes qui n’ont pas d’existence propre indépendamment du ou des lexèmes auxquels ils sont incorporés.

Rastier propose de limiter l'emploi du terme sémème au niveau du morphème et d'appeler sémie le sémème du niveau du lexème ou de la lexie simple ou complexe. (1994, p.47)

Le souci d'une parfaite symétrie dans les concepts milite effectivement en faveur de cette évolution terminologique. Toutefois, nous n'apercevons pas de différence sensible, sinon dans le degré de complexité, entre la structure du sémème et celle de la sémie. Nous nous rallierons néanmoins au terme sémie lorsque nous nous situerons au niveau supérieur au morphème.

Si l’on prend par exemple le mot « herbivore », son sémème ne peut être très différent de celui que l’on peut bâtir à partir de sa définition à savoir "/qui mange de l’herbe/" et par extension (métonymie) "/qui mange exclusivement des végétaux/", et non pas "/herbe/, /manger/".

Quand Pottier nous invite à placer sur la même courbe cyclique « grandir », « être grand », « rapetisser », « être petit », il nous invite à établir le sémème composé ou sémie de « être grand» en même temps que celui de « grandir ».

Par voie de conséquence, il est légitime de poursuivre la construction des sémèmes jusqu’au syntagme qui forme une structure syntaxiquement homogène.

En première approximation, et en attendant de disposer d’une base d’exemples suffisante pour préciser, infirmer ou valider ces règles, nous poseront les règles suivantes :

- un sémème composé ne comportent que des dimensions compatibles entre elles, ce qui suppose une classification précise des dimensions possibles. Par exemple « humain » peut s’associer à « animé » et non, sauf effet littéraire recherché, à « inanimé ».

- le domaine d’un sémème composé est constitué par le domaine de plus grande spécificité des domaines des composants du sémème.

- le taxème d’un sémème composé est constitué du taxème de la base du sémème composé.

- le sémantème d’un sémème composé est constitué de la somme des sémantèmes des composants du sémème composé.

Par exemple, comment construire la sémie de « ballon de football » à partir du sémème de « ballon » et du sémème de « football ».

Le sémème « ballon » correspond à une réalité matérielle /inanimé/ (dimension). Il appartient au domaine de la représentation et se définit comme une /forme/ (taxème). Il se déploie dans l’espace en trois dimensions. Il se spécifie par une /rotondité floue/ (Pottier TAL p.66) qui définit un volume largement ou complètement clos.

Le sémème football appartient au domaine du /sport/ lequel constitue une activité humaine. C’est un /sport collectif qui utilise un ballon rond que l’on pousse avec le pied/.

Plusieurs solutions sont envisageables pour construire la sémie de « ballon de football ».

Ou bien l’on ignore l’idée transversale de ballon qui s’inscrit dans une multitude de domaines en y représentant des objets variés. Dans ce cas « ballon » pourra être considéré comme un taxème appartenant au domaine du /sport/ et les différents types de ballon seront autant de sémèmes ayant mêmes sèmes génériques et opposés les uns aux autres par leurs sèmes spécifiques correspondant en particulier aux différents sports de ballon.

Mais on retrouvera « ballon » dans le domaine de la /verrerie/, comme étant un certain /type de verre ayant une forme particulière et principalement destiné à la consommation du vin/.

Dans cette conception, la proximité avec le mot football ou avec le mot vin joue le rôle d’un sélecteur de domaine pour le mot « ballon ».

Ou bien l’on considère deux sémèmes relevant de deux taxèmes et de deux domaines distincts, domaine de la représentation pour « ballon » et domaine du sport pour « football ». En fait, nous pouvons démontrer que les deux cheminements aboutissent au même résultat.

Sur cette base, on peut néanmoins poser quatre questions. Tous les lexèmes d’un même domaine sont-ils susceptibles de s’associer? Deux lexèmes appartenant à des domaines différents sont-ils dans l’impossibilité de s’associer? Quelle limite doit-on respecter dans cette faculté de construire des sémèmes composés? Enfin, ces interrogations ont-elles une portée pratique et laquelle?

L’aptitude des grammèmes à s’associer avec des lexèmes est commandée par des règles d’isosémie précises fondées sur des distinctions linguistiques fondamentales appartenant au système fonctionnel de la langue. Ainsi, « il se leva à 7 heures » est correct car « lever » comporte un sème non duratif, de même que « à », alors que « il se leva jusqu’à 7 heures » est incorrect en raison de la présence d’un sème duratif dans « jusqu’à » (Pottier 1974 p. 86).

De même, « s’insérer sur la table » est incorrect alors que « s’insérer dans la société » est correct en raison de la présence dans « s’insérer » d’un sème impliquant l’idée d’une entité susceptible de venir se loger à l’intérieur d’une autre entité, sème incompatible avec l’idée d’un entité posée à la surface d’une autre (sur). Ces catégories linguistiques ne doivent rien aux domaines d’expérience au sein desquels s’assemblent les taxèmes d’expérience et qui correspondent à des pratiques socialement normées (Rastier). Les grammèmes ne s’associent pas indistinctement avec n’importe quels lexèmes mais ils s’associent dans le respect de règles d’isosémie à des lexèmes appartenant à des domaines les plus divers. Alors que les lexèmes sont beaucoup plus sélectifs dans leur aptitude à s’associer.

La réponse à la première question nécessite un travail statistique de préférence à la recherche d’exemples dont la généralisation risque d’être contestable. Un « verre à vin » regroupe de toute évidence deux lexèmes dont l’un appartient à un seul domaine, « vin », et dont l'autre a dans ses domaines d’expérience possibles, le domaine auquel appartient le premier (« boisson »). On peut en dire autant de « ballon de football ». Mais il est fort probable que nous trouvions des cas où l’association de deux lexèmes du même domaine aboutisse à un résultat absurde.

Pour la deuxième question, on peut a priori répondre que deux lexèmes relevant de deux domaines différents ou n’ayant parmi leurs domaines possibles aucun domaine en commun, ne peuvent être associés. Si nous disons « la cave de la voiture », « la table de ma moto », « le sourire de la casserole », on obtient évidemment des appariements absurdes, à moins que ces appariements se traduisent par des effacements de sèmes et des activations d’autres sèmes (afférents) qui vident en quelque sorte l’incompatibilité de domaine et produisent des effets littéraires spécialement recherchés. Quand Rastier explique qu’un sème afférent est une relation d’un sémème avec un autre sémème qui n’appartient pas à son ensemble stricte de définition, on est en droit de penser qu’il limite la distance entre les deux sémèmes à une différence de taxème (puisque par ailleurs il définit le sème inhérent comme une relation entre deux sémèmes au sein d’un même taxème), mais deux lexèmes appartenant à deux domaines d’expérience différents appartiennent aussi à deux taxèmes différents.

On doit aller plus loin et s’interroger sur les limites de la notion de domaine qui n’a pas la simplicité que nous lui avons prêté jusqu’ici. Bernard Pottier, après A. Martinet, distingue les lexèmes et les grammèmes. Les lexèmes sont des morphèmes appartenant à des ensembles non finis, ouverts, et socialement instables, alors que les grammèmes sont des morphèmes appartenant à des ensembles finis, fermés et socialement stables. Laissons de côté le fait que les lexèmes sont eux-mêmes souvent composés de lexèmes et grammèmes.

Les grammèmes contiennent trois groupes : les affixes, flexifs, et les mots grammaticaux (déterminants, pronoms, etc.). Ils forment entre eux des taxèmes grammaticaux appartenant à des classes plus vastes, les domaines grammaticaux ou classes taxiques.

La difficulté principale vient du fait qu’entre les grammèmes et les lexèmes, on trouve des cas intermédiaires.

Le mot « s’insérer » est indiscutablement un lexème, mais on ne peut pas dire qu’il ait un domaine d’expérience particulier et toute tentative pour lister tous les domaines d’expérience dans lesquels son emploi est possible est sans doute vouée à l’échec.

En fait, B. Pottier, définit pour chacune des voix les domaines sémantiques qui s’y rapportent. On observera que les domaines ainsi définis ne sont pas liés à une expérience particulière mais peuvent s’exprimer dans une multitude de situations hétérogènes. Ainsi, le situatif vise trois domaines sémantiques, à l’intérieur desquels de nombreuses distinctions sont possibles : le domaine temporel, le domaine spatial et le domaine notionnel. Le lexème « insertion » s’inscrit a priori dans le domaine spatial (« la clé s’insère bien dans la serrure », « cette armoire s’insère bien dans la chambre »,etc.), encore que l’on peut dire « s’insérer dans une entreprise », « s’insérer dans la société » (notionnel), « s’insérer dans son époque » (temporel). Le temporel, le spatial et le notionnel ne correspondent pas à des domaines d’expérience tels que les définit B. Pottier (ensemble de taxèmes lexèmiques liés à l’expérience : « politique », « chirurgie »). Pourtant, ces différents emplois d’« insérer » s’effectuent sans changement de signification de telle sorte qu’on peut considérer que « s’insérer » appartient bien à un domaine sémantique propre, à l’intérieur duquel, selon la définition de F. Rastier, n’existe pas de polysémie. Peut-on dire pour autant que le domaine auquel appartient « s’insérer » soit comme le précise F. Rastier, par sa composition et son inventaire, « liés à des normes sociales », ou recouvre, selon B. Pottier « une zone thématique vaste, liée à l’expérience du groupe » (1974, p; 97). Il semble que les domaines sémantiques utilisés par B. Pottier dans la théorie des voix soient communs à toutes les langues et correspondent à des domaines noémiques. Nous sommes donc conduits à admettre l’existence de domaines sémantiques non nécessairement hiérarchisés qui comporteraient une catégorie restreinte de domaines grammaticaux (Pottier 1974 p. 68), des domaines sémantiques que nous proposons de dénommer domaines noémiques, et enfin des domaines d’expérience, effectivement liés à des normes sociales et à l’expérience du groupe.

Cette hiérarchisation paraît de nature à faciliter l’établissement des règles de détermination du domaine d’un sémème composé.

En ce qui concerne les domaines grammaticaux ou classes taxiques, l’affaire est entendue, ils n’ont aucun rôle dans la détermination d’un domaine d’expérience. Ils sont par structure totalement polyvalents et transversaux à tous les domaines d’expérience.

Il est fort probable qu’il en soit de même des domaines noémiques. Ceux-ci en effet qui se distribuent dans les différentes voix identifiées par B. Pottier, expriment en réalité des relations, comme le font la plupart des affixes, des flexifs et des mots grammaticaux..

Autrement dit, en présence d’un lexème relevant d’un domaine d’expérience défini, les domaines grammaticaux et noémiques s’effacent devant le domaine d’expérience. Dans « insertion sociale », c’est le domaine auquel se rattache « social » qui détermine le domaine de l’ensemble. Dans « le goût de vivre », « le goût du théâtre », « le goût de la liberté », le « goût de la politique », etc. ce sont « vivre », « théâtre », « liberté » « politique » qui déterminent le domaine d’expérience.

Il y a donc des mots qui relèvent de domaines grammaticaux, d’autres de domaines noémiques et enfin d’autres qui appartiennent à des domaines d’expérience. Si nous reprenons les catégories conceptuelles de base (objets physiques, objets abstraits, propriétés, états, procès et actions), seuls les objets physiques peuvent être rattachés directement à un domaine d’expérience. Les objets abstraits résultant de l’objectivation d’une action, suivent le comportement du lexème dont ils sont dérivés (ex. : « insertion » pour « insérer »). Par contre les objets abstraits substantivaux primaires se rattachent à un domaine d’expérience : la philosophie, l’art, la peinture, l’architecture, la littérature ne sont pas des objets physiques, mais ont bien chacun un domaine d’expérience défini.

Donc, en présence de plusieurs lexèmes associés dans un sémème composé, le domaine qui détermine le domaine de l’ensemble est le domaine de plus forte spécificité, soit le domaine d’expérience, domaine qui par construction est unique.

Nous en venons à la troisième question : quelle limite existe -il à la possibilité d’associer entre eux des lexèmes pour en tirer des sémèmes composés?

Ce que nous venons de dire ne permet en aucune manière de poser des limites.

De manière tout à fait intuitive, on pourrait dire que l’association est possible quand une association présente une fixité suffisante pour qu’en langue on puisse imaginer une lexémisation. « Insertion sociale » peut donner « socialisation », même si les deux termes prennent en réalité des sens légèrement différents. « Egalité des chances », constitue quasiment une lexie. « Le plaisir d’écrire » n’en est pas une mais on pourrait imaginer une lexicalisation, qui probablement se réaliserait sans effort dans une langue agglutinante.

Au-delà des virtualités de lexémisation, la juxtaposition de sèmes ne permet plus au sémème de jouer le rôle d’identificateur par différenciation. L’intérêt de l’analyse sémique n’est plus d’identification et de mémorisation. Il devient de découvrir les isotopies et donc les cohésions textuelles qui, en établissant des relations de proximité, permettent de dégager une structure du texte étudié.

En dehors de cette analyse statistique du texte, au demeurant d’un très grand intérêt, la sommation de sèmes perd de sa pertinence. Plus l’on s’éloigne du syntagme et plus le sémème est inapte à rendre compte du sens.

Il est clair que le sémème, lorsqu’il est construit selon le principe de l’analyse différentielle, colle aux bases psychologiques de la mémorisation, et même s’il n’explicite pas la structure interne des concepts, suffit à leur identification pour des êtres ayant une compétence linguistique déterminée. Plus l’on s’éloigne du lexème et plus la relation entre le sémème et le signifié devient impressionniste et l’on perd les bases psychologiques de l’identification qui justifie l’analyse componentielle fondée sur la méthode différentielle (Rastier 1991 p. 141-145).

Nous venons cependant de poser quelques règles de sélection des domaines de nature à simplifier la recherche et le calcul des isotopies.

La question de l’unité minimale de signification et l’approche systémique

Les auteurs emploient fréquemment le singulier.

Ainsi, Maurice Gross (1986-1 p.II) voit dans la "phrase simple" "l'unité minimale de sens".

Cette assertion n'a rien d'évident et paraît de prime abord contradictoire avec l'approche componentielle développée précédemment.

En effet, Le Ny (79) énonce qu "l'unité sémantique de base n'est pas le signifié lexémique, mais un signifié de format inférieur, qui peut être atteint par une décomposition adéquate du lexème ou de la proposition".

Quant à B. Pottier, il définit le morphème comme le ‘‘signe minimal, indécomposable, à un moment de l’évolution d’une langue, l’unité minimale de signification’’.

Ni B. Pottier, ni F. Rastier ne ramène le sème à l'"unité sémantique de base". Nous avons donné plus haut la définition de B. Pottier (cf. p.205). Celle de Rastier est très proche qui y voit un "élément d'un sémème, défini comme l'extrémité d'une relation fonctionnelle binaire entre sémèmes".

Il est clair que tant pour B. Pottier que pour F. Rastier, le sème n'a pas d'existence indépendamment du morphème. Il est non moins clair que le morphème ne peut être isolé du contexte de l'énonciation; et la finalité du parcours analytique est de mettre en lumière toutes les structures internes du texte qui seront nécessaires au moment de la génération.

Il est nécessaire au stade actuel de la démarche de faire appel aux ressources de l'approche systémique, la seule qui soit en mesure de résoudre la contradiction apparente entre définitions de l'unité minimale de sens ou signification1.

1 Nous ne faisons pas ici la nuance, variable au demeurant selon les auteurs, entre sens et signification.

La représentation symbolique ne permet que la représentation d'atome (morphème) ou de molécule (lexie) de signification, et malgré sa puissance d'expression, ne peut faire oublier que l'écriture est elle-même symbolique, et le graphisme de René Thom, s'il nous permet de progresser dans la découverte des structures des sémèmes, n'apporte rien quant au traitement informatique des formes linguistiques.

Le mode componentiel s’appuie sur les mécanismes élémentaires de la mémorisation et de la compréhension et ne comporte que les traits strictement nécessaires à la correcte identification dans un contexte d’énonciation déterminé des lexèmes utilisés, c’est-à-dire à la mobilisation par les locuteurs de leur compétence linguistique. On ne saurait se dissimuler cependant les limitations attachées à la représentation componentielle classique fondée sur des listes de sèmes.

F. Rastier signale ainsi que pour le lexicologue, la définition est la description des unités sémantiques dont se compose le sens des unités lexicales. Cette description comporte deux aspects corrélatifs : l'identification des traits de sens pertinents, que l'on appelle les sèmes, et l'identification des relations entre ces sèmes, qui permet de décrire le sens comme une structure et non comme un inventaire de traits. (1994, p.48).

Cette remarque est à rapprocher de l'annotation de R. Martin (1992, p.79) se rapportant à l'un des sémèmes attachés au mot blaireau qui est le suivant :

  2 : "Pinceau /S2/ fait de poils/s21/ de/s22'/ blaireau/s22/ dont se servent les peintres, les doreurs.../s23/

R. Martin souligne que la proposition "de" est notée s22', car elle n'exprime pas un sème à proprement parler, mais une relation entre sèmes. Et d'ajouter : "On ne tient pas compte ici - et c'est évidemment une grande faiblesse - de la structure syntaxique interne à la définition.

Relevons que cette observation s'applique de la même façon à dont se servent qui exprime une relation entre pinceau et les peintres, les doreurs,...

Pottier est également parfaitement conscient de la difficulté quand il précise qu'un sème ne se réduit pas nécessairement à un seul mot mais doit au contraire comprendre tous les mots nécessaires pour l'exprimer. (TAL, p. 73)

Au niveau de la représentation, on se trouve inéluctablement conduit à inclure dans la structure du sémème les relations entre sèmes, quitte à choisir entre la transcription non structurée de la relation, comme dans dont se servent les peintres, ou de développer ce sème complexe si nécessaire en individualisant la relation et ses deux arguments.

Ajoutons une considération théorique de la plus grande d'importance : Pottier relève que "le sème n'existe pas plus à l'état isolé que le phème (/nasalité/ ou / alvéolaire/). L'unité d'existence sémantique, en langue naturelle, est le sémème, ou ensemble de sèmes coexistants". (TAL, p. 66)

Nous proposons donc de considérer le sémème comme un objet complexe dans lequel les sèmes sont soit des attributs simples, soit des sémèmes réductibles à leur nom (livre), sous la réserve que nous avons faite plus haut p. 2 , soit encore des relations entre sèmes, également réductibles à leur nom de relation.

De la sorte, nous réduisons sensiblement l'écart souligné par F. Rastier entre la représentation par graphes conceptuels et la représentation de type componentielle. Nous nous donnons les moyens également d'un traitement informatique à l'aide des langages et des bases de données orientées objet.

Nous pensons que le domaine du droit constitue à lui seul un contexte d’énonciation suffisamment stable pour assurer pleine validité et efficacité à la sémantique componentielle.

           Sémèmes composés ou sémie

Si l’on s’en tient à la définition initiale donnée par B. Pottier, le sémème est formé de l’ensemble des sèmes d’un signe au niveau du morphème.

La question est donc posée de la légitimité des sémèmes aux niveaux supérieurs, soit celui du lexème, du groupe, voire du syntagme.

Nous ne voyons pas pour notre part d’objection à ce que l’on établisse le sémème d’un lexème qui est lui-même le résultat d’une combinaison de un ou plusieurs morphèmes qui n’ont pas d’existence propre indépendamment du ou des lexèmes auxquels ils sont incorporés.

Rastier propose de limiter l'emploi du terme sémème au niveau du morphème et d'appeler sémie le sémème du niveau du lexème ou de la lexie simple ou complexe. (1994, p.47)

Le souci d'une parfaite symétrie dans les concepts milite effectivement en faveur de cette évolution terminologique. Toutefois, nous n'apercevons pas de différence sensible, sinon dans le degré de complexité, entre la structure du sémème et celle de la sémie. Nous nous rallierons néanmoins au terme sémie lorsque nous nous situerons au niveau supérieur au morphème.

Si l’on prend par exemple le mot « herbivore », son sémème ne peut être très différent de celui que l’on peut bâtir à partir de sa définition à savoir "/qui mange de l’herbe/" et par extension (métonymie) "/qui mange exclusivement des végétaux/", et non pas "/herbe/, /manger/".

Quand Pottier nous invite à placer sur la même courbe cyclique « grandir », « être grand », « rapetisser », « être petit », il nous invite à établir le sémème composé ou sémie de « être grand» en même temps que celui de « grandir ».

Par voie de conséquence, il est légitime de poursuivre la construction des sémèmes jusqu’au syntagme qui forme une structure syntaxiquement homogène.

En première approximation, et en attendant de disposer d’une base d’exemples suffisante pour préciser, infirmer ou valider ces règles, nous poseront les règles suivantes :

- un sémème composé ne comportent que des dimensions compatibles entre elles, ce qui suppose une classification précise des dimensions possibles. Par exemple « humain » peut s’associer à « animé » et non, sauf effet littéraire recherché, à « inanimé ».

- le domaine d’un sémème composé est constitué par le domaine de plus grande spécificité des domaines des composants du sémème.

- le taxème d’un sémème composé est constitué du taxème de la base du sémème composé.

- le sémantème d’un sémème composé est constitué de la somme des sémantèmes des composants du sémème composé.

Par exemple, comment construire la sémie de « ballon de football » à partir du sémème de « ballon » et du sémème de « football ».

Le sémème « ballon » correspond à une réalité matérielle /inanimé/ (dimension). Il appartient au domaine de la représentation et se définit comme une /forme/ (taxème). Il se déploie dans l’espace en trois dimensions. Il se spécifie par une /rotondité floue/ (Pottier TAL p.66) qui définit un volume largement ou complètement clos.

Le sémème football appartient au domaine du /sport/ lequel constitue une activité humaine. C’est un /sport collectif qui utilise un ballon rond que l’on pousse avec le pied/.

Plusieurs solutions sont envisageables pour construire la sémie de « ballon de football ».

Ou bien l’on ignore l’idée transversale de ballon qui s’inscrit dans une multitude de domaines en y représentant des objets variés. Dans ce cas « ballon » pourra être considéré comme un taxème appartenant au domaine du /sport/ et les différents types de ballon seront autant de sémèmes ayant mêmes sèmes génériques et opposés les uns aux autres par leurs sèmes spécifiques correspondant en particulier aux différents sports de ballon.

Mais on retrouvera « ballon » dans le domaine de la /verrerie/, comme étant un certain /type de verre ayant une forme particulière et principalement destiné à la consommation du vin/.

Dans cette conception, la proximité avec le mot football ou avec le mot vin joue le rôle d’un sélecteur de domaine pour le mot « ballon ».

Ou bien l’on considère deux sémèmes relevant de deux taxèmes et de deux domaines distincts, domaine de la représentation pour « ballon » et domaine du sport pour « football ». En fait, nous pouvons démontrer que les deux cheminements aboutissent au même résultat.

Sur cette base, on peut néanmoins poser quatre questions. Tous les lexèmes d’un même domaine sont-ils susceptibles de s’associer? Deux lexèmes appartenant à des domaines différents sont-ils dans l’impossibilité de s’associer? Quelle limite doit-on respecter dans cette faculté de construire des sémèmes composés? Enfin, ces interrogations ont-elles une portée pratique et laquelle?

L’aptitude des grammèmes à s’associer avec des lexèmes est commandée par des règles d’isosémie précises fondées sur des distinctions linguistiques fondamentales appartenant au système fonctionnel de la langue. Ainsi, « il se leva à 7 heures » est correct car « lever » comporte un sème non duratif, de même que « à », alors que « il se leva jusqu’à 7 heures » est incorrect en raison de la présence d’un sème duratif dans « jusqu’à » (Pottier 1974 p. 86).

De même, « s’insérer sur la table » est incorrect alors que « s’insérer dans la société » est correct en raison de la présence dans « s’insérer » d’un sème impliquant l’idée d’une entité susceptible de venir se loger à l’intérieur d’une autre entité, sème incompatible avec l’idée d’un entité posée à la surface d’une autre (sur). Ces catégories linguistiques ne doivent rien aux domaines d’expérience au sein desquels s’assemblent les taxèmes d’expérience et qui correspondent à des pratiques socialement normées (Rastier). Les grammèmes ne s’associent pas indistinctement avec n’importe quels lexèmes mais ils s’associent dans le respect de règles d’isosémie à des lexèmes appartenant à des domaines les plus divers. Alors que les lexèmes sont beaucoup plus sélectifs dans leur aptitude à s’associer.

La réponse à la première question nécessite un travail statistique de préférence à la recherche d’exemples dont la généralisation risque d’être contestable. Un « verre à vin » regroupe de toute évidence deux lexèmes dont l’un appartient à un seul domaine, « vin », et dont l'autre a dans ses domaines d’expérience possibles, le domaine auquel appartient le premier (« boisson »). On peut en dire autant de « ballon de football ». Mais il est fort probable que nous trouvions des cas où l’association de deux lexèmes du même domaine aboutisse à un résultat absurde.

Pour la deuxième question, on peut a priori répondre que deux lexèmes relevant de deux domaines différents ou n’ayant parmi leurs domaines possibles aucun domaine en commun, ne peuvent être associés. Si nous disons « la cave de la voiture », « la table de ma moto », « le sourire de la casserole », on obtient évidemment des appariements absurdes, à moins que ces appariements se traduisent par des effacements de sèmes et des activations d’autres sèmes (afférents) qui vident en quelque sorte l’incompatibilité de domaine et produisent des effets littéraires spécialement recherchés. Quand Rastier explique qu’un sème afférent est une relation d’un sémème avec un autre sémème qui n’appartient pas à son ensemble stricte de définition, on est en droit de penser qu’il limite la distance entre les deux sémèmes à une différence de taxème (puisque par ailleurs il définit le sème inhérent comme une relation entre deux sémèmes au sein d’un même taxème), mais deux lexèmes appartenant à deux domaines d’expérience différents appartiennent aussi à deux taxèmes différents.

On doit aller plus loin et s’interroger sur les limites de la notion de domaine qui n’a pas la simplicité que nous lui avons prêté jusqu’ici. Bernard Pottier, après A. Martinet, distingue les lexèmes et les grammèmes. Les lexèmes sont des morphèmes appartenant à des ensembles non finis, ouverts, et socialement instables, alors que les grammèmes sont des morphèmes appartenant à des ensembles finis, fermés et socialement stables. Laissons de côté le fait que les lexèmes sont eux-mêmes souvent composés de lexèmes et grammèmes.

Les grammèmes contiennent trois groupes : les affixes, flexifs, et les mots grammaticaux (déterminants, pronoms, etc.). Ils forment entre eux des taxèmes grammaticaux appartenant à des classes plus vastes, les domaines grammaticaux ou classes taxiques.

La difficulté principale vient du fait qu’entre les grammèmes et les lexèmes, on trouve des cas intermédiaires.

Le mot « s’insérer » est indiscutablement un lexème, mais on ne peut pas dire qu’il ait un domaine d’expérience particulier et toute tentative pour lister tous les domaines d’expérience dans lesquels son emploi est possible est sans doute vouée à l’échec.

En fait, B. Pottier, définit pour chacune des voix les domaines sémantiques qui s’y rapportent. On observera que les domaines ainsi définis ne sont pas liés à une expérience particulière mais peuvent s’exprimer dans une multitude de situations hétérogènes. Ainsi, le situatif vise trois domaines sémantiques, à l’intérieur desquels de nombreuses distinctions sont possibles : le domaine temporel, le domaine spatial et le domaine notionnel. Le lexème « insertion » s’inscrit a priori dans le domaine spatial (« la clé s’insère bien dans la serrure », « cette armoire s’insère bien dans la chambre »,etc.), encore que l’on peut dire « s’insérer dans une entreprise », « s’insérer dans la société » (notionnel), « s’insérer dans son époque » (temporel). Le temporel, le spatial et le notionnel ne correspondent pas à des domaines d’expérience tels que les définit B. Pottier (ensemble de taxèmes lexèmiques liés à l’expérience : « politique », « chirurgie »). Pourtant, ces différents emplois d’« insérer » s’effectuent sans changement de signification de telle sorte qu’on peut considérer que « s’insérer » appartient bien à un domaine sémantique propre, à l’intérieur duquel, selon la définition de F. Rastier, n’existe pas de polysémie. Peut-on dire pour autant que le domaine auquel appartient « s’insérer » soit comme le précise F. Rastier, par sa composition et son inventaire, « liés à des normes sociales », ou recouvre, selon B. Pottier « une zone thématique vaste, liée à l’expérience du groupe » (1974, p; 97). Il semble que les domaines sémantiques utilisés par B. Pottier dans la théorie des voix soient communs à toutes les langues et correspondent à des domaines noémiques. Nous sommes donc conduits à admettre l’existence de domaines sémantiques non nécessairement hiérarchisés qui comporteraient une catégorie restreinte de domaines grammaticaux (Pottier 1974 p. 68), des domaines sémantiques que nous proposons de dénommer domaines noémiques, et enfin des domaines d’expérience, effectivement liés à des normes sociales et à l’expérience du groupe.

Cette hiérarchisation paraît de nature à faciliter l’établissement des règles de détermination du domaine d’un sémème composé.

En ce qui concerne les domaines grammaticaux ou classes taxiques, l’affaire est entendue, ils n’ont aucun rôle dans la détermination d’un domaine d’expérience. Ils sont par structure totalement polyvalents et transversaux à tous les domaines d’expérience.

Il est fort probable qu’il en soit de même des domaines noémiques. Ceux-ci en effet qui se distribuent dans les différentes voix identifiées par B. Pottier, expriment en réalité des relations, comme le font la plupart des affixes, des flexifs et des mots grammaticaux..

Autrement dit, en présence d’un lexème relevant d’un domaine d’expérience défini, les domaines grammaticaux et noémiques s’effacent devant le domaine d’expérience. Dans « insertion sociale », c’est le domaine auquel se rattache « social » qui détermine le domaine de l’ensemble. Dans « le goût de vivre », « le goût du théâtre », « le goût de la liberté », le « goût de la politique », etc. ce sont « vivre », « théâtre », « liberté » « politique » qui déterminent le domaine d’expérience.

Il y a donc des mots qui relèvent de domaines grammaticaux, d’autres de domaines noémiques et enfin d’autres qui appartiennent à des domaines d’expérience. Si nous reprenons les catégories conceptuelles de base (objets physiques, objets abstraits, propriétés, états, procès et actions), seuls les objets physiques peuvent être rattachés directement à un domaine d’expérience. Les objets abstraits résultant de l’objectivation d’une action, suivent le comportement du lexème dont ils sont dérivés (ex. : « insertion » pour « insérer »). Par contre les objets abstraits substantivaux primaires se rattachent à un domaine d’expérience : la philosophie, l’art, la peinture, l’architecture, la littérature ne sont pas des objets physiques, mais ont bien chacun un domaine d’expérience défini.

Donc, en présence de plusieurs lexèmes associés dans un sémème composé, le domaine qui détermine le domaine de l’ensemble est le domaine de plus forte spécificité, soit le domaine d’expérience, domaine qui par construction est unique.

Nous en venons à la troisième question : quelle limite existe -il à la possibilité d’associer entre eux des lexèmes pour en tirer des sémèmes composés?

Ce que nous venons de dire ne permet en aucune manière de poser des limites.

De manière tout à fait intuitive, on pourrait dire que l’association est possible quand une association présente une fixité suffisante pour qu’en langue on puisse imaginer une lexémisation. « Insertion sociale » peut donner « socialisation », même si les deux termes prennent en réalité des sens légèrement différents. « Egalité des chances », constitue quasiment une lexie. « Le plaisir d’écrire » n’en est pas une mais on pourrait imaginer une lexicalisation, qui probablement se réaliserait sans effort dans une langue agglutinante.

Au-delà des virtualités de lexémisation, la juxtaposition de sèmes ne permet plus au sémème de jouer le rôle d’identificateur par différenciation. L’intérêt de l’analyse sémique n’est plus d’identification et de mémorisation. Il devient de découvrir les isotopies et donc les cohésions textuelles qui, en établissant des relations de proximité, permettent de dégager une structure du texte étudié.

En dehors de cette analyse statistique du texte, au demeurant d’un très grand intérêt, la sommation de sèmes perd de sa pertinence. Plus l’on s’éloigne du syntagme et plus le sémème est inapte à rendre compte du sens.

Il est clair que le sémème, lorsqu’il est construit selon le principe de l’analyse différentielle, colle aux bases psychologiques de la mémorisation, et même s’il n’explicite pas la structure interne des concepts, suffit à leur identification pour des êtres ayant une compétence linguistique déterminée. Plus l’on s’éloigne du lexème et plus la relation entre le sémème et le signifié devient impressionniste et l’on perd les bases psychologiques de l’identification qui justifie l’analyse componentielle fondée sur la méthode différentielle (Rastier 1991 p. 141-145).

Nous venons cependant de poser quelques règles de sélection des domaines de nature à simplifier la recherche et le calcul des isotopies.

          La question de l’unité minimale de signification et l’approche systémique

Les auteurs emploient fréquemment le singulier.

Ainsi, Maurice Gross (1986-1 p.II) voit dans la "phrase simple" "l'unité minimale de sens".

Cette assertion n'a rien d'évident et paraît de prime abord contradictoire avec l'approche componentielle développée précédemment.

En effet, Le Ny (79) énonce qu "l'unité sémantique de base n'est pas le signifié lexémique, mais un signifié de format inférieur, qui peut être atteint par une décomposition adéquate du lexème ou de la proposition".

Quant à B. Pottier, il définit le morphème comme le ‘‘signe minimal, indécomposable, à un moment de l’évolution d’une langue, l’unité minimale de signification’’.

Ni B. Pottier, ni F. Rastier ne ramène le sème à l'"unité sémantique de base". Nous avons donné plus haut la définition de B. Pottier (cf. p.205). Celle de Rastier est très proche qui y voit un "élément d'un sémème, défini comme l'extrémité d'une relation fonctionnelle binaire entre sémèmes".

Il est clair que tant pour B. Pottier que pour F. Rastier, le sème n'a pas d'existence indépendamment du morphème. Il est non moins clair que le morphème ne peut être isolé du contexte de l'énonciation; et la finalité du parcours analytique est de mettre en lumière toutes les structures internes du texte qui seront nécessaires au moment de la génération.

Il est nécessaire au stade actuel de la démarche de faire appel aux ressources de l'approche systémique, la seule qui soit en mesure de résoudre la contradiction apparente entre définitions de l'unité minimale de sens ou signification1.

 

1 Nous ne faisons pas ici la nuance, variable au demeurant selon les auteurs, entre sens et signification.

Top