Lien avec Sémantique Générale

On peut mettre également en relation le chapitre X de TAL « Voix et prédication » et le chapitre VIII de Sémantique Générale « L’événement » ou B. Pottier, s’inspirant des représentations catastrophiques de René Thom, présentent les cinq aires événementielles :

L’aire existentielle

Une entité existe dans l’espace et dans le temps.

L’aire a

Une propriété peut lui être affectée (« Jean/être grand »). Une activité peut émaner d’elle (« Jean/marcher).

L’aire l

L’entité peut également entrer en relation avec le monde objectif, c’est la localisation (« Jean est dans le jardin »).

L’aire b

L’entité peut faire montre d’activité. Les activités issues de la base sont regroupées dans l’aire de l’activité m.

L’aire m

Si l’entité entre en relation avec le monde subjectif («Jean regarde la télévision »), c’est le domaine de la cognitivité (sensations, intellection, modalisation).

La rosace des possibles positionnels

D’où cinq aires événementielles données par le schéma suivant :

Ll4 7 Rosace1

Le quart nord-ouest est endocentrique (les deux flèches vont dans le même sens). C'est le domaine des PROPRIÉTÉS "α".

Le quart Sud-Est est exocentrique. Il recouvre les ACTIVITÉS "β".

Le quart Nord-Est est mixte, et établit les relations de LOCALISATION "γ".

Le quart Sud-Ouest est mixte, et établit les relations de COGNITIVITÉ "μ".

Ce support sémantique a selon B. Pottier une valeur universelle. Il se situe au niveau noémique ou conceptuel, au-delà de toute langue naturelle. Au-dessous, ce sont les spécificités des LN qui apparaissent et en particulier les voix qui semblent propres à chaque langue ou à chaque famille de langues.

Deux grandes caractéristiques sont à souligner.

D’abord, l’affinité de cette représentation avec les voix qui relèvent du niveau linguistique est évidente, même si le découpage ne correspond pas exactement. L’aire a comprend les lexèmes de la voix descriptive 1 et 3, ainsi que l’équatif. L’aire l recouvre les situatifs spatiaux, temporel et notionnel. L’aire m correspond à la voix subjective. L’aire b enfin correspond à la voix descriptive 2 et à tous les cas de causatif.

Ensuite, les limites entre ces grandes classes sont des limites floues. Dans une situation concrète de communication, chaque aire peut interférer avec une autre, b avec l (« untel porte la lampe sur la table »), b avec a (« le peintre blanchit le mur »), avec $ ou avec m (« untel me fait penser à ...). En cela la représentation en rosace des possibles est particulièrement appropriée.

Enfin, la correspondance entre aires événementielles, qui relèvent du niveau conceptuel, et voix qui relèvent du niveau linguistique, montre le caractère contingent des représentations linguistiques.

Prenons un premier exemple. « J’ai faim » et « je suis affamé » relève de l’aire a, le premier se rattachant à la voix descriptive DES3, tandis que le second à la voix descriptive DES1. Il s’agit d’un pur hasard de la langue, car en anglais « j’ai faim » se dit « I am hungry » qui serait de la voix DES1. De même « il mesure 200 mètres » ou « il fait 200 mètres de long » (DES2) se dit en anglais « It is 200 meter long » (DES1), etc.

Second exemple : l’affinité entre le situatif notionnel et l’adjectif qui relève de la voix DES1. « je suis en colère » est un situatif notionnel du seul fait que la langue française ne possède pas d’adjectif pour exprimer l’état de colère momentané, alors qu’elle en possède deux pour exprimer la propension permanente à se mettre en colère : « coléreux » et « colérique ». En espagnol, la distinction entre l’état momentané et l’état naturel et permanent ne sera pas opérée au niveau de l’adjectif, mais à celui de l’auxiliaire, qui sera « estar » dans le premier cas, et « ser » dans le second.

Troisième exemple proposé par B. Pottier (les deux premiers étant de nous), qui illustre le passage de a à l au sein du français : « être embarrassé » (a) est sensiblement équivalent à « être dans l’embarras » (l). De même que « ne plus être réservé » et « sortir de sa réserve ».

Quatrième exemple de classification d’une grande finesse, mais dont l’exploitation en traitement automatique peut soulever des difficultés : la distinction entre la possession impliquée (« j’ai peur, j’ai faim, il a vingt ans, il a deux jambes »), qui exprime une relation attributive avec une forte porosité entre DES1, DES2 et DES3, relève de a et la possession non impliquée qui équivaut à un constat de savoir (« j’ai une voiture ») et qui relève de m.

Quatre conclusions doivent être tirées immédiatement de ces observations.

1) L’énonciateur dispose d’une multiplicité de choix prédicatifs pour exprimer à peu près la même chose, moyennant des nuances marginales qu’il faut le cas échéant être en mesure d’analyser. Ex. :

a = la vache est un herbivore (a et EQU-STA)

b = la vache est herbivore (a et DES1-STA)

c = la vache est mangeuse d’herbe (a et DES1-STA)

d = la vache mange de l’herbe (g et DES2-CAU)

e = la vache mange de l’herbe, dit-on (g et DES2-CAU + modalisation)

f = (regarde!), la vache mange de l’herbe (l et DES2-CAU + modalisation)

Heureusement, le langage normatif ne s’embarrasse pas de toutes ces nuances que l’on retrouve au contraire dans le langage parlé ou dans le langage littéraire, théâtrale ou poétique.

2) Si les voix peuvent se retrouver sans trop de variations d’une langue à une autre, en revanche la répartition des expressions entre les voix peut apparaître assez souvent, comme nous l’avons vu, contingente et étroitement liée à une langue particulière. Par conséquent, la théorie des voix se situe clairement au niveau linguistique et non au niveau conceptuel, à la différence de la rosace des possibles qui se situe au niveau noémique. L’important est, à partir d’une analyse linguistique, de pouvoir atteindre le niveau conceptuel. Si les traits purement linguistiques peuvent être mémorisés, on doit être en mesure de retrouver à peu près le texte initial dans la langue d’origine. Si l’on ne retient que les traits de niveau conceptuel, on doit en principe disposer d’un champ de solutions parasynonymiques plus étendu.

3) La détermination de la voix dépend d’éléments syntaxiques et sémantiques variés au sein de l’énoncé. Pour l’existentiel, il s’agira de la présence d’un présentateur tel que « c’est », « il y a », « il était une fois », etc., pour le descriptif cet élément sera l’adjectif combiné avec l’auxiliaire être, un substantif spécifique combiné avec l’auxiliaire avoir...

4) Dans la détermination de la voix d’un énoncé, l’analyse sémique va jouer un rôle prépondérant.

En effet, s’agissant des verbes, la présente de sèmes d’identification de la voix permettra de les classer aisément et d’établir la voix caractéristique de l’énoncé. Le verbe « insérer » comporte un sème générique inhérent S qui le positionne comme situatif et que son complément indirect permettra de situer dans le domaine sémantique spatial, temporel ou notionnel. Plus subtilement, la distinction que l’on doit opérer entre la possession impliquée et la possession non impliquée trouve sa solution au plan sémique. Dans « il a peur », la peur résultant d’une activité psychique du sujet en réaction à son environnement, l’emploi du mot « peur » dans le prédicat devrait impliquer la voix subjective. Or, dans TAL, « il a peur » est classé DES3, en tant qu’exprimant une sensation, ce qui n’empêche pas B. Pottier de considérer le domaine des sens, de la perception comme un des trois domaines sémantiques de la voix subjective. Nous avons du mal à ne pas trouver une incohérence dans cette classification, d’autant que la possession non impliquée (« j’ai une voiture ») est classée DES3 dans TAL, alors qu’elle constitue le point d’entrée de l’aire événementielle m de la cognitivité, dans la mesure où elle exprime un savoir relationnel, un « constat de savoir ». Nous serions tentés de proposer d’en rester, s’agissant de la possession externe, à l’interprétation de TAL, et donc de mettre ce cas en DES3, mais par contre de reclasser la possession interne dans la voix subjective et dans l’aire m lorsqu’elle exprime une activité psychique, ce qui est le cas des expressions telles que « avoir peur », « avoir faim », « avoir chaud », etc. Lorsque la possession interne (partie du corps, parenté,...) exprime un fait objectif (« il a deux jambes », « il a vingt ans »,...), le classement dans la voix descriptive se justifie complètement. Ce reclassement permet d’assurer une transition convenable entre les voix et les aires événementielles étant observé que :

- l’aire a englobe l’équatif et le descriptif statifs

- l’aire b correspond à l’équatif et au descriptif évolutif et à tous les causatifs

- l’aire g correspond au situatif

- l’aire m correspond au subjectif.

- enfin l’existentiel de la rosace des possibles s’identifie à la voix existentielle.

Il nous paraît que la voix s’intègre idéalement à la notion de domaine telle qu’elle est employée par F. Rastier dans la définition de la structure des sèmes génériques composant le classème d’un sémème. Seulement, nous sommes bien obligés d’admettre dans ce cas que le domaine se définit par au moins deux sèmes correspondant respectivement à la voix et au statut.

Pratiquement, quel usage envisageons-nous de faire de cette classification ?

La première application consistera à déterminer la voix de chaque énoncé.

Connaissant le sémème de chaque lexème, nous allons « calculer » le sémème de chaque groupe, puis de chaque syntagme. La combinaison des sémèmes du SV et du SN ou SA associés doit nous permettre de déterminer la voix. Ainsi, dans « avoir faim », l’auxiliaire avoir pouvant se trouver aussi bien en DES qu’en SUB, l’appartenance de « faim » à SUB permet de sélectionner la voix SUB.

Plutôt que de déterminer par avance les règles de calcul qui président à la sélection des sèmes, à leur activation ou à leur neutralisation, nous préférons procéder de façon empirique et traiter suffisamment d’exemples pour mesurer les difficultés rencontrées et déduire de l’analyse les régularités qui pourront ensuite être reproduites de façon systématique.

En second lieu, dans la représentation que nous allons donner de chaque énoncé sous forme de graphe conceptuel, au lieu d’utiliser comme support de la relation directement le verbe, ou le substantif, lorsque celui-ci désigne une relation et non une entité, ainsi que cela est généralement pratiqué, nous allons utiliser l’une des cinq voix valant classes sémantiques fondamentales de relation, dont le verbe ou le substantif constitueront une occurrence particulière entièrement définie par son sémème.

Sachant que chaque lexème dispose de son module casuel, cette manière de représenter les énoncés est la seule qui permette réellement, lors de la génération ou phase onomasiologique, de générer différentes variantes d’un même graphe ou schème conceptuel en relations mutuelles de paraphrase.

Ainsi l’énoncé : « l’éducation est la première priorité nationale » prendra la forme :

Ll4 7 Rosace2

Il va de soi que la relation peut être caractérisée par d’autres traits :

- traits logiques : réflexivité, symétrie, transitivité. Nous espérons pouvoir exploiter ces caractéristiques. En effet, comme le souligne G. Sabah (1990, p. 90), « l’intelligence artificielle est principalement intéressée par une représentation de la phrase à partir de laquelle des raisonnements portant essentiellement sur le sens pourront être menés ». La caractérisation des relations portées par les verbes ou les substantifs représentatifs de relations, permettent de construire des raisonnements.

- le temps et l’aspect, catégories bien connues en syntaxe.

Ll4 7 Rosace3

En base de données :

Ll4 7 Rosace4

Mais ils permettent de représenter des énoncés complexes. Soit la suite du texte :

« Afin de lui permettre de développer sa personnalité, d’élever son niveau de formation initiale et continue, de s’insérer dans la vie sociale et professionnelle, d’exercer sa citoyenneté. »

Ll4 7 Rosace5

En base de données :

Ll4 7 Rosace6

En base de données :

Ll4 7 Rosace7

Ll4 7 Rosace8

Ll4 7 Rosace9

Ll4 7 Rosace10

Ll4 7 Rosace11

Top