La méthode
4. — Nature de la méthode.
Nous avons soulevé deux questions : celle des rapports distributionnels
entre les phrases, et celle de la corrélation entre la langue et la situa
tion sociale. Nous avons suggéré qu'on peut obtenir des renseignements
concernant ces deux problèmes grâce à l'analyse formelle d'un discours
pris comme un tout spécifique. Quel genre d'analyse faudrait-il utiliser?
Pour en décider, considérons ce que permet le matériau.
Puisque le matériau consiste simplement en une séquence de formes
linguistiques disposées en phrases successives, toute analyse formelle se
limite à localiser des éléments linguistiques à l'intérieur de ces phrases,
c'est-à-dire à établir les occurrences d'éléments; à moins d'introduire de
l'extérieur des informations nouvelles, nous ne pouvons pas étudier la
nature ou la composition de ces éléments, où leur corrélation avec des
caractéristiques non-linguistiques.
Qui plus est, il n'y a pas d'éléments spéciaux qui soient a priori plus
importants que les autres, comme mais, ou je, ou communisme, qui nous
conduiraient à nous intéresser au simple fait de leur absence ou de leur
présence dans notre texte. Toute analyse qui tendrait à découvrir la pré
sence ou l'absence dans un texte de certains mots particuliers choisis par
le linguiste, serait une recherche sur le contenu du texte, qui reposerait
finalement sur le sens des mots choisis. Si nous ne nous appuyons pas sur
le sens dans notre analyse, les seuls morphèmes — ou les seules classes —
que nous puissions traiter séparément sont ceux qui présentent des parti
cularités de distribution établies grammaticalement.
Puisque nous ne nous intéressons donc pas, en général, à tel ou tel
élément choisi à l'avance, mais bien aux éléments qui figurent dans le
texte, il est évident que nous ne voulons pas simplement affirmer tautologiquement qu'ils figurent; nous chercherons à établir empiriquement
comment ils figurent, — lesquels se trouvent toujours à côté de quels
autres, ou dans le même environnement que quels autres, etc., — c'està-
dire l'occurrence relative de ces éléments les uns par rapport aux autres»
En ce sens notre. méthode se rapproche» plus de celle queJ!on< utilise pour
élaborer la grammaire d'une langue (qui établit; les. rapports distributionnels
entre les .éléments), que de celle que l'on (utilise pour en j élaborer le
• dictionnaire (qui dresse la liste de tous les éléments de cette langue, sans se
préoccuper de, leurs .positions).
Enfin, puisque, le matériau est une suite -finie de. phrases, ce que nous
aurons établi sur la distribution.de chaque élément ne peut être valable que
dans les limites de cette séquence de phrases — que ce soit un paragraphe
ou un livre. Nous verrons plus loin (7.3.) qu'on peut parfois utiliser des
renseignements concernant la distribution d'un élément hors du texte consi
déré ; mais ceci ne peut être qu'un auxiliaire extérieur, à n'utiliser que
lorsque la distribution de cet élément dans le texte a été complètement
établie.
5. — Aperçu général de la méthode.
Il résulte de tout ce qui précède que notre méthode devra établir
les occurrences d'éléments et en particulier les occurrences relatives de tous
les éléments d'un discours dans les limites de ce seul discours.
5.1. Éléments dans des environnements identiques.
Pour satisfaire à cette nécessité, nous pourrions. formuler de façon
détaillée la distribution de chacun des éléments dans le discours — de
même qu'en linguistique descriptive nous pourrions établir des formules
individuelles rendant compte de tous les environnements (c'est-à-dire de
la distribution) de chaque élément dans les différentes phrases d'une
langue. Mais ces formules individuelles sont de dimension impossible
pour toute une langue et, même pour un seul texte, elles sont difficiles
à manier. De plus, dans les deux cas, elles ne constituent pas une base
satisfaisante pour procéder à une analyse comparée et pour en déduire des
conclusions générales. C'est pourquoi, dans l'analyse du discours, comme
en linguistique descriptive, on regroupe les éléments qui ont des distribu
tionssem blables en une classe et, à partir de là, on parle de la distribution
de la classe considérée comme un tout plutôt que de celle de chacun des
éléments pris séparément.
Quand deux éléments ont des distributions identiques, cette opération
de regroupement ne présente aucune difficulté. En linguistique descriptive,
cependant, c'est rarement le cas, car peu de mots ont des distributions identiques dans l'ensemble d'une langue 4. Cela peut se trouver plus fr
équemment dans un texte répétitif, où deux mots peuvent être toujours
employés dans des phrases parallèles identiques — comme par exemple
dans les légendes à style en écho, dans les proverbes, dans les slogans, ou
dans les rapports scientifiques « secs », mais précis.
5.2. Éléments à environnements équivalents.
Il est plus fréquent que deux éléments se présentent dans des env
ironnements qui sont presque identiques, sans l'être tout à fait; nous pour
rons peut-être alors les regrouper en une seule classe distributionnelle
en dressant une chaîne d'équivalences qui lie les deux environnements
presque identiques 5. C'est ce qu'on fait en linguistique descriptive quand
on dit, par exemple, qu'en. français la classe des adjectifs A se rencontre
après la classe des noms N, en dépit du fait qu'un certain A (courageuse
par exemple) peut ne jamais figurer après un certain N (table par exemple).
C'est ce qu'on fait en analyse du discours quand on dit que deux parties
de l'énoncé, qui ont le même environnement à un endroit, sont équivalentes
même en un autre endroit où elles n'ont pas le même environnement.
Supposons par exemple que le texte contienne les quatre phrases
suivantes :
Ici les feuilles tombent vers le milieu de l'automne
Ici les feuilles tombent vers la fin du mois d'octobre
Les premiers froids arrivent après le milieu de l'automne
Nous commençons à chauffer après la fin du mois d'octobre.
Nous pouvons dire que le milieu de l'automne et la fin du mois d'octobre
sont équivalents parce qu'ils se présentent dans le même environnement
(Ici les feuilles tombent vers) et que cette équivalence passe dans les
phrases 3 et 4. Ceci posé, on peut aller plus loin et dire que Les premiers
froids arrivent et Nous commençons à chauffer se présentent dans des env
ironnements équivalents (le mot en supplément après est identique dans
les deux environnements). L'élaboration de ces chaînes, qui font passer
l'équivalence de deux parties de l'énoncé d'une paire de phrases où leur
environnement est vraiment identique, à une autre paire de phrases où
il ne l'est pas, doit naturellement présenter de sérieuses garanties, sinon
tout devient équivalent à tout et l'analyse s'effondre. On a le même pro
blème quand on établit les classes en linguistique descriptive. Nous verrons
plus loin (6.1.) le genre de garanties qui sont requises dans l'analyse
du discours.
De façon plus générale, si nous avons dans notre texte les séquences
4. Deux noms de personnes peuvent avoir des distributions identiques. Ainsi
pour toute phrase qui contient Bill, on peut trouver une phrase identique pour tout le
reste, mais qui contient Jim à la place de Bill.
5. Des travaux inédits de N. Chomsky m'ont aidé à mieux comprendre l'usage de
ces chaînes. AM et AN, nous dirons que M est équivalent à N, ou que M et N se pré
sentent dans un même environnement A, ou que M et N se présentent tous
deux comme l'environnement d'un même élément (ou séquence d'éléments)
A; et nous écrirons M = N. Si nous trouvons alors dans notre texte BM et
CN (ou MB et NC), nous dirons que B est équivalent à C (au second degré),
puisque B et C se trouvent dans des environnements M et N, dont nous
avons établi l'équivalence, et nous écrirons B = C. Puis, si nous trouvons
BK et CL, nous écrirons K = L, puisqu'ils se trouvent dans les environ
nements B et C équivalents au second degré, et ainsi de suite. A titre
d'exemple, continuons notre fragment de texte par la phrase suivante :
Nous avons toujours des tas d'ennuis quand nous commençons à chauffer,
mais il faut bien être prêt quand les premiers froids arrivent. Nous dirons
que Nous avons toujours des tas d'ennuis est équivalent (dans ce texte)
à mais il faut bien être prêt.
Dire que B = C ne veut pas dire qu'ils sont égaux en général, ni qu'ils
signifient la même chose; on utilise le signe = pour l'unique raison que
le rapport entre B et C satisfait aux exigences techniques du rapport
communément symbolisé par ce signe; quand nous posons B = C, cela
signifie seulement que ce rapport est une étape dans une chaîne d'équiva
lence: sd 'une part B et C se rencontrent dans des environnements équi
valents (M et N); d'autre part deux environnements (K et L), quels qu'ils
soient, dans lesquels se trouvent B et G seront considérés équivalents.
Il ne sert à rien de soulever des questions comme « Est-il vrai que
B = C? » ou « A-t-on le droit de dire que K = L, simplement parce qu'on
a B = G et qu'on trouve BK et CL? ». Tout ce que nous proposons ici est
une méthode d'analyse, les seules questions pertinentes sont de savoir
si la méthode est utilisable et si elle conduit à des résultats intéressants
et valables. On jugera si la méthode est utilisable en se fondant sur ses
opérations, sans se préoccuper de ses résultats, que nous n'avons pas
encore vus. Quant aux résultats, nous en étudierons l'intérêt aux para
graphes 8, 9 et 10, où nous verrons que les chaînes d'équivalences révèlent
une structure pour chaque texte. Il ne s'agit pas de savoir si nous avons le
« droit » de poser K = L, puisque tout ce que nous signifions par K = L
est qu'on trouve BK et CL et que B = C; la justification viendra du fait
qu'en regroupant toutes les équivalences, on trouve quelque chose sur la
structure du texte.
5.3. Classes d'équivalences.
Après avoir établi quelles sont les séquences qui se rencontrent dans
des environnements équivalents, nous pouvons les regrouper en une seule
classe d'équivalence. Nous avons les formules A = B (tous deux se ren
contrent devant N) et B = C, nous considérerons donc A, B et C comme
membres d'une même classe d'équivalence. De même, M, N, K, L sont tous
membres d'une autre même classe d'équivalence. Reprenons notre
exemple : Les feuilles tombent vers (Tx), Les premiers froids arrivent après (To) et Nous commençons à chauffer après (T3) sont tous trois membres d'une
classe d'équivalence T, tandis que le milieu de V automne (Ex) et la fin du
mois d'octobre (E2) sont membres d'une autre classe d'équivalence E. Il
y a encore une troisième classe d'équivalence E' composée de nous avons
toujours des tas d'ennuis quand et mais il faut bien être prêt quand. Il y a
visiblement un rapport entre E' et E puisque tous deux se rencontrent avec
les deux derniers membres de T. Mais E se trouve après T, tandis que
E' se trouve avant T.
En fonction de ces classes, on peut écrire les cinq phrases du fragment
de texte en six formules (la dernière phrase est double) : TE, TE, TE, TE,
E'T, E'T; on ne peut visiblement pas faire de E et E' une seule classe,
mais on peut dire que, quand l'ordre de E et T est inversé (quand E se
réfléchit dans T), on a E' à la place de E. Si on modifie les membres de E'
pour leur donner la forme qu'ils auraient s'ils suivaient T au lieu de le
précéder, ils deviennent des membres réguliers de E. Par exemple, on
pourrait dire Nous commençons à chauffer avec toujours des tas d'ennuis
mais les premiers froids arrivent si brusquement qu'il faut bien être prêt.
Cette phrase est de la forme TETE. Le nouveau syntagme avec toujours
beaucoup d'ennuis est un membre deE en vertu de son occurrence après T;
appelons le E3; il faut naturellement montrer qu'il est équivalent à Nous
avons toujours des tas d'ennuis, sauf en ce qui concerne sa position inverse
par rapport à T; nous verrons au paragraphe 7.3. à quelles techniques
on fait appel pour établir cette équivalence. De même il faut montrer que
le nouveau syntagme E « mais... si brusquement qu'il faut bien être prêt
(E4) est le réfléchi dans T du syntagme E' mais il faut bien être prêt quand.
Si on peut établir ces deux équivalences, on peut remplacer les deux
syntagmes E' par les syntagmes modifiés qu'on obtient quand on les
met en position E. Nous obtenons par conséquent deux membres de
plus dans E, et la classe E' n'existe plus.
On peut ainsi dresser des classes d'équivalence (comme E) de toutes
les séquences qui ont des environnements équivalents, à l'intérieur du
texte, c'est-à-dire les mêmes classes d'équivalence d'un même côté (avant
ou après). Les éléments (ou séquences d'éléments) qui appartiennent à
la même classe d'équivalence sont dits équivalents les uns aux autres, ou
substituts les uns des autres : nous verrons plus loin (paragraphe 10) que,
par certains côtés (en particulier dans les extensions du texte), on peut les
considérer comme interchangeables ou substituables; dans ce cas la classe
d'équivalence peut aussi s'appeler une classe de substitution.
11 est à remarquer que l'opération consistant à grouper dans une même
classe d'équivalence des formes non identiques, ne repose pas sur le fait
que leurs petites différences de sens sont considérées comme négligeables,
mais sur le fait qu'on les trouve dans des environnements équivalents,
ce qui signifie qu'on les trouve soit dans des environnements identiques
(le milieu de l'automne et la fin du mois d'octobre se rencontrent tous deux
dans l'environnement les feuilles tombent vers), soit dans des environnements qui sont aux extrémités d'une chaîne d'équivalences garantie
(Les premiers froids arrivent et Nous commençons à chauffer se trouvent
dans les environnments équivalents après le milieu de l'automne et après
la fin du mois d'octobre). Notre méthode est donc essentiellement celle de
la linguistique descriptive et non celle de la sémantique.
Il résulte de tout ce qui précède que notre méthode devra établir
les occurrences d'éléments et en particulier les occurrences relatives de tous
les éléments d'un discours dans les limites de ce seul discours.
5.1. Éléments dans des environnements identiques.
Pour satisfaire à cette nécessité, nous pourrions. formuler de façon
détaillée la distribution de chacun des éléments dans le discours — de
même qu'en linguistique descriptive nous pourrions établir des formules
individuelles rendant compte de tous les environnements (c'est-à-dire de
la distribution) de chaque élément dans les différentes phrases d'une
langue. Mais ces formules individuelles sont de dimension impossible
pour toute une langue et, même pour un seul texte, elles sont difficiles
à manier. De plus, dans les deux cas, elles ne constituent pas une base
satisfaisante pour procéder à une analyse comparée et pour en déduire des
conclusions générales. C'est pourquoi, dans l'analyse du discours, comme
en linguistique descriptive, on regroupe les éléments qui ont des distribu
tionssem blables en une classe et, à partir de là, on parle de la distribution
de la classe considérée comme un tout plutôt que de celle de chacun des
éléments pris séparément.
Quand deux éléments ont des distributions identiques, cette opération
de regroupement ne présente aucune difficulté. En linguistique descriptive,
cependant, c'est rarement le cas, car peu de mots ont des distributions identiques dans l'ensemble d'une langue 4. Cela peut se trouver plus fr
équemment dans un texte répétitif, où deux mots peuvent être toujours
employés dans des phrases parallèles identiques — comme par exemple
dans les légendes à style en écho, dans les proverbes, dans les slogans, ou
dans les rapports scientifiques « secs », mais précis.
5.2. Éléments à environnements équivalents.
Il est plus fréquent que deux éléments se présentent dans des env
ironnements qui sont presque identiques, sans l'être tout à fait; nous pour
rons peut-être alors les regrouper en une seule classe distributionnelle
en dressant une chaîne d'équivalences qui lie les deux environnements
presque identiques 5. C'est ce qu'on fait en linguistique descriptive quand
on dit, par exemple, qu'en. français la classe des adjectifs A se rencontre
après la classe des noms N, en dépit du fait qu'un certain A (courageuse
par exemple) peut ne jamais figurer après un certain N (table par exemple).
C'est ce qu'on fait en analyse du discours quand on dit que deux parties
de l'énoncé, qui ont le même environnement à un endroit, sont équivalentes
même en un autre endroit où elles n'ont pas le même environnement.
Supposons par exemple que le texte contienne les quatre phrases
suivantes :
Ici les feuilles tombent vers le milieu de l'automne
Ici les feuilles tombent vers la fin du mois d'octobre
Les premiers froids arrivent après le milieu de l'automne
Nous commençons à chauffer après la fin du mois d'octobre.
Nous pouvons dire que le milieu de l'automne et la fin du mois d'octobre
sont équivalents parce qu'ils se présentent dans le même environnement
(Ici les feuilles tombent vers) et que cette équivalence passe dans les
phrases 3 et 4. Ceci posé, on peut aller plus loin et dire que Les premiers
froids arrivent et Nous commençons à chauffer se présentent dans des env
ironnements équivalents (le mot en supplément après est identique dans
les deux environnements). L'élaboration de ces chaînes, qui font passer
l'équivalence de deux parties de l'énoncé d'une paire de phrases où leur
environnement est vraiment identique, à une autre paire de phrases où
il ne l'est pas, doit naturellement présenter de sérieuses garanties, sinon
tout devient équivalent à tout et l'analyse s'effondre. On a le même pro
blème quand on établit les classes en linguistique descriptive. Nous verrons
plus loin (6.1.) le genre de garanties qui sont requises dans l'analyse
du discours.
De façon plus générale, si nous avons dans notre texte les séquences
4. Deux noms de personnes peuvent avoir des distributions identiques. Ainsi
pour toute phrase qui contient Bill, on peut trouver une phrase identique pour tout le
reste, mais qui contient Jim à la place de Bill.
5. Des travaux inédits de N. Chomsky m'ont aidé à mieux comprendre l'usage de
ces chaînes. AM et AN, nous dirons que M est équivalent à N, ou que M et N se pré
sentent dans un même environnement A, ou que M et N se présentent tous
deux comme l'environnement d'un même élément (ou séquence d'éléments)
A; et nous écrirons M = N. Si nous trouvons alors dans notre texte BM et
CN (ou MB et NC), nous dirons que B est équivalent à C (au second degré),
puisque B et C se trouvent dans des environnements M et N, dont nous
avons établi l'équivalence, et nous écrirons B = C. Puis, si nous trouvons
BK et CL, nous écrirons K = L, puisqu'ils se trouvent dans les environ
nements B et C équivalents au second degré, et ainsi de suite. A titre
d'exemple, continuons notre fragment de texte par la phrase suivante :
Nous avons toujours des tas d'ennuis quand nous commençons à chauffer,
mais il faut bien être prêt quand les premiers froids arrivent. Nous dirons
que Nous avons toujours des tas d'ennuis est équivalent (dans ce texte)
à mais il faut bien être prêt.
Dire que B = C ne veut pas dire qu'ils sont égaux en général, ni qu'ils
signifient la même chose; on utilise le signe = pour l'unique raison que
le rapport entre B et C satisfait aux exigences techniques du rapport
communément symbolisé par ce signe; quand nous posons B = C, cela
signifie seulement que ce rapport est une étape dans une chaîne d'équiva
lence: sd 'une part B et C se rencontrent dans des environnements équi
valents (M et N); d'autre part deux environnements (K et L), quels qu'ils
soient, dans lesquels se trouvent B et G seront considérés équivalents.
Il ne sert à rien de soulever des questions comme « Est-il vrai que
B = C? » ou « A-t-on le droit de dire que K = L, simplement parce qu'on
a B = G et qu'on trouve BK et CL? ». Tout ce que nous proposons ici est
une méthode d'analyse, les seules questions pertinentes sont de savoir
si la méthode est utilisable et si elle conduit à des résultats intéressants
et valables. On jugera si la méthode est utilisable en se fondant sur ses
opérations, sans se préoccuper de ses résultats, que nous n'avons pas
encore vus. Quant aux résultats, nous en étudierons l'intérêt aux para
graphes 8, 9 et 10, où nous verrons que les chaînes d'équivalences révèlent
une structure pour chaque texte. Il ne s'agit pas de savoir si nous avons le
« droit » de poser K = L, puisque tout ce que nous signifions par K = L
est qu'on trouve BK et CL et que B = C; la justification viendra du fait
qu'en regroupant toutes les équivalences, on trouve quelque chose sur la
structure du texte.
5.3. Classes d'équivalences.
Après avoir établi quelles sont les séquences qui se rencontrent dans
des environnements équivalents, nous pouvons les regrouper en une seule
classe d'équivalence. Nous avons les formules A = B (tous deux se ren
contrent devant N) et B = C, nous considérerons donc A, B et C comme
membres d'une même classe d'équivalence. De même, M, N, K, L sont tous
membres d'une autre même classe d'équivalence. Reprenons notre
exemple : Les feuilles tombent vers (Tx), Les premiers froids arrivent après (To) et Nous commençons à chauffer après (T3) sont tous trois membres d'une
classe d'équivalence T, tandis que le milieu de V automne (Ex) et la fin du
mois d'octobre (E2) sont membres d'une autre classe d'équivalence E. Il
y a encore une troisième classe d'équivalence E' composée de nous avons
toujours des tas d'ennuis quand et mais il faut bien être prêt quand. Il y a
visiblement un rapport entre E' et E puisque tous deux se rencontrent avec
les deux derniers membres de T. Mais E se trouve après T, tandis que
E' se trouve avant T.
En fonction de ces classes, on peut écrire les cinq phrases du fragment
de texte en six formules (la dernière phrase est double) : TE, TE, TE, TE,
E'T, E'T; on ne peut visiblement pas faire de E et E' une seule classe,
mais on peut dire que, quand l'ordre de E et T est inversé (quand E se
réfléchit dans T), on a E' à la place de E. Si on modifie les membres de E'
pour leur donner la forme qu'ils auraient s'ils suivaient T au lieu de le
précéder, ils deviennent des membres réguliers de E. Par exemple, on
pourrait dire Nous commençons à chauffer avec toujours des tas d'ennuis
mais les premiers froids arrivent si brusquement qu'il faut bien être prêt.
Cette phrase est de la forme TETE. Le nouveau syntagme avec toujours
beaucoup d'ennuis est un membre deE en vertu de son occurrence après T;
appelons le E3; il faut naturellement montrer qu'il est équivalent à Nous
avons toujours des tas d'ennuis, sauf en ce qui concerne sa position inverse
par rapport à T; nous verrons au paragraphe 7.3. à quelles techniques
on fait appel pour établir cette équivalence. De même il faut montrer que
le nouveau syntagme E « mais... si brusquement qu'il faut bien être prêt
(E4) est le réfléchi dans T du syntagme E' mais il faut bien être prêt quand.
Si on peut établir ces deux équivalences, on peut remplacer les deux
syntagmes E' par les syntagmes modifiés qu'on obtient quand on les
met en position E. Nous obtenons par conséquent deux membres de
plus dans E, et la classe E' n'existe plus.
On peut ainsi dresser des classes d'équivalence (comme E) de toutes
les séquences qui ont des environnements équivalents, à l'intérieur du
texte, c'est-à-dire les mêmes classes d'équivalence d'un même côté (avant
ou après). Les éléments (ou séquences d'éléments) qui appartiennent à
la même classe d'équivalence sont dits équivalents les uns aux autres, ou
substituts les uns des autres : nous verrons plus loin (paragraphe 10) que,
par certains côtés (en particulier dans les extensions du texte), on peut les
considérer comme interchangeables ou substituables; dans ce cas la classe
d'équivalence peut aussi s'appeler une classe de substitution.
11 est à remarquer que l'opération consistant à grouper dans une même
classe d'équivalence des formes non identiques, ne repose pas sur le fait
que leurs petites différences de sens sont considérées comme négligeables,
mais sur le fait qu'on les trouve dans des environnements équivalents,
ce qui signifie qu'on les trouve soit dans des environnements identiques
(le milieu de l'automne et la fin du mois d'octobre se rencontrent tous deux
dans l'environnement les feuilles tombent vers), soit dans des environnements qui sont aux extrémités d'une chaîne d'équivalences garantie
(Les premiers froids arrivent et Nous commençons à chauffer se trouvent
dans les environnments équivalents après le milieu de l'automne et après
la fin du mois d'octobre). Notre méthode est donc essentiellement celle de
la linguistique descriptive et non celle de la sémantique.
5.4. Ordres de phrase.
Nous en arrivons maintenant à une opération que n'emploie pas la
linguistique descriptive, à savoir la représentation de l'ordre des occur
rences successives des membres d'une classe. En linguistique descriptive,
le seul ordre considéré est la position relative des différentes parties d'une
séquence : on décrit, par exemple, l'ordre de l'article et du nom en disant
que le premier précède le second dans la chaîne du syntagme nominal.
Dans l'analyse du discours aussi nous avons ce type d'ordre dans les parties
de la phrase, par exemple les ordres différents de E et E' par rapport à T.
L'ordre des phrases successives ou d'une certaine classe de mots dans
différentes phrases (par exemple la relation entre des sujets successifs)
n'intéresse généralement pas la linguistique descriptive, car les formules
distributionnelles qu'elle définit ne s'appliquent normalement qu'à l'inté
rieur d'une seule phrase à la fois. Dans notre cas cependant, où il s'agit de
tout un discours, le problème existe. Si nous considérions chaque phrase
séparément, en ne la rapprochant des autres que pour comparer des struc
tures, nous pourrions dire (comme en linguistique descriptive) que chacune
des phrases de notre fragment de texte consiste en TE. Mais, puisque nous
considérons le texte comme un tout, nous ne pouvons dire qu'il consiste
simplement en 6 fois TE : les membres de E et de T sont différents dans les
diverses phrases; et leurs différences preuvent être particulières à ce texte,
ou à un groupe de texte semblables.
Nous pouvons représenter structurellement notre fragment de texte
par un tableau à double entrée, l'axe horizontal représentant la matière
qui se présente à l'intérieur d'une seule phrase ou sous-phrase, l'axe ver
tical (ici divisé en 2 parties) représentant les phrases successives.
Nous en arrivons maintenant à une opération que n'emploie pas la
linguistique descriptive, à savoir la représentation de l'ordre des occur
rences successives des membres d'une classe. En linguistique descriptive,
le seul ordre considéré est la position relative des différentes parties d'une
séquence : on décrit, par exemple, l'ordre de l'article et du nom en disant
que le premier précède le second dans la chaîne du syntagme nominal.
Dans l'analyse du discours aussi nous avons ce type d'ordre dans les parties
de la phrase, par exemple les ordres différents de E et E' par rapport à T.
L'ordre des phrases successives ou d'une certaine classe de mots dans
différentes phrases (par exemple la relation entre des sujets successifs)
n'intéresse généralement pas la linguistique descriptive, car les formules
distributionnelles qu'elle définit ne s'appliquent normalement qu'à l'inté
rieur d'une seule phrase à la fois. Dans notre cas cependant, où il s'agit de
tout un discours, le problème existe. Si nous considérions chaque phrase
séparément, en ne la rapprochant des autres que pour comparer des struc
tures, nous pourrions dire (comme en linguistique descriptive) que chacune
des phrases de notre fragment de texte consiste en TE. Mais, puisque nous
considérons le texte comme un tout, nous ne pouvons dire qu'il consiste
simplement en 6 fois TE : les membres de E et de T sont différents dans les
diverses phrases; et leurs différences preuvent être particulières à ce texte,
ou à un groupe de texte semblables.
Nous pouvons représenter structurellement notre fragment de texte
par un tableau à double entrée, l'axe horizontal représentant la matière
qui se présente à l'intérieur d'une seule phrase ou sous-phrase, l'axe ver
tical (ici divisé en 2 parties) représentant les phrases successives.
T1 E1 T3 E2
T1 E2 T3 E3
T2 E1 T2 E4
Dans ce tableau à double entrée, les différents symboles dans la rangée
horizontale représentent les différentes parties d'une seule phrase ou
sous-phrase du texte, dans l'ordre dans lequel elles se présentent dans
la phrase (sauf dans la mesure où l'ordre a été modifié par des transfor
mations explicites comme pour le passage de E' à E). Les colonnes verti
cales indiquent les différents membres d'une classe d'équivalence, dans
l'ordre d'apparition des phrases où ils figurent.
Le fait que l'ordre des symboles d'une rangée puisse être différent de
l'ordre des éléments dans la phrase correspondante tient à ce que nos connaissances linguistiques de la structure de phrase nous permettent
de traiter les éléments indépendamment de leur ordre. C'est ce que nous
faisons quand nous ne tenons pas compte dans nos symboles d'un ordre
automatique et qui réapparaîtrait dès la retraduction de nos symboles en
langue, — par exemple nous incluons mais... dans E4 même s'il en est
nécessairement séparé dans la phrase réelle (puisque mais se trouve géné
ralement au début d'une structure de phrase, quelle que soit la partie
de la phrase à laquelle il se rapporte). C'est ce que nous faisons également
quand nous remplaçons un certain ordre non automatique à valeur mor
phologique par les morphèmes qui sont grammaticalement équivalents
à cet ordre : ainsi quand, par exemple, nous remplaçons NXV N2 par
N2 V* Nj_ (remplacement de le chasseur tue le lion par le lion est tué par
le chasseur) ou quand, dans notre fragment de texte, nous remplaçons
E' avant T par E après T.
Contrairement au traitement cavalier de l'ordre horizontal, nous ne
pouvons rien changer à l'ordre dans une colonne verticale : nous n'avons
là aucune connaissance linguistique a priori qui nous dise quels agence
ments de phrase sont automatiques (s'il y en a) et par conséquent à ne pas
représenter, ni quels agencements peuvent être remplacés par des agen
cements différents, mais équivalents. Une étude plus approfondie des
séquences de phrases dans la langue nous donnera peut-être un jour des
indications à ce sujet; elle établira peut-être, par exemple et pour prendre
un cas très simple, que des séquences de phrases de la forme P parce
que Q sont équivalentes à des séquences de la forme Q donc P, ou que
P et Q est interchangeable avec Q et P (tandis que P mais Q peut n'être
pas pareillement interchangeable avec Q mais P) 6. Qui plus est, une étude
approfondie d'un certain texte ou de plusieurs textes d'un certain type
montrera peut-être que certaines séquences de phrases tout entières
sont interchangeables ou équivalentes; et, grâce à ces données, nous
pourrons peut-être simplifier l'axe vertical du tableau à double entrée,
en trouvant par exemple des schemes verticaux qui reviennent périod
iquement. En attendant, l'axe vertical reste une reproduction exacte
de l'ordre des phrases ou sous-phrases du texte.
horizontale représentent les différentes parties d'une seule phrase ou
sous-phrase du texte, dans l'ordre dans lequel elles se présentent dans
la phrase (sauf dans la mesure où l'ordre a été modifié par des transfor
mations explicites comme pour le passage de E' à E). Les colonnes verti
cales indiquent les différents membres d'une classe d'équivalence, dans
l'ordre d'apparition des phrases où ils figurent.
Le fait que l'ordre des symboles d'une rangée puisse être différent de
l'ordre des éléments dans la phrase correspondante tient à ce que nos connaissances linguistiques de la structure de phrase nous permettent
de traiter les éléments indépendamment de leur ordre. C'est ce que nous
faisons quand nous ne tenons pas compte dans nos symboles d'un ordre
automatique et qui réapparaîtrait dès la retraduction de nos symboles en
langue, — par exemple nous incluons mais... dans E4 même s'il en est
nécessairement séparé dans la phrase réelle (puisque mais se trouve géné
ralement au début d'une structure de phrase, quelle que soit la partie
de la phrase à laquelle il se rapporte). C'est ce que nous faisons également
quand nous remplaçons un certain ordre non automatique à valeur mor
phologique par les morphèmes qui sont grammaticalement équivalents
à cet ordre : ainsi quand, par exemple, nous remplaçons NXV N2 par
N2 V* Nj_ (remplacement de le chasseur tue le lion par le lion est tué par
le chasseur) ou quand, dans notre fragment de texte, nous remplaçons
E' avant T par E après T.
Contrairement au traitement cavalier de l'ordre horizontal, nous ne
pouvons rien changer à l'ordre dans une colonne verticale : nous n'avons
là aucune connaissance linguistique a priori qui nous dise quels agence
ments de phrase sont automatiques (s'il y en a) et par conséquent à ne pas
représenter, ni quels agencements peuvent être remplacés par des agen
cements différents, mais équivalents. Une étude plus approfondie des
séquences de phrases dans la langue nous donnera peut-être un jour des
indications à ce sujet; elle établira peut-être, par exemple et pour prendre
un cas très simple, que des séquences de phrases de la forme P parce
que Q sont équivalentes à des séquences de la forme Q donc P, ou que
P et Q est interchangeable avec Q et P (tandis que P mais Q peut n'être
pas pareillement interchangeable avec Q mais P) 6. Qui plus est, une étude
approfondie d'un certain texte ou de plusieurs textes d'un certain type
montrera peut-être que certaines séquences de phrases tout entières
sont interchangeables ou équivalentes; et, grâce à ces données, nous
pourrons peut-être simplifier l'axe vertical du tableau à double entrée,
en trouvant par exemple des schemes verticaux qui reviennent périod
iquement. En attendant, l'axe vertical reste une reproduction exacte
de l'ordre des phrases ou sous-phrases du texte.
5.5. Résumé.
Nous pouvons maintenant avoir un aperçu général de la méthode.
On dira que des éléments (parties de texte — morphèmes ou séquences de
morphèmes) sont équivalents entre eux s'ils se présentent dans l'env
ironnement d'autres éléments identiques ou équivalents. Tout ensemble
d'éléments équivalents entre eux s'appelle une classe d'équivalence.
6. Les mathématiques, et plus encore la logique, ont déjà établi des ordres de
phrase spécifiques qui sont équivalents. On peut redécouvrir linguistiquement cette
équivalence en trouvant que la distribution de chaque phrase est équivalente à celle
des autres. Mais nous cherchons plutôt ici à découvrir d'autres équivalences que celles
que nous savons déjà faire partie du système.
Nous pouvons maintenant avoir un aperçu général de la méthode.
On dira que des éléments (parties de texte — morphèmes ou séquences de
morphèmes) sont équivalents entre eux s'ils se présentent dans l'env
ironnement d'autres éléments identiques ou équivalents. Tout ensemble
d'éléments équivalents entre eux s'appelle une classe d'équivalence.
6. Les mathématiques, et plus encore la logique, ont déjà établi des ordres de
phrase spécifiques qui sont équivalents. On peut redécouvrir linguistiquement cette
équivalence en trouvant que la distribution de chaque phrase est équivalente à celle
des autres. Mais nous cherchons plutôt ici à découvrir d'autres équivalences que celles
que nous savons déjà faire partie du système.
Chaque phrase successive du texte est alors représentée par une séquence
de classes d'équivalence, celles auxquelles ses différentes parties appar
tiennent. Nous obtenons ainsi pour tout le texte un tableau à double
entrée, l'axe horizontal représentant les classes d'équivalence contenues
par une seule phrase, l'axe vertical représentant les phrases successives.
Ce n'est pas un tableau des structures de phrase (sujets, verbes, etc.),
mais des schemes d'occurrence des classes d'équivalences dans tout le
texte.
Si les différentes phrases contiennent des classes entièrement diffé
rentes, ce tableau n'a pas d'intérêt; mais ce n'est généralement pas le
cas. Il y a, dans presque tous les textes, des passages où certaines classes
d'équivalence se répètent, dans les phrases successives, en un scheme
caractéristique. Le tableau permet d'étudier ce scheme et on peut en
tirer divers types d'information sur le texte, certaines analyses structur
ellesd u texte et certaines exégèses sur le texte. Pour les classes d'équi
valence, qui ont été établies distributionnellement, le tableau en montre
la distribution. Pour le texte dans sa totalité, le tableau montre certaines
caractéristiques de structure.
de classes d'équivalence, celles auxquelles ses différentes parties appar
tiennent. Nous obtenons ainsi pour tout le texte un tableau à double
entrée, l'axe horizontal représentant les classes d'équivalence contenues
par une seule phrase, l'axe vertical représentant les phrases successives.
Ce n'est pas un tableau des structures de phrase (sujets, verbes, etc.),
mais des schemes d'occurrence des classes d'équivalences dans tout le
texte.
Si les différentes phrases contiennent des classes entièrement diffé
rentes, ce tableau n'a pas d'intérêt; mais ce n'est généralement pas le
cas. Il y a, dans presque tous les textes, des passages où certaines classes
d'équivalence se répètent, dans les phrases successives, en un scheme
caractéristique. Le tableau permet d'étudier ce scheme et on peut en
tirer divers types d'information sur le texte, certaines analyses structur
ellesd u texte et certaines exégèses sur le texte. Pour les classes d'équi
valence, qui ont été établies distributionnellement, le tableau en montre
la distribution. Pour le texte dans sa totalité, le tableau montre certaines
caractéristiques de structure.
ليست هناك تعليقات:
إرسال تعليق