Suite à l’intervention de J.-M. Viprey lors du colloque, nous avons fait le choix de modifier le titre de cette rubrique.
La documentation écrite et les transcriptions d’entretiens oraux sont au cœur des travaux des Humanités et des Sciences Humaines et Sociales. Tous ces discours prennent donc la forme matérielle du texte, mais un même texte peut être le terrain de différents discours.
Le chercheur doit donc constituer des corpus en tant qu’échantillon d’un tout généralement impossible à atteindre (Dalbera, 2002) . Or, cette création du corpus se présente comme un enjeu central notamment depuis les questionnements sur l’analyse de discours dès les années 1970 (Guilhaumou, 2002).
A l’heure de la numérisation, les innovations technologiques sont telles que tout le processus de recueil des corpus, de traitement et d’interprétation des résultats connaît de profondes mutations. Non seulement la quantité de matériel disponible s’accroît dans des proportions sans précédent avec la mise en ligne de ressources jusque là difficilement consultables (notamment via les bases de données numériques consultables à distance telles Gallica), mais l’enrichissement permanent de l’offre logicielle ouvre aussi des perspectives d’analyses nouvelles, facilitant la combinaison de différents types d’analyses jusque là compartimentées (telles l’annotation, l’étiquetage, l’analyse de données textuelles et l’analyse de contenu).
Les discours varient d’un acteur ou d’un auteur à l’autre selon des valeurs, des intérêts ou des pratiques largement influencés par le contexte historique, social, économique ou culturel.
De plus, les productions textuelles varient aussi au cœur du parcours d’un même acteur selon ses trajectoires de vie, ses liens créés et tissés… C’est pourquoi il importe non seulement de décrire les structures des schémas informatifs, mais aussi d’évaluer comment des crises et ruptures perturbent ce système et en révèlent les crises latentes. Le corpus permet de cerner comment un événement ponctuel bouscule des systèmes de valeurs ou de représentations, ou comment ceux-ci évoluent lentement de manière sous-jacente. Cette idée de permanences et d’inerties doit aussi être rattachée aux questions de banalités, d’entre-deux ou de saillances autour des thématiques abordées ou du style du texte.
Face à des temps relativement longs (jusqu’à deux siècles pour les jeunes chercheurs engagés dans ce laboratoire junior), le chercheur se trouve face aux mutations des langues ; ce qui pose encore d’autres enjeux méthodologiques.
Les corpus, dans une analyse inter-système, peuvent comporter différentes langues. Parmi les travaux des fondatrices et des membres, quatre langues interviennent : le français (mais aussi l’ancien français), l’anglais, l’allemand et l’italien. D’autres langues pourront être abordées par la suite. Cette barrière linguistique pose la question de la traduction et de la transposition d’une langue à l’autre. Elle révèle aussi la richesse linguistique, la diversité des synonymes, et des réalités lexicales différentes.
Dans une analyse intra-système, les lieux tout comme les temporalités peuvent engendrer des discours distincts, spécifiques et propres, ou au contraire la répétition du même.
Néanmoins, il n’est pas toujours facile de définir les frontières spatiales d’un système linguistique. Les différents dialectes et variétés régionales ont historiquement joué un rôle très important dans la constitution des corpus linguistiques. Par exemple, « l’ancien français » n’est pas vraiment « une langue » au sens moderne, mais plutôt une collection de dialectes descendus de latin (normand, anglo-normand, picard, francien, wallon, poitevin….). Pour étudier la langue dans la période médiévale, il faut absolument tenir compte de ces différences dialectales.
Ainsi, il s’agirait de questionner la stricte dichotomie entre les raisonnements inter- et intra-système.