Laboratoire junior Nombres et Mots

Corpus de textes : composer, mesurer, interpréter

Voici le pro­gramme du col­lo­que :

pdf, 262 ko

Le labo­ra­toire junior « Des nom­bres et des mots (N&M’s) », qui réunit de jeunes cher­cheurs en géo­gra­phie, en infor­ma­ti­que, en lin­guis­ti­que, en sty­lis­ti­que et en socio­lo­gie, orga­nise un col­lo­que pour ini­tier des réflexions inter­dis­ci­pli­nai­res sur les usages des corpus de textes. Cette mani­fes­ta­tion s’ins­crit dans la conti­nuité de la jour­née d’étude du 29 mars 2012 orga­ni­sée à l’ENS de Lyon sur les « Pratiques de corpus numé­ri­ques : enjeux et métho­des inter­dis­ci­pli­nai­res », où des réflexions théo­ri­ques alter­naient avec des études de cas. Ces deux types d’appro­ches seront atten­dus, ali­men­tés tant par des aspects métho­do­lo­gi­ques que par des résul­tats. Le corpus de textes cons­ti­tue l’un des lieux les plus favo­ra­bles à l’obser­va­tion des réa­li­sa­tions de la langue. Deux concep­tions du corpus coexis­tent et peu­vent se nour­rir : il est tantôt consi­déré comme un recueil d’exem­ples ou d’attes­ta­tions ser­vant à véri­fier des hypo­thè­ses ou à étayer des théo­ries lin­guis­ti­ques, tantôt perçu comme un outil d’explo­ra­tion à part entière, sus­cep­ti­ble de faire émerger des savoirs lin­guis­ti­ques. En paral­lèle, les cher­cheurs en scien­ces socia­les ont cons­cience du fait que les objets qu’ils étudient émergent dis­cur­si­ve­ment. Répondant à des démar­ches empi­ri­ques, le corpus de textes est ainsi devenu le ter­rain pri­vi­lé­gié de la mise au jour et/ou de l’obser­va­tion de phé­no­mè­nes his­to­ri­ques, géo­gra­phi­ques, socio­lo­gi­ques, à partir de leurs for­mu­la­tions et déno­mi­na­tions par dif­fé­rents acteurs.

La cons­truc­tion du corpus, son ana­lyse, son inter­pré­ta­tion et sa mise en pers­pec­tive ques­tion­nent certes le contexte d’énonciation des dis­cours, mais aussi la place ou la pos­ture du cher­cheur. Au sein de chaque dis­ci­pline, la place accor­dée aux corpus tex­tuels, ainsi que la ques­tion de leur inves­ti­ga­tion, de leur taille, de leur repré­sen­ta­ti­vité et de leur inter­pré­ta­tion doit être éclaircie et débat­tue. En outre, la situa­tion cen­trale occu­pée par le texte inter­roge les cloi­son­ne­ments dis­ci­pli­nai­res et la pos­si­bi­lité de les dépas­ser. A quel­les condi­tions peut-on faire com­mu­ni­quer les savoirs et les métho­des d’un champ à l’autre ? Les corpus de textes (consi­dé­rés comme des cons­truits) repré­sen­tent-t-ils un déno­mi­na­teur commun ou sont-ils le révé­la­teur de visions seg­men­tées qui repro­dui­sent des cli­va­ges dis­ci­pli­nai­res ?

Axes du colloque

  1. Corpus et traitement numérique En termes de recueil et de formalisation des corpus, la numérisation ou non des données interroge le transfert de méthodes de traitement traditionnelles sur papier, auxquelles le chercheur a été formé lors de son parcours universitaire, vers des méthodes encore parfois peu stabilisées du fait de l’émergence d’offres logicielles plus complètes. Les avantages et les inconvénients de la numérisation, de l’édition numérique, de la place faite aux métadonnées et au codage pourront notamment être abordés. Différents axes de réflexion parmi d’autres pourront faire l’objet d’une communication. Quels sont les liens entre choix d’un logiciel et positionnement épistémologique ? Si l’utilisation de logiciels favorise la prise en compte de vastes corpus, ne risque-t-elle pas de minimiser des particularités au profit d’une homogénéisation des phénomènes ?
  2. Corpus et contexte Tout corpus est « en contexte » : cette perspective modèle en effet le recueil des données. Ainsi, la composition, la mesure et l’interprétation des corpus sont des processus qui s’imbriquent selon des logiques circulatoires. Le contexte, considéré ici comme les éléments extérieurs au texte que le chercheur peut être amené à incorporer dans son analyse, constitue un élément central de la réflexion. L’utilisation de certains logiciels ne permet parfois pas d’intégrer facilement ces différents éléments contextuels. La recherche sur de vastes corpus numériques ne risque-t-elle pas d’occulter l’influence du contexte, par exemple en observant uniquement des occurrences ? Le contexte doit-il être pris en compte dès les hypothèses (formatant/influençant alors le regard du chercheur), ou doit-il être intégré sous la forme d’un codage d’analyse de contenu, ou encore doit-il être analysé ultérieurement comme un élément d’interprétation des résultats ?
  3. Corpus et contraste L’approche par corpus permet de faire apparaître des contrastes, au sens de différences jugées significatives. Les discours varient d’un locuteur à l’autre selon des valeurs, des intérêts ou des pratiques largement influencés par le contexte historique, social, économique ou culturel. Le corpus permet de cerner la manière dont un événement ponctuel bouscule des systèmes de représentations, ou comment ceux-ci évoluent progressivement de manière sous-jacente. Les concepts de saillance ou de tendance pourront être discutés. Quels critères permettent de dégager des contrastes pertinents ? Comment mettre en place des points de comparaison ?

Public visé

Le col­lo­que se veut réso­lu­ment inter­dis­ci­pli­naire et ouvert aux cher­cheurs confir­més comme aux jeunes cher­cheurs. Nous sou­hai­tons mobi­li­ser autant les scien­ces humai­nes et socia­les que les Humanités, autant les appro­ches quan­ti­ta­ti­ves (ana­lyse de contenu, ana­lyse de don­nées tex­tuel­les) que qua­li­ta­ti­ves.

Conditions de soumission

Le résumé s’étendra sur une page maxi­mum ; une deuxième page pou­vant être mobi­li­sée pour des figu­res. La feuille de style à uti­li­ser est télé­char­gea­ble en bas de cette page. Le résumé devra être déposé sur la pla­te­forme SciencesConf du col­lo­que : http://nom­bre­set­mots.scien­ces­conf.org/ . Les pro­po­si­tions rete­nues par le comité scien­ti­fi­que du col­lo­que feront l’objet d’une com­mu­ni­ca­tion orale en fran­çais ou en anglais de vingt minu­tes, suivie d’un temps de ques­tions. Une sélec­tion de com­mu­ni­ca­tions sera publiée sous la forme d’un recueil d’arti­cles en fran­çais. Les non-com­mu­ni­cants (notam­ment des étudiants de l’uni­ver­sité de Lyon mais aussi des maî­tres de confé­ren­ces, des pro­fes­seurs et des cher­cheurs) pour­ront assis­ter au col­lo­que à condi­tion de s’être ins­crit au préa­la­ble.

Calendrier

Janvier 2013 pre­mière cir­cu­laire

20 mars 2013 date limite de récep­tion des résu­més

15 avril 2013 réponse aux auteurs

15 mai 2013 date limite d’ins­crip­tion

17-18 juin 2013 tenue du col­lo­que à l’IFE (ENS de Lyon)

Contacts

Emeline Comby (eme­line.comby(at)ens-lyon.fr) et Stéphanie de Carrara (ste­pha­nie.de-car­rara(at)ens-lyon.fr) nom­bre­set­mots(at)gmail.com

Comité scientifique

Benjamin DERUELLE, Maître de Conférences à l’Université Lille 3, UMR 8529 - IRHiS (page per­son­nelle)

Serge HEIDEN, Ingénieur de Recherche à l’ENS de Lyon, UMR 5191 - ICAR (page per­son­nelle)

Yves-François LE LAY, Maître de Conférences à l’ENS de Lyon, UMR 5600 - EVS (page per­son­nelle)

Véronique MAGRI-MOURGUES, Professeur à l’Université de Nice-Sophia Antipolis, UMR 7320 - Bases, Corpus, Langage (page per­son­nelle)

Pascal MARCHAND, Professeur à l’Université de Toulouse, LERASS (page per­son­nelle)

Damon MAYAFFRE, Chargé de Recherche CNRS, UMR 7320 - Bases, Corpus, Langage (page per­son­nelle)

Bénédicte PINCEMIN, Chargée de Recherche CNRS, UMR 5191 - ICAR (page per­son­nelle)

Pierre RATINAUD, Maître de Conférences à l’Université de Toulouse, LERASS (page per­son­nelle)

Comité d’organisation

Emeline Comby, doc­to­rante à l’Université Jean Moulin Lyon 3

Stéphanie de Carrara, doc­to­rante à l’ENS de Lyon

Matthieu Decorde, ingé­nieur d’études à l’ENS de Lyon

Claire Deslauriers, doc­to­rante à l’ENS de Lyon

Laetitia Faivre, doc­to­rante à l’Université Lumière Lyon 2

Yannick Mosset, doc­to­rant à l’Université Montaigne Bordeaux 3

Mots clés

Corpus – dis­cours – métho­do­lo­gie – recueil – trai­te­ment – inter­pré­ta­tion – réflexi­vité.

Les communications retenues

Un recueil des com­mu­ni­ca­tions rete­nues est consul­ta­ble.

pdf, 2.1 Mo