Laboratoire junior Nombres et Mots

Avant-propos

Trois objec­tifs ont été, plus par­ti­cu­liè­re­ment, mis au pre­mier plan lors du projet de créa­tion de ce labo­ra­toire junior. Etablis par les fon­da­tri­ces et les mem­bres du labo­ra­toire junior en avril 2011, ils pour­ront être amenés à évoluer en même temps que nos réflexions.

Fédérer un collectif interdisciplinaire de jeunes chercheurs

Ce labo­ra­toire junior regroupe ini­tia­le­ment dif­fé­ren­tes dis­ci­pli­nes (géo­gra­phie, lin­guis­ti­que, infor­ma­ti­que) autour des pro­blé­ma­ti­ques posées par les corpus. Cette inter­dis­ci­pli­na­rité se jus­ti­fie par un maté­riau commun : le corpus tex­tuel et par une volonté métho­do­lo­gi­que par­ta­gée. Elle semble néces­saire à la cons­truc­tion d’une appro­che renou­ve­lée. Par la suite, d’autres dis­ci­pli­nes se gref­fe­raient à ce pre­mier col­lec­tif de jeunes cher­cheurs : des his­to­riens ou des socio­lo­gues par exem­ple, mais aussi des cher­cheurs issus des mathé­ma­ti­ques appli­quées ou des scien­ces phy­si­ques.

L’ambi­tion est donc de faire dia­lo­guer des spé­cia­lis­tes de dif­fé­ren­tes dis­ci­pli­nes autour des enjeux métho­do­lo­gi­ques posés par le corpus. Le but serait d’échanger des savoirs, des métho­des et des outils ainsi que des pro­blè­mes. Il abor­de­rait donc les ques­tions posées par les corpus dans un cadre rela­ti­ve­ment large.

Contribuer à une nouvelle approche des corpus

Parmi les ques­tions sou­le­vées, « l’ouvert du texte » (Adam et Viprey, 2009), c’est-à-dire des éléments exté­rieurs au texte que le cher­cheur peut être amené à incor­po­rer dans son ana­lyse, s’avère cen­tral. Cet ouvert doit-il être pris en compte dès les hypo­thè­ses, for­ma­tant alors le regard du cher­cheur ou doit-il être inté­gré sous la forme d’un codage d’ana­lyse de contenu, ou encore doit-il être ana­lysé ulté­rieu­re­ment comme un élément d’inter­pré­ta­tion des résul­tats ?

Un des autres enjeux s’ins­crit dans la ques­tion de l’appré­hen­sion de corpus de lan­gues dif­fé­ren­tes avec le choix ou non de recou­rir à la tra­duc­tion. Cette démar­che com­pa­ra­tive de plus en plus répan­due ques­tionne aussi la place du trai­te­ment auto­ma­ti­que de texte par des logi­ciels qui pei­nent sou­vent à manier la com­plexité de lan­gues dis­tinc­tes.

Enfin, en termes de recueil et de for­ma­li­sa­tion des corpus, la numé­ri­sa­tion ou non des don­nées ques­tionne le trans­fert de métho­des de trai­te­ment tra­di­tion­nel­les sur papier auquel le cher­cheur a été formé lors de son par­cours uni­ver­si­taire, vers des métho­des encore par­fois peu sta­bi­li­sées du fait de l’émergence récente d’offres logi­ciel­les plus com­plè­tes.

Développer des méthodes et des outils à partager

Les tra­vaux de recher­che envi­sa­gés s’ins­cri­vent dans une démar­che syn­chro­ni­que et/ou dia­chro­ni­que ; ce qui sous-entend la mani­pu­la­tion de corpus de taille impor­tante afin de pou­voir mener les études com­pa­rées. Or ces corpus, déjà impo­sants, pren­nent une tout autre ampleur lors­que des ana­ly­ses fines sont menées à l’échelle du para­gra­phe, d’une struc­ture ou même d’un mot. Face à la taille impres­sion­nante des don­nées à mani­pu­ler, déve­lop­per des métho­des et des outils s’avère donc néces­saire.

En termes de métho­des, un des enjeux prin­ci­paux s’ins­crit à la croi­sée d’une appro­che qua­li­ta­tive pres­que « intui­tive » et d’une appro­che quan­ti­ta­tive fondée sur les res­sorts de cal­culs sta­tis­ti­ques. Cette com­plé­men­ta­rité doit être creu­sée notam­ment en termes de tem­po­ra­li­tés de la recher­che : par exem­ple quel type d’appro­ches se jus­ti­fie à quel moment du pro­ces­sus de recher­che ?

En termes d’outils, une des ques­tions fon­da­men­ta­les réside dans le champ des pos­si­bles offert par la numé­ri­sa­tion. Or cette numé­ri­sa­tion chro­no­phage lors de la cons­ti­tu­tion des corpus semble pré­cieuse dans un second temps d’ana­lyse. Se pose donc la ques­tion des res­sour­ces mises à la dis­po­si­tion du cher­cheur, de l’auto­ma­ti­sa­tion de démar­ches par­fois labo­rieu­ses, et enfin de la place lais­sée ou prise par le cher­cheur au sein de ce monde de l’intel­li­gence arti­fi­cielle.