Logement en linguistique

Analyse sectorielle : Logement en linguistique. Recherche parmi 298 000+ dissertations

Par flocheur • 5 Février 2015 • Analyse sectorielle • 1 252 Mots (6 Pages) • 452 Vues

Page 1 sur 6

Le corpus en linguistique[modifier | modifier le code]

La branche de la linguistique qui se préoccupe plus spécifiquement des corpus s'appelle logiquement la linguistique de corpus. Elle est liée au développement des systèmes informatiques, en particulier à la constitution de bases de données textuelles. Depuis 2001, la revue universitaire CORPUS est dédiée à l'objet.

On parle de corpus pour désigner l'aspect normatif de la langue : sa structure et son code en particulier. "Corpus" est généralement opposé à "status" (ou statut), qui correspond aux conditions d'utilisation de la langue. Cette opposition est commune dans l'étude des politiques linguistiques.

Le corpus en littérature[modifier | modifier le code]

Le corpus regroupe un ensemble de textes ayant une visée commune. Un corpus peut être constitué de documents différents (tableau, extrait de texte...) et ces documents divers ont un point en commun. En général, c'est le thème qui fait figure de leur ressemblance. Il faut avoir une technique particulière pour le déchiffrer.

Le corpus dans la science[modifier | modifier le code]

Les corpus sont des outils indispensables et précieux en traitement automatique du langage naturel. Ils permettent en effet d'extraire un ensemble d'informations utiles pour des traitements statistiques.

D'un point de vue informatif, ils permettent d'extraire des tendances et notamment de construire des ensembles de n-grammes.

D'un point de vue méthodologique, ils apportent une objectivité nécessaire à la validation scientifique en traitement automatique du langage naturel. L'information n'est plus empirique, elle est vérifiée par le corpus. Il est donc possible de s'appuyer sur des corpus (à condition qu'ils soient bien formés) pour formuler et vérifier des hypothèses scientifiques.

Corpus bien formé[modifier | modifier le code]

Plusieurs caractéristiques sont à prendre en compte pour la création d'un corpus bien formé :

la taille ;

le langage du corpus ;

le temps couvert par les textes du corpus ;

le registre.

Taille[modifier | modifier le code]

Le corpus doit évidemment atteindre une taille critique pour permettre des traitements statistiques fiables. Il est impossible d'extraire des informations fiables à partir d'un corpus trop petit (voir Statistique).

Langage[modifier | modifier le code]

Un corpus bien formé doit nécessairement couvrir un seul langage, et une seule déclinaison de ce langage. Il existe par exemple de subtiles différences entre le français de France et le français parlé en Belgique. Il ne sera donc pas possible de tirer des conclusions fiables à partir d'un corpus franco-belge sur le français de France, ni sur le français de Belgique.

Temps couvert par les textes du corpus[modifier | modifier le code]

Le temps joue un rôle important dans l'évolution du langage : le français parlé aujourd'hui ne ressemble pas au français parlé il y a 200 ans ni, de façon plus subtile, au français parlé il y a 10 ans, à cause notamment des néologismes. C'est un phénomène à prendre en compte pour toutes les langues vivantes. Un corpus ne doit donc pas contenir de textes rédigés à des intervalles de temps trop larges, ou il doit les dater (pour un usage par les historiens de la langue ou des concepts).

Registre de langage[modifier | modifier le code]

Il ne faut pas non plus mélanger des registres différents et le scientifique ne peut s'autoriser à extraire des informations d'un corpus destiné à un certain registre en les appliquant à un autre. Un corpus construit à partir de textes scientifiques ne peut être utilisé pour extraire des informations sur les textes vulgarisés, et un corpus mélangeant des textes scientifiques et vulgarisés ne permettra de tirer aucune conclusion sur ces deux registres.

Méthodologie[modifier | modifier le code]

Il serait maladroit d'un point de vue méthodologique d'appliquer des traitements statistiques sur le corpus qui a permis de faire ressortir un classement ou une modélisation du langage.

Lorsque l'on travaille avec

...

Télécharger au format txt (8.3 Kb) pdf (100.9 Kb) docx (11.3 Kb)

Voir 5 pages de plus »

Uniquement disponible sur LaDissertation.com

Lire le document complet Enregistrer

Aperçu de la Dissertation

prev next

Signaler un document

Documents relatifs

Le Temps Linguistique
« Qu’est-ce donc que le temps ? Si personne ne me le demande, je le sais bien ; mais si on me le demande, et

7 Pages • 2068 Vues
Linguistique - Le Francais Parlé
Titre: "Signe et signature dans Signéponge" Table de matières 1. Introduction 2. Le « signe » et la « signature » 3. Deconstruire Ponge 4. Synopsis de Signéponge a)

24 Pages • 1564 Vues
La Politique De Logement En France
Politique du logement en France L'effort de l’État est-il suffisant dans le problème de logement? Introduction Au lendemain de la seconde guerre mondiale, la France

24 Pages • 3429 Vues
Le Logement En France
Le logement I/ INTRODUCTION: Les politiques sociales en faveur de l’insertion par le logement regroupent l’ensemble des moyens matériels, humain, financiers et juridiques consacrés au

7 Pages • 1217 Vues
Linguistique, les Bretons et leur accent
Les Bretons et leur accent Etude des représentations sociolinguistiques attachées à l'accent du français de Basse-Bretagne Sous la direction de M. Ronan Calvez, Maître de

35 Pages • 1323 Vues
La Linguistique Entre Historicisme Et Comparativisme
langues indo-européennes. Dans un contexte imprégné des idées philosophiques et les conquêtes scientifiques de l’époque, notamment sous l’influence de l’évolutionnisme observé dans les sciences naturelles

3 Pages • 1582 Vues
Facteurs du marché du logement américain (document en anglais)
The Housing Market in USA : Introduction : If there was any doubt that the housing market was undergoing a recovery, even a modest one

3 Pages • 1107 Vues
Fiche Linguistique
I. Introduction Générale  La linguistique est définie comme la science du langage qu’elle étudie à travers la diversité des langues naturelles parlées sur la

15 Pages • 1931 Vues
L'eau du robinet selon le Ministère de l’écologie du développement durable, du transport, et du logement.
I. Briefing ….................................................................................................................................... II. Analyse de la situation du ministère ........................................................................................ A. Bilan diagnostique …............................................................................................................. B. Communication antérieure …............................................................................................... C. Conclusion de l'analyse ….................................................................................................... III.

3 Pages • 888 Vues
Quels sont les enjeux du logement social aujourd'hui ?
uels sont les enjeux du logement social aujourd’hui ? Le logement social s’est développé dans les années d’après-guerre dans un contexte où les besoins en logements

5 Pages • 2420 Vues