Ancien-français
Anonyme (vers 1040-1045)
  La Vie de Saint Alexis
Chrétien de Troyes (1135-1190)
  Chevalier de la charrette
François Villon (vers 1456)
  Le Lais
Chinois ancien
Dao Chuo (562-645)
  An Le Ji
Xing Jian Bai (776-826)
  Li Wa Zuhan
Moderne
Henri de Bornier (1825-1901)
  La fille de Roland
Lexicographie

La partie lexicographique présente quelques dépouillements de textes rares ou connus. Un pré-traitement spécifique a été exécuté sur chaque texte. Comme une partie des dépouillements se font en temps réels, les temps de réponses peuvent varier...

Si vous désirez nous envoyer un texte à dépouiller, écrivez-nous à info@citadelle.org

 

Définition des termes employés

Corpus Un corpus est un ensemble de textes
Texte Un texte est soit un document complet (un texte d'un auteur) soit des parties d'un texte, identifié par  ###
Section Une section est un morceau de textes, idéntifié dans le texte original par le séparateur  ====
Page Une page peut soit représenter le découpement physique du support, soit fictivement des morceaux de sections, identifié par +++
Paragraphe Un paragraphe est définit par un retour à la ligne, un saut de ligne est considéré comme deux paragraphes
Segments répétés Un segment répété est une suite de formes identiques apparaissant dans un texte (au sens global)

 

Codage des textes

Les textes sont au format TXT encodés en UTF-8. Ils sont donc codés sur 1, 2 ou 3 octets en fonction de la langue utilisée.

Accès au forums

Identifiant
Mot de passe
  1. Perdu votre mot de passe ?
  2. Pour vous inscrire aux forums