Odette: odt ▶ TEI

[en] Edit your text corpus in your word processor (LibreOffice, Microsoft.Word), apply styles abd get them back in XML/TEI with Odette.

[fr] Éditez votre corpus au traitement de textes (LibreOffice, Microsoft.Word), utilisez une feuille de styles, Odette vous les rendra en XML/TEI.

1. document.odt :
2. export, format :
3. result :

[fr] Odette, customisations pour des projets éditoriaux

Odette est un programme qui enregistre 15 années d’expérience, avec des dizaines de projets scientifiques (romans, théâtre, correspondances, essais, presse ancienne…), et plusieurs milliers de livres, afin d’extraire du format odt le plus possible de structure sémantique en XML/TEI. Le code source est totalement libre (GitHub).

Le principe consiste à rédiger dans le traitement de texte avec une feuille de style adaptée à son projet éditorial et scientifique, et à retrouver ses styles sous forme d’éléments XML/TEI. La liste des styles supportés est raffraîchie automatiquement sur le README.me du projet. Il en résulte une liste d’environ 80 mots clés, c’est-à-dire les éléments TEI les plus fréquents dans un corpus textuel, ce qui dépasse l’attention immédiate d’un éditeur qui se concentre sur le texte. C’est pour cette raison que vous trouverez ci-dessous des projets récents qui ont utilisé Odette avec des modèles de documents plus ajustés à un besoin. Si vous visitez par exemple le formulaire Delacroix, Odette a été personnalisée pour éditer la correspondance du peintre, en ajoutant par exemple une entête <teiHeader> spécifique au projet. Si votre projet ne concerne pour l’instant que quelques documents, le plus simple est de prendre le modèle par défaut, et de corriger soi-même ce qui manque dans le <teiHeader>.

Tous les modèles utilisent le même noyau de 80 styles, les ajustements ne concernent que des post-traitements spécifiques. Tout ce qui a été développé de générique à l’occasion d’un projet a été reversé le tronc du code et est disponible dans le modèle par défaut.

Pour plus d’explications : Glorieux, 2015. Le traitement de textes pour produire des documents structurés (XML/TEI).

Renseignements, Frédéric Glorieux.