logo CTB Centrum voor Teksteditie en Bronnenstudie (KANTL)
Koningstraat 18
b-9000 Gent
Belgium
email: ctb@kantl.be
tel: +32 (0)9 265 93 50
fax: +32 (0)9 265 93 49

In 2002, the CTB has launched the long-term DALF project, which aims at the gradual collection of a Digital Archive of Letters in Flanders focusing on letters by Flemish authors and composers from the 19th & 20th century. This project should incorporate future electronic edition projects into a uniform architecture that ensures maximal flexibility regarding possible output formats and usability. A current CTB project, the Electronic edition of the correspondence between Stijn Streuvels (1871-1969) and his Dutch and Flemish publishers, is taken as a pilot project for the development of the DALF outline.

DALF: Een Overzicht

Ron Van den Branden

In het kader van de ontsluiting van Vlaams literair en muzikaal erfgoed heeft het Centrul voor Teksteditie en Bronnenstudie (CTB) van de Koninklijke Academie voor Nederlandse Taal- en Letterkunde (KANTL) in 2002 het DALF-project opgestart. DALF staat voor Digital Archive of Letters in Flanders. Dit lange-termijnproject beoogt de creatie van een groeiende verzameling van elektronisch getranscribeerd en geannoteerd correspondentiemateriaal van Vlaamse schrijvers en componisten, waarbij de werkfocus voorlopig ligt op de 19de en 20ste eeuw. Een vereiste voor deze tekstverzameling is de mogelijkheid om ze zo breed mogelijk te kunnen ontsluiten, zowel wat betreft mogelijke eindproducten (verschillende presentatievormen) als gebruiksvormen (openheid m.b.t. uiteenlopende onderzoeksdoeleinden zoals literaire kritiek, geschiedenis, linguïstiek). Om een dergelijke openheid en dus maximale (her)bruikbaarheid van de elektronische brieven te kunnen garanderen, werd eerst een algemeen technisch raamwerk ontwikkeld waarbinnen DALF-projecten kunnen worden opgenomen. Hiervoor werd een lopend brievenproject van het CTB als pilootproject gebruikt, namelijk de elektronische editie van de correspondentie tussen Stijn Streuvels en zijn Nederlandstalige uitgevers (door Joke Debusschere, 2000-2002).

Een eerste fase in de ontwikkeling van een raamwerk voor DALF-projecten bestond uit het vastleggen van een formaat voor de elektronische opmaak van brieven. Er werd geopteerd om aan te sluiten bij de richtlijnen voor tekstopmaak in XML (eXtensible Markup Language) die zijn opgesteld door het Text Encoding Initiative (TEI). De opmaak van een verzameling van geannoteerde brieftranscripties vereiste echter aanpassingen aan dit opmaakschema op twee gebieden: de opname van uitgebreide meta-informatie over de documenten die verfijnde zoekmogelijkheden bevordert, en de aanduiding van briefspecifieke elementen zoals bijvoorbeeld de enveloppe en het postscriptum. Die werden vastgelegd in een uitbreidingsmodule op de TEI opmaakset: de DALF DTD. Omdat er geen sprake is van een brede theorievorming over elektronische uitgave van primair brievenmateriaal, werd voor deze uitbreiding een beroep gedaan op eigen onderzoek, op de DTD's ontwikkeld voor MASTER (Manuscript Access through Standards for Electronic Records) en MEP (Model Editions Partnership) projecten, en op bevindingen van het Electronic Streuvels Project dat resulteerde in de publicatie van de elektronisch-kritische editie van De teleurgang van den Waterhoek (De Smedt & Vanhoutte, 2000). Deze DALF DTD werd gedetailleerd gedocumenteerd in de DALF guidelines for the description and encoding of modern correspondence material, version 1.0. Dit document kan geraadpleegd of gedownload worden op de DALF webpagina en werd ter evaluatie aangeboden aan de internationale onderzoeksgemeenschap, om zo de theoretische basis en de internationale positie van het project te verstevigen.

Deze DALF DTD werd vervolgens gebruikt om de brieven uit het pilootproject te transcriberen, wat resulteerde in een collectie van 1.731 XML-documenten. Om een indicatie te bieden van de beoogde functionaliteit werden enkele demoversies gemaakt van mogelijke eindproducten. Hoewel die slechts een simulatie van de uiteindelijke functionaliteit bieden, leverde de oefening wel nuttige initiële inzichten op over manieren om het corpus te ontsluiten en hoe gebruiksvriendelijkheid daarbij een centrale rol moet krijgen. Zoals onderstaande schermafbeelding toont, laat de demoversie toe om brieven te selecteren volgens zender, ontvanger en jaar (vergelijkbaar met de indexen van papieren brievenedities), waarbij de selectiemogelijkheden aangepast worden aan de brieven in het corpus en de reeds gemaakte keuzes. Op deze manier krijgt de gebruiker op een intuïtieve manier toegang tot de collectie, en kan hij/zij die bevragen zonder evenwel ongeldige keuzes te kunnen maken. Verder kunnen de brieven op verschillende wijzen gevisualiseerd worden aan de hand van een aantal voorbeeld-stylesheets, en kunnen desgewenst facsimile's opgeroepen worden, zodat de gebruiker toegang heeft tot de verschillende abstractieniveaus in het transcriptieproces, van bron tot transcriptie en visualisering.

Ondertussen wordt verder onderzocht hoe van deze brievencollectie een eindproduct op CD-Rom kan worden afgeleid, dat gebruiksvriendelijkheid combineert met dynamische en uitgebreidere zoekmogelijkheden. Er wordt gestreefd naar echte dynamische informatie-extractie die verder gaat dan het document-retrieval niveau uit de demo, zodat gebruikers bijvoorbeeld alle brieven uit de collectie kunnen selecteren met annotaties waarin bepaalde titels of namen voorkomen; of enkel de structuurelementen (paragrafen, namen, titels, afkortingen,...) kunnen opzoeken die aan hun zoekcriteria voldoen.


XHTML auteur: Edward Vanhoutte
Last revision: 20/11/2003
URL of this website: http://www.kantl.be/ctb/project/dalf/dalfnl.htm


Valid XHTML

        1.0!