Structuren, strategieën en tools voor lexiconbouw

Een van de kerntaken van het Instituut voor de Nederlandse Taal is het bouwen van lexica. Daarvoor ontwikkelen we structuren, strategieën en tools. Die vormen de basis voor een goed opgezet lexicon van historisch of modern Nederlands. Daarnaast maken we programmatuur die een lexicon kan verrijken met de morfologische kenmerken van woorden.

Tags: ,

IMPACT-lexica

IMPACT was een Europees project dat was opgezet om historische teksten online toegankelijker te maken. Er zijn daarbij diverse lexica tot stand gekomen, bedoeld om in te kunnen zetten voor OCR, OCR-postcorrectie en betere zoekmogelijkheden in teksten.

Tags:

PAROLE-lexicon

Het PAROLE-lexicon is een computationeel lexicon met modern Nederlands taalmateriaal van ongeveer 1970-1998. Het bevat ruim 20.000 entry’s, die voorzien zijn van woordsoort, getal, naamval en gebruik in de zin. Het lexicon is onderdeel van een project voor basiscorpora en -lexica voor alle Europese talen.

Tags:

DiaMaNT

DiaMaNT staat voor Diachroon seMantisch lexicon van de Nederlandse Taal. Het is een computationeel semantisch lexicon in ontwikkeling, dat betekenisinformatie over woorden door de tijd heen moet bieden. DiaMaNT legt verbanden tussen woordvormen en betekeniseenheden (concepten), en plaatst ze in de tijd.

Tags: , , ,

GiGaNT

GiGaNT staat voor Groot Geïntegreerd Lexicon van de Nederlandse Taal. Het is een computationeel lexicon in ontwikkeling van de Nederlandse taal vanaf de zesde eeuw tot en met het heden. Dit lexicon vormt straks een verzameling van woorden en woordgroepen in alle mogelijke spelling- en vormvarianten. Het biedt bij elk woord veel extra taalkundige informatie.

Tags: , , , ,

Computationele lexica

Computationele lexica zijn gestructureerde datasets met woorden en taalkundige informatie over die woorden (woordsoort, uitspraak, betekenis, etc.), bedoeld om door een computerprogramma gebruikt te worden. De INT-lexica zijn GiGaNT, DiaMaNT, de IMPACT-lexica en het PAROLE-lexicon.

Tags: , ,


Terug naar 'Zoeken op tags'