Home » Nieuws » Het huwelijk tussen taal en computers
Het huwelijk tussen taal en computers
09 nov 2012
Taal en computers, het is een gouden huwelijk. Neem een computer met voldoende rekenkracht, voer het apparaat een database van miljarden woorden en het geeft in enkele milliseconden antwoord op de meest uitgebreide vraagstukken. Hoogleraar taaltechnologie Antal van den Bosch gaf vanmiddag tijdens zijn oratie een kijkje in de mogelijkheden.Foto: een enigmacodeermachine. Het werk dat onderzoekers als Alan Turing deden om de code van de enigma te breken, is het fundament van het werk dat Van den Bosch nu doet. We spraken hem uitgebreid voor de volgende Vox en komen daar dan op terug. Foto: pilot_micha (Creative Commons) ‘U weet wat ik ga… zeggen’, zo opende Van den Bosch zijn oratie. Tijdens de korte pauze die hij aan het einde liet vallen, voorspelden de aanwezigen al dat de zin zou afsluiten met het woord ‘zeggen’. De mens doet dit bij iedere zin, onbewust. Maar een computer kan dit aan de hand van data ook leren, aldus Van den Bosch. Door een combinatie van de context en de voorafgaande woorden zal een goed geprogrammeerd stukje software op basis van statistiek het woord ‘zeggen’ als één van de meest waarschijnlijke opties uitspugen. En het zijn dit soort programma’s die Van den Bosch maakt in zijn ‘taallab’. Tekstverwerkers, spellingscontroles, vertaalprogramma’s, zoekmachines; door middel van taaltechnologie is er overal nog veel winst te behalen. ‘Door taalvoorspellingen is het bijvoorbeeld mogelijk om een tekstverwerker te ontwerpen waarbij je met veertig procent minder aanslagen hetzelfde resultaat kunt krijgen.’ Op dit moment werkt Van den Bosch aan een programma dat twitterberichten doorzoekt op gebeurtenissen die voorspellen wat ‘nieuws’ kan worden. Deze programma’s leggen vliegensvlug verbanden en zien relaties tussen verschillende woorden of zinsdelen, en dat leidt soms tot verrassende inzichten en resultaten. ‘Een mens zou dat in theorie ook wel kunnen, maar mijn datagedreven methode via de computer doet dit vele, vele malen sneller. Laat een computer nieuwe gevallen vergelijken met bekende gevallen in de database en hij is in staat om subtiele aanwijzingen op te pikken. Als de computer tenminste goed wordt aangestuurd.’ De eentjes en nulletjes waarvan Van den Bosch handige software maakt, stelt hij soms ter beschikking als open source software. ‘Dat is goed voor de wetenschappelijke impact achter de software’. En dat zorgt er en passant ook voor dat jij ze gratis kunt gebruiken. De door Van den Bosch ontwikkelde spellingcontrole van Valkuil.net is daar één van de eerste voorbeelden van. / Tim van Ham