Polifonia: Europese samenwerking rond digitale kennisnetwerken
Het Polifonía Project, een samenwerkingsverband tussen verschillende Europese universiteiten, archieven en onderzoeksinstituten, werkt aan een kennisnetwerk (knowledge graph) rond muziek in Europa vanaf de zestiende eeuw. Aan de hand van tien onderwerpen worden gegevens uit digitale bronnen geëxtraheerd en met elkaar in verband gebracht. Muziekwetenschapper Peter van Kranenburg vertelt over het Nederlandse deel van het project.
‘In zes verschillende talen worden digitale teksten verzameld. In Nederland filteren we bijvoorbeeld uit de digitale krantenbank Delpher.nl alle teksten die over muziek gaan. Vervolgens worden hier met behulp van kunstmatige intelligentie alle entiteiten uitgefilterd, zoals personen, locaties, gebeurtenissen en objecten, en de verbanden tussen deze entiteiten.’ Zo’n dataset van met elkaar verbonden entiteiten wordt een knowledge graph genoemd. Hoe kan zo’n kennisnetwerk ons begrip van de Europese muziekgeschiedenis verrijken? Om de potentie van een knowledge graph te testen zijn tien thema’s gekozen als proefproject.
Kennisnetwerk Nederlandse orgels
Peter leidt het proefproject Organs, rond de Nederlandse Orgelencyclopedie. Vanuit zijn kennis over orgels werkt hij aan een ontologie (datamodel) waarmee de gedigitaliseerde orgelencyclopedie omgezet kan worden in zo’n knowledge graph of kennisnetwerk. ‘In de tekst kun je verschillende entiteiten herkennen, zoals de kas, de pijpen, de speeltafel, de kerk waarin het orgel staat, maar ook de bouwer, de organist en de muziek die hij speelt. Tussen die entiteiten kun je verbindingen benoemen, zoals de restauratie van een orgel door een bepaalde bouwer, of de organist als bespeler van verschillende orgels. Als alle elementen van een tekst passen in het model dat je hebt bedacht, en er dus geen zaken of verbanden meer zijn die in geen enkel vakje passen, dan is het model goed. Om het geheel werkbaar te houden, moet je wel keuzes maken. Een orgelpijp bestaat bijvoorbeeld ook weer uit verschillende onderdelen. En omdat computers nu eenmaal geen mensen zijn, moet je ook een bepaalde mate van ruis accepteren. We gebruiken allerlei methoden en modellen uit de taaltechnologie om de enorme hoeveelheid tekst automatisch te analyseren, maar niet één van die methoden is 100% accuraat.’
Fictieve gebruikers
Maar waar trek je een grens, wanneer is het resultaat goed en gedetailleerd genoeg? ‘Om het resultaat af te bakenen werken we met persona’s en scenario’s. Met het projectteam hebben we een aantal fictieve gebruikers bedacht met verschillende onderzoeksvragen.’ Zo is er bijvoorbeeld de 51-jarige orgelkenner en muziekwetenschapper Amy. Voor haar promotieonderzoek bestudeert ze de technische en artistieke ontwikkelingen van het Nederlandse orgel. Ze hoopt dat het kennisnetwerk op basis van de gedigitaliseerde orgelencyclopedie trends kan identificeren, zodat ze weet waar ze dieper moet graven. Voor Amy is een hele set vragen bedacht die ze aan de knowledge graph kan stellen. Een ander personage is Paul, een organist en muziekwetenschapper die orgelbouwers adviseert bij restauraties. Hij wil bijvoorbeeld weten welke orgels er nog meer zijn van dezelfde bouwer. Peter: ‘Als we de vragen van onze bedachte personages kunnen beantwoorden is het resultaat van ons project goed genoeg. En als je als gebruiker twijfelt over informatie in de knowledge graph, of meer wilt weten over de context, kun je in het eindresultaat altijd doorklikken naar de oorspronkelijke bron.’
Een ander interessant proefproject waar Peter bij betrokken is, is het project rond de Nederlandse Liederenbank van het Meertens Instituut, Tunes. ‘Door de melodieën uit de Liederenbank te koppelen aan verzamelingen uit het buitenland in een groot kennisnetwerk, kunnen we beter traceren waar ze vandaan komen.’
Meer weten over dit project? Kijk op https://polifonia-project.eu