Spraaktechnologie voor verslaggeving in het Vlaams Parlement

Voorbereiding

Om de uitdaging scherper te stellen en de vraag op het aanbod af te stemmen, werd een doorgedreven marktconsultatie uitgevoerd in samenwerking met Addestino.

Marktconsultatie

De eigenlijke marktconsultatie, georganiseerd door het PIO samen met het Vlaams Parlement en Addestino, vond plaats in het Vlaams Parlement op 24 november 2017.

Meer dan 35 deelnemers, van bedrijven en kennisinstellingen uit binnen- en buitenland, tekenden present.

Aan de hand van een overzicht van 'use cases' of uitdagingen (hieronder te downloaden) toonden zij aan wat de technologie te bieden heeft op korte en lange termijn om spraak om te zetten naar tekst.

Addestino legde de resultaten van deze workshop vast in een rapport. Het rapport (in het Nederlands) en een samenvatting (in het Engels) zijn hieronder beschikbaar.

Testdag

Als vervolgstap op de marktconsultatie van 24 november 2017 organiseerden het Vlaams Parlement en het PIO op 4 mei 2018 een testdag in het Vlaams Parlement.

Doel van deze testdag was om de huidige technologische mogelijkheden (en hun kwaliteit) van automatische transcriptie van Nederlandstalige spraak naar tekst te valideren en verder af te stemmen op de behoeften van de verslaggevende diensten van het Vlaams Parlement (= Proof Of Concept [POC]).

Uit de ingediende kandidaturen voor deelname aan de testdag werden, zoals vooraf meegedeeld in de uitnodiging, drie deelnemers geselecteerd. Zij kregen op de testdag zelf drie voor hen onbekende audiofragmenten (van elk ongeveer een half uur) zonder bijhorende sprekers en verslagen, die ze met hun spraak-naar-tekstmodel moesten omzetten naar tekstuele verslagen. Op het einde van de testdag werden de door het model gegenereerde teksten opgeleverd. Deze teksten werden beoordeeld door drie verslaggevers van het Vlaams Parlement op basis van de volgende criteria: (1) de tijd nodig voor de verslaggevers om elk stuk tekst om te zetten naar een 'afgewerkt verslag', (2) het type fouten of te verbeteren passages (al dan niet gerelateerd aan een welbepaalde spreker of grammaticale constructie, al dan niet 'eenvoudig' semiautomatisch te remediëren, etc.), (3) het percentage van accuraatheid van de sprekersherkenning, en (4) de gelijkenis met het oorspronkelijke verslag, naar inschatting van de redacteur die dit oorspronkelijke verslag heeft gemaakt.

De conclusies van de testdag werden verwerkt in een rapport dat hieronder beschikbaar is.

Delen: