Ondertiteling toepassen en best practices

Kwalitatief goede ondertiteling maken en implementeren voor toegankelijke video

Ondertiteling voor doven en slechthorenden spelen een belangrijke rol bij inclusieve media. Het stelt dove gebruikers in staat om multimedia-inhoud te consumeren, slechthorende gebruikers om informatie die door geluid wordt gedragen waar te nemen en gebruikers met cognitieve stoornissen om multimedia-inhoud beter te begrijpen. Voorwaarde is kwalitatief goede ondertiteling. Daarvoor is het belangrijk dat je inhoudelijk goede ondertiteling maakt, maar ook dat je deze technisch op de juiste manier toevoegt. Bovendien moet de (informatie in) ondertiteling visueel goed waarneembaar zijn. Hoe je goede ondertiteling maakt, lees je in dit artikel.

Ondertiteling inhoud

De sleutel tot het produceren van kwalitatief goede ondertitels is beginnen met het vastleggen van de goede inhoud. In tegenstelling tot reguliere ondertitels die vaak worden gebruikt voor vertalingen en alleen spraak naar tekst overzetten, bevatten ondertitels álle hoorbare informatie. Het volgende moet worden opgenomen in de ondertiteling:

  • Spraak (letterlijk). De inhoud moet zo dicht mogelijk bij het dialoog en geluid staan dat wordt beschreven. Deze inhoud bevat geen:
    • Correcties
    • Censuur
    • Interpretatie of verduidelijking
  • Identificatie van de spreker. De bron van de spraak of het geluid moet aangegeven zijn. Dit kan door de volledige naam of verkorte variant van de naam toe te voegen aan de tekst.
  • Relevante informatie over spraak (bijv. toon, opvallende kenmerken)
  • Achtergrondmuziek, als dit belangrijk is voor het begrijpen van de video. Voeg relevante informatie over muziek toe, zoals:
    • Objectieve beschrijvingen om stemming aan te geven
    • Titel en artiest
    • Songtekst
    • Relevante andersoortige (niet gesproken) audio-informatie. Alle relevante geluiden moeten zijn toegevoegd.

De ondertiteling is foutloos. Er moet worden gecontroleerd op nauwkeurigheid. Daarnaast is juiste interpunctie belangrijk. Dit verbetert de leesbaarheid en vergemakkelijkt het begrip.

Er zijn gelegenheden waarbij het nodig is om af te wijken van een letterlijke beschrijving:

  • Het is acceptabel voor video's om niet-essentiële, irrelevante informatie weg te laten om ondertiteling gemakkelijker te verwerken. Bijvoorbeeld bij hoesten of het corrigeren van een verspreking.
  • Bij irrelevante spraak. Zoals meerdere mensen die op de achtergrond praten terwijl de focus van de video bij een persoon op de voorgrond ligt. Beschrijf het als een geluid. Bijvoorbeeld: [mensen op de achtergrond bespreken de decoratie].
  • Als spraak niet te verstaan is. Beschrijf het als zodanig. Bijvoorbeeld: [onverstaanbaar].

Het kan nodig zijn om inhoud in ondertiteling te prioriteren en zelfs over te slaan. Zorg ervoor dat informatie die niet kan worden gezien, maar alleen worden gehoord, hoge prioriteit krijgt.

Ondertitelaar

Het maken van ondertitels kan worden gedaan door een professionele ondertitelaar of door iemand die goede schrijfvaardigheden heeft, auditieve informatie kan scheiden van visuele informatie en de mogelijkheid heeft om inhoud te prioriteren en te selecteren zonder informatie te verliezen. Hoewel een professionele en goedopgeleide ondertitelaar de kwaliteit kan verbeteren en het proces kan versnellen, kan ondertiteling voor vooraf opgenomen video ook door een niet-professional worden gemaakt.  

Automatisch gegenereerde ondertiteling

Voor doven en slechthorenden zijn automatisch gegenereerde ondertitels mogelijk een beter alternatief dan helemaal geen ondertitels. Volledig geautomatiseerde ondertiteling brengt voor gebruikers echter verschillende nadelen met zich mee.  

Nadelen automatische ondertiteling:

  • Gebruikers missen de niet-dialooggeluiden.
  • De ondertitels kunnen niet accuraat kunnen zijn.
  • De spreker wordt niet expliciet genoemd.

Ondertiteling maken

Het maken van ondertitels van goede kwaliteit kan tijdrovend zijn wanneer je helemaal bij nul begint. Advies is daarom om gebruik te maken van automatisch gegenereerde ondertiteling in het productieproces. Niet als eindresultaat. Met automatische spraakherkenning (Automatic Speech Recognition of ASR), kun je snel spraak omzetten naar tekst. Hoewel de kwaliteit hiervan snel beter wordt, biedt deze software een hulpmiddel en geen vervanging voor menselijke transcriptie van spraak naar tekst. Deze hulpmiddelen zijn nog steeds erg foutgevoelig. Zeker voor Nederlandse teksten. Controleer en verbeter de tekst die de ASR-tool genereert.  

Zorg ervoor dat als je gebruik maakt van een tool die audio automatisch omzet naar tekst, dat deze de tekst ook direct tijdcodes meegeeft. Daar maakt de videoplayer gebruik van om de ondertitels te synchroniseren.  

ASR-tools genereren alleen een transcript van gesproken tekst. Je zal dus nog zelf andere auditieve informatie moeten toevoegen. Zoals muziek, geluiden en de identificatie van de spreker.  

Visuele weergave

De visuele presentatie van de ondertitels is belangrijk om ze begrijpelijk te maken. Ondertitels moeten aan de volgende specificaties voldoen:

  • Lettertype
    • De kleur van het lettertype moet onderscheidend zijn van de achtergrond. Een achtergrondkleur kan worden toegevoegd. Lees voor meer informatie het artikel Kleurcontrast.
    • Het lettertype moet gemakkelijk leesbaar zijn in de normale weergave, maar ook wanneer het cursief, vet of in hoofdletters wordt weergegeven.
    • Het lettertype moet schreefloos zijn.
       
  • Locatie en lengte
    • Ondertitels overlappen niet met belangrijke visuele informatie in de video.
    • Ondertitels worden weergegeven op een of twee regels.
    • Bij voorkeur is de lengte niet meer dan 32 tekens per regel.
    • Ondertitels zijn minstens 3 tot 7 seconden op het scherm zichtbaar.
    • Nieuwe zinnen beginnen op een nieuwe regel.
       
  • Meta
    • Er is een visueel onderscheid tussen de dialogen van sprekers. Bijvoorbeeld door namen, initialen of beschrijvingen van de persoon die spreekt toe te voegen. Kleur alleen is niet genoeg om het onderscheid te maken.
    • Er is een visuele indicatie of de spreker in of buiten beeld is. Bijvoorbeeld door cursieven te gebruiken.
    • Er is een onderscheid tussen gesproken en andersoortige audio-informatie. Bijvoorbeeld door haakjes, vierkante haakjes, cursieven of extra witruimte te gebruiken.
    • Informatie over muziek wordt cursief weergegeven.
    • Als een ondertiteling songteksten bevat, moet aan het begin en einde van iedere ondertitel een muzieknoot worden getoond.
    • Visuele aanwijzingen zijn consistent. Als niet-gesproken geluiden bijvoorbeeld tussen vierkante haken staan, dan moet dit in de hele video zo worden gedaan en bij voorkeur in alle video’s die je publiceert.

(Technisch) implementatie

Open of Closed Captions?

Er zijn twee methoden die je kunt gebruiken om ondertiteling aan een video toe te voegen:

  • Open ondertitels (Open Captions) 
    Open Captions staan altijd 'aan'. De ondertiteling is zichtbaar voor elke gebruiker bij het bekijken van de video. Deze ondertitels zijn direct geïntegreerd in de video en kunnen niet worden uitgeschakeld. Het is ook niet mogelijk om de tekstlocatie, grootte of kleur aan te passen.
     
  • Gesloten ondertitels (Closed Captions of CC) 
    Closed Captions zijn pas zichtbaar als ze zijn ingeschakeld. Dit kan worden ingesteld door (standaard) instellingen of bedieningselementen in de videospeler. Deze ondertiteling wordt onafhankelijk van de video-inhoud opgeslagen. Gebruikers hebben de mogelijkheid om ze in/uit te schakelen en naar behoefte aan te passen (positie, grootte, kleur, enz.).

Closed captions en open captions hebben beide verschillende voor- en nadelen. Kies je voor Closed Captions, dan moet je testen of de videoplayer waarmee de video wordt afgespeeld Closed Captions ondersteunt. Anders moet een alternatieve videospeler worden gebruikt. Met open captions ben je niet afhankelijk van deze functionaliteit. Het gros van de videoplayers ondersteunen echter closed captions.  

Closed captions heeft voor de eindgebruiker als voordeel dat deze door de gebruiker zelf te bedienen en aanpasbaar is. Mits de bediening toegankelijk en duidelijk is. Je kunt deze ondertiteling standaard ‘aanzetten’. Mocht een gebruiker ze storend vinden, dan kan die het zelf uitzetten.  

Toevoegen closed captions (CC)

Diverse video- of mediaspelers passen verschillende technieken toe voor het invoegen van ondertiteling. Controleer de ondersteuning of handleidingen van de speler die u gebruikt om video te distribueren om erachter te komen welke methode deze gebruikt. Hier staan een paar voorbeelden van algemeen bekende technieken.

SMIL (en SAMI)

Synchronized Multimedia Integration Language (SMIL) is een op XML gebaseerde taal die verschillende multimedia-elementen in één formaat plaatst. Het kan video, audio, afbeeldingen, animaties, tekst en meer bevatten. Deze elementen kunnen worden gesynchroniseerd door hun timing in code vast te leggen. Met dit formaat kunt u bijvoorbeeld audio in meerdere talen, video voor meerdere bandbreedtes en ondertiteling opnemen.

Als je SMIL gebruikt om ondertiteling op te nemen in een video, moet je een verwijzing naar een tekstbestand toevoegen of de tekst zelf opnemen in de xml. Afhankelijk van de videospeler waarvoor je de SMIL schrijft, kun je voorkeuren instellen voor de plek waar de ondertiteling wordt weergegeven, de visuele instellingen, de timing, enz.

Het gebruik van SMIL wordt ondersteund door Quicktime en RealPlayer. Voor ondertiteling voor Microsoft Windows Media Player kan de taal SAMI worden gebruikt. Meer informatie over deze standaard is te vinden op de Microsoft-pagina SAMI 1.0.  

HTML5

In HTML5 kun je het track-element in het video-element gebruiken om ondertiteling in de video te integreren. Het track-element moet het attribuut ‘kind’ met value ‘captions’ hebben. Het tekstbestand waarnaar het verwijst, moet van het type WebVtt (Web Video Text Tracks) zijn. Dit is een tekstbestand dat kan worden gebruikt voor ondertitels en audiodescriptie. Meer gedetailleerde informatie over het formaat is te vinden op WebVTT: The Web Video Text Tracks Format (W3C).

Houd er rekening mee dat bij het gebruik van het HTML5 video-element een label moet worden toegevoegd dat de video beschrijft en dat de standaard besturingselementen moeten worden ingeschakeld. Meer informatie over toegankelijkheidsvereisten voor HTML5-video is te vinden op Accessible Publishing Knowledge Base (daisy.org).

TIP! Combineer de creatie en implementatie met audiodescriptie of transcripten

Omwille van de efficiëntie kan het maken van ondertitels worden gecombineerd met het creëren van transcripten en audiodescriptie. Transcripten bevatten alle auditieve en alle visuele informatie. Met ondertiteling voor doven en slechthorenden heb je al de helft van die inhoud. Audiodescriptie kan ook met getimede bestanden toegevoegd worden. Net als closed captions. Onderzoek of het samenvoegen van de productie van deze alternatieven (voor audio en beeld) zorgt voor een efficiëntere productie.

Onze experts helpen je verder met toegankelijk publiceren

Bewustwording toegankelijk publiceren
In deze bewustwordingssessie leren medewerkers van uitgeverijen waarom digitale toegankelijkheid essentieel is, voor wie het bedoeld is en hoe mensen met verschillende leesbeperkingen toegang krijgen tot content. Zet de eerste stap met deze introductie in brontoegankelijk publiceren. Kom verder!
Trainingen Toegankelijk Publiceren
De experts van Dedicon delen graag hun kennis over het toegankelijk maken van tekst en beeld. Zo geven we workshops, webinars en trainingen. Over de toepassing van onze producten en diensten, maar ook hoe je zelf ervoor kunt zorgen dat teksten en beelden toegankelijk worden voor mensen met een beperking. Op maat, praktijkgericht en direct toepasbaar.
Advies op maat
Dedicon ondersteunt uitgevers met maatwerk in toegankelijk publiceren. Of dat nu gaat om een verdiepende training, een werksessie in huis, co-creatie of advies op maat. Geen vraag is ons vreemd! Kom verder!
Abonneer je op onze nieuwsbrief (nieuw venster)