FYI.

This story is over 5 years old.

Tech

Wikipedia bouwt aan een databank voor bekende stemmen

Stephen Fry was een van de eersten die zijn eigen stem opnam voor de gratis encyclopedie.
Stephen Fry. Foto via Flickr/Documentally

Ook al wordt je niet regelmatig uitgenodigd voor Hollywood-feestjes, kun je nu horen hoe bekende mensen zichzelf voorstellen dankzij een nieuw project van Wikipedia. De site moedigt iedereen met genoeg VIP-creds om hun eigen pagina op de online encyclopedie te hebben om een audio-opname van zichzelf in te sturen. Daarmee willen ze de stemmen van de groten, de beruchten en de ietwat interessante mensen onder ons vereeuwigen.

Je kan nu de eerste "Wikipedia Voice Intro's" horen op de bibliografische pagina's van zo'n 54 individuen, vooral in het Engels, maar hier en daar ook wat Frans, Hebreeuws, Japans en Zweeds.

Advertentie

De Britse acteur Stephen Fry was één van de eersten die zijn persoonlijke introductie opnam. Onderaan de rechterkolom, onder Fry's handtekening (waarschijnlijk niet de handtekening die hij voor zijn creditcard gebruikt), staat er een audiobestand waarin hij zegt "Hallo, mijn naam is Stephen Fry, ik ben geboren in Londen en ik zit in de entertaiment sinds, uhm, nou, ik denk 1981." Maar dan in uitstekend Engels, welteverstaan.

Audio via Wikimedia Commons/Stephen Fry

Alle intro's volgens hetzelfde recept, en de Wikipedia-pagina van het project legt uit dat ze dit doen voor het nageslacht en de uitspraak: "We doen dit zodat we weten hoe bekende mensen klinken; en hoe ze hun eigen naam uitspreken."

Het project is gestart door Wikipedia-redacteur Andy Mabbett, en iedereen die een eigen artikel bezit is welkom om een audiofragment in te sturen. "Je kunt het Wikipedia voice introproject helpen door mensen die je kent te vragen om opnames te maken in een taal waar ze zich gemakkelijk bij voelen (het project is niet alleen voor Engelssprekende mensen)," aldus een post op de Wikimedia-blog. "Je kan ook helpen met het transcriberen van bestaande bestanden als ondertiteling."

De selectie is voorlopig nog vrij eclectisch, bestaande uit voornamelijk Britse mensen van verschillende achtergronden. De meesten zijn niet bepaald bekend, behalve binnen hun respectievelijke beroepsgroep. Je kan bijvoorbeeld een voorzichtige speech van plantkundige Alastair Culham luisteren, of andere weinig bekende mensen uit bijvoorbeeld het Engelse parlement.

Advertentie

De kwaliteit is afwisselend aangezien de deelnemers hun stem meestal zelf opnemen, maar er is iets intiems aan het horen van andere mensen op de achtergrond, of als ze iets te dicht bij de microfoon praten.

Maar wat misschien nog wel spannender is dan het introproject is Mabbet's poging om stemmen uit BBC-radio op te nemen. Hij werkt samen met de omroep om fragmenten te verkrijgen van vooraanstaande mensen die praten over verschillende onderwerpen.

Bij een evenment eerder deze maand, werkten de Wikimedia-community samen met de BBC, de Open Knowledge Foundation en Creative Commons UK om 300 stemmen te vangen uit het Radio 4-archief. Op het moment van publicatie zijn er zo'n 133 stemmen opgeslagen en beschikbaar gesteld.

Het resultaat is nogal uiteenlopend en soms verassend; ik heb een paar van mijn persoonlijke favorieten hieronder geplaats, allemaal via Wikimedia en de BBC.

Aung San Suu Kyi spreekt over hoe bijna neergeschoten worden:

Benedict Cumberbatch vertelt over hoe hij in een bramenstruik viel toen hij als kind ging paardrijden:

Damien Hirst was niet zo goed in het tekenen van dinosaurussen:

Schrijfster Margaret Atwood zegt dat dichten altijd makkelijker was omdat ze het in haar kelder kon doen:

Morgan Freeman is niet de belichaming van plechtigheid:

Er zijn nog een hoop meer fragmenten te vinden. Ze zijn niet nieuw, maar een databank als deze dient als een interessante herinnering aan vervlogen tijden. We zijn het zo gewend om foto's en zelfs video's te verzamelen, dat audio vaak een beetje vergeten wordt.

Volgens de Telegraph wil de BBC de informatiebank gebruiken als een "vingerafdruk" voor bekende stemmen - een dataset die vervolgens ingezet kan worden als stemherkenning om automatisch hun archief te taggen. Om te beginnen hebben ze tussen de 500 en 1000 fragmenten vrijgegeven.