FYI.

This story is over 5 years old.

Tech

Mit diesem mächtigen Tool kannst du jedem kinderleicht das Wort im Mund umdrehen

Das Photoshop für Stimmen ist da—werden wir unseren Ohren je wieder trauen können?
Bild: Adobe Creative Cloud | Youtube

Wäre es nicht toll, wenn ihr jedem beliebigen Menschen genau die Worte in den Mund legen könntet, die ihr wollt? So könntet ihr beispielsweise George Clooney eine charmante Geburtstagsnachricht an eure Mutter sprechen lassen oder euren kleinen Bruder zwingen, seiner heimlichen Flamme seine Liebe zu gestehen. Falls ihr davon schon immer geträumt habt, ist Adobes neues Tool genau das richtige für euch.

Anzeige

Als Adobe im Jahre 1990 Photoshop herausbrachte, hatte das Unternehmen eine klare Vision: Sie wollten die Aufgaben, für die Filmstudios oder Fotoredakteure sonst Tage benötigten, in wenigen Minuten erledigen können. Die Entwickler dachten damals nicht im Traum daran, dass eines Tages die ganze Welt ihr digitales Bildbearbeitungsprogramm dazu benutzen würde, die Köpfe von Prominenten auf die Körper von Pornostars zu setzen, Frauenkörper für Magazincover zu verändern oder gemeine Memes zu schaffen.

Nachdem Adobe mit Photoshop also ein Werkzeug auf den Markt brachte, mit denen das menschliche Bild kinderleicht nach den eigenen Wünschen verändert werden kann, möchten sie für die menschliche Stimme nun dasselbe tun. Auf der Adobe Max Creativity Conference im Oktober stellte das Unternehmen die entsprechende neue Software namens VoCo zum ersten Mal vor: ein Audiobearbeitungsprogramm, mit dem Nutzer andere Leute durch simple Texteingaben über die Tastatur sagen lassen können, was auch immer sie wollen.

Folgt Motherboard auf Facebook, Instagram, Snapchat und Twitter

Laut Adobe reicht es dem Programm bereits, etwa 20 Minuten einer menschlichen Stimme zuzuhören—danach können Nutzer diese Stimme beliebige Worte sagen lassen, indem sie diese einfach in ein Textfeld eintippen. Adobe-Techniker Zeyu Jin demonstrierte das neue Tool, indem er ein Interview von Komiker Jordan Peele, der das Event moderierte, und seinem Show-Kollegen Keegan-Michael Key überarbeitete. Mithilfe der Software veränderte Jin die Tonspur, so dass Keys Stimme am Ende davon berichtet, wie er Peele anstelle seiner Frau küsst.

Anzeige

In der Originalaufnahme erzählt Key dagegen, wie aufgeregt er war, als er von einer Nominierung erfuhr. „Ich sprang aufs Bett", sagt Key. „Und ich, äh, küsste meine Hunde und meine Frau … in dieser Reihenfolge." Auf der Leinwand über Jin wird die Audiowellenform und ein kleines Kästchen mit dem transkribierten Satz angezeigt.

Jin löscht nun Teile des Satzes und gibt neue Wörter ein, woraufhin sich die Wellenformen entsprechend anpassen. Der Adobe-Techniker braucht nur Sekunden, um Key sagen zu lassen, dass er seine Frau vor den Hunden geküsst habe, dass er Jordan geküsst habe oder gar, dass er Jordan dreimal geküsst habe. Um Key all die Worte in den Mund zu legen, braucht Jin nichts weiter als zu tippen. Die Ergebnisse klingen einwandfrei.

„Keine Sorge", versichert Jin dem Publikum. „Wir haben untersucht, wie man Fälschungen verhindern kann. Das funktioniert in etwas wie bei einem Wasserzeichen in Dokumenten. Während wir die Audio-Ergebnisse soweit verbessern, dass man den Unterschied zwischen dem Original und der Nachahmung nicht mehr hören kann, arbeiten wir gleichzeitig sehr hart daran, eine solche Nachahmung nachweisbar zu machen." Um diese beruhigenden Worte zu unterstreichen, streckt Jin beide Daumen nach oben und grinst.

Jin erklärt, dass Adobe die Software entwickelt habe, um Redakteure von Podcasts und Audiobüchern zu entlasten. Tatsächlich wäre es ein wahrer Segen für beide Bereiche, einen neuen Audioteil nur noch tippen und nicht noch einmal neu aufnehmen zu müssen. Allerdings ist sich Adobe sehr wohl bewusst, dass VoCo auch dafür genutzt werden kann, anderen Leuten beliebige Sätze in den Mund zu legen. Schließlich stellt das Unternehmen das selbst beispiellos unter Beweis, indem es bei seiner ersten Demo nichts besseres zu tun hat, als einem unbeteiligten Dritten die Worte im Mund umdrehen, um den eigenen Moderator zu ärgern.