Während einer Expedition zur versunkenen Titanic hat Computerwissenschaftler Alex Waibel aus einem U-Boot heraus eine Sprachtechnologie mit Videofunktion getestet. Dabei sendete er per Sonar Texte an die Oberfläche, die dort mittels künstlicher Intelligenz (KI) in gesprochene Sprache und Video umgewandelt wurden. Einige Dialoge hätten sie durchbekommen, berichtete der Forscher vom Karlsruher Institut für Technologie (KIT) der Deutschen Presse-Agentur. »Wir konnten sehen, dass das wirklich funktioniert.«
Die Titanic war 1912 auf ihrer Jungfernfahrt untergegangen. Das Passagierschiff liegt in rund 3800 Metern Tiefe im Atlantik. Funken sei von dort aus wegen der Massen an Salzwasser nicht möglich, erläuterte Waibel. Sonar aber ermögliche nur eine »unwahrscheinlich niedrige Bandbreite«. Das reiche gerade für Textnachrichten.
Die getestete Technik funktioniert wie folgt: Vor dem Tauchgang haben Waibel und beteiligte Kollegen Videos und Stimmproben von sich aufgezeichnet. Erreichen nun Textnachrichten das Computersystem, setzt die KI das so um, dass es auf dem Video so aussieht und klingt, als würde die Person selbst gerade sprechen - samt Lippenbewegungen.
Was insbesondere im Zusammenhang mit der Titanic-Expedition nach einer PR-trächtigen Spielerei von technikaffinen Wissenschaftlern klingt, hat einen ernsten Hintergrund: »Es gibt genügend Stellen auf der Welt, wo die Bandbreite so schlecht ist, dass nur Text-Übertragung möglich ist«, sagte Waibel. Mit der neuen Technologie könnte so einmal Video-Kommunikation möglich werden.
Doch hat die Mission auch die Tücken aufgezeigt: Eines von zwei Sonargeräten sei ausgefallen, sagte Waibel. Daher habe nur ein Teil der Dialoge noch aus dem U-Boot übertragen werden können. Auch sei er auf neue Ideen gekommen: So arbeiteten U-Boot-Besatzungen viel mit Abkürzungen, um Texte zu komprimieren. Ein weiteres Ziel sei, die Technologie so zu verkleinern, dass sie in eine Tasche passt. Alles in allem zeigte sich Waibel zufrieden: »Ein guter Anfang ist gelegt.«
Eine der größten Herausforderungen beim Umsetzen der Texte in Videos habe im Übrigen gar nichts mit der Sprache zu tun, verriet der Wissenschaftler: »Wenn die Person nichts sagt, ist das überraschend schwer.« Dann bewegen sich die Lippen in den Videos bislang kaum.
Waibel war Teil einer größeren Mission unter anderem mit Biologen und Archäologen. Immer wieder gibt es derartige Expeditionen zur Titanic.
Seit mehr als 30 Jahren beschäftigt sich der Forscher mit KI und maschinellem Lernen in der Sprach- und Kommunikationstechnologie. Er entwickelte unter anderem den nach KIT-Angaben weltweit ersten automatischen simultanen Übersetzungsdienst an einer Universität. Der »Lecture Translator« zeichnet automatisch den Vortrag des Referenten auf und übersetzt die Sprachsignale simultan ins Englische, was dann als Untertitel eingeblendet wird. Studierende ohne Deutschkenntnisse können so über Laptop, Smartphone oder Tablet der Vorlesung folgen.
Infos über Waibel und seine Forschung
Infos über Titanic-Expeditionen
© dpa-infocom, dpa:220725-99-144671/2