Projektbeschreibung
Bei der heutigen Medienproduktion entfallen viele Kosten und Zeit darauf, dass zunächst beispielsweise ein Nachrichtenbeitrag produziert und aus diesem diverse weitere, zeitlich kürzere Fassungen für unterschiedliche Kanäle (zum Beispiel Social Media) erzeugt werden. Hierfür sind für jeden Kanal eine größtenteils händische inhaltliche Anpassung und eine komplette Neuvertonung mit den Originalsprechern notwendig. In diesem Projekt wird ein Generator für emotional individualisierbare Synthetik-Stimmen (GEISST) entwickelt, der Medienunternehmen in die Lage versetzen soll, Sprachaufnahmen mittels individueller Stimmprofile und frei wählbarer Tonalität und Emotionalität automatisiert zu erstellen.
Die wissenschaftlich-technischen Arbeiten in GEISST, geleitet vom Mittelständler Nachtblau und unterstützt durch den Forschungspartner Fraunhofer IDMT, befassen sich mit der KI-basierten Signalanalyse und Sprachsynthese sowie der Zusammenführung der Technologien in einem Demonstrator. Begleitet wird dies unter Leitung der Hochschule für Medien von umfassenden Forschungsarbeiten zu den ethischen Grundlagen und Konsequenzen sowie durch ein Rechtsgutachten, da bei synthetisierten Sprachaufnahmen die Gefahr des Missbrauchs und die Rolle des Vertrauens in Medien besonders beachtet werden muss.
Technisch wird dies ergänzt durch Forschungs- und Entwicklungsarbeiten zu fälschungssicherer Kenntlichmachung der synthetisiert erstellten Stimmdaten. Die Entwicklungen sollen im Erfolgsfall in bestehende Produkte von Nachtblau integriert werden.
Weitere mögliche Forschungsthemen über das hier ausgeschriebene hinaus können individuell mit der Leiterin des Instituts, Prof. Dr. Petra Grimm, vereinbart werden.
Laufzeit: bis September 2025
Fördervolumen, Fördergeber: 1 Million Euro, Bundesministerium für Bildung und Forschung (BMBF)
Anzahl Mitarbeiter (an der HdM): 1
URL: https://www.hdm-stuttgart.de/digitale-ethik/forschung/forschungsprojekte/geist/