Diese Website verwendet nur technisch notwendige Cookies. In der Datenschutzerklärung können Sie mehr dazu erfahren.

Zum Hauptinhalt springen
Logo, Startseite der Hochschule der Medien

Whisper REST API

Entwicklung einer Web-API für OpenAI's Whisper ASR-Modell. Die API ermöglicht die Transkription von Audiodateien über HTTP und von Streaming Audio über Websockets. Das Ausgabeformat umfasst Metadaten wie Transkriptionsdauer, Teilergebnisse und Wortzeitstempel, ähnlich den gängigen Cloud-Diensten. Damit werden Inhalte barrierefrei und für Gehörlose sowie Menschen mit Hörbeeinträchtigungen zugänglich gemacht.

Team: Florian Demel, Benedikt Scheffbuch, Torben Ziegler

Studiengang: Computer Science and Media (Master), Wirtschaftsingenieurwesen Medien (Bachelor), Mobile Medien (Bachelor, 7 Semester)

Betreuer: Korbinian Kuhn