Das Projekt- und Medienarchiv der HdM

Whisper REST API

Entwicklung einer Web-API für OpenAI's Whisper ASR-Modell. Die API ermöglicht die Transkription von Audiodateien über HTTP und von Streaming Audio über Websockets. Das Ausgabeformat umfasst Metadaten wie Transkriptionsdauer, Teilergebnisse und Wortzeitstempel, ähnlich den gängigen Cloud-Diensten. Damit werden Inhalte barrierefrei und für Gehörlose sowie Menschen mit Hörbeeinträchtigungen zugänglich gemacht.
Zum Projekt wurden keine Video-Dateien gefunden

Beschreibung




Projektart

Projektarbeit

Semester

WS2023/2024

Beteiligte Studiengänge

Wirtschaftsingenieurwesen Medien (Bachelor)

Mobile Medien (Bachelor, 7 Semester)

Computer Science and Media (Master)

Team
Florian Demel, Benedikt Scheffbuch, Torben Ziegler
Betreuer
Korbinian Kuhn
Ansprechpartner

Benedikt Scheffbuch

bs119@hdm-stuttgart.de