Entwicklung einer Web-API für OpenAI's Whisper ASR-Modell. Die API ermöglicht die Transkription von Audiodateien über HTTP und von Streaming Audio über Websockets. Das Ausgabeformat umfasst Metadaten wie Transkriptionsdauer, Teilergebnisse und Wortzeitstempel, ähnlich den gängigen Cloud-Diensten. Damit werden Inhalte barrierefrei und für Gehörlose sowie Menschen mit Hörbeeinträchtigungen zugänglich gemacht.
Zum Projekt wurden keine Video-Dateien gefunden
Beschreibung
Entwicklung einer Web-API für OpenAI's Whisper ASR-Modell. Die API ermöglicht die Transkription von Audiodateien über HTTP und von Streaming Audio über Websockets. Das Ausgabeformat umfasst Metadaten wie Transkriptionsdauer, Teilergebnisse und Wortzeitstempel, ähnlich den gängigen Cloud-Diensten. Damit werden Inhalte barrierefrei und für Gehörlose sowie Menschen mit Hörbeeinträchtigungen zugänglich gemacht.