ASR-API ist eine Web-API für ASR-Modelle, wie das Open Source Projekt Whisper von Open AI. Sie ermöglicht die Transkription von Audiodateien über HTTP und von Streaming-Audio über Websockets. Das Ausgabeformat umfasst den Text der gesprochenen Inhalte auf der Tonspur sowie Metadaten, wie Transkriptionsdauer, Teilergebnisse und Wortzeitstempel, ähnlich den gängigen Cloud-Diensten. Damit werden Inhalte barrierefrei und für Gehörlose sowie Menschen mit Hörbeeinträchtigungen bere
Zum Projekt wurden keine Video-Dateien gefunden
Beschreibung
Entstehungsdetails
Projektart
Projektarbeit
Semester
SS2024
Beteiligte Studiengänge
Computer Science and Media (Master)
Audiovisuelle Medien (Bachelor, 7 Semester)
Wirtschaftsinformatik und digitale Medien (Bachelor, 7 Semester)
Team
Team
Philipp Benner, Yassine Boutarbouch, Florian Demel, Hannah Hielscher