ASR-API ist eine Web-API für ASR-Modelle, wie das Open Source Projekt Whisper von Open AI. Sie ermöglicht die Transkription von Audiodateien über HTTP und von Streaming-Audio über Websockets. Das Ausgabeformat umfasst den Text der gesprochenen Inhalte auf der Tonspur sowie Metadaten, wie Transkriptionsdauer, Teilergebnisse und Wortzeitstempel, ähnlich den gängigen Cloud-Diensten. Damit werden Inhalte barrierefrei und für Gehörlose sowie Menschen mit Hörbeeinträchtigungen bere
Team:
Philipp Benner, Yassine Boutarbouch, Florian Demel, Hannah Hielscher
Studiengang:
Audiovisuelle Medien (Bachelor, 7 Semester), Computer Science and Media (Master), Wirtschaftsinformatik und digitale Medien (Bachelor, 7 Semester)
Betreuer:
Korbinian Kuhn