Lehrinhalte
Verfahren der Sprach- und Audiosignalverarbeitung: Einführung in die Modelle von Sprach- und Audiosignalen sowie grundlegende Methoden der Audiosignalverarbeitung. Verfahren der codebuchbasierten Verarbeitung und der Audiocodierung. Beamforming zur räumlichen und Geräuschreduktion zur spektralen Filterung. Cepstrale Filterung und Sprachgrundfrequenzschätzung. Mel-filtered cepstral coefficients (MFCCs) als Grundlage für die Sprecher- und Spracherkennung. Klassifikations-methoden basierend auf GMM (Gaussian mixture models) sowie Spracherkennung mit HMM (Hidden markov models). Einführung in die Methoden der Musiksignalverarbeitung, z.B. Shazam-App oder Beat-Erkennung.

Literatur
Folien, für weiter Literaturhinweise siehe Homepage der Vorlesung

Voraussetzungen
Für die Vorlesung werden gute Kenntnisse der statistischen Signalverarbeitung (Minimum: Vorlesung „Digital Signal Processing“) vorausgesetzt. Wünschenswert – aber nicht zwingend notwendig – sind zusätzlich Kenntnisse über adaptive Filter.

Online-Angebote
moodle

Stammraum Informationen
S101/A2 Mo. 08:00-10:35

Semester: WiSe 2021/22