Wer hat wann gesprochen?

Die Sprechertagung ist ein Prozess, der aktive Sprecher erkennt und diejenigen Sprachsignale gruppiert, die von demselben Sprecher geäußert wurden. Im Allgemeinen gibt es zwei Hauptanwendungen für die Sprechertypisierung. Automatische Spracherkennungssysteme nutzen die sprecherhomogenen Cluster, um die akustischen Modelle sprecherabhängig anzupassen und damit die Erkennungsleistung zu erhöhen. Sprecherindizierungs- und Rich-Transcription-Systeme nutzen ebenfalls die Sprecherdiarisierungsausgabe als eine der Informationen, die aus einer Aufnahme extrahiert werden und deren automatische Indizierung und andere Weiterverarbeitung ermöglichen. In dieser Studie wird eine Anwendung zur Sprechertiarisierung entwickelt - unter Verwendung von binauralen Mehrparteien-Sprachaufnahmen - um die Sprecheraktivität basierend auf interauralen Zeitdifferenzen (ITD) zu verfolgen. Diese Cues werden für einen gegebenen Sprachsignalrahmen mittels Gammatone-Filterung und Kreuzkorrelationstechnik berechnet. Ihre Werte werden verwendet, um zu bestimmen, welcher Sprecher in der Aufnahme das betrachtete Sprachfragment produziert hat. Diese Studie wurde von Dr. Jon Barker betreut und zur Erfüllung der Anforderungen für den Master in Advanced Computer Science, University of Sheffield, United Kingdom, 2007 verteidigt.

66,00 CHF

Lieferbar


Artikelnummer 9786203172522
Produkttyp Buch
Preis 66,00 CHF
Verfügbarkeit Lieferbar
Einband Kartonierter Einband (Kt)
Meldetext Folgt in ca. 10 Arbeitstagen
Autor Dadvar, Maral
Verlag Verlag Unser Wissen
Weight 0,0
Erscheinungsjahr 20210102
Seitenangabe 72
Sprache ger
Anzahl der Bewertungen 0

Dieser Artikel hat noch keine Bewertungen.

Eine Produktbewertung schreiben