Artikelnummer | 9786203172522 |
---|---|
Produkttyp | Buch |
Preis | 66,00 CHF |
Verfügbarkeit | Lieferbar |
Einband | Kartonierter Einband (Kt) |
Meldetext | Folgt in ca. 10 Arbeitstagen |
Autor | Dadvar, Maral |
Verlag | Verlag Unser Wissen |
Weight | 0,0 |
Erscheinungsjahr | 20210102 |
Seitenangabe | 72 |
Sprache | ger |
Anzahl der Bewertungen | 0 |
Wer hat wann gesprochen? Buchkatalog
Die Sprechertagung ist ein Prozess, der aktive Sprecher erkennt und diejenigen Sprachsignale gruppiert, die von demselben Sprecher geäußert wurden. Im Allgemeinen gibt es zwei Hauptanwendungen für die Sprechertypisierung. Automatische Spracherkennungssysteme nutzen die sprecherhomogenen Cluster, um die akustischen Modelle sprecherabhängig anzupassen und damit die Erkennungsleistung zu erhöhen. Sprecherindizierungs- und Rich-Transcription-Systeme nutzen ebenfalls die Sprecherdiarisierungsausgabe als eine der Informationen, die aus einer Aufnahme extrahiert werden und deren automatische Indizierung und andere Weiterverarbeitung ermöglichen. In dieser Studie wird eine Anwendung zur Sprechertiarisierung entwickelt - unter Verwendung von binauralen Mehrparteien-Sprachaufnahmen - um die Sprecheraktivität basierend auf interauralen Zeitdifferenzen (ITD) zu verfolgen. Diese Cues werden für einen gegebenen Sprachsignalrahmen mittels Gammatone-Filterung und Kreuzkorrelationstechnik berechnet. Ihre Werte werden verwendet, um zu bestimmen, welcher Sprecher in der Aufnahme das betrachtete Sprachfragment produziert hat. Diese Studie wurde von Dr. Jon Barker betreut und zur Erfüllung der Anforderungen für den Master in Advanced Computer Science, University of Sheffield, United Kingdom, 2007 verteidigt.
66,00 CHF
Lieferbar
Dieser Artikel hat noch keine Bewertungen.