Computerlinguistik

Quelle: Wikipedia. Seiten: 68. Kapitel: Sprachsynthese, WordNet, Hidden Markov Model, Web Mining, Information Retrieval, Text Mining, Head-driven Phrase Structure Grammar, Spracherkennung, Functional Grammar, Maschinelle Übersetzung, Textgenerierung, Informationsextraktion, Bedeutung-Text-Modell, Cross-Language Evaluation Forum, Chart-Parser, Prosodieerkennung, Burghard Rieger, Baumbank, Viterbi-Algorithmus, Information Retrieval Facility, Wortnetz, Deutsches Textarchiv, Blindenschriftübersetzungsprogramm, Part-of-speech Tagging, UIMA, Morphologische Analyse, Stemming, Text Engineering Software Laboratory, Phonetische Suche, Across Language Server, Sentiment Detection, Linguatec, Porter-Stemmer-Algorithmus, Conditional Random Field, Bottom-Up-Parser, Recognizer, Wolfgang Wahlster, LF-Parser, Themenentdeckung und -verfolgung, Sprachverarbeitung, Lexikalische Dichte, Textklassifikation, Text Extraction, Tokenisierung, GermaNet, Texttechnologie, GEMET, Sprachsteuerung, Sprachtechnologie, Latent Dirichlet Allocation, COMIT, Gesellschaft für Sprachtechnologie und Computerlinguistik, Tree Adjoining Grammar, Fact Extraction, Informationslinguistik, Worterkennungssystem, Packrat Parser. Auszug: Information Retrieval (IR) bzw. Informationsabruf, gelegentlich ungenau Informationsbeschaffung, ist ein Fachgebiet, das sich mit computergestütztem Suchen nach komplexen Inhalten (also z. B. keine Einzelwörter) beschäftigt und in die Bereiche Informationswissenschaft, Informatik und Computerlinguistik fällt. Wie aus der Wortbedeutung von retrieval (deutsch Abruf, Wiederherstellung) hervorgeht, sind komplexe Texte oder Bilddaten, die in großen Datenbanken gespeichert werden, für Außenstehende zunächst nicht zugänglich oder abrufbar. Im Gegensatz zum Data Mining geht es beim Information Retrieval aber darum bestehende Informationen aufzufinden, nicht neue Strukturen zu entdecken (wie beim Knowledge Discovery in Databases zu dem das Data-Mining und Text Mining gehören). Methoden des Datenabrufs werden in Internet-Suchmaschinen (z. B. Google), aber auch in digitalen Bibliotheken (z. B. zur Literatursuche) sowie bei Bildsuchmaschinen verwendet. Auch Antwortsysteme oder Spamfilter verwenden IR-Techniken. Die Problematik des Zugangs zu gespeicherten komplexen Informationen liegt in zwei Phänomenen: Schematisches Modell des Information-RetrievalGenerell sind am IR zwei (sich unter Umständen überschneidende) Personenkreise beteiligt (vgl. Abbildung rechts). Der erste Personenkreis sind die Autoren der in einem IR-System gespeicherten Informationen, die sie entweder selbst einspeichern, oder die aus anderen Informationssystemen ausgelesen werden (wie es z. B. die Internet-Suchmaschinen praktizieren). Die in das System eingestellten Dokumente werden vom IR-System gemäß dem System-internen Modell der Repräsentation von Dokumenten in eine für die Verarbeitung günstige Form (Dokumentenrepräsentation) umgewandelt. Die zweite Benutzergruppe, die Anwender, haben bestimmte, zum Zeitpunkt der Arbeit am IR-System akute Ziele oder Aufgaben, für deren Lösung ihnen Informationen fehlen. Diese Informationsbedürfnisse möchten Anwender mit Hilfe des Systems decken. Dafür müssen sie ihre Inf

29,90 CHF

Lieferbar


Artikelnummer 9781158794225
Produkttyp Buch
Preis 29,90 CHF
Verfügbarkeit Lieferbar
Einband Kartonierter Einband (Kt)
Meldetext Folgt in ca. 5 Arbeitstagen
Autor Quelle: Wikipedia
Verlag Books LLC, Reference Series
Weight 0,0
Erscheinungsjahr 20110823
Seitenangabe 68
Sprache ger
Anzahl der Bewertungen 0

Dieser Artikel hat noch keine Bewertungen.

Eine Produktbewertung schreiben