TUM - Chair VII - Foundations of Software Reliability and Theoretical Computer Science


	Data Mining und Knowledge Discovery


	held by:
	held in:	WS 2004/2005
	sws:	2
	Die Information in der Welt verdoppelt sich etwa alle 20 Monate. Zu den am stärksten wachsenden Datenquellen gehören neben dem globalen Internet beispielsweise industrielle Prozessleitsysteme, betriebswirtschaftliche Datenbanken sowie die Biotechnik und die automatische Bilderfassung. Neben der Erfassung und Speicherung stellen die Aufbereitung und Verarbeitung der Daten heute die größten Herausforderungen dar. Ziel ist es, aus den großen Datenmengen die relevanten Informationen, also das "Wissen" zu extrahieren. Neben konventionellen statistischen Verfahren wie Korrelation und Regression werden hierzu Methoden der Clusteranalyse, Fuzzy-Logik, Neuroinformatik und Machine Learning angewandt. Diese Datenanalysemethoden werden unter dem Sammelbegriff Data Mining zusammengefasst. Data Mining ist Teil des Knowledge Discovery Prozesses, der darüber hinaus auch die Datenvorverarbeitung, Filterung, Visualisierung, Transformation und Merkmalsgenerierung umfasst. Laut einer Studie der Gartner Group setzen in Jahr 2000 mindestens 50% der Top-1000-Firmen Data Mining ein. Auch bei Siemens werden diese Methoden schon heute in zahlreichen industriellen Projekten eingesetzt. In der Vorlesung werden die wichtigsten Methoden von Data Mining und Knowledge Discovery vorgestellt und anhand einiger Anwendungsbeispiele aus Siemens-Projekten vertieft.
	more information:	http://archive.model.in.tum.de/um/courses/datamining/WS0405/index.shtml