Skip to content. | Skip to navigation

Informatik 5
Information Systems
Prof. Dr. M. Jarke
Sections
Personal tools
You are here: Home Publications Metadatenverwaltung zur qualitätsorientierten Informationslogistik in Data-Warehouse-Systemen

Contact

Prof. Dr. M. Jarke
RWTH Aachen
Informatik 5
Ahornstr. 55
D-52056 Aachen
Tel +49/241/8021501
Fax +49/241/8022321

How to find us

Annual Reports

Disclaimer

Webmaster

 

 

Metadatenverwaltung zur qualitätsorientierten Informationslogistik in Data-Warehouse-Systemen

Year 2003

Abstract The goal of a data warehouse system is to provide a comprehensive overview of the data available in a company, thereby supporting the management decisions. The integration of data coming from heterogeneous sources is one of the key problems in data warehousing. The technical foundations for the integration have been developed in recent years. However, an efficient technical infrastructure is not sufficient to address the following problems. Firstly, the data in the systems involved have different semantics. Secondly, there are different user requirements regarding the quality of data. Existing systems are unable to solve these problems. The present thesis supports the development of data warehouse systems paying special attention to the problems regarding semantics and data quality. The approach is based on the explicit modelling of meta data of data warehouse systems. In particular, the conceptual context, the quality requirements, and the quality characteristics of the individual system components are represented in a formal model. The main contributions of the present thesis are, firstly, an extended meta model of the architecture and processes of a data warehouse system and, secondly, a quality model for the systematic representation of quality requirements and measurements. Furthermore, a classification of quality dimensions and factors is developed that can be used for an extensive quality management in data warehouse systems. The meta data is applied in a model for quality management as well as in a methodology for quality-oriented data integration. The methodology developed in this work uses the meta data by combining different existing approaches to data integration. The results of the present work are validated in various case studies in industrial contexts and in international research projects. Kurzfassung Das Ziel eines Data-Warehouse-Systems ist es, einen umfassenden Überblick über die vorhandenen Daten im Unternehmen zu geben und damit die Entscheidungen zur Unternehmensplanung zu unterstützen. Die Integration von Daten aus vielen heterogenen Datenquellen ist ein Kernproblem von Data-Warehouse-Systemen. Die technischen Voraussetzungen dafür sind in den letzten Jahren entwickelt worden. Jedoch reicht eine effiziente technische Infrastruktur nicht aus, um auch die Probleme zu behandeln, die zum einen durch unterschiedliche Semantiken der Daten aus den beteiligten Systemen und zum anderen durch unterschiedliche Qualitätsanforderungen der Benutzer entstehen. Existierende Systeme können diese Problematik nicht abschließend lösen. Die vorliegende Arbeit unterstützt die Entwicklung von Data-Warehouse-Syste\-men und erfasst die aufgezeigten Probleme der Semantik und der Qualität von Daten systematisch. Der Ansatz beruht auf der expliziten Modellierung der Metadaten des Data-Warehouse-Systems. Insbesondere werden auch der konzeptuelle Kontext der Daten, die Qualitätsanforderungen der Benutzer und die Qualitätseigenschaften der einzelnen Bestandteile des Systems erfasst. Kernbeiträge der Arbeit sind ein erweitertes Metamodell für die Architektur und die Prozesse eines Data-Warehouse-Systems und ein Qualitätsmodell zur systematischen Erfassung von Qualitätsanforderungen und -messungen. Darüber hinaus wird eine Klassifikation von Qualitätsdimensionen und -faktoren aufgestellt, die zu einem umfassenden Qualitätsmanagement in Data-Warehouse- Systemen genutzt werden kann. Zur Anwendung dieser Informationen wird neben einem Vorgehensmodell für das Qualitätsmanagement in Data-Warehouse-Systemen auch ein Verfahren zur qualitätsorientierten Datenintegration entwickelt. Das Verfahren nutzt die zuvor definierten Metadaten, indem es verschiedene existierende Ansätze zur Datenintegration kombiniert. Die Ergebnisse der Arbeit werden in verschiedenen Fallstudien im industriellen und im internationalen Forschungskontext validiert.

Details

Dissertation, RWTH Aachen, 2003

Authors

Related projects

Document Actions