SAP Master Data Management (SAP MDM) — подсистема в составе SAP NetWeaver, предназначенная для управления данными в распределенной среде mySAP Business Suite.
Управление данными заключается в консолидации, гармонизации и централизации данных.
Консолидация в технологиях хранилищ данных включает в себя сбор данных (Data Acquisition), их очистку (Data Cleaning) и собственно агрегирование данных (Data Consolidation).
Под сбором данных подразумевается процесс, который состоит в организации передачи данных из внешних источников в хранилище. Организация процесса пополнения хранилища может быть основана на расписании пополнения хранилища данными либо на временной основе, либо с использованием механизма событий.
Под очисткой данных обычно понимается процесс модификации данных по ходу заполнения хранилища: исключение нежелательных дубликатов, восстановление пропущенных данных, приведение данных к единому формату, удаление нежелательных символов (например, управляющих) и унификация типов данных, проверка на целостность.
При заполнении хранилища агрегированными данными нужно обеспечить выборку данных из транзакционной базы данных и других источников в соответствии с метаданными, поскольку агрегирование происходит в терминах бизнес-понятий. Так, например, агрегированная величина "объем продаж продукта Х в регионе Y за последний квартал" содержит понятия "продукт" и "регион", которые являются бизнес-понятиями данного предприятия. Следует подчеркнуть, что задача выборки необходимых данных не может быть решена полностью автоматически: возможны коллизии (отсутствие необходимых данных, ошибки в данных и т. п.), когда вмешательство человека окажется необходимым. Далее, предполагая, что объектом анализа являются числовые показатели, связанные с бизнес-понятиями, такие как объем продаж или прибыль, необходимо определить правила вычисления этих показателей для составных бизнес-понятий, исходя из их значений для более простых бизнес-понятий. Это и есть правила агрегирования.
Очищенные и согласованные данные в процессе гармонизации распределяются по локальным БД. Данные в локальных БД могут изменяться, но через посредство центрального репозитория, т.е. эти изменения автоматически передаются в центральный репозиторий и оттуда, если требуется, в другие БД, использующие эти данные.