Верификация источников данных
Цель:
Обеспечить достоверность, актуальность и согласованность данных перед их загрузкой в систему. Важно выявить реальные источники данных, оценить их качество и определить необходимые доработки.
Инвентаризация источников: - Выявление всех источников данных (CRM, ERP, базы данных, API, Excel-файлы и т. д.).
- Определение владельцев данных и ответственных за их актуальность.
Анализ качества данных: - Проверка на полноту, дублирование, противоречивость и ошибки.
- Оценка частоты обновления данных.
Профилирование данных: - Анализ структуры, типов данных, ключевых полей.
- Выявление аномалий (пустые значения, выбросы).
Документирование метаданных: - Описание источников, их структуры, бизнес-правил.
- Фиксация ограничений и требований к данным.
Результат:Отчет о качестве данных, список доверенных источников, требования к доработке.