Перейти к содержимому

Качество Данных

Все про Data Goverance и Data Quality.

🇬🇧 - язык материалов

⭐ - наша рекомендация

Data Quality (DQ) - это характеристика данных, определяющая их пригодность для конкретных целей использования. Качественные данные - это данные, которые соответствуют заданным критериям и могут быть эффективно использованы для анализа и принятия решений.

Ключевые характеристики качества данных:

Заголовок раздела «Ключевые характеристики качества данных:»
  • Точность (Accuracy) - соответствие данных реальным значениям
  • Полнота (Completeness) - наличие всех необходимых значений
  • Актуальность (Timeliness) - своевременность и современность данных
  • Согласованность (Consistency) - отсутствие противоречий в данных
  • Достоверность (Validity) - соответствие данных установленным правилам
  • Дублирование записей
  • Пропущенные значения
  • Устаревшие данные
  • Ошибки ввода
  • Несогласованность форматов
  • Более точные бизнес-решения
  • Повышение эффективности операций
  • Снижение рисков
  • Улучшение клиентского опыта
  • Соответствие регуляторным требованиям
  • Регулярная проверка и очистка данных
  • Внедрение стандартов работы с данными
  • Автоматизация процессов проверки
  • Обучение персонала
  • Использование специализированных инструментов

Оба инструмента имеют интеграцию с DTB

  • Elementary - дополняет возможности DBT в части тестов и визуализации.

Из книг можно выделить следующие