By Хоусли Мэтт, Рис Джо
Хоусли Мэтт, Рис Джо, 2024
Это фундаментальное руководство по инженерии данных охватывает все аспекты проектирования и эксплуатации различных архитектур данных. Книга детально рассматривает полный жизненный цикл работы с данными, включая подготовку, поглощение, преобразование, очистку, объединение, оркестрацию и конвейеризацию. Особое внимание уделяется облачным технологиям, распределению нагрузки и безопасному хранению данных. Рассматриваются приемы формирования запросов, работы с базами данных и отслеживания потоков данных, предоставляя исчерпывающее представление о создании enterprise-систем для обработки разнородных данных.
Matt Hously, Joe Rees, 2024
This foundational guide to data engineering covers all aspects of designing and operating diverse data architectures. The book details the complete data lifecycle, including preparation, ingestion, transformation, cleansing, merging, orchestration, and pipelining. It emphasizes cloud technologies, load balancing, and secure data storage. Techniques for query formulation, database interaction, and data stream tracking are explored, offering a comprehensive view of building enterprise-grade systems for processing heterogeneous data.