Книга рассказывает об Apache Spark - открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. В книге описываются особенности Spark, встроенные библиотеки Spark, возможности использования разных источников данных и продвинутые приемы программирования на основе Spark. Книга поможет исследователям данных и программистам быстро включиться в работу с Spark.