Apache Hadoop est un framework open-source permettant le stockage et le traitement distribué de grandes quantités de données. Il repose sur le modèle MapReduce, qui divise les tâches en plusieurs sous-tâches exécutées en parallèle sur un cluster de serveurs.