Průzkumná analýza dat ( EDA ) je analýza hlavních vlastností dat, hledání společných vzorců, distribucí a anomálií v nich, vytváření počátečních modelů, často pomocí vizualizačních nástrojů .
Tento koncept představil matematik John Tukey , který formuloval cíle takové analýzy takto:
Hlavními prostředky exploratorní analýzy jsou studium rozdělení pravděpodobnosti proměnných, konstrukce a analýza korelačních matic , faktorová analýza , diskriminační analýza , vícerozměrné škálování .