Explorative Datenanalyse (EDA) ist der Prozess der Datenanalyse, um die Eigenschaften und die gegenseitigen Beziehungen zwischen den Daten mithilfe von Visualisierungen oder beschreibender Statistik zu verstehen. Unter Visualisierung können wir die Verwendung verschiedener Grafiken und Tabellen, aber auch von Histogrammen, Boxplots oder Scatterplots verstehen. Beschreibende Statistik berücksichtigt Parameter wie Durchschnitt, Median, Varianz, Standardabweichung oder Quartile.
Dank der EDA-Methode können wir Ausreißer, Abweichungen und ungewöhnliche Trends in den Daten und Mustern aufdecken und sie ist daher eine Schlüsselphase im Prozess der Datenanalyse. EDA dient auch zur Identifizierung fehlender Werte und zur Aufdeckung von Inkonsistenzen in den Daten.