Wie entferne ich Ausreißer in Excel?
Suchen Sie eine einfache und schnelle Möglichkeit, Ausreißer in Ihrer Excel -Tabelle zu entfernen? Das Entfernen von Ausreißern aus Ihren Daten kann Ihnen helfen, genauere Ergebnisse und Erkenntnisse aus Ihrer Analyse zu erzielen. In diesem Leitfaden skizzieren wir einige verschiedene Methoden, um Ausreißer in Excel zu entfernen. Wir werden alles abdecken, von der Verwendung der integrierten Funktionen bis zum Erstellen eigener Formeln. Am Ende dieses Artikels können Sie in Ihren Excel -Daten zuversichtlich Ausreißer entfernen.
Ausreißer können in Excel mit der IQR -Methode (Interquartile Range (IQR) identifiziert werden. Um Ausreißer aus Ihrem Datensatz in Excel zu entfernen, können Sie die folgenden Schritte verwenden:
- Berechnen Sie das erste Quartil (Q1) und das dritte Quartil (Q3).
- Berechnen Sie den Interquartilbereich (IQR), indem Sie Q1 von Q3 subtrahieren.
- Berechnen Sie die unteren und oberen Grenzen, indem Sie das Q1 um das 1,5 -fache des IQR hinzufügen und das Q3 um das 1,5 -fache des IQR subtrahieren.
- Überprüfen Sie jeden Wert, um festzustellen, ob er außerhalb der unteren und oberen Grenzen fällt.
- Wenn dies der Fall ist, löschen Sie es aus Ihrem Datensatz.
Ausreißer in Excel verstehen
Ausreißer in Excel sind Datenpunkte, die sich erheblich von den anderen Werten in Ihrem Datensatz unterscheiden. Ausreißer können durch falsche Dateneingabe oder Extremwerte in den Daten verursacht werden. Es ist wichtig, Ausreißer aus Ihrem Datensatz zu identifizieren und zu entfernen, bevor statistische Tests oder Analysen ausgeführt werden. In diesem Artikel werden wir diskutieren, wie Ausreißer in Excel identifiziert und entfernen können.
Ausreißer können identifiziert werden, indem die Daten visuell untersucht oder statistische Tests verwendet werden. Die visuelle Überprüfung der Daten hilft dabei, offensichtliche Ausreißer wie Werte zu identifizieren, die viel größer oder kleiner sind als die übrigen Daten. Statistische Tests können verwendet werden, um Ausreißer zu identifizieren, die offensichtlich nicht sichtbar sind. Beispiele für statistische Tests, die zur Identifizierung von Ausreißer verwendet werden, sind die Z-Score-Methode, den Grubbs-Test, den Dixon-Test und den Tukey-Test.
Sobald die Ausreißer identifiziert wurden, besteht der nächste Schritt darin, sie aus dem Datensatz zu entfernen. Abhängig von der Art des Ausreißers können verschiedene Methoden verwendet werden. Zum Beispiel kann für kleine Ausreißer einfach der Datenpunkt entfernt werden. Für extreme Ausreißer kann es erforderlich sein, den Datenpunkt durch einen vernünftigen Wert zu ersetzen.
Identifizierung von Ausreißern mithilfe visueller Inspektion
Die visuelle Inspektion ist die einfachste und schnellste Möglichkeit, Ausreißer in Ihrem Datensatz zu identifizieren. Um Ausreißer mithilfe einer visuellen Inspektion zu identifizieren, sollten Sie zunächst ein Diagramm oder eine Diagramm der Daten erstellen. Dies wird dazu beitragen, die Ausreißer einfacher zu erkennen. Suchen Sie nach Datenpunkten, die viel größer oder kleiner sind als die übrigen Daten. Dies sind potenzielle Ausreißer.
Eine andere Möglichkeit, potenzielle Ausreißer zu identifizieren, besteht darin, nach Datenpunkten zu suchen, die außerhalb des normalen Bereichs der Daten liegen. Wenn beispielsweise die Werte der Datenpunkte von 0 bis 10 liegen, sollten alle Werte, die größer als 10 oder kleiner als 0 sind, als potenzielle Ausreißer betrachtet werden.
Verwenden von Boxplots, um Ausreißer zu identifizieren
Ein Box -Diagramm, das auch als Box- und Whisker -Diagramm bezeichnet wird, ist eine Art von Grafik, mit der Ausreißer in Ihrem Datensatz schnell identifiziert werden können. Um ein Box -Diagramm zu erstellen, müssen Sie zuerst den Median-, Quartil- und Interquartilbereich der Daten berechnen.
Der Median ist der mittlere Wert im Datensatz. Das erste Quartil ist der Wert, unter dem 25% der Datenpunkte fallen. Das dritte Quartil ist der Wert, über dem 75% der Datenpunkte fallen. Der Interquartilbereich ist der Unterschied zwischen dem ersten Quartil und dem dritten Quartil.
Sobald Sie den Median-, Quartil- und Interquartilbereich berechnet haben, können Sie ein Box -Diagramm erstellen. Das Box -Diagramm zeigt den Median-, Quartil- und Interquartilbereich der Daten. Alle Punkte, die außerhalb des Tellerrands liegen, sollten als potenzielle Ausreißer angesehen werden.
Verwendung statistischer Tests zur Identifizierung von Ausreißern
Zusätzlich zur visuellen Inspektion können statistische Tests verwendet werden, um Ausreißer zu identifizieren. Beispiele für statistische Tests, die zur Identifizierung von Ausreißer verwendet werden, sind die Z-Score-Methode, den Grubbs-Test, den Dixon-Test und den Tukey-Test.
Die Z-Score-Methode ist ein einfacher statistischer Test, mit dem Ausreißer identifiziert werden können. Um die Z-Score-Methode zu verwenden, müssen Sie den Mittelwert und die Standardabweichung der Daten berechnen. Für jeden Datenpunkt müssen Sie dann den Z-Score berechnen. Alle Datenpunkte mit einem Z -Score von mehr als 2 oder weniger als -2 sollten als potenzielle Ausreißer betrachtet werden.
Der Grubbs -Test ist ein fortschrittlicherer statistischer Test, mit dem extreme Ausreißer identifiziert werden können. Um den Grubbs -Test zu verwenden, müssen Sie den Mittelwert und die Standardabweichung der Daten berechnen. Anschließend müssen Sie die Grubbs -Statistik für jeden Datenpunkt berechnen. Alle Datenpunkte mit einer GRUBBS -Statistik, die größer als der kritische Wert ist, sollten als potenzielle Ausreißer betrachtet werden.
Der Dixon -Test und der Tukey -Test ähneln dem Grubbs -Test. Der Hauptunterschied zwischen den drei Tests ist der kritische Wert, der zur Identifizierung von Ausreißern verwendet wird.
Entfernen von Ausreißern aus dem Datensatz
Sobald die Ausreißer identifiziert wurden, besteht der nächste Schritt darin, sie aus dem Datensatz zu entfernen. Abhängig von der Art des Ausreißers können verschiedene Methoden verwendet werden. Zum Beispiel kann für kleine Ausreißer einfach der Datenpunkt entfernt werden. Für extreme Ausreißer kann es erforderlich sein, den Datenpunkt durch einen vernünftigen Wert zu ersetzen.
Ersetzen von Ausreißern durch den Mittelwert
Eine Möglichkeit, einen Ausreißer mit einem vernünftigeren Wert zu ersetzen, besteht darin, ihn durch den Mittelwert des Datensatzes zu ersetzen. Dazu müssen Sie den Mittelwert des Datensatzes berechnen. Dann können Sie den Ausreißer durch den Mittelwert ersetzen.
Ersetzen von Ausreißern durch Median
Eine andere Möglichkeit, einen Ausreißer mit einem vernünftigeren Wert zu ersetzen, besteht darin, ihn durch den Median des Datensatzes zu ersetzen. Dazu müssen Sie den Median des Datensatzes berechnen. Dann können Sie den Ausreißer durch den Medianwert ersetzen.
Abschluss
Ausreißer können identifiziert werden, indem die Daten visuell untersucht oder statistische Tests verwendet werden. Sobald die Ausreißer identifiziert wurden, können sie aus dem Datensatz entfernt werden, indem die Datenpunkte gelöscht oder sie durch einen angemesseneren Wert ersetzt werden. Das Ersetzen eines Ausreißers durch den Mittelwert oder den Median des Datensatzes ist eine Möglichkeit, ihn durch einen vernünftigen Wert zu ersetzen.
Nur wenige häufig gestellte Fragen
Was ist ein Ausreißer?
Ein Ausreißer ist eine Beobachtung (Datenpunkt), die signifikant vom Rest eines Datensatzes abweicht. Ausreißer können durch Messfehler, Dateneingabefehler oder einfach durch extreme Werte verursacht werden, die für die Mehrheit der Daten nicht repräsentativ sind.
Wie können Ausreißer identifiziert werden?
Ausreißer können anhand der visuellen Datenpunkte oder anhand statistischer Techniken wie dem Interquartilbereich (IQR) oder dem Z-Score identifiziert werden. Die IQR-Methode zur Identifizierung von Ausreißern basiert auf der Differenz zwischen dem ersten und dritten Quartilen, während der Z-Score Ausreißer basierend auf dem Abstand der Datenpunkte vom Mittelwert identifiziert.
Wie entferne ich Ausreißer in Excel?
Das Entfernen von Ausreißern in Excel kann mit der Filterfunktion erfolgen. Um Ausreißer herauszufiltern, wählen Sie die Registerkarte "Daten" aus, wählen Sie "Filter" aus und wählen Sie "Erweiterter Filter". Geben Sie von dort die Kriterien für die Ausreißeridentifikation an, wie „größer als“ oder „weniger als“ ein bestimmter Wert. Die gefilterten Daten zeigen nur die Daten, die den Kriterien entsprechen, und die Ausreißer wurden entfernt.
Was sind die Vorteile des Entfernens von Ausreißern?
Das Entfernen von Ausreißern aus einem Datensatz kann aus mehreren Gründen von Vorteil sein. Ausreißer können die Ergebnisse statistischer Analysen verzerren und zu falschen Schlussfolgerungen führen. Durch Entfernen von Ausreißern werden Datenpunkte enthalten, die für die Mehrheit der Daten repräsentativer sind, was zu genaueren Ergebnissen führen kann.
Gibt es Nachteile, um Ausreißer zu entfernen?
Das Entfernen von Ausreißern kann auch einige Nachteile haben. In einigen Fällen können Extremwerte gültig sein und sollten in den Datensatz aufgenommen werden. Wenn Ausreißer ohne ordnungsgemäße Rechtfertigung entfernt werden, können die Ergebnisse der Analyse voreingenommen sein. Es ist wichtig, die Ausreißer zu identifizieren und zu rechtfertigen.
Was sind einige Alternativen zum Entfernen von Ausreißern?
Wenn Ausreißer identifiziert werden, aber nicht entfernt werden sollten, gibt es einige Alternativen, mit denen sie angesprochen werden können. Eine Alternative besteht darin, robuste Analysemethoden wie den Median oder die mediane absolute Abweichung zu verwenden, die von Ausreißern weniger beeinflusst werden. Eine andere Alternative besteht darin, eine Transformation wie die logarithmische Transformation zu verwenden, die den Effekt von Ausreißern verringern kann.
So entfernen Sie Ausreißer in Excel
Das Entfernen von Ausreißern in Excel kann eine entmutigende Aufgabe sein, aber mit den richtigen Werkzeugen kann dies schnell und einfach erfolgen. Durch das Verständnis der verschiedenen Funktionen und Tools, die in Excel verfügbar sind, können Sie bestimmen, welchen Ausreißerentyp Sie haben, und verwenden dann die entsprechende Funktion, um sie zu entfernen. Mit der Praxis können Sie in Excel Ausreißer entfernen, sodass Sie Ihre Daten schnell analysieren und sinnvolle Erkenntnisse ziehen können.