Einführung
Hallo, heute werden wir das Feature-Engineering entmystifizieren. Es scheint ein schwieriges Thema zu sein, aber ich hoffe, dass Sie am Ende dieses Artikels zumindest die Grundlagen verstehen werden.
Aus Wikipedia ist Feature Engineering eine Methode des maschinellen Lernens, die Daten verwendet, um neue Variablen zu erstellen, die nicht im Trainingssatz enthalten sind.
Es kann neue Funktionen sowohl für überwachtes als auch für unüberwachtes Lernen generieren.
Macht Datentransformationen einfacher und schneller und verbessert gleichzeitig die Genauigkeit des Modells.
Feature-Engineering-Techniken
-
Datenbereinigung: Hiermit werden Ihre Daten aufgeräumt. Sie beheben fehlende Informationen, korrigieren Fehler und beseitigen etwaige Inkonsistenzen.
-
Datentransformation: Dabei handelt es sich um die Umgestaltung oder Anpassung von Daten. Beispiel: Herunterskalieren großer Zahlen oder Normalisieren von Daten, sodass sie in einen bestimmten Bereich passen.
Der wichtige Faktor besteht darin, diese Änderungen vorzunehmen, ohne die Bedeutung der Daten zu ändern.
-
Feature-Extraktion: Hier untersuchen wir vorhandene Daten und erstellen neue Features, die neue Erkenntnisse bieten können. Dadurch wird das Modell einfacher und schneller, ohne dass nützliche Details verloren gehen.
-
Funktionsauswahl: beinhaltet die Auswahl der Datenelemente, die am engsten mit Ihrer Zielvorhersage zusammenhängen. Dadurch werden unnötige Informationen entfernt, wodurch das Modell fokussierter wird.
-
Funktionsiteration: Hier dreht sich alles um Versuch und Irrtum. Der Prozess des Hinzufügens oder Entfernens bestimmter Funktionen, des Testens, wie sie sich auf das Modell auswirken, und des Beibehaltens derjenigen, die die Leistung des Modells verbessern.
Arten von Funktionen beim maschinellen Lernen
-
Numerische Merkmale: Dabei handelt es sich um Zahlen, die gemessen werden können, unkompliziert und kontinuierlicher Natur sind. Beispiel: Alter.
-
Kategorische Merkmale: Dies sind kategorische Merkmale. Beispiel Augenfarbe.
-
Zeitreihenfunktionen: Daten, die im Zeitverlauf aufgezeichnet werden. Beispiel; Aktien.
-
Textfunktionen: Dies sind Funktionen, die aus Wörtern oder Text bestehen. Beispiel: Kundenrezensionen
Fazit
Ich hoffe, ich habe die Begriffe gut erklärt. Ich glaube, das sind die wenigen Dinge, die man als Anfänger theoretisch wissen muss. Das nächste Mal, wenn wir über Feature-Engineering sprechen, werden wir uns eher auf praktische Aspekte konzentrieren.
Bis zum nächsten Mal!
Das obige ist der detaillierte Inhalt vonFeature-Engineering. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!