Hallo!?
Heute bin ich mit einem neuen Notizbuch zurück, das die Arbeit mit Daten in Jupyter demonstriert.
Ich habe den Datensatz von
heruntergeladen Kaggle ist eine Plattform, um reale Daten zu finden und sich mit anderen Datenbegeisterten zu vernetzen.
Dort finden Sie eine unglaubliche Sammlung an Datensätzen und Projekten und können auch an Wettbewerben teilnehmen.
Nachdem ich eine prägnante Zusammenfassung des Datenrahmens zurückgegeben hatte, führte ich dieBereinigung der Datendurch, um meine Daten in ein verwendbares und konsistentes Format für die Analyse zu bringen
Die Methodeastype() wird verwendet, um ein Pandas-Objekt in einen angegebenen Datentyp zu konvertieren.
Ich habe fillna(0) verwendet, um den ursprünglich aufgetretenen Fehler zu beheben. Probieren Sie es selbst aus!
Weitere Informationen finden Sie in meinem GitHub-Repository. Hier habe ich das Notizbuch und natürlich den Datensatz hochgeladen. In kurzen Worten erfahren Sie, wie es geht
Laden Sie einen Datenrahmen,
Untersuchen Sie seine Metadaten,
Datentypen konvertieren
Erkunden Sie den Datenrahmen mithilfe der iloc-Indizierung.
Darüber hinaus erfahren Sie mehr über die Boolesche Maskierung und ... wie Sie den Medianwert berechnen. ?
Sind Sie bereit, die Daten zu erkunden?
Das obige ist der detaillierte Inhalt vonArbeiten mit DataFrames in Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!