Frage:
Wie kann ich effizient ein Streudiagramm erstellen? Mit einem Pandas DataFrame zeichnen, wobei die Markierungen durch eine dritte Spalte im DataFrame vorgegeben werden?
Antwort:
Verwendung von matplotlib.pyplot.scatter() zur Unterscheidung von Markierungen nach Kategorie kann ineffizient sein. Erwägen Sie stattdessen die Verwendung von matplotlib.pyplot.plot() für diskrete Kategorien:
import matplotlib.pyplot as plt import numpy as np import pandas as pd # Generate Data num = 20 x, y = np.random.random((2, num)) labels = np.random.choice(['a', 'b', 'c'], num) df = pd.DataFrame(dict(x=x, y=y, label=labels)) # Group by labels groups = df.groupby('label') # Plot fig, ax = plt.subplots() ax.margins(0.05) # Optional padding # Use different markers and colors for each group for name, group in groups: ax.plot(group.x, group.y, marker='o', linestyle='', ms=12, label=name) ax.legend() # Specify custom colors and styles plt.rcParams.update(pd.tools.plotting.mpl_stylesheet) colors = pd.tools.plotting._get_standard_colors(len(groups), color_type='random') ax.set_color_cycle(colors) ax.legend(numpoints=1, loc='upper left') plt.show()
Dieser Code generiert ein Streudiagramm mit nach Kategorie farblich gekennzeichneten Markierungen.
Das obige ist der detaillierte Inhalt vonWie erstelle ich ein Streudiagramm mit nach Kategorien differenzierten Markierungen in einem Pandas DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!