살펴볼 가치가 있는 Python의 효율적인 데이터 처리-파이썬 튜토리얼-php.cn

살펴볼 가치가 있는 Python의 효율적인 데이터 처리

Pandas는 Python에서 매우 일반적으로 사용되는 데이터 처리 도구이며 사용하기 매우 편리합니다. NumPy 배열 구조를 기반으로 구축되었으므로 많은 작업이 NumPy 또는 Pandas와 함께 제공되는 확장 모듈을 통해 작성됩니다. 이러한 모듈은 Cython으로 작성되고 C로 컴파일되며 C에서 실행되므로 처리 속도가 보장됩니다.오늘 우리는 그 힘을 경험해보겠습니다.

1. 데이터 생성

pandas를 사용하면 쉽게 데이터를 생성할 수 있습니다. 이제 5개의 열과 1000개의 행이 있는 pandas DataFrame을 만들어 보겠습니다.

mu1, sigma1 = 0, 0.1 mu2, sigma2 = 0.2, 0.2 n = 1000df = pd.DataFrame( { "a1": pd.np.random.normal(mu1, sigma1, n), "a2": pd.np.random.normal(mu2, sigma2, n), "a3": pd.np.random.randint(0, 5, n), "y1": pd.np.logspace(0, 1, num=n), "y2": pd.np.random.randint(0, 2, n), } )

로그인 후 복사

a1 및 a2: 무작위 샘플의 정규(가우스) 분포에서 추출됩니다. .

a3: 0에서 4 사이의 임의의 정수.

y1: 0에서 1까지의 로그 척도로 균일하게 분포됩니다.
y2: 0에서 1 사이의 임의의 정수.
아래와 같이 데이터를 생성합니다.

2. 이미지 그리기

Pandas 그리기 함수는 matplotlib 좌표축(Axes)을 반환하므로 그 위에 그리는 데 필요한 것을 사용자 정의할 수 있습니다. 예를 들어 수직선과 평행선을 그립니다. 이는 우리에게 매우 도움이 될 것입니다:

1. 평균 선 그리기

2. 핵심 사항 표시

import matplotlib.pyplot as plt ax = df.y1.plot() ax.axhline(6, color="red", linestyle="--") ax.axvline(775, color="red", linestyle="--") plt.show()

로그인 후 복사

또한 하나의 차트에 표시되는 테이블 수를 사용자 정의할 수 있습니다.

fig, ax = plt.subplots(2, 2, figsize=(14,7)) df.plot(x="index", y="y1", ax=ax[0, 0]) df.plot.scatter(x="index", y="y2", ax=ax[0, 1]) df.plot.scatter(x="index", y="a3", ax=ax[1, 0]) df.plot(x="index", y="a1", ax=ax[1, 1]) plt.show()

로그인 후 복사

3. 히스토그램 그리기

Pandas를 사용하면 매우 간단한 방법으로 두 그래픽의 모양을 비교할 수 있습니다.

df[["a1", "a2"]].plot(bins=30, kind="hist") plt.show()

로그인 후 복사

또한 여러 그래픽을 그릴 수도 있습니다.

df[["a1", "a2"]].plot(bins=30, kind="hist", subplots=True) plt.show()

로그인 후 복사

물론 선 차트 생성은 더 이상 그려지지 않습니다.

df[['a1', 'a2']].plot(by=df.y2, subplots=True) plt.show()

로그인 후 복사

4. 선형 피팅

팬더를 사용하여 다음 그림에 가장 가까운 직선을 찾을 수도 있습니다.

최소 제곱법은 직선으로부터 최단 거리를 계산합니다.

df['ones'] = pd.np.ones(len(df)) m, c = pd.np.linalg.lstsq(df[['index', 'ones']], df['y1'], rcond=None)[0]

로그인 후 복사

최소 제곱 결과를 바탕으로 y와 맞춤 직선을 그립니다.

df['y'] = df['index'].apply(lambda x: x * m + c) df[['y', 'y1']].plot() plt.show()

로그인 후 복사

읽어주셔서 감사합니다. 많은.

이 기사는 https://blog.csdn.net/u010751000/article/details/106735872

Php8, 나도 갈게

30분 안에 웹사이트 레이아웃 배우기

Shangguan Oracle 초보자부터 능숙한 비디오 튜토리얼까지

UNI-APP 코드의 첫 번째 줄

처음부터 앱 실행까지 Flutter

Lian 형제 새 Linux 비디오 튜토리얼

AXURE 9 비디오 튜토리얼(제품 관리자 대화형 제품 디자인 UI에 적합)

Zero 기본 숙련도 PS 비디오 튜토리얼

시작하는 데 도움이 되는 16일 UI 비디오 튜토리얼

PS 기술 및 슬라이싱 기술 비디오 튜토리얼

Alibaba Cloud 환경 구축 및 프로젝트 출시 비디오 튜토리얼

컴퓨터 네트워크 개요 - 프로그래머가 마스터해야 하는 기본 지식

프로그래머를 위한 필수 튜토리얼 - HTTP 프로토콜 설명

웹소켓 비디오 튜토리얼

살펴볼 가치가 있는 Python의 효율적인 데이터 처리

Pandas 그리기 함수는 matplotlib 좌표축(Axes)을 반환하므로 그 위에 그리는 데 필요한 것을 사용자 정의할 수 있습니다. 예를 들어 수직선과 평행선을 그립니다. 이는 우리에게 매우 도움이 될 것입니다:

Pandas를 사용하면 매우 간단한 방법으로 두 그래픽의 모양을 비교할 수 있습니다.

df[["a1", "a2"]].plot(bins=30, kind="hist") plt.show()

로그인 후 복사

팬더를 사용하여 다음 그림에 가장 가까운 직선을 찾을 수도 있습니다.