Groupby를 사용한 Pandas 전체 비율
특정 주에서 사무실당 매출 비율을 계산하는 것은 Pandas의 groupby를 사용하여 수행할 수 있습니다. 그러나 원하는 결과를 얻으려면 추가 단계가 필요합니다.
주, 사무실 ID 및 매출을 나타내는 열이 포함된 CSV 파일이 있다고 가정해 보겠습니다. Pandas를 가져오고 DataFrame을 생성할 수 있습니다.
import pandas as pd df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id': list(range(1, 7)) * 2, 'sales': [np.random.randint(100000, 999999) for _ in range(12)]})
각 사무실과 주에 대한 총 매출을 계산하려면 해당 열을 기준으로 그룹화할 수 있습니다.
state_office = df.groupby(['state', 'office_id']).agg({'sales': 'sum'})
특정 주의 사무실당 매출을 주별로 그룹화하고 각 사무실의 매출을 전체 주로 나누는 함수를 적용할 수 있습니다. 매출:
state_pcts = state_office.groupby(level=0).apply(lambda x: 100 * x / float(x.sum()))
이렇게 하면 각 사무실의 매출 비율이 포함된 DataFrame이 생성됩니다.
print(state_pcts) sales state office_id AZ 2 16.981365 4 19.250033 6 63.768601 CA 1 19.331879 3 33.858747 5 46.809373 CO 1 36.851857 3 19.874290 5 43.273852 WA 2 34.707233 4 35.511259 6 29.781508
이 방법은 특정 주의 사무실당 매출 비율을 " '' 도달하여 주 전체의 매출을 합산하는 그룹비의 주 수준까지 도달합니다.
위 내용은 Pandas Groupby를 사용하여 각 주 내 사무실당 매출 비율을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!