Python は groupby グループ化後に指定された位置レコードメソッドを抽出します-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Python は groupby グループ化後に指定された位置レコードメソッドを抽出します

不言

Apr 20, 2018 pm 01:45 PM

groupby python 指定

以下は、groupby グループ化後に指定された位置レコードを抽出するための Python メソッドです。非常に参考になるので、皆様のお役に立てれば幸いです。ぜひ一緒に見てください

データ分析とデータモデリングを実行するとき、最初に行う必要があるのは、データを処理して必要な情報を抽出することです。データ処理をより便利にするための groupby の使用法をいくつか紹介します。

groupby を使用して情報を抽出すると、グループ化されたサンプルの統計 (最大値、最小値、変数など) が見つかることがよくあります。グループ化されたサンプルの 2 番目のレコードと最後から 3 番目のレコードを取得したい場合、どうすればよいでしょうか?最初と最後をグループ化した後、最初と最後のサンプルを抽出できます。しかし、指定した場所でサンプルを採取したい場合、既成の機能はありません。自分たちで書く必要があります。以下に上記の機能を実装する方法を紹介します。

1) データの紹介

action テーブルには userid、actionType、actionTime の 3 つの列があり、それぞれユーザー ID、ユーザーの行動タイプ、行動の発生時間を表します。具体的な形式は以下の図に示すとおりです。

2) グループ化操作

a = action.groupby(&#39;userid&#39;) 
b = action.groupby(&#39;userid&#39;)[&#39;actionTime&#39;] 
type(a) 
type(b)

グループ化後、a と b のデータ型が DataFrameGroupBy と SeriesGroupBy

であることがわかります。

3) カウント操作

①異なるユーザーの2番目/最後から2番目の操作時間

action.groupby(&#39;userid&#39;)[&#39;actionTime&#39;].apply(lambda i:i.iloc[1] if len(i)>1 else np.nan) 
action.groupby(&#39;userid&#39;)[&#39;actionTime&#39;].apply(lambda i:i.iloc[-2] if len(i)>1 else np.nan)

②異なるユーザーの特定の行動の2番目/最後から2番目の操作時間

action[action[&#39;actionType&#39;]==2].groupby(&#39;userid&#39;)[&#39;actionTime&#39;].apply(lambda i:i.iloc[1] if len(i)>1 else np.nan) 
action[action[&#39;actionType&#39;]==2].groupby(&#39;userid&#39;)[&#39;actionTime&#39;].apply(lambda i:i.iloc[-2] if len(i)>1 else np.nan)

追記: ユーザーによってはレコードが 1 つしかない場合があるため、直接取得するのは間違っている可能性があるため、最初に判断するために if を使用します。

このようにして、グループ化されたデータ内の任意の位置でサンプルを抽出できます。

関連する推奨事項: groupby グループ内の最大値を持つ行を取得する

pandas メソッド

以上がPython は groupby グループ化後に指定された位置レコードメソッドを抽出しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undress AI Tool

脱衣画像を無料で

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Laravel チュートリアル

1604

PHP チュートリアル

1509

276

Related knowledge

Pythonで仮想環境を作成する方法 Aug 05, 2025 pm 01:05 PM

Python仮想環境を作成するには、VENVモジュールを使用できます。手順は次のとおりです。1。プロジェクトディレクトリを入力して、python-mvenvenv環境を実行して環境を作成します。 2。SourceENV/bin/Activate to Mac/LinuxおよびEnv \ Scripts \ Windowsにアクティブ化します。 3. PIPINSTALLインストールパッケージ、PIPFREEZE> RECUMESSION.TXTを使用して、依存関係をエクスポートします。 4.仮想環境をGITに提出しないように注意し、設置中に正しい環境にあることを確認してください。仮想環境は、特にマルチプロジェクト開発に適した競合を防ぐためにプロジェクト依存関係を分離でき、PycharmやVSCodeなどの編集者も

Pythonの複数のプロセス間でデータを共有する方法は？ Aug 02, 2025 pm 01:15 PM

MultiProcessing.Queueを使用して、複数のプロセスと消費者のシナリオに適した複数のプロセス間でデータを安全に渡す。 2。MultiProcessing.Pipeを使用して、2つのプロセス間の双方向の高速通信を実現しますが、2点接続のみ。 3.値と配列を使用して、シンプルなデータ型を共有メモリに保存し、競争条件を回避するためにロックで使用する必要があります。 4.マネージャーを使用して、リストや辞書などの複雑なデータ構造を共有します。これらは非常に柔軟ですが、パフォーマンスが低く、複雑な共有状態を持つシナリオに適しています。データサイズ、パフォーマンス要件、複雑さに基づいて適切な方法を選択する必要があります。キューとマネージャーは、初心者に最適です。

Python boto3 S3アップロード例 Aug 02, 2025 pm 01:08 PM

BOTO3を使用してファイルをS3にアップロードしてBOTO3を最初にインストールし、AWS資格情報を構成します。 2。boto3.client（ 's3'）を介してクライアントを作成し、upload_file（）メソッドを呼び出してローカルファイルをアップロードします。 3. S3_Keyをターゲットパスとして指定し、指定されていない場合はローカルファイル名を使用できます。 4. filenotfounderror、nocredentialserror、clienterrorなどの例外を処理する必要があります。 5。ACL、ContentType、StorageClass、Metadataは、exrceargsパラメーターを介して設定できます。 6。メモリデータについては、bytesioを使用して単語を作成できます

Pythonのリストを使用してスタックデータ構造を実装する方法は？ Aug 03, 2025 am 06:45 AM

pythonlistscani実装Append（）penouspop（）popoperations.1.useappend（）2つのBelief stotetopthestack.2.usep op（）toremoveandreturnthetop要素、保証済みのtocheckeckeckestackisnotemptoavoidindexerror.3.pekattehatopelementwithstack [-1]

Pythonスケジュールライブラリの例 Aug 04, 2025 am 10:33 AM

Pythonscheduleライブラリを使用して、タイミングタスクを簡単に実装します。まず、PipinstallScheduleを介してライブラリをインストールし、スケジュールモジュールと時間モジュールをインポートし、定期的に実行する必要がある関数を定義し、スケジュールを使用して時間間隔を設定してタスク関数を結合します。最後に、スケジュールを呼び出してください。たとえば、10秒ごとにタスクを実行すると、スケジュールとして記述できます。すべて（10）.seconds.do（job）。数分、数時間、日、週などをサポートし、特定のタスクを指定することもできます。

崇高なテキストでPythonコードを実行する方法 Aug 04, 2025 pm 04:25 PM

Ensurepythonisinstaledaddeddeddeddeddeddeddeddedtopathion interminal;

Pythonでメモリリークをデバッグするための一般的な戦略は何ですか？ Aug 06, 2025 pm 01:43 PM

USETRACEMALLOCTOTRACKMEMORYALLOCATIONS ANDIDENTIFIFYMEMORYLINES; 2.monitorObjectCountSwithgcandobjgraphtodectectgrowingObjecttypes;

Pythonによる生存分析 Aug 03, 2025 pm 12:58 PM

サバイバル分析は、イベントの時間を研究するために使用され、ライフラインとScikit Survivalを使用してPythonで一般的に実装されています。 1.ライフラインライブラリをインストールし、時間とイベントのステータスを含むデータを準備します。 2。カプラン・マイヤー推定器を使用して生存曲線を描画して、イベントが発生しない確率を視覚化します。 3.コックス比例ハザードモデルを介したイベント時間に対する変数の影響を分析し、モデルの仮定を確認します。 4.検閲されたデータの処理に注意して、イベント列が検閲とイベントの発生を正しくマークすることを確認してください。

See all articles

Python は groupby グループ化後に指定された位置レコード メソッドを抽出します