今日のペースの速いデータ サイエンスの世界では、データを効果的に視覚化することが重要です。経験豊富なデータ アナリストであっても、データ アナリストを始めたばかりであっても、さまざまな視覚化テクニックを習得すると、洞察を伝え、意思決定を推進する能力が大幅に向上します。この包括的なガイドでは、インタラクティブな Web アプリケーションを作成するための人気のある Python ライブラリである Streamlit について説明し、データを視覚化するために簡単に作成できる 12 の強力なグラフ タイプ を紹介します。このチュートリアルでは、単純な棒グラフから高度な地理空間視覚化まで、すべてをカバーします。
Streamlit は、データ サイエンティストや開発者がデータ視覚化のためのインタラクティブな Web アプリケーションを作成する方法に革命をもたらしました。 Streamlit を使用すると、直感的な API と一般的な Python ライブラリとのシームレスな統合により、データ スクリプトを数分で共有可能な Web アプリに変換できます。このガイドでは、さまざまなデータ視覚化のニーズに合わせて調整されたさまざまな種類のグラフを作成する Streamlit の多用途性に焦点を当てます。
面グラフは、時間の経過やカテゴリ全体の累積合計を表示するのに最適です。これらは、変化の大きさと異なるデータセット間の関係を強調するため、傾向の追跡や複数のデータシリーズの比較に最適です。
import numpy as np import pandas as pd import streamlit as st st.write("### 1. Area Chart") # Generate random data for the area chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Create an area chart using the random data st.area_chart( chart_data, x="col1", y=["col2", "col3"], color=["#FF0000", "#0000FF"], )
棒グラフは、さまざまなカテゴリやグループを比較するための基本的な方法です。これらは離散データ ポイントを表示するのに非常に効果的であり、さまざまなカテゴリにわたる量を簡単に比較できます。
import numpy as np import pandas as pd import streamlit as st st.write("### 1. Area Chart") # Generate random data for the area chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Create an area chart using the random data st.area_chart( chart_data, x="col1", y=["col2", "col3"], color=["#FF0000", "#0000FF"], )
折れ線グラフは、時系列などの連続データの傾向を示すのに最適です。これらは、変化の追跡、パターンの特定、同じ間隔での複数のデータ系列の比較に役立ちます。
import numpy as np import pandas as pd import streamlit as st st.write("### 2. Bar Chart") # Generate random data for the bar chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Display a bar chart using the same data st.bar_chart(chart_data)
地理データの視覚化は空間分析にとって重要であり、地図上のデータ ポイントを視覚化して、さまざまな場所にわたるパターン、ホットスポット、分布を特定できます。
import numpy as np import pandas as pd import streamlit as st st.write("### 1. Area Chart") # Generate random data for the area chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Create an area chart using the random data st.area_chart( chart_data, x="col1", y=["col2", "col3"], color=["#FF0000", "#0000FF"], )
散布図は、2 つの変数間の関係や相関関係を特定するための強力なツールです。これらは、データ内のパターン、傾向、および潜在的な因果関係を明らかにするのに役立ちます。
import numpy as np import pandas as pd import streamlit as st st.write("### 2. Bar Chart") # Generate random data for the bar chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Display a bar chart using the same data st.bar_chart(chart_data)
Altair は、Python 用の宣言型統計視覚化ライブラリであり、シンプルで直感的な構文で高度なグラフ作成機能を提供します。最小限のコードでインタラクティブで複雑なビジュアライゼーションを作成することに優れています。
import numpy as np import pandas as pd import streamlit as st st.write("### 1. Area Chart") # Generate random data for the area chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Create an area chart using the random data st.area_chart( chart_data, x="col1", y=["col2", "col3"], color=["#FF0000", "#0000FF"], )
Graphviz は、グラフとネットワーク図を作成するためのツールであり、関係、ワークフロー、組織構造を視覚化するのに非常に役立ちます。これにより、複雑な接続を明確かつ組織的に表現できます。
import numpy as np import pandas as pd import streamlit as st st.write("### 2. Bar Chart") # Generate random data for the bar chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Display a bar chart using the same data st.bar_chart(chart_data)
Plotly は、インタラクティブで出版品質のグラフを作成するための強力なライブラリです。幅広いグラフの種類とカスタマイズ オプションを提供し、複雑なデータの視覚化やインタラクティブなダッシュボードに適しています。
import numpy as np import pandas as pd import streamlit as st st.write("### 1. Area Chart") # Generate random data for the area chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Create an area chart using the random data st.area_chart( chart_data, x="col1", y=["col2", "col3"], color=["#FF0000", "#0000FF"], )
import numpy as np import pandas as pd import streamlit as st st.write("### 2. Bar Chart") # Generate random data for the bar chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Display a bar chart using the same data st.bar_chart(chart_data)
pydeck は、deck.gl の Python インターフェイスであり、WebGL を利用した高度で高性能な視覚化を可能にします。これは、複雑でインタラクティブな地理空間視覚化を作成する場合に特に役立ちます。
import numpy as np import pandas as pd import streamlit as st st.write("### 3. Line Chart") # Generate random data for the line chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Create a line chart with the random data st.line_chart( chart_data, x="col1", y="col2", color="col3", ) st.write("#### 3.1 Basic Line Chart")
Matplotlib は Python の基本的なプロット ライブラリであり、pyplot は静的、アニメーション化された、対話型の視覚化を作成するための MATLAB のようなインターフェイスを提供します。高度にカスタマイズ可能で、統計データ分析や教育目的に広く使用されています。
import numpy as np import pandas as pd import streamlit as st st.write("### 1. Area Chart") # Generate random data for the area chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Create an area chart using the random data st.area_chart( chart_data, x="col1", y=["col2", "col3"], color=["#FF0000", "#0000FF"], )
Vega-Lite は、インタラクティブなビジュアライゼーションを作成するための高レベルの文法であり、柔軟性を高めるために Streamlit に統合されています。これにより、簡潔な仕様で洗練された応答性の高いチャートを構築できるため、大規模なコーディングを行わずに複雑なビジュアライゼーションを簡単に作成できます。
import numpy as np import pandas as pd import streamlit as st st.write("### 2. Bar Chart") # Generate random data for the bar chart chart_data = pd.DataFrame( np.random.randn(20, 3), columns=["col1", "col2", "col3"], ) # Display a bar chart using the same data st.bar_chart(chart_data)
このチュートリアルでは、Streamlit で使用できるさまざまなグラフの種類について説明しました。それぞれがさまざまなデータ視覚化のニーズに適しています。
?コードを取得: GitHub - jamesbmour/blog_tutorials
?関連する Streamlit チュートリアル:JustCodeIt
?私の仕事をサポートしてください: コーヒーを買ってください
以上がStreamlit パート マスタリング データの視覚化とチャート タイプの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。