numpy 配列には合計で数万の要素があります。ここで、各要素の前にある番号 000001 などを保持し、重複を削除して一意の番号だけを残したいと考えています。結果は #['000001','000002','000003','000004'] となるはずです。for ステートメントを使用する以外に、より効率的な方法はありますか?
#['000001','000002','000003','000004']
ringa_lee
NumPyを書いてみよう〜
Python3
次のように書くこともできます: np.frompyfunc'|S6' は文字列を 6 バイトで保存します
np.frompyfunc
'|S6'
'<U6'是以6个小端序Unicode字符ストア文字列
'<U6'
小端序Unicode字符
二人の兄弟の書き方に基づいています@同意し、@xiaojieluoffを受け入れます
数値の長さが最初の 6 桁に固定されている場合、最も速い方法は以下の最初の桁です
マップと匿名関数を使用する
出力:
次のコードを実行すると、600 万個のデータにより、マップが
テストデータが6,000万件に拡大されると、その差はさらに顕著になります
NumPyを書いてみよう〜
Python3
リーリー次のように書くこともできます:
np.frompyfunc
'|S6'
は文字列を 6 バイトで保存します
リーリー'<U6'
是以6个小端序Unicode字符
ストア文字列二人の兄弟の書き方に基づいています
@同意し、@xiaojieluoffを受け入れます
数値の長さが最初の 6 桁に固定されている場合、最も速い方法は以下の最初の桁です
リーリーマップと匿名関数を使用する
リーリー出力:
リーリー次のコードを実行すると、600 万個のデータにより、マップが
よりも約 0.6 秒高速であることがわかります。 リーリー出力:
リーリーテストデータが6,000万件に拡大されると、その差はさらに顕著になります
リーリー