コミュニティ学ぶツールライブラリレジャー

日本語

ホームページ > バックエンド開発 > PHPチュートリアル > 2,000万行のテキストデータを取得する方法

2,000万行のテキストデータを取得する方法

WBOY

リリース： 2016-08-04 09:19:11

オリジナル

985 人が閲覧しました

テキストドキュメントには2000w行のデータがあります。データの形式は次のとおりです
ウォーキングデッド_マザー
金蝉の逃走_笑顔
さらば我が愛_
無罰_永遠
....
海を渡る八仙_運命

イディオムや英語の単語を素早く検索するにはどうすればよいですか?アルゴリズムを教えてください。専門家に感謝します

返信内容:

テキストドキュメントには2000w行のデータがあります。データの形式は次のとおりです
ウォーキングデッド_マザー
金蝉の逃走_笑顔
さらば我が愛_
無罰_永遠
....
海を渡る八仙_運命

イディオムや英語の単語を素早く検索するにはどうすればよいですか?アルゴリズムを教えてください。専門家に感謝します

あなたの目的は、特定のイディオム/単語が英語に存在するかどうかを判断すること、またはこのイディオム/単語が出現する回数を数えることでしょうか?
どのような方法であっても、全文を読むことが一番可能性が高いと思います。取得の頻度が非常に高い場合は、2,000 万のデータをメモリに配置し、インデックスを作成して保存するのが最も速くなります。1 回のみ実行する場合は、すべてのファイルを読み取る時間が最も速くなります (出現回数を計算します）。

Solrを構築してインデックスを作成すると、検索効率が大幅に向上します

関連ラベル：

php

ソース：php.cn

前の記事：IP の 65535 ポートが開いているかどうかを同時にスキャンするために PHP swoole を拡張する方法についてアドバイスを求めてください。次の記事：javascript - Ajax jqueryロードメソッドがphpの情報を読み取ることができません

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

NullPointerException とは何ですか?どのように修正すればよいですか?

2024-10-22 09:46:29
初心者からプログラマーへ: 旅は C の基礎から始まります

2024-10-13 13:53:41
PHP による Web 開発のロックを解除する: 初心者ガイド

2024-10-12 12:15:51
C の謎を解く: 新人プログラマーのための明確でシンプルな道

2024-10-11 22:47:31
コーディングの可能性を解き放つ: まったくの初心者のための C プログラミング

2024-10-11 19:36:51
内なるプログラマーを解き放つ: まったくの初心者のための C

2024-10-11 15:50:41
C で生活を自動化する: 初心者向けのスクリプトとツール

2024-10-11 15:07:41
PHP を簡単に: Web 開発の最初のステップ

2024-10-11 14:21:21
Python で何でも構築: 創造性を解き放つための初心者ガイド

2024-10-11 12:59:11
コーディングの鍵: 初心者のための Python の力を解き放つ

2024-10-11 12:17:31

最新の問題

URL パラメータから取得した PHP 配列が期待どおりに動作しないカテゴリ ID を含む URL パラメータがあり、それを次のような配列として扱いたいと考えています: http://example.com?cat[]=3,9,13 PHP では、...

から 2024-04-06 22:09:02

0

1

1428

ApacheのどこにCustomLogディレクティブを配置すればよいですか私はphp:7.2-apachedockerを使用しています。ヘルスチェック URL ログインアクセスログを無効にする必要があります。このリンクに基づいて、Customlog ...

から 2024-04-06 22:03:59

0

1

990

戻り値の変数の形式は何ですか? 私はphpの初心者です。コードを見つけました: if($x<time()){return[false,'error'];} ロジックや変数は重要ではありませんが、[false...

から 2024-04-06 21:55:20

0

1

778

opentbs を使用して odt ファイルを生成するときに発生する問題: 同じキーの値が別の列ではなく同じ行に表示されます。 PHPでodtを作成するためにOpenTbsというライブラリを使っていますが、列と行が動的に生成されるので利用しています。行と列の作成方法は知っていますが、それらを整理する方法がわ...

から 2024-04-06 20:18:18

0

1

483

ループするために MySQL の結果を ID ごとにグループ化する mysqlにフライトデータを含むテーブルがあります。 codeigniter3Journey_idair_idFlightDurationout_or_inflightdurati...

から 2024-04-06 17:27:56

0

1

406

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート