コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > PHPチュートリアル > PHP と Redis を組み合わせて大規模ファイルの重複排除を実現

PHP と Redis を組み合わせて大規模ファイルの重複排除を実現

little bottle

リリース： 2023-04-06 06:10:02

転載

3058 人が閲覧しました

この記事の主な内容は、PHP の複数のプロセスを使用して、順序付けされた Redis のコレクションと連携して、大きなファイルの重複排除を実現することです。興味のある友人は、それについて学ぶことができます。

1.たとえば、大きなファイルの場合、私のファイルは

-rw-r--r-- 1 ubuntu ubuntu 9.1G Mar 1 17:53 2018-12 -awk -uniq.txt

2. 分割コマンドを使用して 10 個の小さなファイルに分割します

split -b 1000m 2018-12-awk-uniq.txt -b バイトに従って切り取ります。サポートされているユニット m と k

3. 10 個の php プロセスを使用してファイルを読み取り、redis の順序付きセット構造に挿入します。繰り返しのものは挿入できません。重複排除の役割を果たすことができます

<?php
$file=$argv[1];
//守护进程
umask(0); //把文件掩码清0
if (pcntl_fork() != 0){ //是父进程，父进程退出
        exit();
}    
posix_setsid();//设置新会话组长，脱离终端
if (pcntl_fork() != 0){ //是第一子进程，结束第一子进程  
        exit();
}    
$start=memory_get_usage();
$redis=new Redis();
$redis->connect(&#39;127.0.0.1&#39;, 6379);
$handle = fopen("./{$file}", &#39;rb&#39;);
while (feof($handle)===false) {
        $line=fgets($handle);
        $email=str_replace("\n","",$line);
        $redis->zAdd(&#39;emails&#39;, 1, $email);
}

ログイン後にコピー

4.取得したデータを redis で表示します

zcard email 要素の数を取得します

100000 から始まり 100100 で終わるなど、特定の範囲の要素を取得します

zrange email 100000 100100 WITHSCORES

PHP をより効率的に学習したい場合は、PHP 中国語 Web サイトの

PHP ビデオチュートリアル

に注目してください。

以上がPHP と Redis を組み合わせて大規模ファイルの重複排除を実現の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

php redis

前の記事：xampp統合環境におけるPHPのdate()関数で得られる時刻誤差の解決方法次の記事：【PHP】SMSインターフェース（定期照合）

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

mysqlスロークエリとは何ですか

2019-05-31 18:00:19
mysql の無料版は使いやすいですか?

2019-05-31 17:53:44
mysqlの入力方法

2019-05-31 17:41:15
mysqlのインストールパスを確認する方法

2019-05-31 17:32:51
cmdを使用してmysqlに入る方法

2019-05-31 17:24:18
mysqlって何ができるの？

2019-05-31 17:15:01
vueは何をするのですか

2019-05-31 16:58:16
jQueryのafterメソッドの使い方

2019-05-31 16:37:47
jqueryでpropは何を意味しますか

2019-05-31 16:19:45
jq とはどういう意味ですか?

2019-05-31 16:04:54

最新の問題

PHP 拡張子 intl

から 1970-01-01 08:00:00

0

0

0

phpのデータ取得？

から 1970-01-01 08:00:00

0

0

0

PHP GET エラーレポート

から 1970-01-01 08:00:00

0

0

0

phpを上手に学ぶ方法

から 1970-01-01 08:00:00

0

0

0

PHP Toolboxを使用してPHPファイルを開く方法

から 1970-01-01 08:00:00

0

0

0

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

Redisコマンド操作中国語マニュアル

226195
Math Academy の詳細な Redis ビデオチュートリアル

43367
Redis 中国語開発マニュアル

114
Yan Shiba redis ビデオチュートリアル

146513

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート