他の人は私の Web サイトのサブディレクトリを閲覧できますか?-PHPチュートリアル-php.cn

他の人は私の Web サイトのサブディレクトリを閲覧できますか?

WBOY

リリース： 2016-06-23 14:13:11

オリジナル

1546 人が閲覧しました

この投稿は、u010676349 によって 2013-06-12 11:12:08 に最終編集されました

私は、ドメイン名 http://www.XXX.com/ の Web サイトと、ルートディレクトリにindex.php ファイルを持っています。この場合、アクセスアドレスは http://www.XXX.com/index.php になります

次に、Web サイトのルートディレクトリにサブディレクトリ (tner など) を作成し、このディレクトリ内にサブサイトを作成します。その後、訪問者は http: を使用します。 //www. XXX.com/tner/index.php は私のサブディレクトリにある Web サイトにアクセスできます

私の質問は、私が他の人の tner サブディレクトリを知らない場合、他の人は私のルートディレクトリからこのサブディレクトリを見つけることができるということです

言い換えれば、誰かが私のメイン Web サイトのアドレス http://www.XXX.com/index.php を知っている場合、私がその人に伝えなければ、私が以下のサブディレクトリを隠していることが分かるでしょうか?不可能な気がしますが、私のサブディレクトリにある Web サイトを開いたところ、ウェブスパイダーがすでにアクセスしていることがわかりました。ウェブスパイダーはどのようにして私のサブディレクトリを知ったのでしょうか?

ディスカッションに返信 (解決策)

できること行うべきことは: 開くか開かないかです

開かない場合は通常、ログインが必要です。これは、サブディレクトリ全体の権限を制限することになります

開いている限り、興味のある人はいつでも見つけることができます

クローラーには通常 2 種類ありますリンクを取得するには 2 つの方法がありますか? フォローと推測
前者は言うまでもありません
後者は、法的な URL 文字の原則に基づいており、通常、Web ページを取得する必要はありません。ヘッダーが存在するかどうかを検出するだけで十分です。その後、 follow を使用してサブディレクトリ内のサイトを取得します

robots.txt

User-agent: *
Disallow: /tner/

検索エンジンへのアクセスを禁止します。

ユーザーが http://www.XXX.com/tner と入力したときに、tner の下にあるすべてのファイルのリストが印刷されないように、tner の下に空のindex.html を作成します。

robots.txt

ユーザーエージェント: *
禁止: /tner/

検索エンジンのアクセスを無効にします。

ユーザーが http://www.XXX.com/tner と入力したときに、tner の下にあるすべてのファイルのリストが印刷されないように、tner の下に空のindex.html を作成します。

すごいですね! 検索エンジンへのアクセスを禁止する方法について、たくさんの人に尋ねたり、投稿したりしましたが、詳しく教えていただけますか? /tner ディレクトリにありますか? それとも別の場所にありますか? .html ファイル?

できることは次のとおりです: 開くか開かないか
開かない場合は、通常、サブディレクトリ全体に対するアクセス許可が制限されます

開いている限り、関心のある人はいつでもアクセスできます。見つけてください

クローラーがリンクを取得する方法は一般に 2 つあります??フォローと計算
前者は言うまでもありません
後者は URL の正当な文字の原則に基づいており、検出は一般的に一定の範囲内で行われます。、Web ページを取得する必要はありません。ヘッダーが存在するかどうかを検出するだけで十分です。その後、フォローを使用してサブディレクトリを取得します。
下のサイトが開かないのはなぜですか?

robots.txt

ユーザーエージェント: *

許可しない: /tner/

検索エンジンへのアクセスを禁止します。

ユーザーが http://www.XXX.com/tner と入力したときに、tner の下にあるすべてのファイルのリストが印刷されないように、tner の下に空のindex.html を作成します。

検索したところ、root ディレクトリ (http://www.XXX.com/) に robots.txt ファイルを作成する必要があることがわかりました。しかし、他の人がこのファイルをダウンロードするのが怖いのです。ファイル、このサブディレクトリの秘密が漏洩したのではありませんか?

無関係な人に私のこのサブディレクトリを見つけてほしくありません (ただし、彼はこのサブディレクトリが存在すると推測しているかもしれません)。また、検索エンジンにも検索されたくないです。サブディレクトリの内容が含まれています。

robots.txt をルートディレクトリに置きます。 /var/www/html/robots.txt
他の人は http://www.yourdomain.com/robots.txt を開いて設定を確認できます禁止: /tner/

したがって、/tner/ に置く必要がありますディレクトリ空の Index.html ファイル (0 バイト)。 http://www.yourdomain.com/tner と入力しても、空のページとして表示され、/tner/ の下にあるファイルリストは印刷されません。外。

私もこの問題に悩んでいて、上の階で良い方法を見つけました