返信内容:
戦争を始めたいのですが、銃と剣で射撃の練習をしたほうがよいでしょうか?
Java を学習してから、Lucene (http://lucene.apache.org/core/) を学習します。
お聞きしたいのですが、Lucene も検索エンジンです、ふふ。
あはは、この友人は素晴らしいアイデアを持っています
しかし、検索エンジンの鍵は言語ではなくアルゴリズムの中核であるのは残念です
もちろん、アルゴリズムには言語も必要ですExpress では、検索アルゴリズムのパフォーマンス要件を考慮すると、PHP や Java よりも C++ を選択する方が良いでしょう。
C++、Java などを使用して検索エンジンを作成できます。重要なのは、どのような種類の検索エンジンを構築するか、単なるドキュメント検索かインターネット スタイルの検索エンジンか、データの量、およびデータ量です。転置インデックスを構築するかどうか (インデックスのボリュームが 100,000 未満の場合は、転置インデックスを構築しないことをお勧めします)、クローラの作成方法、インデックスを更新する頻度、および純粋な英語をサポートするかどうか。中国語と英語の両方をサポートする場合は、キャプチャしたコンテンツを分割する方法などを考慮する必要があります。そのため、言語は実際には大きな問題ではありません。何をしたいか、どれだけ得意かということが重要です。質問したいです。
検索エンジンの規模と包括性は、通常、いわゆる C++、PHP、JAVA よりも優れています。これは実際には議論すべき問題ではありません。
彼の CS101 コースの 1 つは、プログラミングがまったくできない人でも Python 言語を使用して 7 週間で検索エンジンを作成できるようにするというものです。ビデオ(壁を回避する必要があります)、宿題、試験があります。
http://www.udacity.com/overview/Course/cs101/CourseRev/apr2012
検索エンジンは複数の知識分野の複合体であり、どの言語にも適した場所があるため、1 つの言語だけで完全な検索エンジンを実装することは困難です。そのため、C++、Java、Python、および PHP を学習してください。
オープンソースの検索エンジン、Nutch、httpclient、lucene などを確認できます。
http://udacity.com/
これをチェックしてください。 CS101 では、単純な検索エンジンを作成します。使用言語はPythonです。ビデオは壁の外にあります。