fetch を使用して HTML ページのコンテンツを変数に取得するノード スクリプトを作成しているとします。
fetch
これで、このようなもの用の CSS セレクターができました。これを使用して、CSS セレクターによって認識される HTML コンテンツやテキスト コンテンツを抽出するにはどうすればよいですか。
活用できる既存のツール/パッケージがある場合は、2 つのレベルで回答してください:
Node.js の CSS セレクターによって識別された HTML/テキスト コンテンツを抽出するには、Cheerio、jsdom、Puppeteer などのさまざまなパッケージを使用できます。 CSS セレクターを使用して、純粋な CSS セレクター ベースおよび jQuery ベースのツールのコンテンツを抽出する方法の例を次に示します。
Hello World!'; const $ = Cheerio.load(html); const content = $('.content').text(); console.log(content); // 出力: Hello World!
Hello World!'; const dom = 新しい JSDOM(html); const $ = require('jquery')(dom.window); const content = $('.content').text(); console.log(content); // 出力: Hello World!
Node.js の CSS セレクターによって識別された HTML/テキスト コンテンツを抽出するには、Cheerio、jsdom、Puppeteer などのさまざまなパッケージを使用できます。 CSS セレクターを使用して、純粋な CSS セレクター ベースおよび jQuery ベースのツールのコンテンツを抽出する方法の例を次に示します。
純粋な CSS セレクターに基づく: Cheerio は、HTML を解析し、CSS セレクターを使用してデータを抽出できるようにする高速かつ柔軟なパッケージです。 Cheerio を使用して CSS セレクター経由でコンテンツを抽出する方法は次のとおりです: