Python - sklearn を使用して大きなテキストの tfidf 特徴を見つけますか?
大家讲道理
大家讲道理 2017-06-28 09:23:35
0
1
768


上記のデータは、ロイター データ セットの 7303 トレーニング セットから取得され、tfidf 特徴を抽出するために sklearn が使用されています。得られた結果はすべて 0 です。 ?

このデータの一部を取得すると、データのこれらの小さな部分に対して正しい tfidf 結果を取得できます。

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全員に返信(1)
扔个三星炸死你

上記のコードは、精度が低すぎるか、min_count が原因である可能性があります

たとえば、単語の頻度が 1 で単語の総数が 1e9 の場合、対応する tf は 1e-9 であり、これは無視されます。

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!