Tencent Hunyuan がオープンソースアクセラレーションライブラリをリリース、画像生成時間を 75% 短縮-AI-php.cn

Tencent Hunyuan がオープンソースアクセラレーションライブラリをリリース、画像生成時間を 75% 短縮

WBOY

リリース： 2024-06-08 12:12:11

オリジナル

1187 人が閲覧しました

6 月 8 日、Tencent は、Tencent Hunyuan テキスト生成グラフの大規模なオープンソースモデル (Hunyuan DiT モデルと呼ばれる) の高速化ライブラリをリリースしました。これにより、推論効率が大幅に向上し、グラフ生成時間が 75% 短縮されました。

Hunyuan DiT モデルを使用するための敷居も大幅に引き下げられました。ユーザーは、ComfyUI のグラフィカルインターフェイスに基づいた Tencent Hunyuan Wensheng グラフモデル機能を使用できます。同時に、Hunyuan DiT モデルは Hugging Face Diffusers 一般モデルライブラリにデプロイされ、ユーザーはオリジナルのコードライブラリをダウンロードせずに、わずか 3 行のコードで Hunyuan DiT モデルを呼び出すことができます。

以前、Tencentは、大規模なHunyuanテキスト生成モデルが完全にアップグレードされ、オープンソース化され、企業や個人の開発者が無料で商用利用できるようになったと発表しました。これは業界初の中国語ネイティブの DiT アーキテクチャテキスト生成グラフオープンソースモデルであり、Sora と同じ DiT アーキテクチャを使用して中国語と英語のバイリンガル入力と理解をサポートしており、テキスト生成をサポートするだけでなく、マルチインターフェイスとしても使用できます。ビデオなどのモーダルビジュアル生成モデル。

Tencent HunyuanDiTモデルオープンソースは多くのコミュニティ開発者によって認められています。 1 か月も経たないうちに、プロジェクトの Github スター数は 2100 を超え、オープンソースコミュニティで人気の DiT モデルの上位にランクされています。

Tencent Hunyuan がオープンソースアクセラレーションライブラリをリリース、画像生成時間を 75% 短縮

Hunyuan DiT Github ページ

開発者のエクスペリエンスを向上させるために、Tencent Hunyuan は専用のアクセラレーションライブラリを正式にリリースしました。これにより、推論時間が 75% 短縮され、大規模モデルの操作効率が向上します。。開発者は、Hugging Face を通じて推論高速化ツールをダウンロードできます。

プロジェクトチームは、知識の蒸留と TensorRT 高性能推論フレームワークを通じて、サンプリングステップの圧縮と DiT モデルの効率的な推論展開を実現しました。蒸留とは主に、加速を達成するために拡散モデルの反復ステップの数を減らすことを指します。モデルの全体的な構造とパラメータの量は変わりません。追加の操作や機器を必要とせずに、蒸留重みを使用することで反復ステップの数を 50% 削減でき、時間の消費を半分にできます。 TensorRT 推論高速化ソリューションは、エンジニアリングの最適化を通じて時間の消費をさらに削減でき、モデルの重みから切り離されています。両方を同時に使用して推論を展開すると、推論時間を 75% 削減できます。

ユーザーは ComfyUI のグラフィカルインターフェイスを直接使用して、最新ニュースに基づいたコミュニティの共同作業を活用できます。同時に、Hugging Face チームとの協力により、ハイブリッド DiT モデルが Hugging Face 公式モデルライブラリディフューザーに展開され、モデルライブラリの使用と生成コードが再調整され、ユーザーはモデルライブラリを直接呼び出すことができます。このチャネルを介したハイブリッド DiT モデルにより、ユーザーの使用コストが大幅に簡素化されます。

ComfyUI は、Vincentian グラフ分野の WebUI インターフェイス設計であり、Vincentian グラフ分野の拡散アルゴリズムをモジュール化してグラフィカル化し、生成効率とリソース使用率を向上させ、開発者の使用しきい値を大幅に削減します。ユーザーは、グラフィカルワークフローを通じて Hunyuan DiT Wensheng グラフモデルを使用して、公式モデルと同じ効果を実現できます。

Tencent Hunyuan がオープンソースアクセラレーションライブラリをリリース、画像生成時間を 75% 短縮

Hunyuan DiT Vincent グラフモデルの ComfyUI ユーザーインターフェイス

さらに、ComfyUI の使用エコロジーを中心に強力なオープンソースコミュニティが誕生しました。 Hunyuan DiT による ComfyUI のサポートにより、コミュニティメンバーは最新の DiT アーキテクチャに基づいた Wensheng ダイアグラムモデルを体験することもできます。

有名な AI オープンソースコミュニティとして、Hugging Face の Diffusers は現在、さまざまな主流の大規模なヴィンセントグラフモデルを呼び出すためのユニバーサルライブラリであり、今日の大規模なヴィンセントグラフモデルを使用するためのコミュニティ標準となっています。

ハギング DiT モデルをハギングフェイスディフューザーに適応させると、モデルの使いやすさとユーザーベースが大幅に向上します。ユーザーは、オリジナルのコードライブラリをダウンロードして自分の環境にデプロイする必要はありません。Diffusers ライブラリをインストールした開発者は、数行のコードを実行するだけで Hunyuan DiT モデルを呼び出すことができるため、構成と呼び出しが非常に便利です。同時に、Hugging Face と Tencent Hunyuan チームは共同でアルゴリズムフレームワークを最適化し、画像生成を高速化しました。

これは、Hunyuan DiT に基づくその後のすべての使用と開発に対する基礎的なサポートを提供することにも相当し、上記の ComfyUI メソッドを含む、Hunyuan DiT を呼び出す必要があるあらゆるシナリオをカバーします。同時に、開発者にとっては、ディフューザーに基づいて以前に構成されたワークフローとプラグインを、少し変更するだけで Hunyuan DiT で直接使用できます。 Tencent Wenshengtu の責任者、Lu Qinglin 氏は次のように述べています。「Tencent の Hunyuan Wenshengtu モデルは、オープンソース化されてから多くの開発者からサポートとフィードバックを受けています。私たちは非常に満足しており、改善と対応のためにコミュニティとも協力しています」 Hunyuan DiT に基づいてオープンソースエコシステムを最適化することで、より多くの開発者が最新の研究成果をより便利に享受できるようになります。また、次世代ビジュアル世代のオープンソースエコシステムの構築に参加し、大規模な開発を促進することも歓迎します。モデル業界。」

Tencent Hunyuan Wenshengtu オープンソース大型モデル (Hunyuan DiT モデル) プロジェクトのリンクを添付します

公式ウェブサイト: //m.sbmmt.com/link/35817bda28b11 1aa49bd8fdf 61878246 コード:モデル:

//m.sbmmt.com /link /5dacab03c06f42f75c3f21a2c9f98997論文:

//m.sbmmt.com/link/a0b173044f2019316bebc411696e7 d35

以上がTencent Hunyuan がオープンソースアクセラレーションライブラリをリリース、画像生成時間を 75% 短縮の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。