HyFUモデルV1の概要: Flux AIのハイブリッド機能を解放する

Flux Unchained by SCG

作者: socalguitarist
公開日: 2024-08-14T17:53:00.922Z

モデルの詳細

モデルID: 645943
モデル名: Flux Unchained by SCG
モデルタイプ: チェックポイントトレーニング

モデルバージョン

バージョン	ベースモデル	ステップ	エポック	クリップスキップ	名前	ファイルサイズ	ダウンロードリンク
HyFU-8-Step-Hybrid-v1.0	Flux.1 D	なし	なし	なし	HyFU-8-step-v1.0-pruned.safetensors	11340.41 MB	リンク
SchnFU-v1.3-Unet-4step	Flux.1 S	なし	なし	なし	SchnFU-fp8-1.3.0.safetensors	11340.44 MB	リンク
FU_V1_Unet_Only(FP8)	Flux.1 D	なし	なし	なし	FluxUnchained_fp8_unet_only.safetensors	11350.17 MB	リンク
FU(t5_16xfp8_e4m3fn)_v1.1	Flux.1 D	なし	なし	なし	FluxUnchained_v1.1.0.safetensors	20829.46 MB	リンク
FU(t5_8x8_e4m3fn)_v1.1	Flux.1 D	なし	なし	なし	FluxVision.d(8x8_e4m3fn)_v1.safetensors	16287.67 MB	リンク

HyFUモデルV1について

HyFUモデルV1は、Flux AIエコシステムの中でワクワクするような進展なんだよね。これは、基本のFlux.dモデルを使って、低重量のLoRAトレーニングを何度も重ねて作られたハイブリッドモデルなの。NSFW（職場不向き）なコンテンツ、特に女性の体についてや複雑な概念を扱えるように設計されてるんだ。まだ進行中のプロジェクトだけど、今のところ得られた結果はかなり良い感じ。

モデルは、映画のスチル、アート写真、そして明確なヌードやアート的なヌードを混ぜてトレーニングされてるよ。約80％が写真に基づいてて、20％がAIやイラストを使用してるから、リアルでスタイリッシュな出力を produz できるバランスの取れたデータセットになってるんだ。

どうやって動作するの？

HyFUはハイブリッド技術を使ってて、いろいろなトレーニングパスを組み合わせてるんだ。flux.1_dev_8x8_e4m3fn-marduk191モデルに基づいてて、FP16クオリティで動作する（FP8のオプションもあるよ）。それで、モデルはすごく正確で詳細な画像を生成できるし、計算の負担も抑えられてるんだ。

このモデルは、SFW（職場向き）とNSFW（職場不向き）の画像の両方に特に効果的だよ。ユーザーからは、基本のfluxモデルに似た反応を示すって言われてて、いろんなアートスタイルに対応できるんだ。

モデルの特徴

NSFW生成: 女性の体の適切な表現と露骨なコンテンツを生成することに特化してる。
バランスの取れたデータセット: アートと露骨な写真を混ぜた5,000枚の画像でトレーニングされてるよ。
FP16 & FP8: 高品質のFP16モデルで、FP8もリクエストがあれば提供される。
柔軟な提示詞: 基本のfluxと同じように提示詞が使えるから、簡単に使えるよ。

モデルバージョンの説明

HyFU 8-Step Hybrid V1.0

HyFU 8-Stepハイブリッドモデルは、スピードと品質のバランスが取れてるから、人気のバージョンなんだ。もっと複雑な構図をサポートしてて、リアルなポーズもうまく扱えるんだ。他のバージョンに比べて、全身の画像で体の歪みを最小化するように設計されてるから、特に効果的なんだよ。

Schnell 4-Stepモデル

「Schnell」または「クイック」バージョンは、速いけど、複雑なポーズや詳細な部分を扱うにはあんまり強くないんだ。すぐ結果が欲しいユーザー向けだね、でも、詳細な構図には向いてない。

よくある質問

モデルは男性の体に対応してるの？

現時点では女性の体にかなり焦点が当たってて、男性と女性の体両方に対応するようにトレーニングしてほしいってリクエストもあるけど、今は女性向けのNSFWにより適してるかな。

8GB VRAMのシステムで動作する？

うん、限られたVRAMのシステムでも動作する方法があるよ。6GBや3GB VRAMのセットアップでも成功したってユーザーが言ってたけど、NF4やGGUFバージョンを使ったり、設定を最適化する必要があるかもね。

背景のぼかしやボケ効果を取り除くことはできる？

残念ながら、これについては知られている問題なんだ。ネガティブプロンプトは生成を大幅に遅くするから、代わりに「携帯電話カメラ、フラットフォーカス、広角」みたいな形容詞を使って、パフォーマンスを落とさずに背景のぼかしを減らしてみて。

Automatic1111で動作する？

できるけど、ForgeやComfyUIで使うとメモリ管理がもっと良くて、全体的にスムーズに動くから、おすすめだよ。A1111で動かすとき、特にLoRAを追加すると大きな遅延やクラッシュが報告されてるから注意してね。

レンダリング時間を短縮する方法は？

より速いレンダリングを求めるなら、LCMサンプラーを試してBETAスケジューラーを1.0 CFGで使うといいよ。この設定だと、最低4ステップで良い結果が得られるから。ただし、LoRAを追加すると遅くなることがあるから、注意してね。

Forgeでエラーが出るのはなぜ？

「CLIPステート辞書がありません！」ってエラーが出る場合は、VAEフォルダーに正しいファイル、つまりae.safetensors、clip_l.safetensors、t5xxl_fp16.safetensorsが揃ってることを確認してね。これらはモデルが正しく動作するために一緒に読み込まれないといけないから。

結論

HyFUモデルV1は、Flux AIラインナップの中で多用途で進化し続けるツールなんだ。複雑な構図を生成するのが得意で、NSFW画像も適切な体の表現を持ってるし、さまざまなユーザーニーズに合った異なるバージョンが用意されてるよ。スピードを重視するか、詳細を重視するか、あなたにぴったりのモデルバージョンがあるはず。これは進行中のプロジェクトだから、今後の更新でさらなる改善や新機能が期待できるよ！