本项目是一个基于 FLUX.2 Klein 模型开发的 AI 智能换头工具。通过集成 SDNQ (Spatial Dynamic Neural Quantization) 4-bit 动态量化技术,在显著降低显存占用的同时,保持了卓越的图像生成质量。配合 BFS (Best Face Swap) LoRA 模型,能够精准地实现人头替换,并完美融合原图的光照、角度和背景。
✨ 核心功能
🚀 极速与低显存优化
- SDNQ 4-bit 量化:采用先进的动态量化技术,将大模型压缩至极小体积,大幅减少显存需求。
- 双模式切换:
- 4B 模式:适合低显存显卡(约 8GB VRAM),生成速度快。
- 9B 模式:提供更高的人脸细节和光影一致性(需更高显存支持)。
- INT8 加速:自动检测硬件并启用 INT8 矩阵乘法加速,进一步提升推理效率。
- CPU 卸载:智能管理显存,自动将不使用的模型层卸载至内存,防止显存溢出。
🎨 智能自动化体验
- 分辨率自适应:上传“目标图像”后,系统会自动读取原图尺寸,并自动调整为符合模型要求的最佳分辨率(无需手动输入)。
- 即传即生:上传两张图片后自动触发生成流程,无需繁琐点击。
- 自动归档:生成的图片自动保存至 output/ 目录,文件名自动附带日期和随机编号,便于管理和查找。
🖼️ 高质量换脸
- 光影融合:不仅替换人脸,还能根据原图的环境光、阴影自动调整新的人脸肤色和光照。
- 角度匹配:模型能理解头部姿态,尝试匹配原头部的旋转角度和朝向。
🛠️ 系统要求
- 显存 (VRAM):
- 4B 模型:建议 8GB 及以上
- 9B 模型:建议 12GB 以上
📖 使用指南
1. 启动与配置
运行脚本后,终端会提示选择模型版本:
- 输入 1 并回车:加载 4B 模型 (速度快,省显存)。
- 输入 2 并回车:加载 9B 模型 (质量高,细节好)。
2. 上传图片
- 参考人脸:上传一张您想换上去的正面人脸照片。
- 目标图像:上传一张背景或身体照片(系统将以此图的尺寸为基准)。
3. 生成与调整
- 上传完成后,系统会自动开始处理。
- 在处理过程中,您可以观察下方的进度条。
- 生成完成后,拖动对比滑块查看换脸前后的效果。
4. 查看结果
- 生成的图片会自动保存在代码同目录下的 output 文件夹中。
- 界面上可以直接下载或预览。
⚙️ 高级设置说明
如果您需要对结果进行微调,可以点击“高级设置”:
- 随机种子:控制生成的随机性。固定种子可以复现完全相同的结果。
- 宽度/高度:通常系统会自动设置。如果需要生成特定尺寸(如高清大图),可在此手动调整(需为 8 的倍数)。
- 推理步数:默认为 4。对于蒸馏模型,4步通常为最佳平衡点。增加步数可能会略微提升细节,但会显著增加耗时。
- 引导系数:默认为 1.0。控制模型对提示词的遵循程度。数值过高可能导致图像过度饱和或扭曲。
⚠️ 注意事项
- 显存不足:如果遇到 CUDA Out Of Memory 错误,请尝试使用 4B 模型或减小生成尺寸(如 512×512 或 768×768)。
- 生成质量:请尽量上传清晰、光线充足的“参考人脸”,模糊或遮挡严重的脸部会影响换脸效果。









整合包说明
1 最低支持英伟达8G显卡,内存至少24G。
2 集合了 FLUX.2-klein 9B和4B,启动的时候自己选择。
3 个人觉得是个不错的工具。
20260519更新记录
1 添加Qwen-Image-Edit-2511 模型支持
2 修正部分bug
3 该工具更名为HeadFusion 版本号为1.0
20260525 更新记录
1 添加一个增加真实感的lora Ultra-Realistic-Portrait,可以增加输出的图片质感
2 修正Qwen Lightning 设置,添加一个无,选择无,可以极大提升输出图片的质量。但速度会慢
3 修正部分bug
20260601 更新记录
1 添加一个新的Qwen Lightning 最高质量的 LORA模型,5090的小伙伴 可以试试
2 修正部分参数,生成的质量更好
3 修正部分bug
4 更正部分模型文件为优先本地加载,不再检测模型的远程仓库
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END







暂无评论内容