Fix SDXL area composition sometimes not using the right pooled output.

2025-09-11 03:58:22 +00:00 · 2023-12-18 12:54:23 -05:00
parent d2f322902c
commit 8cf1daa108
2 changed files with 14 additions and 3 deletions
--- a/comfy/model_base.py
+++ b/comfy/model_base.py
@@ -126,9 +126,15 @@ class BaseModel(torch.nn.Module):
                        cond_concat.append(blank_inpaint_image_like(noise))
            data = torch.cat(cond_concat, dim=1)
            out['c_concat'] = comfy.conds.CONDNoiseShape(data)
+
        adm = self.encode_adm(**kwargs)
        if adm is not None:
            out['y'] = comfy.conds.CONDRegular(adm)
+
+        cross_attn = kwargs.get("cross_attn", None)
+        if cross_attn is not None:
+            out['c_crossattn'] = comfy.conds.CONDCrossAttn(cross_attn)
+
        return out

    def load_model_weights(self, sd, unet_prefix=""):
@@ -322,6 +328,10 @@ class SVD_img2vid(BaseModel):

        out['c_concat'] = comfy.conds.CONDNoiseShape(latent_image)

+        cross_attn = kwargs.get("cross_attn", None)
+        if cross_attn is not None:
+            out['c_crossattn'] = comfy.conds.CONDCrossAttn(cross_attn)
+
        if "time_conditioning" in kwargs:
            out["time_context"] = comfy.conds.CONDCrossAttn(kwargs["time_conditioning"])