From 4a2a06f9e1e156071b95080f117ef2a85f3adcfd Mon Sep 17 00:00:00 2001
From: biondizzle <biondizzle@gmail.com>
Date: Wed, 27 May 2026 05:25:33 +0000
Subject: [PATCH] Fix gO slice: use separate Int32(0) instead of tuple

---
 dsv4/kernels/attention/fmha_smem_acc.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/dsv4/kernels/attention/fmha_smem_acc.py b/dsv4/kernels/attention/fmha_smem_acc.py
index c999c0bd..39b190e0 100644
--- a/dsv4/kernels/attention/fmha_smem_acc.py
+++ b/dsv4/kernels/attention/fmha_smem_acc.py
@@ -626,7 +626,7 @@ class FmhaKernel:
                 gO_qdl = cute.flat_divide(
                     mC, cute.select(self.pv_mma_tiler, mode=[0, 1])
                 )
-                gO = gO_qdl[None, None, None, Int32(0), (Int32(0), Int32(0))]
+                gO = gO_qdl[None, None, None, Int32(0), Int32(0)]
                 tOsO, tOgO = cpasync.tma_partition(
                     tma_c, 0, cute.make_layout(1),
                     cute.group_modes(sC, 0, 2),