nvfp4-megamoe-kernel/dsv4/kernels/compressor/compress_tail.py at ca661d32e8e94de838d550da52e934dd7f5c6312

Files

biondizzle daf84524ac E2/E3: compressor bridge, indexer bridge, flush pipeline wiring

- compress_tail.py: PyTorch reference CSA/HCA compression
  (token-level softmax over m/m' entries, paper eq. 11-12)
- compressor/__init__.py: csa_compress_and_store, hca_compress_and_store
  bridges (compression deferred to flush pipeline)
- indexer/__init__.py: compute_index_scores_topk bridge (NotImplemented)
- Fixed attention.py: removed extra positions arg to write_swa

2026-05-30 21:16:54 +00:00

4.9 KiB

Raw Blame History

View Raw

4.9 KiB Raw Blame History

4.9 KiB

Raw Blame History