[V1] LogitsProcessor programming model (#16728)

Signed-off-by: Nick Hill <nhill@redhat.com> Signed-off-by: Andrew Feldman <afeldman@neuralmagic.com> Signed-off-by: Andrew Feldman <afeldman@redhat.com> Co-authored-by: Nick Hill <nhill@redhat.com>
2025-07-02 12:10:42 -04:00
parent c1909e7e8c
commit 48fb076cbc
13 changed files with 1401 additions and 393 deletions
--- a/tests/v1/sample/test_rejection_sampler.py
+++ b/tests/v1/sample/test_rejection_sampler.py
@@ -7,6 +7,7 @@ import torch
 import torch.nn.functional as F

 from vllm.platforms import current_platform
+from vllm.v1.sample.logits_processor import LogitsProcessorManager
 from vllm.v1.sample.metadata import SamplingMetadata
 from vllm.v1.sample.rejection_sampler import (PLACEHOLDER_TOKEN_ID,
                                              RejectionSampler)
@@ -58,7 +59,6 @@ def create_sampling_metadata(
        all_random=not all_greedy,
        top_p=top_p,
        top_k=top_k,
-        min_p=torch.empty(1, ),
        generators=generators,
        max_num_logprobs=0,
        no_penalties=False,
@@ -67,10 +67,9 @@ def create_sampling_metadata(
        presence_penalties=torch.tensor([]),
        repetition_penalties=torch.tensor([]),
        output_token_ids=[],
-        min_tokens={},
-        logit_bias=[None],
        allowed_token_ids_mask=None,
        bad_words_token_ids={},
+        logitsprocs=LogitsProcessorManager(),
    )