vllm/__init__.py

"""vLLM: a high-throughput and memory-efficient inference engine for LLMs"""

from vllm.engine.arg_utils import AsyncEngineArgs, EngineArgs
from vllm.engine.async_llm_engine import AsyncLLMEngine
from vllm.engine.llm_engine import LLMEngine
from vllm.engine.ray_utils import initialize_cluster
from vllm.entrypoints.llm import LLM
from vllm.outputs import CompletionOutput, RequestOutput
from vllm.sampling_params import SamplingParams

__version__ = "0.1.1"

__all__ = [
    "LLM",
    "SamplingParams",
    "RequestOutput",
    "CompletionOutput",
    "LLMEngine",
    "EngineArgs",
    "AsyncLLMEngine",
    "AsyncEngineArgs",
    "initialize_cluster",
]
[Quality] Add code formatter and linter (#326) 2023-07-03 11:31:55 -07:00			`"""vLLM: a high-throughput and memory-efficient inference engine for LLMs"""`

Change the name to vLLM (#150) 2023-06-17 03:07:40 -07:00			`from vllm.engine.arg_utils import AsyncEngineArgs, EngineArgs`
			`from vllm.engine.async_llm_engine import AsyncLLMEngine`
			`from vllm.engine.llm_engine import LLMEngine`
			`from vllm.engine.ray_utils import initialize_cluster`
			`from vllm.entrypoints.llm import LLM`
			`from vllm.outputs import CompletionOutput, RequestOutput`
			`from vllm.sampling_params import SamplingParams`

Bump up version to 0.1.1 (#204) 2023-06-22 15:33:32 +08:00			`__version__ = "0.1.1"`
Change the name to vLLM (#150) 2023-06-17 03:07:40 -07:00
			`__all__ = [`
			`"LLM",`
			`"SamplingParams",`
			`"RequestOutput",`
			`"CompletionOutput",`
			`"LLMEngine",`
			`"EngineArgs",`
			`"AsyncLLMEngine",`
			`"AsyncEngineArgs",`
			`"initialize_cluster",`
			`]`