[Streaming -> Realtime] Rename all voxtral related classes, fn, files (#33415)

Signed-off-by: Patrick von Platen <patrick.v.platen@gmail.com>
2026-01-31 05:49:00 +01:00
parent 6c64c41b4a
commit 15e0bb9c42
6 changed files with 18 additions and 65 deletions
--- a/docs/serving/openai_compatible_server.md
+++ b/docs/serving/openai_compatible_server.md
@@ -610,54 +610,10 @@ Audio must be sent as base64-encoded PCM16 audio at 16kHz sample rate, mono chan
 | `transcription.done` | Final transcription with usage stats |
 | `error` | Error notification with message and optional code |

-#### Python WebSocket Example
+#### Example Clients

-??? code
-
-    ```python
-    import asyncio
-    import base64
-    import json
-    import websockets
-
-    async def realtime_transcribe():
-        uri = "ws://localhost:8000/v1/realtime"
-
-        async with websockets.connect(uri) as ws:
-            # Wait for session.created
-            response = await ws.recv()
-            print(f"Session: {response}")
-
-            # Commit buffer
-            await ws.send(json.dumps({
-                "type": "input_audio_buffer.commit"
-            }))
-
-            # Send audio chunks (example with file)
-            with open("audio.raw", "rb") as f:
-                while chunk := f.read(4096):
-                    await ws.send(json.dumps({
-                        "type": "input_audio_buffer.append",
-                        "audio": base64.b64encode(chunk).decode()
-                    }))
-
-            # Signal all audio is sent
-            await ws.send(json.dumps({
-                "type": "input_audio_buffer.commit",
-                "final": True,
-            }))
-
-            # Receive transcription
-            while True:
-                response = json.loads(await ws.recv())
-                if response["type"] == "transcription.delta":
-                    print(response["delta"], end="", flush=True)
-                elif response["type"] == "transcription.done":
-                    print(f"\nFinal: {response['text']}")
-                    break
-
-    asyncio.run(realtime_transcribe())
-    ```
+- [openai_realtime_client.py](https://github.com/vllm-project/vllm/tree/main/examples/online_serving/openai_realtime_client.py) - Upload and transcribe an audio file
+- [openai_realtime_microphone_client.py](https://github.com/vllm-project/vllm/tree/main/examples/online_serving/openai_realtime_microphone_client.py) - Gradio demo for live microphone transcription

 ### Tokenizer API