Merge pull request #24 from datalab-to/tokens

fix: respect max output tokens
2026-03-07 06:14:14 +00:00 · 2025-11-04 13:19:06 -05:00
parent aabfed2ed3 d1cde9b608
commit d69d18d6e8
1 changed files with 1 additions and 1 deletions
--- a/chandra/model/vllm.py
+++ b/chandra/model/vllm.py
@@ -71,7 +71,7 @@ def generate_vllm(
            completion = client.chat.completions.create(
                model=model_name,
                messages=[{"role": "user", "content": content}],
-                max_tokens=settings.MAX_OUTPUT_TOKENS,
+                max_tokens=max_output_tokens,
                temperature=temperature,
                top_p=top_p,
            )