Merge branch 'main' into python_backend

Signed-off-by: Parth Thakkar <thakkarparth007@gmail.com>
2025-08-14 10:37:43 -07:00 · 2022-11-09 12:51:16 -06:00 · 2022-11-09 12:51:16 -06:00 · f0a12b5e8e
commit f0a12b5e8e
parent fa423d1da1 e5825da8be
10 changed files with 145 additions and 13 deletions
--- a/copilot_proxy/utils/codegen.py
+++ b/copilot_proxy/utils/codegen.py
@ -21,6 +21,9 @@ class CodeGenProxy:
        # Max number of tokens the model can handle
        self.MAX_MODEL_LEN = 2048

+    class TokensExceedsMaximum(Exception):
+        pass
+
    @staticmethod
    def prepare_tensor(name: str, tensor_input):
        t = client_util.InferInput(
@ -82,8 +85,15 @@ class CodeGenProxy:
        prompt_len = input_start_ids.shape[1]
        input_len = prompt_len * np.ones([input_start_ids.shape[0], 1]).astype(np_type)
        max_tokens = data.get('max_tokens', 16)
-        if max_tokens + input_len[0][0] > self.MAX_MODEL_LEN:
-            raise ValueError("Max tokens + prompt length exceeds maximum model length")
+        prompt_tokens: int = input_len[0][0]
+        requested_tokens = max_tokens + prompt_tokens
+        if requested_tokens > self.MAX_MODEL_LEN:
+            print(1)
+            raise self.TokensExceedsMaximum(
+                f"This model's maximum context length is {self.MAX_MODEL_LEN}, however you requested "
+                f"{requested_tokens} tokens ({prompt_tokens} in your prompt; {max_tokens} for the completion). "
+                f"Please reduce your prompt; or completion length."
+            )
        output_len = np.ones_like(input_len).astype(np_type) * max_tokens
        num_logprobs = data.get('logprobs', -1)
        if num_logprobs is None:
--- a/copilot_proxy/utils/errors.py
+++ b/copilot_proxy/utils/errors.py
@ -0,0 +1,19 @@
+from typing import *
+
+class FauxPilotException(Exception):
+    def __init__(self, message: str, type: Optional[str] = None, param: Optional[str] = None, code: Optional[int] = None):
+        super().__init__(message)
+        self.message = message
+        self.type = type
+        self.param = param
+        self.code = code
+
+    def json(self):
+        return {
+            'error': {
+                'message': self.message,
+                'type': self.type,
+                'param': self.param,
+                'code': self.code
+            }
+        }