Update application files and fix LLM models, create new retriever class

2025-11-29 08:33:20 +00:00 · 2024-04-09 14:02:33 +01:00
parent e07df29ab9
commit 391f686173
13 changed files with 202 additions and 185 deletions
--- a/application/llm/anthropic.py
+++ b/application/llm/anthropic.py
@@ -10,7 +10,7 @@ class AnthropicLLM(BaseLLM):
        self.HUMAN_PROMPT = HUMAN_PROMPT
        self.AI_PROMPT = AI_PROMPT

-    def gen(self, model, messages, engine=None, max_tokens=300, stream=False, **kwargs):
+    def gen(self, model, messages, max_tokens=300, stream=False, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Context \n {context} \n ### Question \n {user_question}"
@@ -25,7 +25,7 @@ class AnthropicLLM(BaseLLM):
        )
        return completion.completion

-    def gen_stream(self, model, messages, engine=None, max_tokens=300, **kwargs):
+    def gen_stream(self, model, messages, max_tokens=300, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Context \n {context} \n ### Question \n {user_question}"
--- a/application/llm/docsgpt_provider.py
+++ b/application/llm/docsgpt_provider.py
@@ -8,7 +8,7 @@ class DocsGPTAPILLM(BaseLLM):
        self.endpoint =  "https://llm.docsgpt.co.uk"


-    def gen(self, model, engine, messages, stream=False, **kwargs):
+    def gen(self, model, messages, stream=False, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Instruction \n {user_question} \n ### Context \n {context} \n ### Answer \n"
@@ -24,7 +24,7 @@ class DocsGPTAPILLM(BaseLLM):

        return response_clean

-    def gen_stream(self, model, engine, messages, stream=True, **kwargs):
+    def gen_stream(self, model, messages, stream=True, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Instruction \n {user_question} \n ### Context \n {context} \n ### Answer \n"
--- a/application/llm/huggingface.py
+++ b/application/llm/huggingface.py
@@ -29,7 +29,7 @@ class HuggingFaceLLM(BaseLLM):
        )
        hf = HuggingFacePipeline(pipeline=pipe)

-    def gen(self, model, engine, messages, stream=False, **kwargs):
+    def gen(self, model, messages, stream=False, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Instruction \n {user_question} \n ### Context \n {context} \n ### Answer \n"
@@ -38,7 +38,7 @@ class HuggingFaceLLM(BaseLLM):

        return result.content

-    def gen_stream(self, model, engine, messages, stream=True, **kwargs):
+    def gen_stream(self, model, messages, stream=True, **kwargs):

        raise NotImplementedError("HuggingFaceLLM Streaming is not implemented yet.")

--- a/application/llm/llama_cpp.py
+++ b/application/llm/llama_cpp.py
@@ -12,7 +12,7 @@ class LlamaCpp(BaseLLM):

        llama = Llama(model_path=llm_name, n_ctx=2048)

-    def gen(self, model, engine, messages, stream=False, **kwargs):
+    def gen(self, model, messages, stream=False, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Instruction \n {user_question} \n ### Context \n {context} \n ### Answer \n"
@@ -24,7 +24,7 @@ class LlamaCpp(BaseLLM):
        
        return result['choices'][0]['text'].split('### Answer \n')[-1]

-    def gen_stream(self, model, engine, messages, stream=True, **kwargs):
+    def gen_stream(self, model, messages, stream=True, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Instruction \n {user_question} \n ### Context \n {context} \n ### Answer \n"
--- a/application/llm/openai.py
+++ b/application/llm/openai.py
@@ -18,7 +18,7 @@ class OpenAILLM(BaseLLM):
        
        return openai

-    def gen(self, model, engine, messages, stream=False, **kwargs):
+    def gen(self, model, messages, stream=False, engine=settings.AZURE_DEPLOYMENT_NAME, **kwargs):
        response = self.client.chat.completions.create(model=model,
            messages=messages,
            stream=stream,
@@ -26,7 +26,7 @@ class OpenAILLM(BaseLLM):

        return response.choices[0].message.content

-    def gen_stream(self, model, engine, messages, stream=True, **kwargs):
+    def gen_stream(self, model, messages, stream=True, engine=settings.AZURE_DEPLOYMENT_NAME, **kwargs):
        response = self.client.chat.completions.create(model=model,
            messages=messages,
            stream=stream,
--- a/application/llm/premai.py
+++ b/application/llm/premai.py
@@ -12,7 +12,7 @@ class PremAILLM(BaseLLM):
        self.api_key = api_key
        self.project_id = settings.PREMAI_PROJECT_ID

-    def gen(self, model, engine, messages, stream=False, **kwargs):
+    def gen(self, model, messages, stream=False, **kwargs):
        response = self.client.chat.completions.create(model=model,
            project_id=self.project_id,
            messages=messages,
@@ -21,7 +21,7 @@ class PremAILLM(BaseLLM):

        return response.choices[0].message["content"]

-    def gen_stream(self, model, engine, messages, stream=True, **kwargs):
+    def gen_stream(self, model, messages, stream=True, **kwargs):
        response = self.client.chat.completions.create(model=model,
            project_id=self.project_id,
            messages=messages,
--- a/application/llm/sagemaker.py
+++ b/application/llm/sagemaker.py
@@ -74,7 +74,7 @@ class SagemakerAPILLM(BaseLLM):
        self.runtime = runtime


-    def gen(self, model, engine, messages, stream=False, **kwargs):
+    def gen(self, model, messages, stream=False, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Instruction \n {user_question} \n ### Context \n {context} \n ### Answer \n"
@@ -103,7 +103,7 @@ class SagemakerAPILLM(BaseLLM):
        print(result[0]['generated_text'], file=sys.stderr)
        return result[0]['generated_text'][len(prompt):]

-    def gen_stream(self, model, engine, messages, stream=True, **kwargs):
+    def gen_stream(self, model, messages, stream=True, **kwargs):
        context = messages[0]['content']
        user_question = messages[-1]['content']
        prompt = f"### Instruction \n {user_question} \n ### Context \n {context} \n ### Answer \n"