auto-rag

Need vectorstores testing for all except faiss
2025-11-30 00:53:14 +00:00 · 2025-06-08 22:08:23 +02:00
parent c0f693d35d
commit 01ea90f39a
12 changed files with 1971 additions and 1474 deletions
--- a/application/retriever/classic_rag.py
+++ b/application/retriever/classic_rag.py
@@ -2,11 +2,16 @@ import logging
 from application.core.settings import settings
 from application.llm.llm_creator import LLMCreator
 from application.retriever.base import BaseRetriever
-
 from application.vectorstore.vector_creator import VectorCreator

+logger = logging.getLogger(__name__)

 class ClassicRAG(BaseRetriever):
+    # Settings for Auto-Chunking
+    AUTO_CHUNK_MIN: int = 0
+    AUTO_CHUNK_MAX: int = 10
+    SIMILARITY_SCORE_THRESHOLD: float = 0.5
+    
    def __init__(
        self,
        source,
@@ -47,6 +52,7 @@ class ClassicRAG(BaseRetriever):
        self.question = self._rephrase_query()
        self.vectorstore = source["active_docs"] if "active_docs" in source else None
        self.decoded_token = decoded_token
+        self.actual_chunks_retrieved = 0

    def _rephrase_query(self):
        if (
@@ -77,8 +83,66 @@ class ClassicRAG(BaseRetriever):
            return self.original_question

    def _get_data(self):
+        if self.chunks == 'Auto':
+            return self._get_data_auto()
+        else:
+            return self._get_data_classic()
+
+    def _get_data_auto(self):
+        if not self.vectorstore:
+            self.actual_chunks_retrieved = 0
+            return []
+
+        docsearch = VectorCreator.create_vectorstore(
+            settings.VECTOR_STORE, self.vectorstore, settings.EMBEDDINGS_KEY
+        )
+        
+        try:
+            docs_with_scores = docsearch.search_with_scores(self.question, k=self.AUTO_CHUNK_MAX)
+        except Exception as e:
+            logger.error(f"Error during search_with_scores: {e}", exc_info=True)
+            self.actual_chunks_retrieved = 0
+            return []
+        
+        if not docs_with_scores:
+            self.actual_chunks_retrieved = 0
+            return []
+
+        candidate_docs = []
+        for doc, score in docs_with_scores:
+            if score >= self.SIMILARITY_SCORE_THRESHOLD:
+                candidate_docs.append(doc)
+                
+        if len(candidate_docs) < self.AUTO_CHUNK_MIN and self.AUTO_CHUNK_MIN > 0:
+            final_docs_to_format = [doc for doc, score in docs_with_scores[:self.AUTO_CHUNK_MIN]]
+        else:
+            final_docs_to_format = candidate_docs
+            
+        self.actual_chunks_retrieved = len(final_docs_to_format)
+        
+        if not final_docs_to_format:
+            return []
+
+        formatted_docs = [
+            {
+                "title": i.metadata.get(
+                    "title", i.metadata.get("post_title", i.page_content)
+                ).split("/")[-1],
+                "text": i.page_content,
+                "source": (
+                    i.metadata.get("source")
+                    if i.metadata.get("source")
+                    else "local"
+                ),
+            }
+            for i in final_docs_to_format
+        ]
+        logger.info(f"AutoRAG: Retrieved {self.actual_chunks_retrieved} chunks for query '{self.original_question}'.")
+        return formatted_docs
+
+    def _get_data_classic(self):
        if self.chunks == 0:
-            docs = []
+            return []
        else:
            docsearch = VectorCreator.create_vectorstore(
                settings.VECTOR_STORE, self.vectorstore, settings.EMBEDDINGS_KEY
@@ -98,8 +162,7 @@ class ClassicRAG(BaseRetriever):
                }
                for i in docs_temp
            ]
-
-        return docs
+            return docs

    def gen():
        pass
@@ -111,12 +174,24 @@ class ClassicRAG(BaseRetriever):
        return self._get_data()

    def get_params(self):
-        return {
+        params = {
            "question": self.original_question,
            "rephrased_question": self.question,
            "source": self.vectorstore,
-            "chunks": self.chunks,
            "token_limit": self.token_limit,
            "gpt_model": self.gpt_model,
            "user_api_key": self.user_api_key,
        }
+        if self.chunks == 'Auto':
+            params.update({
+                "chunks_mode": "Auto",
+                "chunks_retrieved_auto": self.actual_chunks_retrieved,
+                "auto_chunk_min_setting": self.AUTO_CHUNK_MIN,
+                "auto_chunk_max_setting": self.AUTO_CHUNK_MAX,
+                "similarity_threshold_setting": self.SIMILARITY_SCORE_THRESHOLD,
+            })
+        else:
+            params["chunks_mode"] = "Classic"
+            params["chunks"] = self.chunks
+
+        return params