Merge pull request #23 from mohamed-em2m/patch-4

kkkjz · web-flow · commit b15223e6cbac · 2025-07-12T23:24:59.000+08:00
fix changing models bug
diff --git a/memoryos-pypi/memoryos.py b/memoryos-pypi/memoryos.py
@@ -44,6 +44,7 @@ def __init__(self, user_id: str,
         self.assistant_id = assistant_id
         self.data_storage_path = os.path.abspath(data_storage_path)
         self.llm_model = llm_model
+        os.environ["llm_model"]= llm_model
         self.mid_term_similarity_threshold = mid_term_similarity_threshold
 
         print(f"Initializing Memoryos for user '{self.user_id}' and assistant '{self.assistant_id}'. Data path: {self.data_storage_path}")
@@ -328,4 +329,4 @@ def force_mid_term_analysis(self):
         self.mid_term_heat_threshold = original_threshold # Restore original threshold
 
     def __repr__(self):
-        return f"<Memoryos user_id='{self.user_id}' assistant_id='{self.assistant_id}' data_path='{self.data_storage_path}'>" 
+        return f"<Memoryos user_id='{self.user_id}' assistant_id='{self.assistant_id}' data_path='{self.data_storage_path}'>" 
diff --git a/memoryos-pypi/utils.py b/memoryos-pypi/utils.py
@@ -73,7 +73,9 @@ def batch_chat_completion(self, requests):
         futures = []
         for req in requests:
             future = self.chat_completion_async(
-                model=req.get("model", "gpt-4o-mini"),
+                model=req.get("model",     
+                               model=os.environ.get("llm_model") 
+                              ),
                 messages=req["messages"],
                 temperature=req.get("temperature", 0.7),
                 max_tokens=req.get("max_tokens", 2000)
@@ -183,6 +185,7 @@ def compute_time_decay(event_timestamp_str, current_timestamp_str, tau_hours=24)
 # ---- LLM-based Utility Functions ----
 
 def gpt_summarize_dialogs(dialogs, client: OpenAIClient, model="gpt-4o-mini"):
+    model=os.environ.get("llm_model") or model
     dialog_text = "\n".join([f"User: {d.get('user_input','')} Assistant: {d.get('agent_response','')}" for d in dialogs])
     messages = [
         {"role": "system", "content": prompts.SUMMARIZE_DIALOGS_SYSTEM_PROMPT},
@@ -192,6 +195,7 @@ def gpt_summarize_dialogs(dialogs, client: OpenAIClient, model="gpt-4o-mini"):
     return client.chat_completion(model=model, messages=messages)
 
 def gpt_generate_multi_summary(text, client: OpenAIClient, model="gpt-4o-mini"):
+    model=os.environ.get("llm_model") or model
     messages = [
         {"role": "system", "content": prompts.MULTI_SUMMARY_SYSTEM_PROMPT},
         {"role": "user", "content": prompts.MULTI_SUMMARY_USER_PROMPT.format(text=text)}
@@ -211,6 +215,7 @@ def gpt_user_profile_analysis(dialogs, client: OpenAIClient, model="gpt-4o-mini"
     Analyze and update user personality profile from dialogs
     结合现有画像和新对话，直接输出更新后的完整画像
     """
+    model=os.environ.get("llm_model") or model
     conversation = "\n".join([f"User: {d.get('user_input','')} (Timestamp: {d.get('timestamp', '')})\nAssistant: {d.get('agent_response','')} (Timestamp: {d.get('timestamp', '')})" for d in dialogs])
     messages = [
         {"role": "system", "content": prompts.PERSONALITY_ANALYSIS_SYSTEM_PROMPT},
@@ -226,6 +231,7 @@ def gpt_user_profile_analysis(dialogs, client: OpenAIClient, model="gpt-4o-mini"
 
 def gpt_knowledge_extraction(dialogs, client: OpenAIClient, model="gpt-4o-mini"):
     """Extract user private data and assistant knowledge from dialogs"""
+    model=os.environ.get("llm_model") or model
     conversation = "\n".join([f"User: {d.get('user_input','')} (Timestamp: {d.get('timestamp', '')})\nAssistant: {d.get('agent_response','')} (Timestamp: {d.get('timestamp', '')})" for d in dialogs])
     messages = [
         {"role": "system", "content": prompts.KNOWLEDGE_EXTRACTION_SYSTEM_PROMPT},
@@ -270,6 +276,7 @@ def gpt_personality_analysis(dialogs, client: OpenAIClient, model="gpt-4o-mini",
     This function is kept for backward compatibility only.
     """
     # Call the new functions
+    model=os.environ.get("llm_model") or model
     profile = gpt_user_profile_analysis(dialogs, client, model, known_user_traits)
     knowledge_data = gpt_knowledge_extraction(dialogs, client, model)
     
@@ -281,6 +288,7 @@ def gpt_personality_analysis(dialogs, client: OpenAIClient, model="gpt-4o-mini",
 
 
 def gpt_update_profile(old_profile, new_analysis, client: OpenAIClient, model="gpt-4o-mini"):
+    model=os.environ.get("llm_model") or model
     messages = [
         {"role": "system", "content": prompts.UPDATE_PROFILE_SYSTEM_PROMPT},
         {"role": "user", "content": prompts.UPDATE_PROFILE_USER_PROMPT.format(old_profile=old_profile, new_analysis=new_analysis)}
@@ -289,6 +297,8 @@ def gpt_update_profile(old_profile, new_analysis, client: OpenAIClient, model="g
     return client.chat_completion(model=model, messages=messages)
 
 def gpt_extract_theme(answer_text, client: OpenAIClient, model="gpt-4o-mini"):
+    model=os.environ.get("llm_model") or model
+
     messages = [
         {"role": "system", "content": prompts.EXTRACT_THEME_SYSTEM_PROMPT},
         {"role": "user", "content": prompts.EXTRACT_THEME_USER_PROMPT.format(answer_text=answer_text)}
@@ -297,6 +307,9 @@ def gpt_extract_theme(answer_text, client: OpenAIClient, model="gpt-4o-mini"):
     return client.chat_completion(model=model, messages=messages)
 
 def llm_extract_keywords(text, client: OpenAIClient, model="gpt-4o-mini"):
+    
+    model=os.environ.get("llm_model") or model
+
     messages = [
         {"role": "system", "content": prompts.EXTRACT_KEYWORDS_SYSTEM_PROMPT},
         {"role": "user", "content": prompts.EXTRACT_KEYWORDS_USER_PROMPT.format(text=text)}
@@ -309,7 +322,8 @@ def llm_extract_keywords(text, client: OpenAIClient, model="gpt-4o-mini"):
 def check_conversation_continuity(previous_page, current_page, client: OpenAIClient, model="gpt-4o-mini"):
     prev_user = previous_page.get("user_input", "") if previous_page else ""
     prev_agent = previous_page.get("agent_response", "") if previous_page else ""
-    
+    model=os.environ.get("llm_model") or model
+
     user_prompt = prompts.CONTINUITY_CHECK_USER_PROMPT.format(
         prev_user=prev_user,
         prev_agent=prev_agent,
@@ -324,6 +338,7 @@ def check_conversation_continuity(previous_page, current_page, client: OpenAICli
     return response.strip().lower() == "true"
 
 def generate_page_meta_info(last_page_meta, current_page, client: OpenAIClient, model="gpt-4o-mini"):
+    model=os.environ.get("llm_model") or model
     current_conversation = f"User: {current_page.get('user_input', '')}\nAssistant: {current_page.get('agent_response', '')}"
     user_prompt = prompts.META_INFO_USER_PROMPT.format(
         last_meta=last_page_meta if last_page_meta else "None",