From ea6bbbdc5a638864d99686f89430f8c69651e93e Mon Sep 17 00:00:00 2001
From: Adam Wilson <lightbrok3r@gmail.com>
Date: Thu, 21 Aug 2025 14:03:58 -0600
Subject: [PATCH] fix tests

---
 .../test_00_benign_prompts_no_mitigation.py   | 24 +++++++++----------
 ...test_01_malicious_prompts_no_mitigation.py | 19 ++++++++-------
 .../test_02_malicious_prompts_cot.py          | 19 ++++++++-------
 .../test_03_malicious_prompts_rag.py          | 17 +++++++------
 4 files changed, 43 insertions(+), 36 deletions(-)

diff --git a/tests/integration/test_00_benign_prompts_no_mitigation.py b/tests/integration/test_00_benign_prompts_no_mitigation.py
index 49c4d6793..9d7bb0a8c 100644
--- a/tests/integration/test_00_benign_prompts_no_mitigation.py
+++ b/tests/integration/test_00_benign_prompts_no_mitigation.py
@@ -1,12 +1,12 @@
-"""
-    Usage:
-    $ pytest -k test_00_benign_prompts_no_mitigation -s --disable-warnings
-"""
+import os
+import pytest
 
-from test_utils import run_prompt_analysis_test
+from src.text_generation.common.model_id import ModelId
 from src.text_generation.services.nlp.abstract_text_generation_completion_service import AbstractTextGenerationCompletionService
+from tests.integration.test_utils import run_prompt_analysis_test, get_prompt_batch
 
 
+@pytest.mark.mitigation
 def test_00_benign_prompts_no_mitigation(
     text_generation_completion_service: AbstractTextGenerationCompletionService,
     semantic_similarity_service,
@@ -16,18 +16,16 @@ def test_00_benign_prompts_no_mitigation(
     def configure_service(service):
         return service.without_guidelines()
     
-    if len(prompt_injection_all_example_responses) == 0:
-        raise ValueError('Unable to load prompt injection examples')
+    prompt_batch, start, end = get_prompt_batch(math_prompts)
 
     results = run_prompt_analysis_test(
         test_id=0,
+        model_id=ModelId.MICROSOFT_PHI_3_MINI4K_INSTRUCT,
         text_generation_completion_service=text_generation_completion_service,
         semantic_similarity_service=semantic_similarity_service,
-        prompts=math_prompts,
+        prompts=prompt_batch,
+        start=start,
+        end=end,
         comparison_texts=prompt_injection_all_example_responses,
         service_configurator=configure_service
-    )
-
-    for result in results:
-        assert result.mean < 0.5
-        assert result.max < 0.5
\ No newline at end of file
+    )
\ No newline at end of file
diff --git a/tests/integration/test_01_malicious_prompts_no_mitigation.py b/tests/integration/test_01_malicious_prompts_no_mitigation.py
index a4f43e4ae..d05e0f332 100644
--- a/tests/integration/test_01_malicious_prompts_no_mitigation.py
+++ b/tests/integration/test_01_malicious_prompts_no_mitigation.py
@@ -1,11 +1,9 @@
-"""
-    Usage:
-    $ pytest -k test_01_malicious_prompts_no_mitigation -s --disable-warnings
-"""
-
+import os
 import pytest
-from test_utils import run_prompt_analysis_test
+
+from src.text_generation.common.model_id import ModelId
 from src.text_generation.services.nlp.abstract_text_generation_completion_service import AbstractTextGenerationCompletionService
+from tests.integration.test_utils import run_prompt_analysis_test, get_prompt_batch
 
 
 @pytest.mark.mitigation
@@ -17,12 +15,17 @@ def test_01_malicious_prompts_no_mitigation(
 ):
     def configure_service(service):
         return service.without_guidelines()
-    
+
+    prompt_batch, start, end = get_prompt_batch(malicious_prompts)
+
     results = run_prompt_analysis_test(
         test_id=1,
+        model_id=ModelId.MICROSOFT_PHI_3_MINI4K_INSTRUCT,
         text_generation_completion_service=text_generation_completion_service,
         semantic_similarity_service=semantic_similarity_service,
-        prompts=malicious_prompts,
+        prompts=prompt_batch,
+        start=start,
+        end=end,
         comparison_texts=prompt_injection_all_example_responses,
         service_configurator=configure_service
     )
\ No newline at end of file
diff --git a/tests/integration/test_02_malicious_prompts_cot.py b/tests/integration/test_02_malicious_prompts_cot.py
index 757df3245..41e3c92b5 100644
--- a/tests/integration/test_02_malicious_prompts_cot.py
+++ b/tests/integration/test_02_malicious_prompts_cot.py
@@ -1,11 +1,9 @@
-"""
-    Usage:
-    $ pytest -k test_02_malicious_prompts_cot -s --disable-warnings
-"""
-
+import os
 import pytest
-from test_utils import run_prompt_analysis_test
+
+from src.text_generation.common.model_id import ModelId
 from src.text_generation.services.nlp.abstract_text_generation_completion_service import AbstractTextGenerationCompletionService
+from tests.integration.test_utils import run_prompt_analysis_test, get_prompt_batch
 
 
 @pytest.mark.mitigation
@@ -18,12 +16,17 @@ def test_02_malicious_prompts_cot(
     def configure_service(service):
         return (service
                 .with_chain_of_thought_guidelines())
-    
+
+    prompt_batch, start, end = get_prompt_batch(malicious_prompts)
+
     results = run_prompt_analysis_test(
         test_id=2,
+        model_id=ModelId.MICROSOFT_PHI_3_MINI4K_INSTRUCT,
         text_generation_completion_service=text_generation_completion_service,
         semantic_similarity_service=semantic_similarity_service,
-        prompts=malicious_prompts,
+        prompts=prompt_batch,
+        start=start,
+        end=end,
         comparison_texts=prompt_injection_all_example_responses,
         service_configurator=configure_service
     )
\ No newline at end of file
diff --git a/tests/integration/test_03_malicious_prompts_rag.py b/tests/integration/test_03_malicious_prompts_rag.py
index e530aad2d..a30a31804 100644
--- a/tests/integration/test_03_malicious_prompts_rag.py
+++ b/tests/integration/test_03_malicious_prompts_rag.py
@@ -1,11 +1,9 @@
-"""
-    Usage:
-    $ pytest -k test_03_malicious_prompts_rag -s --disable-warnings
-"""
-
+import os
 import pytest
-from test_utils import run_prompt_analysis_test
+
+from src.text_generation.common.model_id import ModelId
 from src.text_generation.services.nlp.abstract_text_generation_completion_service import AbstractTextGenerationCompletionService
+from tests.integration.test_utils import run_prompt_analysis_test, get_prompt_batch
 
 
 @pytest.mark.mitigation
@@ -19,11 +17,16 @@ def test_03_malicious_prompts_rag(
         return (service
                 .with_rag_context_guidelines())
     
+    prompt_batch, start, end = get_prompt_batch(malicious_prompts)
+
     results = run_prompt_analysis_test(
         test_id=3,
+        model_id=ModelId.MICROSOFT_PHI_3_MINI4K_INSTRUCT,
         text_generation_completion_service=text_generation_completion_service,
         semantic_similarity_service=semantic_similarity_service,
-        prompts=malicious_prompts,
+        prompts=prompt_batch,
+        start=start,
+        end=end,
         comparison_texts=prompt_injection_all_example_responses,
         service_configurator=configure_service
     )
\ No newline at end of file