From e5b6ed8bb703c32a2248661f30756f09a566a560 Mon Sep 17 00:00:00 2001
From: Mohsin Shah <websitemohsinshah@gmail.com>
Date: Sun, 28 Jan 2024 23:15:17 -0500
Subject: [PATCH 1/4] added generative text explainer, modified setup.py

Signed-off-by: Mohsin Shah <websitemohsinshah@gmail.com>
---
 .../managers/explainer_manager.py             | 64 ++++++++++++++++++-
 responsibleai_text/setup.py                   |  4 ++
 2 files changed, 65 insertions(+), 3 deletions(-)

diff --git a/responsibleai_text/responsibleai_text/managers/explainer_manager.py b/responsibleai_text/responsibleai_text/managers/explainer_manager.py
index 870af5af88..aebfb221c8 100644
--- a/responsibleai_text/responsibleai_text/managers/explainer_manager.py
+++ b/responsibleai_text/responsibleai_text/managers/explainer_manager.py
@@ -29,6 +29,24 @@
                                                  Tokens)
 from responsibleai_text.utils.question_answering import QAPredictor
 
+try:
+    from interpret_text.generative.lime_tools.explainers import (
+        LocalExplanationSentenceEmbedder
+    )
+except ImportError as e:
+    print("Could not import LocalExplanationSentenceEmbedder: ", e)
+
+try:
+    from interpret_text.generative.model_lib.openai_tooling import ChatOpenAI
+except ImportError as e:
+    print("Could not import ChatOpenAI: ", e)
+
+try:
+    from sentence_transformers import SentenceTransformer
+except ImportError as e:
+    print("Could not import SentenceTransformer: ", e)
+
+
 CONTEXT = QuestionAnsweringFields.CONTEXT
 QUESTIONS = QuestionAnsweringFields.QUESTIONS
 SEP = Tokens.SEP
@@ -74,10 +92,13 @@ def __init__(self, model: Any, evaluation_examples: pd.DataFrame,
         """
         self._model = model
         self._target_column = target_column
-        if not isinstance(target_column, list):
+        if not isinstance(target_column, (list, type(None))):
             target_column = [target_column]
-        self._evaluation_examples = \
-            evaluation_examples.drop(columns=target_column)
+        if target_column is None:
+            self._evaluation_examples = evaluation_examples
+        else:
+            self._evaluation_examples = \
+                evaluation_examples.drop(columns=target_column)
         self._is_run = False
         self._is_added = False
         self._features = list(self._evaluation_examples.columns)
@@ -131,6 +152,43 @@ def compute(self):
                 eval_examples.append(question + SEP + context)
             self._explanation = [explainer_start(eval_examples),
                                  explainer_end(eval_examples)]
+        elif self._task_type == ModelTask.GENERATIVE_TEXT:
+            context = self._evaluation_examples[CONTEXT]
+            questions = self._evaluation_examples[QUESTIONS]
+            eval_examples = []
+            for context, question in zip(context, questions):
+                eval_examples.append(question + SEP + context)
+
+            sentence_embedder = SentenceTransformer('all-MiniLM-L6-v2')
+            explainer = LocalExplanationSentenceEmbedder(
+                sentence_embedder=sentence_embedder,
+                perturbation_model="removal",
+                partition_fn="sentences",
+                progress_bar=None)
+            max_completion = 50  # Define max tokens for the completion
+
+            api_settings = {
+                "api_type": self._model.model.api_type,
+                "api_base": self._model.model.api_base,
+                "api_version": self._model.model.api_version,
+                "api_key": self._model.model.api_key
+            }
+            model_wrapped = ChatOpenAI(
+                engine=self._model.model.engine,
+                encoding="cl100k_base",
+                api_settings=api_settings)
+            completions = model_wrapped.sample(
+                eval_examples, max_new_tokens=max_completion)
+
+            explanation = []
+            for i, completion in enumerate(completions):
+                attribution, parts = explainer.attribution(model_wrapped,
+                                                           eval_examples[i],
+                                                           completion,
+                                                           )
+                explanation.append((attribution, parts))
+
+            self._explanation = explanation
         else:
             raise ValueError("Unknown task type: {}".format(self._task_type))
 
diff --git a/responsibleai_text/setup.py b/responsibleai_text/setup.py
index 8b0bada790..9c9a7b689e 100644
--- a/responsibleai_text/setup.py
+++ b/responsibleai_text/setup.py
@@ -24,6 +24,10 @@
         'bert_score',
         'nltk',
         'rouge_score'
+    ],
+    "generative_text": [
+        'interpret_text',
+        'sentence_transformers'
     ]
 }
 setuptools.setup(

From 495001c63832e6dbdf20ce017c2839fb2f6345ae Mon Sep 17 00:00:00 2001
From: Mohsin Shah <websitemohsinshah@gmail.com>
Date: Mon, 29 Jan 2024 00:04:44 -0500
Subject: [PATCH 2/4] isort fix

Signed-off-by: Mohsin Shah <websitemohsinshah@gmail.com>
---
 .../responsibleai_text/managers/explainer_manager.py           | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/responsibleai_text/responsibleai_text/managers/explainer_manager.py b/responsibleai_text/responsibleai_text/managers/explainer_manager.py
index aebfb221c8..0c24de4014 100644
--- a/responsibleai_text/responsibleai_text/managers/explainer_manager.py
+++ b/responsibleai_text/responsibleai_text/managers/explainer_manager.py
@@ -30,9 +30,8 @@
 from responsibleai_text.utils.question_answering import QAPredictor
 
 try:
-    from interpret_text.generative.lime_tools.explainers import (
+    from interpret_text.generative.lime_tools.explainers import \
         LocalExplanationSentenceEmbedder
-    )
 except ImportError as e:
     print("Could not import LocalExplanationSentenceEmbedder: ", e)
 

From 854f2f9c4b541b590726aefb12880cd7f95a6bb5 Mon Sep 17 00:00:00 2001
From: Mohsin Shah <websitemohsinshah@gmail.com>
Date: Mon, 29 Jan 2024 10:31:57 -0500
Subject: [PATCH 3/4] improved error handling

Signed-off-by: Mohsin Shah <websitemohsinshah@gmail.com>
---
 .../managers/explainer_manager.py             | 36 +++++++++++++++----
 1 file changed, 30 insertions(+), 6 deletions(-)

diff --git a/responsibleai_text/responsibleai_text/managers/explainer_manager.py b/responsibleai_text/responsibleai_text/managers/explainer_manager.py
index 0c24de4014..25c41fa364 100644
--- a/responsibleai_text/responsibleai_text/managers/explainer_manager.py
+++ b/responsibleai_text/responsibleai_text/managers/explainer_manager.py
@@ -32,18 +32,21 @@
 try:
     from interpret_text.generative.lime_tools.explainers import \
         LocalExplanationSentenceEmbedder
-except ImportError as e:
-    print("Could not import LocalExplanationSentenceEmbedder: ", e)
+    interpret_text_explainers_installed = True
+except ImportError:
+    interpret_text_explainers_installed = False
 
 try:
     from interpret_text.generative.model_lib.openai_tooling import ChatOpenAI
-except ImportError as e:
-    print("Could not import ChatOpenAI: ", e)
+    interpret_text_openai_tooling_installed = True
+except ImportError:
+    interpret_text_openai_tooling_installed = False
 
 try:
     from sentence_transformers import SentenceTransformer
-except ImportError as e:
-    print("Could not import SentenceTransformer: ", e)
+    sentence_transformers_installed = True
+except ImportError:
+    sentence_transformers_installed = False
 
 
 CONTEXT = QuestionAnsweringFields.CONTEXT
@@ -152,6 +155,27 @@ def compute(self):
             self._explanation = [explainer_start(eval_examples),
                                  explainer_end(eval_examples)]
         elif self._task_type == ModelTask.GENERATIVE_TEXT:
+            if not interpret_text_explainers_installed:
+                error = (
+                    "The required module"
+                    "'interpret_text.generative.lime_tools.explainers' "
+                    "is not installed."
+                )
+                raise RuntimeError(error)
+            if not interpret_text_openai_tooling_installed:
+                error = (
+                    "The required module"
+                    "'interpret_text.generative.model_lib.openai_tooling' "
+                    "is not installed."
+                )
+                raise RuntimeError(error)
+            if not sentence_transformers_installed:
+                error = (
+                    "The required package"
+                    "'sentence_transformers' "
+                    "is not installed."
+                )
+                raise RuntimeError(error)
             context = self._evaluation_examples[CONTEXT]
             questions = self._evaluation_examples[QUESTIONS]
             eval_examples = []

From bf0559f639ebc2e623d0e3d7b50413a89e41069e Mon Sep 17 00:00:00 2001
From: Mohsin Shah <websitemohsinshah@gmail.com>
Date: Mon, 29 Jan 2024 12:42:22 -0500
Subject: [PATCH 4/4] explainer now works without context and questions columns

Signed-off-by: Mohsin Shah <websitemohsinshah@gmail.com>
---
 .../managers/explainer_manager.py             | 20 ++++++++++++++-----
 1 file changed, 15 insertions(+), 5 deletions(-)

diff --git a/responsibleai_text/responsibleai_text/managers/explainer_manager.py b/responsibleai_text/responsibleai_text/managers/explainer_manager.py
index 25c41fa364..265bef60fd 100644
--- a/responsibleai_text/responsibleai_text/managers/explainer_manager.py
+++ b/responsibleai_text/responsibleai_text/managers/explainer_manager.py
@@ -62,6 +62,7 @@
 MODEL = Metadata.MODEL
 EXPLANATION = '_explanation'
 TASK_TYPE = '_task_type'
+PROMPT = 'prompt'
 
 
 class ExplainerManager(BaseManager):
@@ -176,12 +177,21 @@ def compute(self):
                     "is not installed."
                 )
                 raise RuntimeError(error)
-            context = self._evaluation_examples[CONTEXT]
-            questions = self._evaluation_examples[QUESTIONS]
-            eval_examples = []
-            for context, question in zip(context, questions):
-                eval_examples.append(question + SEP + context)
 
+            if CONTEXT in self._evaluation_examples.columns and \
+                    QUESTIONS in self._evaluation_examples.columns:
+                context = self._evaluation_examples[CONTEXT]
+                questions = self._evaluation_examples[QUESTIONS]
+                eval_examples = []
+                for context, question in zip(context, questions):
+                    eval_examples.append(question + SEP + context)
+            elif PROMPT in self._evaluation_examples.columns:
+                eval_examples = self._evaluation_examples[PROMPT].tolist()
+            else:
+                raise ValueError(
+                    "Neither 'context'/'questions' nor 'prompt' columns "
+                    "are present in the evaluation_examples DataFrame"
+                )
             sentence_embedder = SentenceTransformer('all-MiniLM-L6-v2')
             explainer = LocalExplanationSentenceEmbedder(
                 sentence_embedder=sentence_embedder,