vocodedev · ajar98 · Nov 30, 2023 · Nov 17, 2023 · Nov 17, 2023 · Nov 30, 2023
diff --git a/.gitignore b/.gitignore
@@ -10,3 +10,4 @@ credentials.json
 benchmark_results/
 private.key
 dump.rdb
+.idea
diff --git a/poetry.lock b/poetry.lock
diff --git a/pyproject.toml b/pyproject.toml
@@ -24,7 +24,7 @@ six = "^1.16.0"
 opentelemetry-sdk = "^1.17.0"
 janus = "^1.0.0"
 scipy = "^1.10.1"
-anthropic = "^0.2.9"
+anthropic = "^0.7.1"
 
 elevenlabs = {version = "^0.2.6", optional = true}
 google-cloud-texttospeech = {version = "^2.14.1", optional = true}

diff --git a/vocode/streaming/agent/anthropic_agent.py b/vocode/streaming/agent/anthropic_agent.py
@@ -58,7 +58,7 @@ def __init__(
 
         # streaming not well supported by langchain, so we will connect directly
         self.anthropic_client = (
-            anthropic.Client(api_key=anthropic_api_key)
+            anthropic.AsyncAnthropic(api_key=anthropic_api_key)
             if agent_config.generate_responses
             else None
         )
@@ -98,25 +98,23 @@ async def generate_response(
         self.memory.chat_memory.messages.append(bot_memory_message)
         prompt = self.llm._convert_messages_to_prompt(self.memory.chat_memory.messages)
 
-        streamed_response = await self.anthropic_client.acompletion_stream(
-            prompt=prompt,
-            max_tokens_to_sample=self.agent_config.max_tokens_to_sample,
-            model=self.agent_config.model_name,
-        )
-
-        buffer = ""
-        async for message in streamed_response:
-            completion = message["completion"]
-            delta = completion[len(bot_memory_message.content + buffer) :]
-            buffer += delta
-
-            sentence, remainder = get_sentence_from_buffer(buffer)
+        if self.anthropic_client:
+            streamed_response = await self.anthropic_client.completions.create(
+                prompt=prompt,
+                max_tokens_to_sample=self.agent_config.max_tokens_to_sample,
+                model=self.agent_config.model_name,
+                stream=True,
+            )
 
-            if sentence:
-                bot_memory_message.content = bot_memory_message.content + sentence
-                buffer = remainder
-                yield sentence, True
-            continue
+            buffer = ""
+            async for completion in streamed_response:
+                buffer += completion.completion
+                sentence, remainder = get_sentence_from_buffer(buffer)
+                if sentence:
+                    bot_memory_message.content = bot_memory_message.content + sentence
+                    buffer = remainder
+                    yield sentence, True
+                continue
 
     def update_last_bot_message_on_cut_off(self, message: str):
         for memory_message in self.memory.chat_memory.messages[::-1]: