lm-sys · icowan · Apr 18, 2024 · Apr 24, 2024 · Apr 24, 2024 · Apr 25, 2024
diff --git a/Dockerfile b/Dockerfile
@@ -0,0 +1,20 @@
+FROM python:3.10.14-alpine
+
+LABEL maintainer="[email protected]"
+
+RUN apk add gcc python3-dev musl-dev linux-headers
+
+RUN pip3 config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
+
+RUN pip3 install --no-cache-dir aiohttp fastapi httpx \
+    markdown2[all] nh3 numpy prompt_toolkit>=3.0.0 \
+    pydantic psutil requests rich>=10.0.0 \
+    shortuuid tiktoken uvicorn
+
+WORKDIR /app
+
+COPY . /app/
+RUN pip3 install -e .
+RUN pip3 install pydantic
+
+CMD ["python3", "-m", "fastchat.serve.controller", "--host", "0.0.0.0"]
diff --git a/fastchat/conversation.py b/fastchat/conversation.py
@@ -39,6 +39,7 @@ class SeparatorStyle(IntEnum):
     GEMMA = auto()
     CLLM = auto()
     DEFAULT = auto()
+    OPENBUDDY_LLAMA3 = auto()
 
 
 IMAGE_PLACEHOLDER_STR = "$$<image>$$"
@@ -134,9 +135,9 @@ def get_prompt(self) -> str:
             for i, (role, message) in enumerate(self.messages):
                 if message:
                     ret += (
-                        role
-                        + ": "
-                        + message.replace("\r\n", "\n").replace("\n\n", "\n")
+                            role
+                            + ": "
+                            + message.replace("\r\n", "\n").replace("\n\n", "\n")
                     )
                     ret += "\n\n"
                 else:
@@ -193,12 +194,16 @@ def get_prompt(self) -> str:
             ret = "" if system_prompt == "" else system_prompt + self.sep + "\n"
             for role, message in self.messages:
                 if message:
-                    if type(message) is tuple:
-                        message, images = message
-                        message = IMAGE_PLACEHOLDER_STR * len(images) + message
-                    ret += role + "\n" + message + self.sep + "\n"
+                    if isinstance(message, tuple):
+                        message, images = message if len(message) > 1 else (message[0], [])
+                        images = images if images is not None else []
+                        message = (IMAGE_PLACEHOLDER_STR * len(images) if images else "") + (
+                            message if message is not None else "")
+                    else:
+                        message = message if message is not None else ""
+                    ret += f"{role}\n{message}{self.sep}\n"
                 else:
-                    ret += role + "\n"
+                    ret += f"{role}\n"
             return ret
         elif self.sep_style == SeparatorStyle.CHATGLM3:
             ret = ""
@@ -321,16 +326,24 @@ def get_prompt(self) -> str:
                 else:
                     ret += role + ":"
             return ret
+        elif self.sep_style == SeparatorStyle.OPENBUDDY_LLAMA3:
+            ret = system_prompt + "\n"
+            for role, message in self.messages:
+                if message:
+                    ret += f"<|role|>{role}<|says|>{message}<|end|>\n"
+                else:
+                    ret += f"<|role|>{role}<|says|>\n"
+            return ret
         else:
             raise ValueError(f"Invalid style: {self.sep_style}")
 
     def get_images(self):
         images = []
-        for i, (role, msg) in enumerate(self.messages[self.offset :]):
+        for i, (role, msg) in enumerate(self.messages[self.offset:]):
             if i % 2 == 0:
                 if type(msg) is tuple:
                     for image in msg[1]:
-                        images.append(image.base64_str)
+                        images.append(image)
 
         return images
 
@@ -361,7 +374,7 @@ def to_gradio_chatbot(self):
         from fastchat.serve.vision.image import ImageFormat
 
         ret = []
-        for i, (role, msg) in enumerate(self.messages[self.offset :]):
+        for i, (role, msg) in enumerate(self.messages[self.offset:]):
             if i % 2 == 0:
                 if type(msg) is tuple:
                     msg, images = msg
@@ -415,14 +428,76 @@ def to_openai_vision_api_messages(self):
                     )
         return ret
 
+    def to_openai_image_format(self, image_urls):
+        import base64
+
+        openai_images = []
+        for image_url in image_urls:
+            if image_url.startswith("http://") or image_url.startswith(
+                "https://"
+            ):  # input is a url
+                openai_images.append(image_url)
+            elif image_url.lower().endswith(
+                ("png", "jpg", "jpeg", "webp", "gif")
+            ):  # input is a local image
+                img_b64_str = self.convert_image_to_base64(image_url)
+                filetype = image_url.split(".")[-1].lower()
+                openai_images.append(f"data:image/{filetype};base64,{img_b64_str}")
+            else:
+                try:
+                    assert (
+                        base64.b64encode(base64.b64decode(image_url))
+                        == image_url.encode()
+                    ), "The image data is not a valid base64 encoded string"
+                    openai_images.append(f"data:image/jpeg;base64,{image_url}")
+                except:
+                    raise ValueError(
+                        f"This file is not valid or not currently supported by the OpenAI API: {image_url}"
+                    )
+        return openai_images
+
+    def to_openai_vision_api_messages(self):
+        """Convert the conversation to OpenAI vision api completion format"""
+        ret = [
+            {
+                "role": "system",
+                "content": [{"type": "text", "text": self.system_message}],
+            }
+        ]
+        for i, (_, msg) in enumerate(self.messages[self.offset :]):
+            if i % 2 == 0:
+                if type(msg) is tuple:
+                    content_list = [{"type": "text", "text": msg[0]}]
+
+                    image_urls = self.to_openai_image_format(msg[1])
+                    for image_url in image_urls:
+                        content_list.append(
+                            {"type": "image_url", "image_url": {"url": image_url}}
+                        )
+
+                    ret.append({"role": "user", "content": content_list})
+                else:
+                    ret.append(
+                        {"role": "user", "content": [{"type": "text", "text": msg}]}
+                    )
+            else:
+                if msg is not None:
+                    ret.append(
+                        {
+                            "role": "assistant",
+                            "content": [{"type": "text", "text": msg}],
+                        }
+                    )
+        return ret
+
     def to_openai_api_messages(self):
         """Convert the conversation to OpenAI chat completion format."""
         if self.system_message == "":
             ret = []
         else:
             ret = [{"role": "system", "content": self.system_message}]
 
-        for i, (_, msg) in enumerate(self.messages[self.offset :]):
+        for i, (_, msg) in enumerate(self.messages[self.offset:]):
             if i % 2 == 0:
                 ret.append({"role": "user", "content": msg})
             else:
@@ -667,7 +742,7 @@ def register_conv_template(template: Conversation, override: bool = False):
     """Register a new conversation template."""
     if not override:
         assert (
-            template.name not in conv_templates
+                template.name not in conv_templates
         ), f"{template.name} has been registered."
 
     conv_templates[template.name] = template
@@ -694,7 +769,7 @@ def get_conv_template(name: str) -> Conversation:
     Conversation(
         name="one_shot",
         system_message="A chat between a curious human and an artificial intelligence assistant. "
-        "The assistant gives helpful, detailed, and polite answers to the human's questions.",
+                       "The assistant gives helpful, detailed, and polite answers to the human's questions.",
         roles=("Human", "Assistant"),
         messages=(
             (
@@ -1015,6 +1090,27 @@ def get_conv_template(name: str) -> Conversation:
     )
 )
 
+# Buddy default template
+register_conv_template(
+    Conversation(
+        name="openbuddy-llama3",
+        system_message="""<|role|>system<|says|>You(assistant) are a helpful, respectful and honest INTP-T AI Assistant named Buddy. You are talking to a human(user).
+Always answer as helpfully and logically as possible, while being safe. Your answers should not include any harmful, political, religious, unethical, racist, sexist, toxic, dangerous, or illegal content. Please ensure that your responses are socially unbiased and positive in nature.
+You cannot access the internet, but you have vast knowledge, cutoff: 2023-04.
+You are trained by OpenBuddy team, (https://openbuddy.ai, https://github.com/OpenBuddy/OpenBuddy), not related to GPT or OpenAI.<|end|>
+<|role|>user<|says|>History input 1<|end|>
+<|role|>assistant<|says|>History output 1<|end|>
+<|role|>user<|says|>History input 2<|end|>
+<|role|>assistant<|says|>History output 2<|end|>
+<|role|>user<|says|>Current input<|end|>
+<|role|>assistant<|says|>
+""",
+        roles=("user", "assistant"),
+        sep_style=SeparatorStyle.OPENBUDDY_LLAMA3,
+        sep="\n",
+    )
+)
+
 # Phoenix default template
 register_conv_template(
     Conversation(
@@ -1437,7 +1533,8 @@ def get_conv_template(name: str) -> Conversation:
         sep_style=SeparatorStyle.RWKV,
         sep="\n",
         sep2="<|endoftext|>",
-        stop_str="\nUser",  # use stop_str to stop generation after stop_token_ids, it will also remove stop_str from the generated text
+        stop_str="\nUser",
+        # use stop_str to stop generation after stop_token_ids, it will also remove stop_str from the generated text
         stop_token_ids=[
             0,
             1,
@@ -1878,7 +1975,8 @@ def get_conv_template(name: str) -> Conversation:
         sep_style=SeparatorStyle.FALCON_CHAT,
         sep="\n",
         sep2="<|endoftext|>",
-        stop_str="\nUser:",  # use stop_str to stop generation after stop_token_ids, it will also remove stop_str from the generated text
+        stop_str="\nUser:",
+        # use stop_str to stop generation after stop_token_ids, it will also remove stop_str from the generated text
     )
 )
 

diff --git a/fastchat/model/model_adapter.py b/fastchat/model/model_adapter.py
@@ -1570,6 +1570,20 @@ def load_model(self, model_path: str, from_pretrained_kwargs: dict):
     def get_default_conv_template(self, model_path: str) -> Conversation:
         return get_conv_template("llama-2")
 
+class Llama3Adapter(BaseModelAdapter):
+    """The model adapter for Llama-3 (e.g., meta-llama/Meta-Llama-3-8B-Instruct)"""
+
+    def match(self, model_path: str):
+        return "meta-llama-3" in model_path.lower()
+
+    def load_model(self, model_path: str, from_pretrained_kwargs: dict):
+        model, tokenizer = super().load_model(model_path, from_pretrained_kwargs)
+        model.config.eos_token_id = tokenizer.eos_token_id
+        model.config.pad_token_id = tokenizer.pad_token_id
+        return model, tokenizer
+
+    def get_default_conv_template(self, model_path: str) -> Conversation:
+        return get_conv_template("llama-2")
 
 class Llama3Adapter(BaseModelAdapter):
     """The model adapter for Llama-3 (e.g., meta-llama/Meta-Llama-3-8B-Instruct)"""

diff --git a/fastchat/protocol/openai_api_protocol.py b/fastchat/protocol/openai_api_protocol.py
@@ -72,6 +72,7 @@ class ChatCompletionRequest(BaseModel):
     presence_penalty: Optional[float] = 0.0
     frequency_penalty: Optional[float] = 0.0
     user: Optional[str] = None
+    seed: Optional[int] = None
 
 
 class ChatMessage(BaseModel):
@@ -166,6 +167,7 @@ class CompletionRequest(BaseModel):
     user: Optional[str] = None
     use_beam_search: Optional[bool] = False
     best_of: Optional[int] = None
+    seed: Optional[int] = None
 
 
 class CompletionResponseChoice(BaseModel):

diff --git a/fastchat/serve/controller.py b/fastchat/serve/controller.py
@@ -27,7 +27,6 @@
 )
 from fastchat.utils import build_logger
 
-
 logger = build_logger("controller", "controller.log")
 
 
@@ -73,11 +72,11 @@ def __init__(self, dispatch_method: str):
         self.heart_beat_thread.start()
 
     def register_worker(
-        self,
-        worker_name: str,
-        check_heart_beat: bool,
-        worker_status: dict,
-        multimodal: bool,
+            self,
+            worker_name: str,
+            check_heart_beat: bool,
+            worker_status: dict,
+            multimodal: bool,
     ):
         if worker_name not in self.worker_info:
             logger.info(f"Register a new worker: {worker_name}")
@@ -123,7 +122,7 @@ def refresh_all_workers(self):
 
         for w_name, w_info in old_info.items():
             if not self.register_worker(
-                w_name, w_info.check_heart_beat, None, w_info.multimodal
+                    w_name, w_info.check_heart_beat, None, w_info.multimodal
             ):
                 logger.info(f"Remove stale worker: {w_name}")
 
@@ -263,6 +262,17 @@ def worker_api_get_status(self):
             "queue_length": queue_length,
         }
 
+    def worker_get_info(self):
+        worker_info = self.worker_info
+        for w_name in worker_info:
+            worker_status = self.get_worker_status(w_name)
+            if worker_status is not None:
+                worker_info[w_name].model_names = worker_status["model_names"]
+                worker_info[w_name].speed = worker_status["speed"]
+                worker_info[w_name].queue_length = worker_status["queue_length"]
+
+        return worker_info
+
     def worker_api_generate_stream(self, params):
         worker_addr = self.get_worker_address(params["model"])
         if not worker_addr:
@@ -350,6 +360,11 @@ async def worker_api_get_status(request: Request):
     return "success"
 
 
+@app.get("/worker_get_info")
+async def worker_api_get_status(request: Request):
+    return controller.worker_get_info()
+
+
 def create_controller():
     parser = argparse.ArgumentParser()
     parser.add_argument("--host", type=str, default="localhost")