DeepSpeed #88

ccmaymay · 2023-03-09T21:04:23Z

w/ bf16

ccmaymay · 2023-03-10T19:46:59Z

https://github.com/microsoft/DeepSpeed-MII#deploying-mii-public

Has grpc server, seems to resemble our own https://github.com/microsoft/DeepSpeed-MII/blob/main/mii/server.py for example:

        # XXX: fetch model provider based on model name in a more general way
        if model_name == "gpt-neox":
            provider = mii.constants.MODEL_PROVIDER_NAME_EA
        elif ("bigscience/bloom" == model_name) or ("microsoft/bloom" in model_name):
            provider = mii.constants.MODEL_PROVIDER_NAME_HF_LLM
        elif self.task == mii.Tasks.TEXT2IMG:
            provider = mii.constants.MODEL_PROVIDER_NAME_DIFFUSERS
        else:
            provider = mii.constants.MODEL_PROVIDER_NAME_HF
        server_args_str += f" --provider {provider}"

ccmaymay · 2023-03-20T18:16:02Z

Branch status: event loop not found at query time

ccmaymay · 2023-07-19T19:09:12Z

Looks like DeepSpeed-MII recently removed the Bloom-specific LLM functionality and replaced it with a generalized "meta tensor" functionality: microsoft/DeepSpeed-MII@60a85dc

may be worth trying out again

ccmaymay added the new-framework New software framework to consider for improving backend label Mar 9, 2023

ccmaymay self-assigned this Mar 13, 2023

ccmaymay added the performance Performance issues or improvements label Jul 5, 2023

ccmaymay removed their assignment Jul 29, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

DeepSpeed #88

DeepSpeed #88

ccmaymay commented Mar 9, 2023

ccmaymay commented Mar 10, 2023 •

edited

Loading

ccmaymay commented Mar 20, 2023

ccmaymay commented Jul 19, 2023

DeepSpeed #88

DeepSpeed #88

Comments

ccmaymay commented Mar 9, 2023

ccmaymay commented Mar 10, 2023 • edited Loading

ccmaymay commented Mar 20, 2023

ccmaymay commented Jul 19, 2023

ccmaymay commented Mar 10, 2023 •

edited

Loading