From 0b5daf162b9446680454d35a96a4620c4b35f8bd Mon Sep 17 00:00:00 2001 From: QweRez <131252058+QweRezOn@users.noreply.github.com> Date: Fri, 13 Sep 2024 19:56:56 +0300 Subject: [PATCH 1/6] Create README_ru.md add ru --- README_ru.md | 130 +++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 130 insertions(+) create mode 100644 README_ru.md diff --git a/README_ru.md b/README_ru.md new file mode 100644 index 000000000..21d1dd536 --- /dev/null +++ b/README_ru.md @@ -0,0 +1,130 @@ +[Японский](/README_ja.md) [Корейский](/README_ko.md) [Английский](/README_en.md) + +## Что нового! +- Мы выпустили продукт-сестру - клиент Text To Speech. + - Вы можете насладиться генерацией голоса через простой интерфейс. + - Подробнее [здесь](https://github.com/w-okada/ttsclient). +- Код тренировки Beatrice V2 теперь доступен! + - [Репозиторий кода тренировки](https://huggingface.co/fierce-cats/beatrice-trainer) + - [Версия для Colab](https://github.com/w-okada/beatrice-trainer-colab) +- v.2.0.61-alpha + - [ЗДЕСЬ](https://github.com/w-okada/voice-changer/tree/v.2) + - Новые функции: + - Теперь можно задавать продолжительность перекрёстного затухания. + - Исправления: + - Исправлена проблема, при которой неиспользуемые элементы модели влияли на производительность при объединении моделей, путём установки их значений в ноль. +- v.2.0.60-alpha + - Новые функции: + - [Тёмный режим](https://github.com/w-okada/voice-changer/issues/1306) + - [Возвращение PyTorch RMVPE](https://github.com/w-okada/voice-changer/issues/1319) + - [Выбор эксклюзивного режима WASAPI](https://github.com/w-okada/voice-changer/issues/1305) +- v.2.0.58-alpha + - [ЗДЕСЬ](https://github.com/w-okada/voice-changer/tree/v.2) + - Новые функции: + - SIO Broadcasting + - Встроенный ngrok (экспериментальный) + - Улучшения: + - Оптимизация для мобильных телефонов. + - Исправления: + - Неправильное отображение сообщений CUI на macOS +- v.2.0.55-alpha + - [ЗДЕСЬ](https://github.com/w-okada/voice-changer/tree/v.2) + - Улучшения: + - Снижение нагрузки на процессор для RVC + - Поддержка WebSocket + - Изменения: + - Включение опции `no_cui` в стартовом батч-файле + +# Что такое VC Клиент + +1. Это клиентское ПО для выполнения преобразования голоса в реальном времени с использованием различных AI для преобразования голоса. Поддерживаемые AI: + - [MMVC](https://github.com/isletennos/MMVC_Trainer) (только v1) + - [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) (только v1) + - [RVC (Retrieval-based Voice Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI) + - [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) (только v1) + - [Beatrice JVS Corpus Edition](https://prj-beatrice.com/) * экспериментальный * (не по лицензии MIT, см. [readme](https://github.com/w-okada/voice-changer/blob/master/server/voice_changer/Beatrice/)), только для Windows, зависит от процессора (только v1) + - [Beatrice v2](https://prj-beatrice.com/) (только v2) + +2. Распределение нагрузки между разными ПК + Реализация преобразования голоса работает по схеме "сервер-клиент". Вы можете запустить сервер MMVC на отдельном ПК для минимизации влияния на другие ресурсоёмкие процессы, такие как стриминг. + +![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png) + +3. Кроссплатформенная совместимость + Поддержка Windows, Mac (включая Apple Silicon M1), Linux и Google Colaboratory. + +# Как использовать + +Это приложение для изменения голоса с использованием MMVC и so-vits-svc. + +Есть два основных способа использования, в порядке сложности: + +- Использование готового исполняемого файла +- Настройка окружения с Docker или Anaconda + +## (1) Использование готовых исполняемых файлов + +- Вы можете скачать и запустить исполняемые файлы. + +- Смотрите [здесь](tutorials/tutorial_rvc_en_latest.md) для получения руководства. ([устранение неполадок](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md)) + +- Теперь попробовать можно на [Google Colaboratory](https://github.com/w-okada/voice-changer/tree/v.2/w_okada's_Voice_Changer_version_2_x.ipynb) (требуется аккаунт ngrok). Вы можете запустить его через кнопку "Открыть в Colab" в верхнем левом углу. + + + +- Мы предлагаем версии для Windows и Mac на [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) +- v2 для Windows + - Пожалуйста, скачайте и используйте `vcclient_win_std_xxx.zip`. Преобразование голоса можно выполнять с использованием мощного процессора без GPU или с использованием DirectML для GPU (AMD, Nvidia). v2 поддерживает как torch, так и onnx. + - Если у вас Nvidia GPU, скачайте `vcclient_win_cuda_xxx.zip` для более быстрого преобразования. +- v2 для Mac (Apple Silicon) + - Пожалуйста, скачайте и используйте `vcclient_mac_xxx.zip`. +- v1 + - Для Windows с Nvidia GPU скачайте ONNX (cpu, cuda), PyTorch (cpu, cuda). + - Для Windows с AMD/Intel GPU скачайте ONNX (cpu, DirectML) и PyTorch (cpu, cuda). AMD/Intel GPU поддерживаются только для ONNX моделей. + +- Для пользователей Windows: после распаковки zip-файла запустите соответствующий `start_http.bat` файл. + +- Для Mac: после распаковки zip-файла дважды щёлкните на `startHttp.command`. Если появится сообщение о невозможности проверки разработчика, нажмите Ctrl и повторно запустите. + +- Если подключаетесь удалённо, используйте `.command` (Mac) или `.bat` (Windows) файл с https вместо http. + +- Энкодер DDPS-SVC поддерживает только hubert-soft. + +- [Скачать с hugging face](https://huggingface.co/wok000/vcclient000/tree/main) + +## (2) Использование после настройки окружения с Docker или Anaconda + +Клонируйте этот репозиторий и используйте его. Для Windows требуется настройка WSL2. Для Mac нужно настроить виртуальные среды Python, например Anaconda. Этот метод обеспечивает наивысшую скорость в большинстве случаев. ** Даже без GPU можно получить достаточную производительность на современном процессоре (смотрите раздел о производительности в реальном времени ниже)**. + +[Видео-инструкция по установке WSL2 и Docker](https://youtu.be/POo_Cg0eFMU) + +[Видео-инструкция по установке WSL2 и Anaconda](https://youtu.be/fba9Zhsukqw) + +Для запуска Docker смотрите [start docker](docker_vcclient/README_en.md). + +Для запуска на Anaconda venv смотрите [руководство разработчика](README_dev_en.md). + +Для запуска на Linux с AMD GPU смотрите [руководство](tutorials/tutorial_anaconda_amd_rocm.md). + +# Подпись программного обеспечения + +Это ПО не подписано разработчиком. Появится предупреждение, но его можно запустить, нажав на иконку с удержанием клавиши Ctrl. Это связано с политикой безопасности Apple. Использование ПО на ваш риск. + +![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png) + +https://user-images.githubusercontent.com/48346627/212569645-e30b7f4e-079d-4504-8cf8-7816c5f40b00.mp4 + +# Благодарности + +- [Материалы Tachizunda-mon](https://seiga.nicovideo.jp/seiga/im10792934) +- [Irasutoya](https://www.irasutoya.com/) +- [Tsukuyomi-chan](https://tyc.rei-yumesaki.net) + +> Это ПО использует голосовые данные бесплатного материала персонажа "Цукуёми-тян", предоставленного CV. Юмесаки Рэй. +> +> - Корпус Цукуёми-тян (CV. Юмесаки Рэй) +> +> https://tyc.rei-yumesaki.net/material/corpus/ +> +> Авторское право. Юмесаки Рэй, Все права защищены. + From 4ebcd670e7f467b8b133a965cfae8ac5186e4ae5 Mon Sep 17 00:00:00 2001 From: QweRez <131252058+QweRezOn@users.noreply.github.com> Date: Fri, 13 Sep 2024 19:57:30 +0300 Subject: [PATCH 2/6] Update README_en.md --- README_en.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README_en.md b/README_en.md index d6755f439..d7973ccc7 100644 --- a/README_en.md +++ b/README_en.md @@ -1,6 +1,6 @@ ## VC Client -[Japanese](/README_ja.md) [Korean](/README_ko.md) +[Japanese](/README_ja.md) [Korean](/README_ko.md) [Russian](/README_ru.md) ## What's New! - We have released a sister product, the Text To Speech client. From 006b9d575ccba949f9fffc3fab5b377a5be9074b Mon Sep 17 00:00:00 2001 From: QweRez <131252058+QweRezOn@users.noreply.github.com> Date: Fri, 13 Sep 2024 19:59:08 +0300 Subject: [PATCH 3/6] Update README_dev_en.md --- README_dev_en.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README_dev_en.md b/README_dev_en.md index 99e5b940d..557e8a363 100644 --- a/README_dev_en.md +++ b/README_dev_en.md @@ -1,6 +1,6 @@ ## For Developper -[Japanese](/README_dev_ja.md) +[Japanese](/README_dev_ja.md) [Russian](/README_dev_ru.md) ## Prerequisit From b02c4f48c35f2da3d422072dc570d160407857a8 Mon Sep 17 00:00:00 2001 From: QweRez <131252058+QweRezOn@users.noreply.github.com> Date: Fri, 13 Sep 2024 20:02:19 +0300 Subject: [PATCH 4/6] Create README_dev_ru.md --- README_dev_ru.md | 124 +++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 124 insertions(+) create mode 100644 README_dev_ru.md diff --git a/README_dev_ru.md b/README_dev_ru.md new file mode 100644 index 000000000..c77dd5251 --- /dev/null +++ b/README_dev_ru.md @@ -0,0 +1,124 @@ +Вот перевод файла `README_dev_en.md` на русский язык: + +## Для разработчиков + +[Японский](/README_dev_ja.md) [Английский](/README_dev_en.md) + +## Требования + +- Linux (Ubuntu, Debian) или WSL2 (другие дистрибуции Linux и Mac не тестировались) +- Anaconda + +## Подготовка + +1. Создайте виртуальную среду Anaconda: + +``` +$ conda create -n vcclient-dev python=3.10 +$ conda activate vcclient-dev +``` + +2. Клонируйте репозиторий: + +``` +$ git clone https://github.com/w-okada/voice-changer.git +``` + +## Для серверных разработчиков + +1. Установите необходимые зависимости: + +``` +$ cd voice-changer/server +$ pip install -r requirements.txt +``` + +2. Запустите сервер + +Запустите сервер с помощью следующей команды. Вы можете указать свои пути к весам моделей. + +``` +$ python3 MMVCServerSIO.py -p 18888 --https true \ + --content_vec_500 pretrain/checkpoint_best_legacy_500.pt \ + --content_vec_500_onnx pretrain/content_vec_500.onnx \ + --content_vec_500_onnx_on true \ + --hubert_base pretrain/hubert_base.pt \ + --hubert_base_jp pretrain/rinna_hubert_base_jp.pt \ + --hubert_soft pretrain/hubert/hubert-soft-0d54a1f4.pt \ + --nsf_hifigan pretrain/nsf_hifigan/model \ + --crepe_onnx_full pretrain/crepe_onnx_full.onnx \ + --crepe_onnx_tiny pretrain/crepe_onnx_tiny.onnx \ + --rmvpe pretrain/rmvpe.pt \ + --model_dir model_dir \ + --samples samples.json +``` + +Откройте браузер (на данный момент поддерживается только Chrome), и вы увидите графический интерфейс. + +2-1. Устранение неполадок + +(1) OSError: не найдена библиотека PortAudio + +Если вы получите сообщение ниже, необходимо установить дополнительную библиотеку: + +``` +OSError: PortAudio library not found +``` + +Вы можете установить библиотеку командой: + +``` +$ sudo apt-get install libportaudio2 +$ sudo apt-get install libasound-dev +``` + +(2) Не запускается! Чертова программа! + +Клиент не запускается автоматически. Пожалуйста, откройте браузер и перейдите по URL, отображаемому в консоли. И будьте осторожны со словами. + +(3) Не удалось загрузить библиотеку libcudnn_cnn_infer.so.8 + +При использовании WSL может возникнуть ошибка `Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.so: cannot open shared object file: No such file or directory`. Это часто связано с тем, что путь к библиотеке не установлен. Установите путь с помощью команды ниже. Вы можете добавить эту команду в ваш скрипт запуска, например, в .bashrc. + +``` +export LD_LIBRARY_PATH=/usr/lib/wsl/lib:$LD_LIBRARY_PATH +``` + +- ссылки: + - https://qiita.com/cacaoMath/items/811146342946cdde5b83 + - https://github.com/microsoft/WSL/issues/8587 + +3. Наслаждайтесь разработкой. + +### Приложение + +1. Windows + Anaconda (не поддерживается) + +Используйте conda для установки PyTorch: + +``` +conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia +``` + +Также выполните эти команды: + +``` +pip install chardet +pip install numpy==1.24.0 +``` + +## Для клиентских разработчиков + +1. Импорт модулей и начальная сборка: + +``` +cd client +cd lib +npm install +npm run build:dev +cd ../demo +npm install +npm run build:dev +``` + +2. Наслаждайтесь. From 33387bd351459691ca6d1933e28a3ca76c846d90 Mon Sep 17 00:00:00 2001 From: QweRez <131252058+QweRezOn@users.noreply.github.com> Date: Fri, 13 Sep 2024 20:02:44 +0300 Subject: [PATCH 5/6] Update README.md --- README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README.md b/README.md index 2993f164e..a51736c9a 100644 --- a/README.md +++ b/README.md @@ -1,6 +1,6 @@ ## VC Client -[English](/README_en.md) [Korean](/README_ko.md) +[English](/README_en.md) [Korean](/README_ko.md) [Russian](/README_ru.md) ## What's New! - 姉妹品のText To Speechのクライアントをリリースしました。 From dfbc95bd61e931e0159f892795de28a5dc98dc5c Mon Sep 17 00:00:00 2001 From: QweRez <131252058+QweRezOn@users.noreply.github.com> Date: Fri, 13 Sep 2024 20:03:50 +0300 Subject: [PATCH 6/6] Update README_ru.md --- README_ru.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README_ru.md b/README_ru.md index 21d1dd536..162995a46 100644 --- a/README_ru.md +++ b/README_ru.md @@ -102,7 +102,7 @@ Для запуска Docker смотрите [start docker](docker_vcclient/README_en.md). -Для запуска на Anaconda venv смотрите [руководство разработчика](README_dev_en.md). +Для запуска на Anaconda venv смотрите [руководство разработчика](README_dev_ru.md). Для запуска на Linux с AMD GPU смотрите [руководство](tutorials/tutorial_anaconda_amd_rocm.md).