Skip to content

Style-Bert-VITS2モデルと簡単な音声会話をするためのスクリプト(適宜改造してください)

Notifications You must be signed in to change notification settings

kokuren333/KantanKaiwa_Style-Bert-VITS2

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 

Repository files navigation

KantanKaiwa_Style-Bert-VITS2

Style-Bert-VITS2モデルと簡単な音声会話をするためのスクリプトです。(適宜改造してください)
ただ設定通りの振る舞いをしてもらいつつ音声会話をするためだけのスクリプトになっています。

Style-Bert-VITS2
https://github.com/litagin02/Style-Bert-VITS2

使用例(動画)

https://youtu.be/fkyQgcnX68U

動画ではgpt-3.5-turbo-0125を使用していました。

使い方

  • kaiwa.py
    Style-Bert-VITS2のserver_fastapi.pyを実行してから、このスクリプトをターミナル上で実行してください。
    設定(params)のところが自分用のままなので、適宜値を変更してみてください。
    (特にmodel_idは動かしたいモデルに変更してください。)
    ターミナル上で"go"と打つと録音が開始し、設定秒数無音を検出すると録音が終了し、whisperで文字起こしがされます。whisperで文字起こしされた情報がuser_input変数に代入され、OpenAIのChatモデルに送信、返ってきた文章をStyle-Bert-VITS2でTTS変換します。"exit"で会話から抜けられます。ただし、現状記憶機能は実装できていません。
    追記(2024-02-14):簡単な記憶機能を実装しました。最新n件の会話ログをmessagesに保持するようにしています。

  • kaiwa02.py
    cotomoを目指して色々弄りましたが、Whisperでは限界があるかも。
    https://youtu.be/-ufgnSrpcnU

便利リポジトリの紹介

https://github.com/p2-3r/Discord-ReadTextBot-for-Style-Bert-VITS2-API

discord bot上でStyle-Bert-VITS2を動かすためのものなのですが、パスを設定しておけばrun_API.batで仮想環境ごとserver_fastapi.pyを起動できます。

About

Style-Bert-VITS2モデルと簡単な音声会話をするためのスクリプト(適宜改造してください)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages