[WIP] RWKV: Receptive Key Weight Value

WIP: This is meant to be reference block implmentaiton for various RWKV modules. It is not considered complete

Pytorch design decisions

RWKV states are passed around with native tuples, and list intentionally, benchmarking show this has a measurable speed bump compared to data state classes when needed.
init state tune weights should be made avaliable via init_state.x.wkv

Conda specific setup

conda create -n py-3-12 python=3.12 pip nvidia
conda activate py-3-12

# Install cuda in conda env
conda install cuda
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

# Install FLA and other required packages
pip3 install -r requirements.txt

# Optional test requirements
pip3 install -r test/requirements.txt

Name		Name	Last commit message	Last commit date
Latest commit History 139 Commits
rwkv_block		rwkv_block
test		test
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

[WIP] RWKV: Receptive Key Weight Value

Pytorch design decisions

Conda specific setup

About

Releases

Packages

Contributors 2

Languages

RWKV/RWKV-block

Folders and files

Latest commit

History

Repository files navigation

[WIP] RWKV: Receptive Key Weight Value

Pytorch design decisions

Conda specific setup

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages