Transcribe and Diarize

A script for trancribing and diarizing wav formatted audio files.

Installation

pip install git+https://github.com/AaltoRSE/Diarize.git

Usage

Transcription

List all parameters using

transcribe_and_diarize --help

For example, to run for all files in a folder:

transcribe_and_diarize --input_folder=INPUT_FOLDER_NAME --output_folder=OUTPUT_FOLDER_NAME --hugging_face_token YOUR_TOKEN

Summarizing transcripts

First install the GPT4All client and use it to download a model. Make a note of the folder where the model files are stored. You will need a path to the model file to run summarization.

To summarize all diarized transcripts in a folder:

summarize_transcript --input_folder=INPUT_FOLDER_NAME --output_folder=OUTPUT_FOLDER_NAME --model PATH_TO_MODEL

Name		Name	Last commit message	Last commit date
Latest commit History 54 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
citation.cff		citation.cff
requirements.txt		requirements.txt
setup.py		setup.py
summarize_transcript.py		summarize_transcript.py
transcribe_and_diarize.py		transcribe_and_diarize.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Transcribe and Diarize

Installation

Usage

Transcription

Summarizing transcripts

About

Releases 2

Packages

Languages

License

AaltoRSE/Diarize

Folders and files

Latest commit

History

Repository files navigation

Transcribe and Diarize

Installation

Usage

Transcription

Summarizing transcripts

About

Resources

License

Stars

Watchers

Forks

Releases 2

Packages 0

Languages

Packages