diff --git a/.gitignore b/.gitignore
index a8e86c83..37cf191c 100644
--- a/.gitignore
+++ b/.gitignore
@@ -169,6 +169,5 @@ version.txt
 
 actions-runner/
 experiments/
-examples/
 .engine/
 amdsmi
\ No newline at end of file
diff --git a/examples/api_launch.py b/examples/api_launch.py
index 987ec8c9..734dfd3c 100644
--- a/examples/api_launch.py
+++ b/examples/api_launch.py
@@ -4,7 +4,6 @@
 from optimum_benchmark.launchers.torchrun.config import TorchrunConfig
 from optimum_benchmark.logging_utils import setup_logging
 
-
 if __name__ == "__main__":
     setup_logging(level="INFO")
     launcher_config = TorchrunConfig(nproc_per_node=2)
diff --git a/examples/fast-mteb/README.md b/examples/fast-mteb/README.md
deleted file mode 100644
index fee12ad6..00000000
--- a/examples/fast-mteb/README.md
+++ /dev/null
@@ -1,44 +0,0 @@
-# Optimum-Benchmark x MTEB
-
-A set of performance benchmarks using [`BAAI/bge-base-en-v1.5`](https://huggingface.co/BAAI/bge-base-en-v1.5), the number one embedding model on the [`Massive Text Embedding Benchmark (MTEB) Leaderboard`](https://huggingface.co/spaces/mteb/leaderboard).
-
-For these benchmarks in particular, we recommend using a docker image with TensorRT intalled, for example [`nvcr.io/nvidia/tensorrt:22.12-py3`](../../docker/gpu.dockerfile) or removing the `TensorrtExecutionProvider` experiments from `configs/`.
-
-Just run `script.sh` from this directory:
-
-```bash
-sh script.sh
-```
-
-This script will run sweeps over batch sizes and sequence lengths for each backend using the config files in `configs/`. The results of the sweeps will be saved in `experiments/`. Then run the reporting script `report.py`:
-
-```bash
-python report.py -e experiments/
-```
-
-Which will generate the plots and csv files in `artifact/`.
-
-## Results
-
-### Latency
-
-For latency, we consider the case of a server processing requests one at a time (i.e. batch size of 1).
-We achieve 1 to 2 milliseconds latency for the forward pass of the embedding model using either `CUDAExecutionProvider` with `O4` optimization level or `TensorrtExecutionProvider` with `fp16` precision. This can be seen as a 5x to 7x speedup over the baseline pytorch model.
-
-<p align="center">
-  <img src="artifacts/forward_latency_plot.png" alt="Latency" width="70%"/>
-</p>
-
-### Throughput
-
-For throughput, we consider the case of a server processing requests of average length (i.e. sequence length of 256).
-We achieve a throughput of +2000 samples per second for the forward pass of the embedding model at an optimal batch size of 128 using either `CUDAExecutionProvider` with `O4` optimization level or `TensorrtExecutionProvider` with `fp16` precision. This can be seen as a 7.5x increase over the baseline pytorch model.
-
-<p align="center">
-  <img src="artifacts/forward_throughput_plot.png" alt="Throughput" width="70%"/>
-</p>
-
-### Notes
-
-- The `TensorrtExecutionProvider` requires engine building, which can take a few minutes during model loading and the first forward pass. It also rebuilds the engine every time the sequence length changes. This is why I think that `CUDAExecutionProvider` with `O4` optimization level is the sweetspot for GPU inference.
-- Some other cases, such as processing big batches of short sequences, can demonstrate even higher speedups (~15x). We don't study them here.
diff --git a/examples/fast-mteb/artifacts/forward_latency_plot.png b/examples/fast-mteb/artifacts/forward_latency_plot.png
deleted file mode 100644
index c4aecc6d..00000000
Binary files a/examples/fast-mteb/artifacts/forward_latency_plot.png and /dev/null differ
diff --git a/examples/fast-mteb/artifacts/forward_throughput_plot.png b/examples/fast-mteb/artifacts/forward_throughput_plot.png
deleted file mode 100644
index 4be441a3..00000000
Binary files a/examples/fast-mteb/artifacts/forward_throughput_plot.png and /dev/null differ
diff --git a/examples/fast-mteb/artifacts/full_report.csv b/examples/fast-mteb/artifacts/full_report.csv
deleted file mode 100644
index 8a7e23cf..00000000
--- a/examples/fast-mteb/artifacts/full_report.csv
+++ /dev/null
@@ -1,52 +0,0 @@
-experiment_name,backend.name,backend.version,backend._target_,backend.seed,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.initial_isolation_check,backend.continous_isolation_check,backend.delete_cache,backend.no_weights,backend.export,backend.use_cache,backend.use_merged,backend.torch_dtype,backend.provider,backend.provider_options.trt_engine_cache_enable,backend.provider_options.trt_engine_cache_path,backend.provider_options.device_id,backend.provider_options.trt_fp16_enable,backend.use_io_binding,backend.session_options.enable_profiling,backend.optimization,backend.quantization,backend.calibration,backend.auto_optimization,backend.auto_quantization,backend.use_inference_session,backend.use_ddp,backend.peft_strategy,benchmark.name,benchmark._target_,benchmark.duration,benchmark.warmup_runs,benchmark.memory,benchmark.energy,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,benchmark.can_diffuse,benchmark.can_generate,model,device,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,environment.optimum_version,environment.transformers_version,environment.accelerate_version,environment.diffusers_version,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,environment.gpus,Unnamed: 0,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),backend.auto_optimization_config.disable_shape_inference,backend.device_map,backend.disable_grad,backend.eval_mode,backend.amp_autocast,backend.amp_dtype,backend.torch_compile,backend.bettertransformer,backend.quantization_scheme
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,128,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0584,2190.0,4612,,,,,,,,,
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0152,2110.0,4016,,,,,,,,,
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,64,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0303,2110.0,4150,,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,128,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0639,2000.0,5583,False,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,64,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0324,1980.0,4304,False,,,,,,,,
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00811,1970.0,3943,,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0167,1920.0,4304,False,,,,,,,,
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,256,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.137,1870.0,5514,,,,,,,,,
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00434,1840.0,3899,,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00883,1810.0,3767,False,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,256,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.146,1750.0,8152,False,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,512,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.294,1740.0,13263,False,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1024,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.595,1720.0,23700,False,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2048,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,1.2,1710.0,44135,False,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00486,1650.0,3767,False,,,,,,,,
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00259,1540.0,3871,,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00307,1300.0,3765,False,,,,,,,,
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00176,1140.0,3851,,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00195,1030.0,3500,False,,,,,,,,
-bge_seq_len_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,16,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.000995,1010.0,3832,,,,,,,,,
-bge_seq_len_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,32,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00105,952.0,3844,,,,,,,,,
-bge_seq_len_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,16,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0011,909.0,3532,False,,,,,,,,
-bge_seq_len_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,64,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0011,909.0,3857,,,,,,,,,
-bge_seq_len_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,64,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00113,885.0,3496,False,,,,,,,,
-bge_seq_len_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,32,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00114,877.0,3536,False,,,,,,,,
-bge_seq_len_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,128,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00124,806.0,3869,,,,,,,,,
-bge_seq_len_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,128,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00132,758.0,3498,False,,,,,,,,
-bge_batch_size_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00145,690.0,3498,False,,,,,,,,
-bge_batch_size_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00146,685.0,3838,,,,,,,,,
-bge_seq_len_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00148,676.0,3888,,,,,,,,,
-bge_seq_len_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0015,667.0,3502,False,,,,,,,,
-bge_seq_len_sweep_ort_trt_fp16,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,TensorrtExecutionProvider,True,tmp/trt_cache,0,True,False,False,False,False,False,,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,512,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00197,508.0,3920,,,,,,,,,
-bge_seq_len_sweep_ort_cuda_o4,onnxruntime,ort-gpu:1.15.1,optimum_benchmark.backends.onnxruntime.backend.ORTBackend,42,,,False,False,False,False,True,True,False,,CUDAExecutionProvider,,,0,,False,False,False,False,False,O4,,True,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,512,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00201,498.0,3500,False,,,,,,,,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,512,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,1.58,324.0,8328,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2048,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,6.34,323.0,29283,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,256,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.792,323.0,5107,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1024,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,3.17,323.0,15576,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,128,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.403,318.0,3494,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,64,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.204,314.0,2689,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0537,298.0,2083,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.109,294.0,2286,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0302,265.0,1995,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0155,258.0,1936,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00901,222.0,1902,,,True,True,False,,False,False,
-bge_batch_size_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00649,154.0,1890,,,True,True,False,,False,False,
-bge_seq_len_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,32,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00669,149.0,1883,,,True,True,False,,False,False,
-bge_seq_len_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00687,146.0,1890,,,True,True,False,,False,False,
-bge_seq_len_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,64,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00689,145.0,1885,,,True,True,False,,False,False,
-bge_seq_len_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,128,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00689,145.0,1888,,,True,True,False,,False,False,
-bge_seq_len_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,16,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.00729,137.0,1881,,,True,True,False,,False,False,
-bge_seq_len_sweep_baseline,pytorch,2.0.1,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,False,False,False,False,,,,,,,,,,,,,,,,,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,512,1,80,3000,16000,,False,False,BAAI/bge-base-en-v1.5,cuda,feature-extraction,main,,False,False,1.13.0,4.34.0.dev0,0.23.0.dev0,0.21.0.dev0,3.8.10,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0,0.0096,104.0,1906,,,True,True,False,,False,False,
diff --git a/examples/fast-mteb/artifacts/rich_table.svg b/examples/fast-mteb/artifacts/rich_table.svg
deleted file mode 100644
index a43cab78..00000000
--- a/examples/fast-mteb/artifacts/rich_table.svg
+++ /dev/null
@@ -1,479 +0,0 @@
-<svg class="rich-terminal" viewBox="0 0 1568 2636.3999999999996" xmlns="http://www.w3.org/2000/svg">
-    <!-- Generated with Rich https://www.textualize.io -->
-    <style>
-
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Regular"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Regular.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Regular.woff") format("woff");
-        font-style: normal;
-        font-weight: 400;
-    }
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Bold"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Bold.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Bold.woff") format("woff");
-        font-style: bold;
-        font-weight: 700;
-    }
-
-    .terminal-1426755226-matrix {
-        font-family: Fira Code, monospace;
-        font-size: 20px;
-        line-height: 24.4px;
-        font-variant-east-asian: full-width;
-    }
-
-    .terminal-1426755226-title {
-        font-size: 18px;
-        font-weight: bold;
-        font-family: arial;
-    }
-
-    .terminal-1426755226-r1 { fill: #d9d9d9 }
-.terminal-1426755226-r2 { fill: #d9d9d9;font-weight: bold }
-    </style>
-
-    <defs>
-    <clipPath id="terminal-1426755226-clip-terminal">
-      <rect x="0" y="0" width="1548.3999999999999" height="2585.3999999999996" />
-    </clipPath>
-    <clipPath id="terminal-1426755226-line-0">
-    <rect x="0" y="1.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-1">
-    <rect x="0" y="25.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-2">
-    <rect x="0" y="50.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-3">
-    <rect x="0" y="74.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-4">
-    <rect x="0" y="99.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-5">
-    <rect x="0" y="123.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-6">
-    <rect x="0" y="147.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-7">
-    <rect x="0" y="172.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-8">
-    <rect x="0" y="196.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-9">
-    <rect x="0" y="221.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-10">
-    <rect x="0" y="245.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-11">
-    <rect x="0" y="269.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-12">
-    <rect x="0" y="294.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-13">
-    <rect x="0" y="318.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-14">
-    <rect x="0" y="343.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-15">
-    <rect x="0" y="367.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-16">
-    <rect x="0" y="391.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-17">
-    <rect x="0" y="416.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-18">
-    <rect x="0" y="440.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-19">
-    <rect x="0" y="465.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-20">
-    <rect x="0" y="489.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-21">
-    <rect x="0" y="513.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-22">
-    <rect x="0" y="538.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-23">
-    <rect x="0" y="562.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-24">
-    <rect x="0" y="587.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-25">
-    <rect x="0" y="611.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-26">
-    <rect x="0" y="635.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-27">
-    <rect x="0" y="660.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-28">
-    <rect x="0" y="684.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-29">
-    <rect x="0" y="709.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-30">
-    <rect x="0" y="733.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-31">
-    <rect x="0" y="757.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-32">
-    <rect x="0" y="782.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-33">
-    <rect x="0" y="806.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-34">
-    <rect x="0" y="831.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-35">
-    <rect x="0" y="855.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-36">
-    <rect x="0" y="879.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-37">
-    <rect x="0" y="904.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-38">
-    <rect x="0" y="928.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-39">
-    <rect x="0" y="953.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-40">
-    <rect x="0" y="977.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-41">
-    <rect x="0" y="1001.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-42">
-    <rect x="0" y="1026.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-43">
-    <rect x="0" y="1050.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-44">
-    <rect x="0" y="1075.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-45">
-    <rect x="0" y="1099.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-46">
-    <rect x="0" y="1123.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-47">
-    <rect x="0" y="1148.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-48">
-    <rect x="0" y="1172.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-49">
-    <rect x="0" y="1197.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-50">
-    <rect x="0" y="1221.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-51">
-    <rect x="0" y="1245.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-52">
-    <rect x="0" y="1270.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-53">
-    <rect x="0" y="1294.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-54">
-    <rect x="0" y="1319.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-55">
-    <rect x="0" y="1343.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-56">
-    <rect x="0" y="1367.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-57">
-    <rect x="0" y="1392.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-58">
-    <rect x="0" y="1416.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-59">
-    <rect x="0" y="1441.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-60">
-    <rect x="0" y="1465.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-61">
-    <rect x="0" y="1489.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-62">
-    <rect x="0" y="1514.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-63">
-    <rect x="0" y="1538.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-64">
-    <rect x="0" y="1563.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-65">
-    <rect x="0" y="1587.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-66">
-    <rect x="0" y="1611.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-67">
-    <rect x="0" y="1636.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-68">
-    <rect x="0" y="1660.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-69">
-    <rect x="0" y="1685.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-70">
-    <rect x="0" y="1709.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-71">
-    <rect x="0" y="1733.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-72">
-    <rect x="0" y="1758.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-73">
-    <rect x="0" y="1782.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-74">
-    <rect x="0" y="1807.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-75">
-    <rect x="0" y="1831.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-76">
-    <rect x="0" y="1855.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-77">
-    <rect x="0" y="1880.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-78">
-    <rect x="0" y="1904.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-79">
-    <rect x="0" y="1929.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-80">
-    <rect x="0" y="1953.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-81">
-    <rect x="0" y="1977.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-82">
-    <rect x="0" y="2002.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-83">
-    <rect x="0" y="2026.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-84">
-    <rect x="0" y="2051.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-85">
-    <rect x="0" y="2075.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-86">
-    <rect x="0" y="2099.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-87">
-    <rect x="0" y="2124.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-88">
-    <rect x="0" y="2148.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-89">
-    <rect x="0" y="2173.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-90">
-    <rect x="0" y="2197.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-91">
-    <rect x="0" y="2221.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-92">
-    <rect x="0" y="2246.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-93">
-    <rect x="0" y="2270.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-94">
-    <rect x="0" y="2295.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-95">
-    <rect x="0" y="2319.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-96">
-    <rect x="0" y="2343.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-97">
-    <rect x="0" y="2368.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-98">
-    <rect x="0" y="2392.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-99">
-    <rect x="0" y="2417.1" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-100">
-    <rect x="0" y="2441.5" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-101">
-    <rect x="0" y="2465.9" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-102">
-    <rect x="0" y="2490.3" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-103">
-    <rect x="0" y="2514.7" width="1549.4" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1426755226-line-104">
-    <rect x="0" y="2539.1" width="1549.4" height="24.65"/>
-            </clipPath>
-    </defs>
-
-    <rect fill="#0c0c0c" stroke="rgba(255,255,255,0.35)" stroke-width="1" x="1" y="1" width="1566" height="2634.4" rx="8"/><text class="terminal-1426755226-title" fill="#d9d9d9" text-anchor="middle" x="783" y="27">Inference&#160;Report</text>
-            <g transform="translate(26,22)">
-            <circle cx="0" cy="0" r="7" fill="#ff5f57"/>
-            <circle cx="22" cy="0" r="7" fill="#febc2e"/>
-            <circle cx="44" cy="0" r="7" fill="#28c840"/>
-            </g>
-        
-    <g transform="translate(9, 41)" clip-path="url(#terminal-1426755226-clip-terminal)">
-    
-    <g class="terminal-1426755226-matrix">
-    <text class="terminal-1426755226-r1" x="0" y="20" textLength="1549.4" clip-path="url(#terminal-1426755226-line-0)">┏━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━┓</text><text class="terminal-1426755226-r1" x="1549.4" y="20" textLength="12.2" clip-path="url(#terminal-1426755226-line-0)">
-</text><text class="terminal-1426755226-r1" x="0" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">┃</text><text class="terminal-1426755226-r1" x="244" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">┃</text><text class="terminal-1426755226-r1" x="414.8" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">┃</text><text class="terminal-1426755226-r1" x="658.8" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">┃</text><text class="terminal-1426755226-r1" x="817.4" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">┃</text><text class="terminal-1426755226-r1" x="1037" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">┃</text><text class="terminal-1426755226-r2" x="1061.4" y="44.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-1)">&#160;&#160;Forward&#160;Latency</text><text class="terminal-1426755226-r1" x="1281" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">┃</text><text class="terminal-1426755226-r2" x="1305.4" y="44.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-1)">Forward&#160;Throughput</text><text class="terminal-1426755226-r1" x="1537.2" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">┃</text><text class="terminal-1426755226-r1" x="1549.4" y="44.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-1)">
-</text><text class="terminal-1426755226-r1" x="0" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">┃</text><text class="terminal-1426755226-r2" x="24.4" y="68.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-2)">Experiment&#160;Name&#160;&#160;</text><text class="terminal-1426755226-r1" x="244" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">┃</text><text class="terminal-1426755226-r2" x="268.4" y="68.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-2)">&#160;&#160;&#160;&#160;Backend</text><text class="terminal-1426755226-r1" x="414.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">┃</text><text class="terminal-1426755226-r2" x="439.2" y="68.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-2)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;Provider</text><text class="terminal-1426755226-r1" x="658.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">┃</text><text class="terminal-1426755226-r2" x="683.2" y="68.8" textLength="122" clip-path="url(#terminal-1426755226-line-2)">Batch&#160;Size</text><text class="terminal-1426755226-r1" x="817.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">┃</text><text class="terminal-1426755226-r2" x="841.8" y="68.8" textLength="183" clip-path="url(#terminal-1426755226-line-2)">Sequence&#160;Length</text><text class="terminal-1426755226-r1" x="1037" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">┃</text><text class="terminal-1426755226-r2" x="1061.4" y="68.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-2)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;(s)</text><text class="terminal-1426755226-r1" x="1281" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">┃</text><text class="terminal-1426755226-r2" x="1305.4" y="68.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-2)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;(samples/s)</text><text class="terminal-1426755226-r1" x="1537.2" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">┃</text><text class="terminal-1426755226-r1" x="1549.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-2)">
-</text><text class="terminal-1426755226-r1" x="0" y="93.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-3)">┡━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━┩</text><text class="terminal-1426755226-r1" x="1549.4" y="93.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-3)">
-</text><text class="terminal-1426755226-r1" x="0" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">│</text><text class="terminal-1426755226-r1" x="24.4" y="117.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-4)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">│</text><text class="terminal-1426755226-r1" x="268.4" y="117.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-4)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">│</text><text class="terminal-1426755226-r1" x="439.2" y="117.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-4)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">│</text><text class="terminal-1426755226-r1" x="683.2" y="117.6" textLength="122" clip-path="url(#terminal-1426755226-line-4)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">│</text><text class="terminal-1426755226-r1" x="841.8" y="117.6" textLength="183" clip-path="url(#terminal-1426755226-line-4)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1426755226-r1" x="1037" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="117.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-4)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9.95e-04</text><text class="terminal-1426755226-r1" x="1281" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="117.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-4)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1010.00</text><text class="terminal-1426755226-r1" x="1537.2" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="117.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-4)">
-</text><text class="terminal-1426755226-r1" x="0" y="142" textLength="1549.4" clip-path="url(#terminal-1426755226-line-5)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="142" textLength="12.2" clip-path="url(#terminal-1426755226-line-5)">
-</text><text class="terminal-1426755226-r1" x="0" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">│</text><text class="terminal-1426755226-r1" x="24.4" y="166.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-6)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">│</text><text class="terminal-1426755226-r1" x="268.4" y="166.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-6)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">│</text><text class="terminal-1426755226-r1" x="439.2" y="166.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-6)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">│</text><text class="terminal-1426755226-r1" x="683.2" y="166.4" textLength="122" clip-path="url(#terminal-1426755226-line-6)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">│</text><text class="terminal-1426755226-r1" x="841.8" y="166.4" textLength="183" clip-path="url(#terminal-1426755226-line-6)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1426755226-r1" x="1037" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="166.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-6)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.10e-03</text><text class="terminal-1426755226-r1" x="1281" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="166.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-6)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;909.00</text><text class="terminal-1426755226-r1" x="1537.2" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="166.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-6)">
-</text><text class="terminal-1426755226-r1" x="0" y="190.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-7)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="190.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-7)">
-</text><text class="terminal-1426755226-r1" x="0" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">│</text><text class="terminal-1426755226-r1" x="24.4" y="215.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-8)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">│</text><text class="terminal-1426755226-r1" x="268.4" y="215.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-8)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">│</text><text class="terminal-1426755226-r1" x="658.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">│</text><text class="terminal-1426755226-r1" x="683.2" y="215.2" textLength="122" clip-path="url(#terminal-1426755226-line-8)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">│</text><text class="terminal-1426755226-r1" x="841.8" y="215.2" textLength="183" clip-path="url(#terminal-1426755226-line-8)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1426755226-r1" x="1037" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="215.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-8)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7.29e-03</text><text class="terminal-1426755226-r1" x="1281" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="215.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-8)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;137.00</text><text class="terminal-1426755226-r1" x="1537.2" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="215.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-8)">
-</text><text class="terminal-1426755226-r1" x="0" y="239.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-9)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="239.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-9)">
-</text><text class="terminal-1426755226-r1" x="0" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">│</text><text class="terminal-1426755226-r1" x="24.4" y="264" textLength="207.4" clip-path="url(#terminal-1426755226-line-10)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">│</text><text class="terminal-1426755226-r1" x="268.4" y="264" textLength="134.2" clip-path="url(#terminal-1426755226-line-10)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">│</text><text class="terminal-1426755226-r1" x="439.2" y="264" textLength="207.4" clip-path="url(#terminal-1426755226-line-10)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">│</text><text class="terminal-1426755226-r1" x="683.2" y="264" textLength="122" clip-path="url(#terminal-1426755226-line-10)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">│</text><text class="terminal-1426755226-r1" x="841.8" y="264" textLength="183" clip-path="url(#terminal-1426755226-line-10)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;32</text><text class="terminal-1426755226-r1" x="1037" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="264" textLength="207.4" clip-path="url(#terminal-1426755226-line-10)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.05e-03</text><text class="terminal-1426755226-r1" x="1281" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="264" textLength="219.6" clip-path="url(#terminal-1426755226-line-10)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;952.00</text><text class="terminal-1426755226-r1" x="1537.2" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="264" textLength="12.2" clip-path="url(#terminal-1426755226-line-10)">
-</text><text class="terminal-1426755226-r1" x="0" y="288.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-11)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="288.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-11)">
-</text><text class="terminal-1426755226-r1" x="0" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">│</text><text class="terminal-1426755226-r1" x="24.4" y="312.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-12)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">│</text><text class="terminal-1426755226-r1" x="268.4" y="312.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-12)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">│</text><text class="terminal-1426755226-r1" x="439.2" y="312.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-12)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">│</text><text class="terminal-1426755226-r1" x="683.2" y="312.8" textLength="122" clip-path="url(#terminal-1426755226-line-12)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">│</text><text class="terminal-1426755226-r1" x="841.8" y="312.8" textLength="183" clip-path="url(#terminal-1426755226-line-12)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;32</text><text class="terminal-1426755226-r1" x="1037" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="312.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-12)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.14e-03</text><text class="terminal-1426755226-r1" x="1281" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="312.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-12)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;877.00</text><text class="terminal-1426755226-r1" x="1537.2" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="312.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-12)">
-</text><text class="terminal-1426755226-r1" x="0" y="337.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-13)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="337.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-13)">
-</text><text class="terminal-1426755226-r1" x="0" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">│</text><text class="terminal-1426755226-r1" x="24.4" y="361.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-14)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">│</text><text class="terminal-1426755226-r1" x="268.4" y="361.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-14)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">│</text><text class="terminal-1426755226-r1" x="658.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">│</text><text class="terminal-1426755226-r1" x="683.2" y="361.6" textLength="122" clip-path="url(#terminal-1426755226-line-14)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">│</text><text class="terminal-1426755226-r1" x="841.8" y="361.6" textLength="183" clip-path="url(#terminal-1426755226-line-14)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;32</text><text class="terminal-1426755226-r1" x="1037" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="361.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-14)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.69e-03</text><text class="terminal-1426755226-r1" x="1281" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="361.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-14)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;149.00</text><text class="terminal-1426755226-r1" x="1537.2" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="361.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-14)">
-</text><text class="terminal-1426755226-r1" x="0" y="386" textLength="1549.4" clip-path="url(#terminal-1426755226-line-15)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="386" textLength="12.2" clip-path="url(#terminal-1426755226-line-15)">
-</text><text class="terminal-1426755226-r1" x="0" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">│</text><text class="terminal-1426755226-r1" x="24.4" y="410.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-16)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">│</text><text class="terminal-1426755226-r1" x="268.4" y="410.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-16)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">│</text><text class="terminal-1426755226-r1" x="439.2" y="410.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-16)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">│</text><text class="terminal-1426755226-r1" x="683.2" y="410.4" textLength="122" clip-path="url(#terminal-1426755226-line-16)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">│</text><text class="terminal-1426755226-r1" x="841.8" y="410.4" textLength="183" clip-path="url(#terminal-1426755226-line-16)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;64</text><text class="terminal-1426755226-r1" x="1037" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="410.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-16)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.10e-03</text><text class="terminal-1426755226-r1" x="1281" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="410.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-16)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;909.00</text><text class="terminal-1426755226-r1" x="1537.2" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="410.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-16)">
-</text><text class="terminal-1426755226-r1" x="0" y="434.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-17)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="434.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-17)">
-</text><text class="terminal-1426755226-r1" x="0" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">│</text><text class="terminal-1426755226-r1" x="24.4" y="459.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-18)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">│</text><text class="terminal-1426755226-r1" x="268.4" y="459.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-18)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">│</text><text class="terminal-1426755226-r1" x="439.2" y="459.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-18)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">│</text><text class="terminal-1426755226-r1" x="683.2" y="459.2" textLength="122" clip-path="url(#terminal-1426755226-line-18)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">│</text><text class="terminal-1426755226-r1" x="841.8" y="459.2" textLength="183" clip-path="url(#terminal-1426755226-line-18)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;64</text><text class="terminal-1426755226-r1" x="1037" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="459.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-18)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.13e-03</text><text class="terminal-1426755226-r1" x="1281" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="459.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-18)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;885.00</text><text class="terminal-1426755226-r1" x="1537.2" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="459.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-18)">
-</text><text class="terminal-1426755226-r1" x="0" y="483.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-19)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="483.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-19)">
-</text><text class="terminal-1426755226-r1" x="0" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">│</text><text class="terminal-1426755226-r1" x="24.4" y="508" textLength="207.4" clip-path="url(#terminal-1426755226-line-20)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">│</text><text class="terminal-1426755226-r1" x="268.4" y="508" textLength="134.2" clip-path="url(#terminal-1426755226-line-20)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">│</text><text class="terminal-1426755226-r1" x="658.8" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">│</text><text class="terminal-1426755226-r1" x="683.2" y="508" textLength="122" clip-path="url(#terminal-1426755226-line-20)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">│</text><text class="terminal-1426755226-r1" x="841.8" y="508" textLength="183" clip-path="url(#terminal-1426755226-line-20)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;64</text><text class="terminal-1426755226-r1" x="1037" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="508" textLength="207.4" clip-path="url(#terminal-1426755226-line-20)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.89e-03</text><text class="terminal-1426755226-r1" x="1281" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="508" textLength="219.6" clip-path="url(#terminal-1426755226-line-20)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;145.00</text><text class="terminal-1426755226-r1" x="1537.2" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="508" textLength="12.2" clip-path="url(#terminal-1426755226-line-20)">
-</text><text class="terminal-1426755226-r1" x="0" y="532.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-21)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="532.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-21)">
-</text><text class="terminal-1426755226-r1" x="0" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">│</text><text class="terminal-1426755226-r1" x="24.4" y="556.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-22)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">│</text><text class="terminal-1426755226-r1" x="268.4" y="556.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-22)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">│</text><text class="terminal-1426755226-r1" x="439.2" y="556.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-22)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">│</text><text class="terminal-1426755226-r1" x="683.2" y="556.8" textLength="122" clip-path="url(#terminal-1426755226-line-22)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">│</text><text class="terminal-1426755226-r1" x="841.8" y="556.8" textLength="183" clip-path="url(#terminal-1426755226-line-22)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;128</text><text class="terminal-1426755226-r1" x="1037" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="556.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-22)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.24e-03</text><text class="terminal-1426755226-r1" x="1281" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="556.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-22)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;806.00</text><text class="terminal-1426755226-r1" x="1537.2" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="556.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-22)">
-</text><text class="terminal-1426755226-r1" x="0" y="581.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-23)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="581.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-23)">
-</text><text class="terminal-1426755226-r1" x="0" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">│</text><text class="terminal-1426755226-r1" x="24.4" y="605.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-24)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">│</text><text class="terminal-1426755226-r1" x="268.4" y="605.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-24)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">│</text><text class="terminal-1426755226-r1" x="439.2" y="605.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-24)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">│</text><text class="terminal-1426755226-r1" x="683.2" y="605.6" textLength="122" clip-path="url(#terminal-1426755226-line-24)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">│</text><text class="terminal-1426755226-r1" x="841.8" y="605.6" textLength="183" clip-path="url(#terminal-1426755226-line-24)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;128</text><text class="terminal-1426755226-r1" x="1037" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="605.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-24)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.32e-03</text><text class="terminal-1426755226-r1" x="1281" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="605.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-24)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;758.00</text><text class="terminal-1426755226-r1" x="1537.2" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="605.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-24)">
-</text><text class="terminal-1426755226-r1" x="0" y="630" textLength="1549.4" clip-path="url(#terminal-1426755226-line-25)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="630" textLength="12.2" clip-path="url(#terminal-1426755226-line-25)">
-</text><text class="terminal-1426755226-r1" x="0" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">│</text><text class="terminal-1426755226-r1" x="24.4" y="654.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-26)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">│</text><text class="terminal-1426755226-r1" x="268.4" y="654.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-26)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">│</text><text class="terminal-1426755226-r1" x="658.8" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">│</text><text class="terminal-1426755226-r1" x="683.2" y="654.4" textLength="122" clip-path="url(#terminal-1426755226-line-26)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">│</text><text class="terminal-1426755226-r1" x="841.8" y="654.4" textLength="183" clip-path="url(#terminal-1426755226-line-26)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;128</text><text class="terminal-1426755226-r1" x="1037" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="654.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-26)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.89e-03</text><text class="terminal-1426755226-r1" x="1281" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="654.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-26)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;145.00</text><text class="terminal-1426755226-r1" x="1537.2" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="654.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-26)">
-</text><text class="terminal-1426755226-r1" x="0" y="678.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-27)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="678.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-27)">
-</text><text class="terminal-1426755226-r1" x="0" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">│</text><text class="terminal-1426755226-r1" x="24.4" y="703.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-28)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">│</text><text class="terminal-1426755226-r1" x="268.4" y="703.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-28)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">│</text><text class="terminal-1426755226-r1" x="439.2" y="703.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-28)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">│</text><text class="terminal-1426755226-r1" x="683.2" y="703.2" textLength="122" clip-path="url(#terminal-1426755226-line-28)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">│</text><text class="terminal-1426755226-r1" x="841.8" y="703.2" textLength="183" clip-path="url(#terminal-1426755226-line-28)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="703.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-28)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.45e-03</text><text class="terminal-1426755226-r1" x="1281" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="703.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-28)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;690.00</text><text class="terminal-1426755226-r1" x="1537.2" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="703.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-28)">
-</text><text class="terminal-1426755226-r1" x="0" y="727.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-29)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="727.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-29)">
-</text><text class="terminal-1426755226-r1" x="0" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">│</text><text class="terminal-1426755226-r1" x="24.4" y="752" textLength="207.4" clip-path="url(#terminal-1426755226-line-30)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">│</text><text class="terminal-1426755226-r1" x="268.4" y="752" textLength="134.2" clip-path="url(#terminal-1426755226-line-30)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">│</text><text class="terminal-1426755226-r1" x="439.2" y="752" textLength="207.4" clip-path="url(#terminal-1426755226-line-30)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">│</text><text class="terminal-1426755226-r1" x="683.2" y="752" textLength="122" clip-path="url(#terminal-1426755226-line-30)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">│</text><text class="terminal-1426755226-r1" x="841.8" y="752" textLength="183" clip-path="url(#terminal-1426755226-line-30)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="752" textLength="207.4" clip-path="url(#terminal-1426755226-line-30)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.46e-03</text><text class="terminal-1426755226-r1" x="1281" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="752" textLength="219.6" clip-path="url(#terminal-1426755226-line-30)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;685.00</text><text class="terminal-1426755226-r1" x="1537.2" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="752" textLength="12.2" clip-path="url(#terminal-1426755226-line-30)">
-</text><text class="terminal-1426755226-r1" x="0" y="776.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-31)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="776.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-31)">
-</text><text class="terminal-1426755226-r1" x="0" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">│</text><text class="terminal-1426755226-r1" x="24.4" y="800.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-32)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">│</text><text class="terminal-1426755226-r1" x="268.4" y="800.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-32)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">│</text><text class="terminal-1426755226-r1" x="439.2" y="800.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-32)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">│</text><text class="terminal-1426755226-r1" x="683.2" y="800.8" textLength="122" clip-path="url(#terminal-1426755226-line-32)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">│</text><text class="terminal-1426755226-r1" x="841.8" y="800.8" textLength="183" clip-path="url(#terminal-1426755226-line-32)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="800.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-32)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.48e-03</text><text class="terminal-1426755226-r1" x="1281" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="800.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-32)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;676.00</text><text class="terminal-1426755226-r1" x="1537.2" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="800.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-32)">
-</text><text class="terminal-1426755226-r1" x="0" y="825.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-33)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="825.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-33)">
-</text><text class="terminal-1426755226-r1" x="0" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">│</text><text class="terminal-1426755226-r1" x="24.4" y="849.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-34)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">│</text><text class="terminal-1426755226-r1" x="268.4" y="849.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-34)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">│</text><text class="terminal-1426755226-r1" x="439.2" y="849.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-34)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">│</text><text class="terminal-1426755226-r1" x="683.2" y="849.6" textLength="122" clip-path="url(#terminal-1426755226-line-34)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">│</text><text class="terminal-1426755226-r1" x="841.8" y="849.6" textLength="183" clip-path="url(#terminal-1426755226-line-34)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="849.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-34)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.50e-03</text><text class="terminal-1426755226-r1" x="1281" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="849.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-34)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;667.00</text><text class="terminal-1426755226-r1" x="1537.2" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="849.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-34)">
-</text><text class="terminal-1426755226-r1" x="0" y="874" textLength="1549.4" clip-path="url(#terminal-1426755226-line-35)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="874" textLength="12.2" clip-path="url(#terminal-1426755226-line-35)">
-</text><text class="terminal-1426755226-r1" x="0" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">│</text><text class="terminal-1426755226-r1" x="24.4" y="898.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-36)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">│</text><text class="terminal-1426755226-r1" x="268.4" y="898.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-36)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">│</text><text class="terminal-1426755226-r1" x="658.8" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">│</text><text class="terminal-1426755226-r1" x="683.2" y="898.4" textLength="122" clip-path="url(#terminal-1426755226-line-36)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">│</text><text class="terminal-1426755226-r1" x="841.8" y="898.4" textLength="183" clip-path="url(#terminal-1426755226-line-36)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="898.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-36)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.49e-03</text><text class="terminal-1426755226-r1" x="1281" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="898.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-36)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;154.00</text><text class="terminal-1426755226-r1" x="1537.2" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="898.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-36)">
-</text><text class="terminal-1426755226-r1" x="0" y="922.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-37)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="922.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-37)">
-</text><text class="terminal-1426755226-r1" x="0" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">│</text><text class="terminal-1426755226-r1" x="24.4" y="947.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-38)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">│</text><text class="terminal-1426755226-r1" x="268.4" y="947.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-38)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">│</text><text class="terminal-1426755226-r1" x="658.8" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">│</text><text class="terminal-1426755226-r1" x="683.2" y="947.2" textLength="122" clip-path="url(#terminal-1426755226-line-38)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">│</text><text class="terminal-1426755226-r1" x="841.8" y="947.2" textLength="183" clip-path="url(#terminal-1426755226-line-38)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="947.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-38)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.87e-03</text><text class="terminal-1426755226-r1" x="1281" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="947.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-38)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;146.00</text><text class="terminal-1426755226-r1" x="1537.2" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="947.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-38)">
-</text><text class="terminal-1426755226-r1" x="0" y="971.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-39)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="971.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-39)">
-</text><text class="terminal-1426755226-r1" x="0" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">│</text><text class="terminal-1426755226-r1" x="24.4" y="996" textLength="207.4" clip-path="url(#terminal-1426755226-line-40)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">│</text><text class="terminal-1426755226-r1" x="268.4" y="996" textLength="134.2" clip-path="url(#terminal-1426755226-line-40)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">│</text><text class="terminal-1426755226-r1" x="439.2" y="996" textLength="207.4" clip-path="url(#terminal-1426755226-line-40)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">│</text><text class="terminal-1426755226-r1" x="683.2" y="996" textLength="122" clip-path="url(#terminal-1426755226-line-40)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">│</text><text class="terminal-1426755226-r1" x="841.8" y="996" textLength="183" clip-path="url(#terminal-1426755226-line-40)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;512</text><text class="terminal-1426755226-r1" x="1037" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="996" textLength="207.4" clip-path="url(#terminal-1426755226-line-40)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.97e-03</text><text class="terminal-1426755226-r1" x="1281" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="996" textLength="219.6" clip-path="url(#terminal-1426755226-line-40)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;508.00</text><text class="terminal-1426755226-r1" x="1537.2" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="996" textLength="12.2" clip-path="url(#terminal-1426755226-line-40)">
-</text><text class="terminal-1426755226-r1" x="0" y="1020.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-41)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1020.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-41)">
-</text><text class="terminal-1426755226-r1" x="0" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1044.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-42)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1044.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-42)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1044.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-42)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1044.8" textLength="122" clip-path="url(#terminal-1426755226-line-42)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1044.8" textLength="183" clip-path="url(#terminal-1426755226-line-42)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;512</text><text class="terminal-1426755226-r1" x="1037" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1044.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-42)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.01e-03</text><text class="terminal-1426755226-r1" x="1281" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1044.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-42)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;498.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1044.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-42)">
-</text><text class="terminal-1426755226-r1" x="0" y="1069.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-43)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1069.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-43)">
-</text><text class="terminal-1426755226-r1" x="0" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1093.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-44)">bge_seq_len_swee…</text><text class="terminal-1426755226-r1" x="244" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1093.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-44)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">│</text><text class="terminal-1426755226-r1" x="658.8" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1093.6" textLength="122" clip-path="url(#terminal-1426755226-line-44)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1426755226-r1" x="817.4" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1093.6" textLength="183" clip-path="url(#terminal-1426755226-line-44)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;512</text><text class="terminal-1426755226-r1" x="1037" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1093.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-44)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9.60e-03</text><text class="terminal-1426755226-r1" x="1281" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1093.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-44)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;104.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1093.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-44)">
-</text><text class="terminal-1426755226-r1" x="0" y="1118" textLength="1549.4" clip-path="url(#terminal-1426755226-line-45)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1118" textLength="12.2" clip-path="url(#terminal-1426755226-line-45)">
-</text><text class="terminal-1426755226-r1" x="0" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1142.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-46)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1142.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-46)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1142.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-46)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1142.4" textLength="122" clip-path="url(#terminal-1426755226-line-46)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1426755226-r1" x="817.4" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1142.4" textLength="183" clip-path="url(#terminal-1426755226-line-46)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1142.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-46)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.76e-03</text><text class="terminal-1426755226-r1" x="1281" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1142.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-46)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1140.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1142.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-46)">
-</text><text class="terminal-1426755226-r1" x="0" y="1166.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-47)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1166.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-47)">
-</text><text class="terminal-1426755226-r1" x="0" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1191.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-48)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1191.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-48)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1191.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-48)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1191.2" textLength="122" clip-path="url(#terminal-1426755226-line-48)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1426755226-r1" x="817.4" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1191.2" textLength="183" clip-path="url(#terminal-1426755226-line-48)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1191.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-48)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.95e-03</text><text class="terminal-1426755226-r1" x="1281" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1191.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-48)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1030.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1191.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-48)">
-</text><text class="terminal-1426755226-r1" x="0" y="1215.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-49)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1215.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-49)">
-</text><text class="terminal-1426755226-r1" x="0" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1240" textLength="207.4" clip-path="url(#terminal-1426755226-line-50)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1240" textLength="134.2" clip-path="url(#terminal-1426755226-line-50)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">│</text><text class="terminal-1426755226-r1" x="658.8" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1240" textLength="122" clip-path="url(#terminal-1426755226-line-50)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1426755226-r1" x="817.4" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1240" textLength="183" clip-path="url(#terminal-1426755226-line-50)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1240" textLength="207.4" clip-path="url(#terminal-1426755226-line-50)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9.01e-03</text><text class="terminal-1426755226-r1" x="1281" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1240" textLength="219.6" clip-path="url(#terminal-1426755226-line-50)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;222.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1240" textLength="12.2" clip-path="url(#terminal-1426755226-line-50)">
-</text><text class="terminal-1426755226-r1" x="0" y="1264.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-51)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1264.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-51)">
-</text><text class="terminal-1426755226-r1" x="0" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1288.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-52)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1288.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-52)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1288.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-52)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1288.8" textLength="122" clip-path="url(#terminal-1426755226-line-52)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1426755226-r1" x="817.4" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1288.8" textLength="183" clip-path="url(#terminal-1426755226-line-52)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1288.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-52)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.59e-03</text><text class="terminal-1426755226-r1" x="1281" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1288.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-52)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1540.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1288.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-52)">
-</text><text class="terminal-1426755226-r1" x="0" y="1313.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-53)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1313.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-53)">
-</text><text class="terminal-1426755226-r1" x="0" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1337.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-54)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1337.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-54)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1337.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-54)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1337.6" textLength="122" clip-path="url(#terminal-1426755226-line-54)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1426755226-r1" x="817.4" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1337.6" textLength="183" clip-path="url(#terminal-1426755226-line-54)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1337.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-54)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.07e-03</text><text class="terminal-1426755226-r1" x="1281" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1337.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-54)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1300.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1337.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-54)">
-</text><text class="terminal-1426755226-r1" x="0" y="1362" textLength="1549.4" clip-path="url(#terminal-1426755226-line-55)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1362" textLength="12.2" clip-path="url(#terminal-1426755226-line-55)">
-</text><text class="terminal-1426755226-r1" x="0" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1386.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-56)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1386.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-56)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">│</text><text class="terminal-1426755226-r1" x="658.8" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1386.4" textLength="122" clip-path="url(#terminal-1426755226-line-56)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1426755226-r1" x="817.4" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1386.4" textLength="183" clip-path="url(#terminal-1426755226-line-56)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1386.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-56)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.55e-02</text><text class="terminal-1426755226-r1" x="1281" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1386.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-56)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;258.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1386.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-56)">
-</text><text class="terminal-1426755226-r1" x="0" y="1410.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-57)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1410.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-57)">
-</text><text class="terminal-1426755226-r1" x="0" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1435.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-58)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1435.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-58)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1435.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-58)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1435.2" textLength="122" clip-path="url(#terminal-1426755226-line-58)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1426755226-r1" x="817.4" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1435.2" textLength="183" clip-path="url(#terminal-1426755226-line-58)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1435.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-58)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.34e-03</text><text class="terminal-1426755226-r1" x="1281" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1435.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-58)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1840.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1435.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-58)">
-</text><text class="terminal-1426755226-r1" x="0" y="1459.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-59)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1459.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-59)">
-</text><text class="terminal-1426755226-r1" x="0" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1484" textLength="207.4" clip-path="url(#terminal-1426755226-line-60)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1484" textLength="134.2" clip-path="url(#terminal-1426755226-line-60)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1484" textLength="207.4" clip-path="url(#terminal-1426755226-line-60)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1484" textLength="122" clip-path="url(#terminal-1426755226-line-60)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1426755226-r1" x="817.4" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1484" textLength="183" clip-path="url(#terminal-1426755226-line-60)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1484" textLength="207.4" clip-path="url(#terminal-1426755226-line-60)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.86e-03</text><text class="terminal-1426755226-r1" x="1281" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1484" textLength="219.6" clip-path="url(#terminal-1426755226-line-60)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1650.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1484" textLength="12.2" clip-path="url(#terminal-1426755226-line-60)">
-</text><text class="terminal-1426755226-r1" x="0" y="1508.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-61)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1508.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-61)">
-</text><text class="terminal-1426755226-r1" x="0" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1532.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-62)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1532.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-62)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">│</text><text class="terminal-1426755226-r1" x="658.8" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1532.8" textLength="122" clip-path="url(#terminal-1426755226-line-62)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1426755226-r1" x="817.4" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1532.8" textLength="183" clip-path="url(#terminal-1426755226-line-62)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1532.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-62)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.02e-02</text><text class="terminal-1426755226-r1" x="1281" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1532.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-62)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;265.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1532.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-62)">
-</text><text class="terminal-1426755226-r1" x="0" y="1557.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-63)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1557.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-63)">
-</text><text class="terminal-1426755226-r1" x="0" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1581.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-64)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1581.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-64)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1581.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-64)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1581.6" textLength="122" clip-path="url(#terminal-1426755226-line-64)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1426755226-r1" x="817.4" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1581.6" textLength="183" clip-path="url(#terminal-1426755226-line-64)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1581.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-64)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8.11e-03</text><text class="terminal-1426755226-r1" x="1281" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1581.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-64)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1970.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1581.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-64)">
-</text><text class="terminal-1426755226-r1" x="0" y="1606" textLength="1549.4" clip-path="url(#terminal-1426755226-line-65)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1606" textLength="12.2" clip-path="url(#terminal-1426755226-line-65)">
-</text><text class="terminal-1426755226-r1" x="0" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1630.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-66)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1630.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-66)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1630.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-66)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1630.4" textLength="122" clip-path="url(#terminal-1426755226-line-66)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1426755226-r1" x="817.4" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1630.4" textLength="183" clip-path="url(#terminal-1426755226-line-66)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1630.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-66)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8.83e-03</text><text class="terminal-1426755226-r1" x="1281" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1630.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-66)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1810.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1630.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-66)">
-</text><text class="terminal-1426755226-r1" x="0" y="1654.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-67)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1654.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-67)">
-</text><text class="terminal-1426755226-r1" x="0" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1679.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-68)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1679.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-68)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">│</text><text class="terminal-1426755226-r1" x="658.8" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1679.2" textLength="122" clip-path="url(#terminal-1426755226-line-68)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1426755226-r1" x="817.4" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1679.2" textLength="183" clip-path="url(#terminal-1426755226-line-68)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1679.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-68)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;5.37e-02</text><text class="terminal-1426755226-r1" x="1281" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1679.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-68)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;298.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1679.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-68)">
-</text><text class="terminal-1426755226-r1" x="0" y="1703.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-69)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1703.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-69)">
-</text><text class="terminal-1426755226-r1" x="0" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1728" textLength="207.4" clip-path="url(#terminal-1426755226-line-70)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1728" textLength="134.2" clip-path="url(#terminal-1426755226-line-70)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1728" textLength="207.4" clip-path="url(#terminal-1426755226-line-70)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1728" textLength="122" clip-path="url(#terminal-1426755226-line-70)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;32</text><text class="terminal-1426755226-r1" x="817.4" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1728" textLength="183" clip-path="url(#terminal-1426755226-line-70)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1728" textLength="207.4" clip-path="url(#terminal-1426755226-line-70)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.52e-02</text><text class="terminal-1426755226-r1" x="1281" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1728" textLength="219.6" clip-path="url(#terminal-1426755226-line-70)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2110.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1728" textLength="12.2" clip-path="url(#terminal-1426755226-line-70)">
-</text><text class="terminal-1426755226-r1" x="0" y="1752.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-71)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1752.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-71)">
-</text><text class="terminal-1426755226-r1" x="0" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1776.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-72)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1776.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-72)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1776.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-72)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1776.8" textLength="122" clip-path="url(#terminal-1426755226-line-72)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;32</text><text class="terminal-1426755226-r1" x="817.4" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1776.8" textLength="183" clip-path="url(#terminal-1426755226-line-72)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1776.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-72)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.67e-02</text><text class="terminal-1426755226-r1" x="1281" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1776.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-72)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1920.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1776.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-72)">
-</text><text class="terminal-1426755226-r1" x="0" y="1801.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-73)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1801.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-73)">
-</text><text class="terminal-1426755226-r1" x="0" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1825.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-74)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1825.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-74)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">│</text><text class="terminal-1426755226-r1" x="658.8" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1825.6" textLength="122" clip-path="url(#terminal-1426755226-line-74)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;32</text><text class="terminal-1426755226-r1" x="817.4" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1825.6" textLength="183" clip-path="url(#terminal-1426755226-line-74)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1825.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-74)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.09e-01</text><text class="terminal-1426755226-r1" x="1281" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1825.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-74)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;294.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1825.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-74)">
-</text><text class="terminal-1426755226-r1" x="0" y="1850" textLength="1549.4" clip-path="url(#terminal-1426755226-line-75)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1850" textLength="12.2" clip-path="url(#terminal-1426755226-line-75)">
-</text><text class="terminal-1426755226-r1" x="0" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1874.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-76)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1874.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-76)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1874.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-76)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1874.4" textLength="122" clip-path="url(#terminal-1426755226-line-76)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;64</text><text class="terminal-1426755226-r1" x="817.4" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1874.4" textLength="183" clip-path="url(#terminal-1426755226-line-76)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1874.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-76)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.03e-02</text><text class="terminal-1426755226-r1" x="1281" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1874.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-76)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2110.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1874.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-76)">
-</text><text class="terminal-1426755226-r1" x="0" y="1898.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-77)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1898.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-77)">
-</text><text class="terminal-1426755226-r1" x="0" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1923.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-78)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1923.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-78)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">│</text><text class="terminal-1426755226-r1" x="439.2" y="1923.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-78)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1923.2" textLength="122" clip-path="url(#terminal-1426755226-line-78)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;64</text><text class="terminal-1426755226-r1" x="817.4" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1923.2" textLength="183" clip-path="url(#terminal-1426755226-line-78)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1923.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-78)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.24e-02</text><text class="terminal-1426755226-r1" x="1281" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1923.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-78)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1980.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1923.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-78)">
-</text><text class="terminal-1426755226-r1" x="0" y="1947.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-79)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1947.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-79)">
-</text><text class="terminal-1426755226-r1" x="0" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">│</text><text class="terminal-1426755226-r1" x="24.4" y="1972" textLength="207.4" clip-path="url(#terminal-1426755226-line-80)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">│</text><text class="terminal-1426755226-r1" x="268.4" y="1972" textLength="134.2" clip-path="url(#terminal-1426755226-line-80)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">│</text><text class="terminal-1426755226-r1" x="658.8" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">│</text><text class="terminal-1426755226-r1" x="683.2" y="1972" textLength="122" clip-path="url(#terminal-1426755226-line-80)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;64</text><text class="terminal-1426755226-r1" x="817.4" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">│</text><text class="terminal-1426755226-r1" x="841.8" y="1972" textLength="183" clip-path="url(#terminal-1426755226-line-80)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="1972" textLength="207.4" clip-path="url(#terminal-1426755226-line-80)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.04e-01</text><text class="terminal-1426755226-r1" x="1281" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="1972" textLength="219.6" clip-path="url(#terminal-1426755226-line-80)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;314.00</text><text class="terminal-1426755226-r1" x="1537.2" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="1972" textLength="12.2" clip-path="url(#terminal-1426755226-line-80)">
-</text><text class="terminal-1426755226-r1" x="0" y="1996.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-81)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="1996.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-81)">
-</text><text class="terminal-1426755226-r1" x="0" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2020.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-82)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2020.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-82)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">│</text><text class="terminal-1426755226-r1" x="439.2" y="2020.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-82)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2020.8" textLength="122" clip-path="url(#terminal-1426755226-line-82)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;128</text><text class="terminal-1426755226-r1" x="817.4" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2020.8" textLength="183" clip-path="url(#terminal-1426755226-line-82)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2020.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-82)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;5.84e-02</text><text class="terminal-1426755226-r1" x="1281" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2020.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-82)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2190.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2020.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-82)">
-</text><text class="terminal-1426755226-r1" x="0" y="2045.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-83)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2045.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-83)">
-</text><text class="terminal-1426755226-r1" x="0" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2069.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-84)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2069.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-84)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">│</text><text class="terminal-1426755226-r1" x="439.2" y="2069.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-84)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2069.6" textLength="122" clip-path="url(#terminal-1426755226-line-84)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;128</text><text class="terminal-1426755226-r1" x="817.4" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2069.6" textLength="183" clip-path="url(#terminal-1426755226-line-84)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2069.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-84)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.39e-02</text><text class="terminal-1426755226-r1" x="1281" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2069.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-84)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2000.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2069.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-84)">
-</text><text class="terminal-1426755226-r1" x="0" y="2094" textLength="1549.4" clip-path="url(#terminal-1426755226-line-85)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2094" textLength="12.2" clip-path="url(#terminal-1426755226-line-85)">
-</text><text class="terminal-1426755226-r1" x="0" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2118.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-86)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2118.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-86)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">│</text><text class="terminal-1426755226-r1" x="658.8" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2118.4" textLength="122" clip-path="url(#terminal-1426755226-line-86)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;128</text><text class="terminal-1426755226-r1" x="817.4" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2118.4" textLength="183" clip-path="url(#terminal-1426755226-line-86)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2118.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-86)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.03e-01</text><text class="terminal-1426755226-r1" x="1281" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2118.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-86)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;318.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2118.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-86)">
-</text><text class="terminal-1426755226-r1" x="0" y="2142.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-87)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2142.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-87)">
-</text><text class="terminal-1426755226-r1" x="0" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2167.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-88)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2167.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-88)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">│</text><text class="terminal-1426755226-r1" x="439.2" y="2167.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-88)">TensorrtExecutio…</text><text class="terminal-1426755226-r1" x="658.8" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2167.2" textLength="122" clip-path="url(#terminal-1426755226-line-88)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="817.4" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2167.2" textLength="183" clip-path="url(#terminal-1426755226-line-88)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2167.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-88)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.37e-01</text><text class="terminal-1426755226-r1" x="1281" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2167.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-88)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1870.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2167.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-88)">
-</text><text class="terminal-1426755226-r1" x="0" y="2191.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-89)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2191.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-89)">
-</text><text class="terminal-1426755226-r1" x="0" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2216" textLength="207.4" clip-path="url(#terminal-1426755226-line-90)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2216" textLength="134.2" clip-path="url(#terminal-1426755226-line-90)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">│</text><text class="terminal-1426755226-r1" x="439.2" y="2216" textLength="207.4" clip-path="url(#terminal-1426755226-line-90)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2216" textLength="122" clip-path="url(#terminal-1426755226-line-90)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="817.4" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2216" textLength="183" clip-path="url(#terminal-1426755226-line-90)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2216" textLength="207.4" clip-path="url(#terminal-1426755226-line-90)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.46e-01</text><text class="terminal-1426755226-r1" x="1281" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2216" textLength="219.6" clip-path="url(#terminal-1426755226-line-90)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1750.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2216" textLength="12.2" clip-path="url(#terminal-1426755226-line-90)">
-</text><text class="terminal-1426755226-r1" x="0" y="2240.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-91)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2240.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-91)">
-</text><text class="terminal-1426755226-r1" x="0" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2264.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-92)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2264.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-92)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">│</text><text class="terminal-1426755226-r1" x="658.8" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2264.8" textLength="122" clip-path="url(#terminal-1426755226-line-92)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="817.4" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2264.8" textLength="183" clip-path="url(#terminal-1426755226-line-92)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2264.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-92)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7.92e-01</text><text class="terminal-1426755226-r1" x="1281" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2264.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-92)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;323.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2264.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-92)">
-</text><text class="terminal-1426755226-r1" x="0" y="2289.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-93)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2289.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-93)">
-</text><text class="terminal-1426755226-r1" x="0" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2313.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-94)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2313.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-94)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">│</text><text class="terminal-1426755226-r1" x="439.2" y="2313.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-94)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2313.6" textLength="122" clip-path="url(#terminal-1426755226-line-94)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;512</text><text class="terminal-1426755226-r1" x="817.4" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2313.6" textLength="183" clip-path="url(#terminal-1426755226-line-94)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2313.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-94)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.94e-01</text><text class="terminal-1426755226-r1" x="1281" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2313.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-94)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1740.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2313.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-94)">
-</text><text class="terminal-1426755226-r1" x="0" y="2338" textLength="1549.4" clip-path="url(#terminal-1426755226-line-95)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2338" textLength="12.2" clip-path="url(#terminal-1426755226-line-95)">
-</text><text class="terminal-1426755226-r1" x="0" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2362.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-96)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2362.4" textLength="134.2" clip-path="url(#terminal-1426755226-line-96)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">│</text><text class="terminal-1426755226-r1" x="658.8" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2362.4" textLength="122" clip-path="url(#terminal-1426755226-line-96)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;512</text><text class="terminal-1426755226-r1" x="817.4" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2362.4" textLength="183" clip-path="url(#terminal-1426755226-line-96)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2362.4" textLength="207.4" clip-path="url(#terminal-1426755226-line-96)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.58</text><text class="terminal-1426755226-r1" x="1281" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2362.4" textLength="219.6" clip-path="url(#terminal-1426755226-line-96)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;324.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2362.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-96)">
-</text><text class="terminal-1426755226-r1" x="0" y="2386.8" textLength="1549.4" clip-path="url(#terminal-1426755226-line-97)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2386.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-97)">
-</text><text class="terminal-1426755226-r1" x="0" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2411.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-98)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2411.2" textLength="134.2" clip-path="url(#terminal-1426755226-line-98)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">│</text><text class="terminal-1426755226-r1" x="439.2" y="2411.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-98)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2411.2" textLength="122" clip-path="url(#terminal-1426755226-line-98)">&#160;&#160;&#160;&#160;&#160;&#160;1024</text><text class="terminal-1426755226-r1" x="817.4" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2411.2" textLength="183" clip-path="url(#terminal-1426755226-line-98)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2411.2" textLength="207.4" clip-path="url(#terminal-1426755226-line-98)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;5.95e-01</text><text class="terminal-1426755226-r1" x="1281" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2411.2" textLength="219.6" clip-path="url(#terminal-1426755226-line-98)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1720.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2411.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-98)">
-</text><text class="terminal-1426755226-r1" x="0" y="2435.6" textLength="1549.4" clip-path="url(#terminal-1426755226-line-99)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2435.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-99)">
-</text><text class="terminal-1426755226-r1" x="0" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2460" textLength="207.4" clip-path="url(#terminal-1426755226-line-100)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2460" textLength="134.2" clip-path="url(#terminal-1426755226-line-100)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">│</text><text class="terminal-1426755226-r1" x="658.8" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2460" textLength="122" clip-path="url(#terminal-1426755226-line-100)">&#160;&#160;&#160;&#160;&#160;&#160;1024</text><text class="terminal-1426755226-r1" x="817.4" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2460" textLength="183" clip-path="url(#terminal-1426755226-line-100)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2460" textLength="207.4" clip-path="url(#terminal-1426755226-line-100)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.17</text><text class="terminal-1426755226-r1" x="1281" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2460" textLength="219.6" clip-path="url(#terminal-1426755226-line-100)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;323.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2460" textLength="12.2" clip-path="url(#terminal-1426755226-line-100)">
-</text><text class="terminal-1426755226-r1" x="0" y="2484.4" textLength="1549.4" clip-path="url(#terminal-1426755226-line-101)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2484.4" textLength="12.2" clip-path="url(#terminal-1426755226-line-101)">
-</text><text class="terminal-1426755226-r1" x="0" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2508.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-102)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2508.8" textLength="134.2" clip-path="url(#terminal-1426755226-line-102)">OnnxRuntime</text><text class="terminal-1426755226-r1" x="414.8" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">│</text><text class="terminal-1426755226-r1" x="439.2" y="2508.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-102)">CUDAExecutionPro…</text><text class="terminal-1426755226-r1" x="658.8" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2508.8" textLength="122" clip-path="url(#terminal-1426755226-line-102)">&#160;&#160;&#160;&#160;&#160;&#160;2048</text><text class="terminal-1426755226-r1" x="817.4" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2508.8" textLength="183" clip-path="url(#terminal-1426755226-line-102)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2508.8" textLength="207.4" clip-path="url(#terminal-1426755226-line-102)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.20</text><text class="terminal-1426755226-r1" x="1281" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2508.8" textLength="219.6" clip-path="url(#terminal-1426755226-line-102)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1710.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2508.8" textLength="12.2" clip-path="url(#terminal-1426755226-line-102)">
-</text><text class="terminal-1426755226-r1" x="0" y="2533.2" textLength="1549.4" clip-path="url(#terminal-1426755226-line-103)">├───────────────────┼─────────────┼───────────────────┼────────────┼─────────────────┼───────────────────┼────────────────────┤</text><text class="terminal-1426755226-r1" x="1549.4" y="2533.2" textLength="12.2" clip-path="url(#terminal-1426755226-line-103)">
-</text><text class="terminal-1426755226-r1" x="0" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">│</text><text class="terminal-1426755226-r1" x="24.4" y="2557.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-104)">bge_batch_size_s…</text><text class="terminal-1426755226-r1" x="244" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">│</text><text class="terminal-1426755226-r1" x="268.4" y="2557.6" textLength="134.2" clip-path="url(#terminal-1426755226-line-104)">&#160;&#160;&#160;&#160;PyTorch</text><text class="terminal-1426755226-r1" x="414.8" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">│</text><text class="terminal-1426755226-r1" x="658.8" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">│</text><text class="terminal-1426755226-r1" x="683.2" y="2557.6" textLength="122" clip-path="url(#terminal-1426755226-line-104)">&#160;&#160;&#160;&#160;&#160;&#160;2048</text><text class="terminal-1426755226-r1" x="817.4" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">│</text><text class="terminal-1426755226-r1" x="841.8" y="2557.6" textLength="183" clip-path="url(#terminal-1426755226-line-104)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;256</text><text class="terminal-1426755226-r1" x="1037" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">│</text><text class="terminal-1426755226-r1" x="1061.4" y="2557.6" textLength="207.4" clip-path="url(#terminal-1426755226-line-104)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.34</text><text class="terminal-1426755226-r1" x="1281" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">│</text><text class="terminal-1426755226-r1" x="1305.4" y="2557.6" textLength="219.6" clip-path="url(#terminal-1426755226-line-104)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;323.00</text><text class="terminal-1426755226-r1" x="1537.2" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">│</text><text class="terminal-1426755226-r1" x="1549.4" y="2557.6" textLength="12.2" clip-path="url(#terminal-1426755226-line-104)">
-</text><text class="terminal-1426755226-r1" x="0" y="2582" textLength="1549.4" clip-path="url(#terminal-1426755226-line-105)">└───────────────────┴─────────────┴───────────────────┴────────────┴─────────────────┴───────────────────┴────────────────────┘</text><text class="terminal-1426755226-r1" x="1549.4" y="2582" textLength="12.2" clip-path="url(#terminal-1426755226-line-105)">
-</text>
-    </g>
-    </g>
-</svg>
diff --git a/examples/fast-mteb/artifacts/short_report.csv b/examples/fast-mteb/artifacts/short_report.csv
deleted file mode 100644
index c6255ea7..00000000
--- a/examples/fast-mteb/artifacts/short_report.csv
+++ /dev/null
@@ -1,52 +0,0 @@
-experiment_name,Backend,Provider,Batch Size,Sequence Length,Forward Latency (s),Forward Throughput (samples/s)
-bge_seq_len_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,1,16,0.000995,1010.0
-bge_seq_len_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,1,16,0.0011,909.0
-bge_seq_len_sweep_baseline,PyTorch,,1,16,0.00729,137.0
-bge_seq_len_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,1,32,0.00105,952.0
-bge_seq_len_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,1,32,0.00114,877.0
-bge_seq_len_sweep_baseline,PyTorch,,1,32,0.00669,149.0
-bge_seq_len_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,1,64,0.0011,909.0
-bge_seq_len_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,1,64,0.00113,885.0
-bge_seq_len_sweep_baseline,PyTorch,,1,64,0.00689,145.0
-bge_seq_len_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,1,128,0.00124,806.0
-bge_seq_len_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,1,128,0.00132,758.0
-bge_seq_len_sweep_baseline,PyTorch,,1,128,0.00689,145.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,1,256,0.00145,690.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,1,256,0.00146,685.0
-bge_seq_len_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,1,256,0.00148,676.0
-bge_seq_len_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,1,256,0.0015,667.0
-bge_batch_size_sweep_baseline,PyTorch,,1,256,0.00649,154.0
-bge_seq_len_sweep_baseline,PyTorch,,1,256,0.00687,146.0
-bge_seq_len_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,1,512,0.00197,508.0
-bge_seq_len_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,1,512,0.00201,498.0
-bge_seq_len_sweep_baseline,PyTorch,,1,512,0.0096,104.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,2,256,0.00176,1140.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,2,256,0.00195,1030.0
-bge_batch_size_sweep_baseline,PyTorch,,2,256,0.00901,222.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,4,256,0.00259,1540.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,4,256,0.00307,1300.0
-bge_batch_size_sweep_baseline,PyTorch,,4,256,0.0155,258.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,8,256,0.00434,1840.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,8,256,0.00486,1650.0
-bge_batch_size_sweep_baseline,PyTorch,,8,256,0.0302,265.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,16,256,0.00811,1970.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,16,256,0.00883,1810.0
-bge_batch_size_sweep_baseline,PyTorch,,16,256,0.0537,298.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,32,256,0.0152,2110.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,32,256,0.0167,1920.0
-bge_batch_size_sweep_baseline,PyTorch,,32,256,0.109,294.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,64,256,0.0303,2110.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,64,256,0.0324,1980.0
-bge_batch_size_sweep_baseline,PyTorch,,64,256,0.204,314.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,128,256,0.0584,2190.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,128,256,0.0639,2000.0
-bge_batch_size_sweep_baseline,PyTorch,,128,256,0.403,318.0
-bge_batch_size_sweep_ort_trt_fp16,OnnxRuntime,TensorrtExecutionProvider,256,256,0.137,1870.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,256,256,0.146,1750.0
-bge_batch_size_sweep_baseline,PyTorch,,256,256,0.792,323.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,512,256,0.294,1740.0
-bge_batch_size_sweep_baseline,PyTorch,,512,256,1.58,324.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,1024,256,0.595,1720.0
-bge_batch_size_sweep_baseline,PyTorch,,1024,256,3.17,323.0
-bge_batch_size_sweep_ort_cuda_o4,OnnxRuntime,CUDAExecutionProvider,2048,256,1.2,1710.0
-bge_batch_size_sweep_baseline,PyTorch,,2048,256,6.34,323.0
diff --git a/examples/fast-mteb/configs/bge_base_config.yaml b/examples/fast-mteb/configs/bge_base_config.yaml
deleted file mode 100644
index 96b60263..00000000
--- a/examples/fast-mteb/configs/bge_base_config.yaml
+++ /dev/null
@@ -1,31 +0,0 @@
-defaults:
-  - benchmark: inference # default benchmark
-  - experiment # inheriting from experiment config
-  - _self_ # for hydra 1.1 compatibility
-  - override hydra/job_logging: colorlog # colorful logging
-  - override hydra/hydra_logging: colorlog # colorful logging
-
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  job:
-    chdir: true
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0
-
-experiment_name: bge_seq_len_sweep_pytorch
-model: BAAI/bge-base-en-v1.5
-task: feature-extraction
-device: cuda
-
-backend:
-  initial_isolation_check: false
-  continous_isolation_check: false
-
-benchmark:
-  memory: true
-  input_shapes:
-    batch_size: null
-    sequence_length: null
diff --git a/examples/fast-mteb/configs/bge_batch_size_sweep_baseline.yaml b/examples/fast-mteb/configs/bge_batch_size_sweep_baseline.yaml
deleted file mode 100644
index 6fd462aa..00000000
--- a/examples/fast-mteb/configs/bge_batch_size_sweep_baseline.yaml
+++ /dev/null
@@ -1,12 +0,0 @@
-defaults:
-  - backend: pytorch
-  - bge_base_config
-  - _self_
-
-hydra:
-  sweeper:
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: 256
-
-experiment_name: bge_batch_size_sweep_baseline
diff --git a/examples/fast-mteb/configs/bge_batch_size_sweep_ort_cuda_o4.yaml b/examples/fast-mteb/configs/bge_batch_size_sweep_ort_cuda_o4.yaml
deleted file mode 100644
index 8d496384..00000000
--- a/examples/fast-mteb/configs/bge_batch_size_sweep_ort_cuda_o4.yaml
+++ /dev/null
@@ -1,10 +0,0 @@
-defaults:
-  - bge_batch_size_sweep_baseline
-  - _self_
-  - override backend: onnxruntime
-
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-
-backend:
-  provider: CUDAExecutionProvider
-  auto_optimization: O4
diff --git a/examples/fast-mteb/configs/bge_batch_size_sweep_ort_trt_fp16.yaml b/examples/fast-mteb/configs/bge_batch_size_sweep_ort_trt_fp16.yaml
deleted file mode 100644
index 743daa4d..00000000
--- a/examples/fast-mteb/configs/bge_batch_size_sweep_ort_trt_fp16.yaml
+++ /dev/null
@@ -1,11 +0,0 @@
-defaults:
-  - bge_batch_size_sweep_baseline
-  - _self_
-  - override backend: onnxruntime
-
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-
-backend:
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_fp16_enable: true
diff --git a/examples/fast-mteb/configs/bge_seq_len_sweep_baseline.yaml b/examples/fast-mteb/configs/bge_seq_len_sweep_baseline.yaml
deleted file mode 100644
index 3c0efe2d..00000000
--- a/examples/fast-mteb/configs/bge_seq_len_sweep_baseline.yaml
+++ /dev/null
@@ -1,12 +0,0 @@
-defaults:
-  - backend: pytorch
-  - bge_base_config
-  - _self_
-
-hydra:
-  sweeper:
-    params:
-      benchmark.input_shapes.batch_size: 1
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-
-experiment_name: bge_seq_len_sweep_baseline
diff --git a/examples/fast-mteb/configs/bge_seq_len_sweep_ort_cuda_o4.yaml b/examples/fast-mteb/configs/bge_seq_len_sweep_ort_cuda_o4.yaml
deleted file mode 100644
index d9a053b2..00000000
--- a/examples/fast-mteb/configs/bge_seq_len_sweep_ort_cuda_o4.yaml
+++ /dev/null
@@ -1,10 +0,0 @@
-defaults:
-  - bge_seq_len_sweep_baseline
-  - _self_
-  - override backend: onnxruntime
-
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-
-backend:
-  provider: CUDAExecutionProvider
-  auto_optimization: O4
diff --git a/examples/fast-mteb/configs/bge_seq_len_sweep_ort_trt_fp16.yaml b/examples/fast-mteb/configs/bge_seq_len_sweep_ort_trt_fp16.yaml
deleted file mode 100644
index 191d6614..00000000
--- a/examples/fast-mteb/configs/bge_seq_len_sweep_ort_trt_fp16.yaml
+++ /dev/null
@@ -1,11 +0,0 @@
-defaults:
-  - bge_seq_len_sweep_baseline
-  - _self_
-  - override backend: onnxruntime
-
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-
-backend:
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_fp16_enable: true
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml
deleted file mode 100644
index 4a0d3af7..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml
deleted file mode 100644
index 7a1a42b2..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=256
-    id: '0'
-    num: 0
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml
deleted file mode 100644
index 68453b03..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/hydra_config.yaml
deleted file mode 100644
index a8374b0b..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/inference_results.csv
deleted file mode 100644
index 64e5148b..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1)_sequence_length(256)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00649,154.0,1890
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/config.yaml
deleted file mode 100644
index dfa93908..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1024
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/hydra.yaml
deleted file mode 100644
index 6245d526..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1024
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1024,benchmark.input_shapes.sequence_length=256
-    id: '10'
-    num: 10
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/overrides.yaml
deleted file mode 100644
index 874d4c51..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1024
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/hydra_config.yaml
deleted file mode 100644
index 176cbe80..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1024
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/inference_results.csv
deleted file mode 100644
index 13937065..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(1024)_sequence_length(256)/10/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,3.17,323.0,15576
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml
deleted file mode 100644
index dcf20c08..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 128
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml
deleted file mode 100644
index 0af85235..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=128
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=128,benchmark.input_shapes.sequence_length=256
-    id: '7'
-    num: 7
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml
deleted file mode 100644
index 459be207..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=128
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/hydra_config.yaml
deleted file mode 100644
index 967d4978..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 128
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/inference_results.csv
deleted file mode 100644
index f1aea2af..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(128)_sequence_length(256)/7/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.403,318.0,3494
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml
deleted file mode 100644
index d1415b57..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index ee269ee2..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16,benchmark.input_shapes.sequence_length=256
-    id: '4'
-    num: 4
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index 9e742a69..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=16
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/hydra_config.yaml
deleted file mode 100644
index c77066b1..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/inference_results.csv
deleted file mode 100644
index d5d39469..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(16)_sequence_length(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0537,298.0,2083
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml
deleted file mode 100644
index e7e7cc9d..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml
deleted file mode 100644
index 03514e6a..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2,benchmark.input_shapes.sequence_length=256
-    id: '1'
-    num: 1
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml
deleted file mode 100644
index bf46a09f..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=2
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/hydra_config.yaml
deleted file mode 100644
index 6526e0c2..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/inference_results.csv
deleted file mode 100644
index 1326276e..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2)_sequence_length(256)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00901,222.0,1902
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/config.yaml
deleted file mode 100644
index 5d10c040..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2048
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/hydra.yaml
deleted file mode 100644
index eaa83b80..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2048
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2048,benchmark.input_shapes.sequence_length=256
-    id: '11'
-    num: 11
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/overrides.yaml
deleted file mode 100644
index c0074884..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=2048
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/hydra_config.yaml
deleted file mode 100644
index a0d85fbe..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2048
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/inference_results.csv
deleted file mode 100644
index 12f5a323..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(2048)_sequence_length(256)/11/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,6.34,323.0,29283
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml
deleted file mode 100644
index 6df59894..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 256
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml
deleted file mode 100644
index 047bec6d..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=256
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=256,benchmark.input_shapes.sequence_length=256
-    id: '8'
-    num: 8
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml
deleted file mode 100644
index 827e72de..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=256
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/hydra_config.yaml
deleted file mode 100644
index 1480d48d..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 256
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/inference_results.csv
deleted file mode 100644
index 91898ab3..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(256)_sequence_length(256)/8/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.792,323.0,5107
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml
deleted file mode 100644
index 64249ed0..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 32
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml
deleted file mode 100644
index 8fc2114f..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=32
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=32,benchmark.input_shapes.sequence_length=256
-    id: '5'
-    num: 5
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml
deleted file mode 100644
index 3e2c3635..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=32
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/hydra_config.yaml
deleted file mode 100644
index d0d51aaf..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 32
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/inference_results.csv
deleted file mode 100644
index a0c77f7c..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(32)_sequence_length(256)/5/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.109,294.0,2286
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml
deleted file mode 100644
index 4a4c4aa5..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml
deleted file mode 100644
index a43fdac6..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4,benchmark.input_shapes.sequence_length=256
-    id: '2'
-    num: 2
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml
deleted file mode 100644
index 3c675c88..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=4
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/hydra_config.yaml
deleted file mode 100644
index b2ccf7d5..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/inference_results.csv
deleted file mode 100644
index 54f6d8d9..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(4)_sequence_length(256)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0155,258.0,1936
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml
deleted file mode 100644
index 6e4fd05a..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 512
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml
deleted file mode 100644
index 456b45d7..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=512
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=512,benchmark.input_shapes.sequence_length=256
-    id: '9'
-    num: 9
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml
deleted file mode 100644
index 830422b4..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=512
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/hydra_config.yaml
deleted file mode 100644
index d0416dc0..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 512
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/inference_results.csv
deleted file mode 100644
index e0ede21a..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(512)_sequence_length(256)/9/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,1.58,324.0,8328
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml
deleted file mode 100644
index 078ebee2..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 64
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml
deleted file mode 100644
index 4d33e000..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=64
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=64,benchmark.input_shapes.sequence_length=256
-    id: '6'
-    num: 6
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml
deleted file mode 100644
index 31aa8a55..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=64
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/hydra_config.yaml
deleted file mode 100644
index 78e0093d..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 64
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/inference_results.csv
deleted file mode 100644
index af286bcb..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(64)_sequence_length(256)/6/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.204,314.0,2689
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml
deleted file mode 100644
index 812a7865..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml
deleted file mode 100644
index 783acfbc..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8,benchmark.input_shapes.sequence_length=256
-    id: '3'
-    num: 3
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml
deleted file mode 100644
index 854c6355..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=8
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/hydra_config.yaml
deleted file mode 100644
index 511e3988..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/inference_results.csv
deleted file mode 100644
index 202cc59b..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(8)_sequence_length(256)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0302,265.0,1995
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(None)_sequence_length(None)/multirun.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(None)_sequence_length(None)/multirun.yaml
deleted file mode 100644
index 8ff2f6cb..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_baseline_batch_size(None)_sequence_length(None)/multirun.yaml
+++ /dev/null
@@ -1,242 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task: []
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: ''
-    id: ???
-    num: ???
-    config_name: bge_batch_size_sweep_baseline.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: ???
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: null
-    sequence_length: null
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml
deleted file mode 100644
index 07de7b09..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml
deleted file mode 100644
index 77b4d0d4..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=256
-    id: '0'
-    num: 0
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml
deleted file mode 100644
index 68453b03..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/hydra_config.yaml
deleted file mode 100644
index 8a12a256..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/inference_results.csv
deleted file mode 100644
index 095db4b2..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00145,690.0,3498
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/config.yaml
deleted file mode 100644
index 7d772929..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1024
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/hydra.yaml
deleted file mode 100644
index c836f4da..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1024
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1024,benchmark.input_shapes.sequence_length=256
-    id: '10'
-    num: 10
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/overrides.yaml
deleted file mode 100644
index 874d4c51..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1024
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/hydra_config.yaml
deleted file mode 100644
index 1c9acd28..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1024
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/inference_results.csv
deleted file mode 100644
index 7bdbdf81..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(1024)_sequence_length(256)/10/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.595,1720.0,23700
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml
deleted file mode 100644
index 58a6fccd..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 128
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml
deleted file mode 100644
index 34efa3ac..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=128
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=128,benchmark.input_shapes.sequence_length=256
-    id: '7'
-    num: 7
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml
deleted file mode 100644
index 459be207..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=128
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/hydra_config.yaml
deleted file mode 100644
index b7c8696e..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 128
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/inference_results.csv
deleted file mode 100644
index 52458f7e..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(128)_sequence_length(256)/7/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0639,2000.0,5583
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml
deleted file mode 100644
index 6d8ae445..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index c91dd995..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16,benchmark.input_shapes.sequence_length=256
-    id: '4'
-    num: 4
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index 9e742a69..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=16
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/hydra_config.yaml
deleted file mode 100644
index d346a163..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/inference_results.csv
deleted file mode 100644
index 1324094c..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(16)_sequence_length(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00883,1810.0,3767
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml
deleted file mode 100644
index 60bc9d90..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml
deleted file mode 100644
index 2f2b897e..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2,benchmark.input_shapes.sequence_length=256
-    id: '1'
-    num: 1
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml
deleted file mode 100644
index bf46a09f..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=2
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/hydra_config.yaml
deleted file mode 100644
index 5e598330..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/inference_results.csv
deleted file mode 100644
index 56c0418f..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2)_sequence_length(256)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00195,1030.0,3500
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/config.yaml
deleted file mode 100644
index 427d25f3..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2048
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/hydra.yaml
deleted file mode 100644
index 3376a3de..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2048
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2048,benchmark.input_shapes.sequence_length=256
-    id: '11'
-    num: 11
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/overrides.yaml
deleted file mode 100644
index c0074884..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=2048
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/hydra_config.yaml
deleted file mode 100644
index ec0027cf..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2048
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/inference_results.csv
deleted file mode 100644
index 3eed0c11..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(2048)_sequence_length(256)/11/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,1.2,1710.0,44135
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml
deleted file mode 100644
index 1be484cb..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 256
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml
deleted file mode 100644
index 357b41c3..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=256
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=256,benchmark.input_shapes.sequence_length=256
-    id: '8'
-    num: 8
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml
deleted file mode 100644
index 827e72de..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=256
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/hydra_config.yaml
deleted file mode 100644
index a0a13d98..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 256
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/inference_results.csv
deleted file mode 100644
index b90bccca..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(256)_sequence_length(256)/8/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.146,1750.0,8152
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml
deleted file mode 100644
index 5244ec01..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 32
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml
deleted file mode 100644
index 69faa12f..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=32
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=32,benchmark.input_shapes.sequence_length=256
-    id: '5'
-    num: 5
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml
deleted file mode 100644
index 3e2c3635..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=32
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/hydra_config.yaml
deleted file mode 100644
index c7c3b724..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 32
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/inference_results.csv
deleted file mode 100644
index 516c144b..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(32)_sequence_length(256)/5/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0167,1920.0,4304
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml
deleted file mode 100644
index bc7a3904..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml
deleted file mode 100644
index 5d8bbff3..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4,benchmark.input_shapes.sequence_length=256
-    id: '2'
-    num: 2
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml
deleted file mode 100644
index 3c675c88..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=4
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/hydra_config.yaml
deleted file mode 100644
index 8865a904..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/inference_results.csv
deleted file mode 100644
index 433d02f7..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(4)_sequence_length(256)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00307,1300.0,3765
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml
deleted file mode 100644
index edbe07af..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 512
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml
deleted file mode 100644
index 0ed92d8f..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=512
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=512,benchmark.input_shapes.sequence_length=256
-    id: '9'
-    num: 9
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml
deleted file mode 100644
index 830422b4..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=512
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/hydra_config.yaml
deleted file mode 100644
index 794322d8..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 512
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/inference_results.csv
deleted file mode 100644
index ab8286c9..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(512)_sequence_length(256)/9/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.294,1740.0,13263
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml
deleted file mode 100644
index 422a64d4..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 64
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml
deleted file mode 100644
index b9bdeb5e..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=64
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=64,benchmark.input_shapes.sequence_length=256
-    id: '6'
-    num: 6
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml
deleted file mode 100644
index 31aa8a55..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=64
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/hydra_config.yaml
deleted file mode 100644
index 79d08b36..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 64
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/inference_results.csv
deleted file mode 100644
index 2d63eb62..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(64)_sequence_length(256)/6/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0324,1980.0,4304
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml
deleted file mode 100644
index a20b60b7..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml
deleted file mode 100644
index 5a81e9e5..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8,benchmark.input_shapes.sequence_length=256
-    id: '3'
-    num: 3
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml
deleted file mode 100644
index 854c6355..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=8
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/hydra_config.yaml
deleted file mode 100644
index 28e33900..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/inference_results.csv
deleted file mode 100644
index 82681477..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(8)_sequence_length(256)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00486,1650.0,3767
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(None)_sequence_length(None)/multirun.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(None)_sequence_length(None)/multirun.yaml
deleted file mode 100644
index 62776c29..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_cuda_o4_batch_size(None)_sequence_length(None)/multirun.yaml
+++ /dev/null
@@ -1,252 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task: []
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: ''
-    id: ???
-    num: ???
-    config_name: bge_batch_size_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: ???
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: null
-    sequence_length: null
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml
deleted file mode 100644
index 7bfc99bc..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml
deleted file mode 100644
index 988960a4..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=256
-    id: '0'
-    num: 0
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml
deleted file mode 100644
index 68453b03..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/hydra_config.yaml
deleted file mode 100644
index a61f1d86..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/inference_results.csv
deleted file mode 100644
index 1eb6aa3d..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00146,685.0,3838
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml
deleted file mode 100644
index e8b256a7..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 128
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml
deleted file mode 100644
index 103379e5..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=128
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=128,benchmark.input_shapes.sequence_length=256
-    id: '7'
-    num: 7
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml
deleted file mode 100644
index 459be207..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=128
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/hydra_config.yaml
deleted file mode 100644
index 45419696..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 128
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/inference_results.csv
deleted file mode 100644
index 9bf5e5ed..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(128)_sequence_length(256)/7/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0584,2190.0,4612
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml
deleted file mode 100644
index 3d72d184..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index a316954a..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16,benchmark.input_shapes.sequence_length=256
-    id: '4'
-    num: 4
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index 9e742a69..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=16
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/hydra_config.yaml
deleted file mode 100644
index 7db739c3..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/inference_results.csv
deleted file mode 100644
index 25531fcb..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(16)_sequence_length(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00811,1970.0,3943
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml
deleted file mode 100644
index 89eddd9d..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml
deleted file mode 100644
index 7835eaef..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2,benchmark.input_shapes.sequence_length=256
-    id: '1'
-    num: 1
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml
deleted file mode 100644
index bf46a09f..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=2
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/hydra_config.yaml
deleted file mode 100644
index ee4705e6..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/inference_results.csv
deleted file mode 100644
index 66368e46..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(2)_sequence_length(256)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00176,1140.0,3851
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml
deleted file mode 100644
index 9ae4cf91..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 256
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml
deleted file mode 100644
index a8e2e54d..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=256
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=256,benchmark.input_shapes.sequence_length=256
-    id: '8'
-    num: 8
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml
deleted file mode 100644
index 827e72de..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=256
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/hydra_config.yaml
deleted file mode 100644
index 06530c91..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 256
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/inference_results.csv
deleted file mode 100644
index e0c9802a..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(256)_sequence_length(256)/8/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.137,1870.0,5514
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml
deleted file mode 100644
index 9bbdc30e..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 32
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml
deleted file mode 100644
index a5555aae..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=32
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=32,benchmark.input_shapes.sequence_length=256
-    id: '5'
-    num: 5
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml
deleted file mode 100644
index 3e2c3635..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=32
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/hydra_config.yaml
deleted file mode 100644
index 7d8e18de..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 32
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/inference_results.csv
deleted file mode 100644
index e20af000..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(32)_sequence_length(256)/5/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0152,2110.0,4016
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml
deleted file mode 100644
index 7e63f163..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml
deleted file mode 100644
index 3c839db0..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4,benchmark.input_shapes.sequence_length=256
-    id: '2'
-    num: 2
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml
deleted file mode 100644
index 3c675c88..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=4
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/hydra_config.yaml
deleted file mode 100644
index a64e8e87..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/inference_results.csv
deleted file mode 100644
index 0cd91e11..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(4)_sequence_length(256)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00259,1540.0,3871
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml
deleted file mode 100644
index ccee80c1..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 512
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml
deleted file mode 100644
index f2b834d4..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=512
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=512,benchmark.input_shapes.sequence_length=256
-    id: '9'
-    num: 9
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml
deleted file mode 100644
index 830422b4..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=512
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/hydra_config.yaml
deleted file mode 100644
index 909ded7f..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(512)_sequence_length(256)/9/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 512
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml
deleted file mode 100644
index 1d37b256..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 64
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml
deleted file mode 100644
index bd1eac69..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=64
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=64,benchmark.input_shapes.sequence_length=256
-    id: '6'
-    num: 6
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml
deleted file mode 100644
index 31aa8a55..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=64
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/hydra_config.yaml
deleted file mode 100644
index 2618f579..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 64
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/inference_results.csv
deleted file mode 100644
index 54978095..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(64)_sequence_length(256)/6/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0303,2110.0,4150
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml
deleted file mode 100644
index b85ddcb6..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml
deleted file mode 100644
index d0b65270..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8,benchmark.input_shapes.sequence_length=256
-    id: '3'
-    num: 3
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml
deleted file mode 100644
index 854c6355..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=8
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/hydra_config.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/hydra_config.yaml
deleted file mode 100644
index 9b73cf99..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/inference_results.csv b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/inference_results.csv
deleted file mode 100644
index 286e93b3..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(8)_sequence_length(256)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00434,1840.0,3899
diff --git a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(None)_sequence_length(None)/multirun.yaml b/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(None)_sequence_length(None)/multirun.yaml
deleted file mode 100644
index 7ead4d1b..00000000
--- a/examples/fast-mteb/experiments/bge_batch_size_sweep_ort_trt_fp16_batch_size(None)_sequence_length(None)/multirun.yaml
+++ /dev/null
@@ -1,253 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128,256,512,1024,2048
-      benchmark.input_shapes.sequence_length: '256'
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task: []
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: ''
-    id: ???
-    num: ???
-    config_name: bge_batch_size_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: ???
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: null
-    sequence_length: null
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_batch_size_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml
deleted file mode 100644
index 0ccfe4de..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml
deleted file mode 100644
index 161f2c19..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=128
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=128
-    id: '3'
-    num: 3
-    config_name: bge_seq_len_sweep_baseline
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedder
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedder/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedder/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml
deleted file mode 100644
index 1c55c407..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=128
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/hydra_config.yaml
deleted file mode 100644
index 5f2a4904..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/inference_results.csv
deleted file mode 100644
index 732c490f..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(128)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00689,145.0,1888
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml
deleted file mode 100644
index 478a8d82..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 16
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml
deleted file mode 100644
index f6f55836..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=16
-    id: '0'
-    num: 0
-    config_name: bge_seq_len_sweep_baseline
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedder
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedder/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedder/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml
deleted file mode 100644
index 7d89e6a3..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=16
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/hydra_config.yaml
deleted file mode 100644
index 4562d4f4..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 16
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/inference_results.csv
deleted file mode 100644
index 9057696a..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(16)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00729,137.0,1881
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml
deleted file mode 100644
index 6a6fc649..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index 8995d1aa..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=256
-    id: '4'
-    num: 4
-    config_name: bge_seq_len_sweep_baseline
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedder
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedder/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedder/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index 68453b03..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/hydra_config.yaml
deleted file mode 100644
index c14f63a6..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/inference_results.csv
deleted file mode 100644
index b2d73b86..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00687,146.0,1890
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml
deleted file mode 100644
index 05f11981..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 32
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml
deleted file mode 100644
index 3b60c1e3..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=32
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=32
-    id: '1'
-    num: 1
-    config_name: bge_seq_len_sweep_baseline
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedder
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedder/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedder/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml
deleted file mode 100644
index f47df8c7..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=32
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/hydra_config.yaml
deleted file mode 100644
index 7c4a5cfb..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 32
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/inference_results.csv
deleted file mode 100644
index 209fabad..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(32)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00669,149.0,1883
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml
deleted file mode 100644
index b0dbc122..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml
deleted file mode 100644
index 31e76c7e..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=512
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=512
-    id: '5'
-    num: 5
-    config_name: bge_seq_len_sweep_baseline
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedder
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedder/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedder/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml
deleted file mode 100644
index a262b1b5..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=512
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/hydra_config.yaml
deleted file mode 100644
index fad0e265..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/inference_results.csv
deleted file mode 100644
index c4cd6554..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(512)/5/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0096,104.0,1906
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml
deleted file mode 100644
index e700bc5f..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 64
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml
deleted file mode 100644
index 1d8e5207..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=64
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=64
-    id: '2'
-    num: 2
-    config_name: bge_seq_len_sweep_baseline
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedder
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedder/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedder/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml
deleted file mode 100644
index cba39030..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=64
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/hydra_config.yaml
deleted file mode 100644
index 99404dfd..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/hydra_config.yaml
+++ /dev/null
@@ -1,69 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 64
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/inference_results.csv
deleted file mode 100644
index 3ed7fd6d..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(1)_sequence_length(64)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00689,145.0,1885
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(None)_sequence_length(None)/multirun.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(None)_sequence_length(None)/multirun.yaml
deleted file mode 100644
index d4c2c139..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_baseline_batch_size(None)_sequence_length(None)/multirun.yaml
+++ /dev/null
@@ -1,242 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task: []
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: ''
-    id: ???
-    num: ???
-    config_name: bge_seq_len_sweep_baseline
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedder
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedder/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: ???
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: null
-    sequence_length: null
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_baseline
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml
deleted file mode 100644
index f8432893..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml
deleted file mode 100644
index c7a9d347..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=128
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=128
-    id: '3'
-    num: 3
-    config_name: bge_seq_len_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml
deleted file mode 100644
index 1c55c407..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=128
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/hydra_config.yaml
deleted file mode 100644
index 63bbae2b..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/inference_results.csv
deleted file mode 100644
index dcc94eaa..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(128)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00132,758.0,3498
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml
deleted file mode 100644
index 64afa779..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 16
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml
deleted file mode 100644
index 7726101f..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=16
-    id: '0'
-    num: 0
-    config_name: bge_seq_len_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml
deleted file mode 100644
index 7d89e6a3..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=16
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/hydra_config.yaml
deleted file mode 100644
index 407f267d..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 16
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/inference_results.csv
deleted file mode 100644
index 74272d3d..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(16)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0011,909.0,3532
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml
deleted file mode 100644
index acfac450..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index c8780806..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=256
-    id: '4'
-    num: 4
-    config_name: bge_seq_len_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index 68453b03..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/hydra_config.yaml
deleted file mode 100644
index adaffc10..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/inference_results.csv
deleted file mode 100644
index 3ef35c01..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0015,667.0,3502
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml
deleted file mode 100644
index 645481ab..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 32
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml
deleted file mode 100644
index 5f21f5a0..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=32
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=32
-    id: '1'
-    num: 1
-    config_name: bge_seq_len_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml
deleted file mode 100644
index f47df8c7..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=32
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/hydra_config.yaml
deleted file mode 100644
index 2cbedd4a..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 32
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/inference_results.csv
deleted file mode 100644
index 15a2e38c..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(32)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00114,877.0,3536
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml
deleted file mode 100644
index a247a6a7..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml
deleted file mode 100644
index 5ff5e201..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=512
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=512
-    id: '5'
-    num: 5
-    config_name: bge_seq_len_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml
deleted file mode 100644
index a262b1b5..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=512
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/hydra_config.yaml
deleted file mode 100644
index 05f00cb8..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/inference_results.csv
deleted file mode 100644
index 120e5f03..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(512)/5/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00201,498.0,3500
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml
deleted file mode 100644
index 3a245689..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 64
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml
deleted file mode 100644
index 3025fc1d..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=64
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=64
-    id: '2'
-    num: 2
-    config_name: bge_seq_len_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml
deleted file mode 100644
index cba39030..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=64
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/hydra_config.yaml
deleted file mode 100644
index 606f06c6..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: 0
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config:
-    disable_shape_inference: false
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 64
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/inference_results.csv
deleted file mode 100644
index e8e30549..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(1)_sequence_length(64)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00113,885.0,3496
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(None)_sequence_length(None)/multirun.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(None)_sequence_length(None)/multirun.yaml
deleted file mode 100644
index a1ea59cd..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_cuda_o4_batch_size(None)_sequence_length(None)/multirun.yaml
+++ /dev/null
@@ -1,252 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task: []
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: ''
-    id: ???
-    num: ???
-    config_name: bge_seq_len_sweep_ort_cuda_o4.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: ???
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: O4
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: null
-    sequence_length: null
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_cuda_o4
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml
deleted file mode 100644
index d4b6b5d4..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml
deleted file mode 100644
index c5333f4d..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=128
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=128
-    id: '3'
-    num: 3
-    config_name: bge_seq_len_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml
deleted file mode 100644
index 1c55c407..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=128
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/hydra_config.yaml
deleted file mode 100644
index e40d334f..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/inference_results.csv
deleted file mode 100644
index 6cff36d1..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(128)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00124,806.0,3869
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml
deleted file mode 100644
index 4134efb9..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 16
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml
deleted file mode 100644
index e6886a78..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=16
-    id: '0'
-    num: 0
-    config_name: bge_seq_len_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml
deleted file mode 100644
index 7d89e6a3..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=16
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/hydra_config.yaml
deleted file mode 100644
index 01b97ae8..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 16
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/inference_results.csv
deleted file mode 100644
index 003987a6..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(16)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.000995,1010.0,3832
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml
deleted file mode 100644
index b35d8efc..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index 515c308b..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=256
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=256
-    id: '4'
-    num: 4
-    config_name: bge_seq_len_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index 68453b03..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=256
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/hydra_config.yaml
deleted file mode 100644
index fa81af8c..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/inference_results.csv
deleted file mode 100644
index 06f60d6f..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00148,676.0,3888
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml
deleted file mode 100644
index 430baf34..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 32
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml
deleted file mode 100644
index b2a9e143..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=32
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=32
-    id: '1'
-    num: 1
-    config_name: bge_seq_len_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml
deleted file mode 100644
index f47df8c7..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=32
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/hydra_config.yaml
deleted file mode 100644
index 42dbfbb1..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 32
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/inference_results.csv
deleted file mode 100644
index 57b1a868..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(32)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00105,952.0,3844
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml
deleted file mode 100644
index adbde47a..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml
deleted file mode 100644
index cb6168be..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=512
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=512
-    id: '5'
-    num: 5
-    config_name: bge_seq_len_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml
deleted file mode 100644
index a262b1b5..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=512
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/hydra_config.yaml
deleted file mode 100644
index 2a5170bd..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/inference_results.csv
deleted file mode 100644
index cc6a0421..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(512)/5/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.00197,508.0,3920
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml
deleted file mode 100644
index 1cfd0f78..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 64
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml
deleted file mode 100644
index 7d5c355b..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-    - benchmark.input_shapes.sequence_length=64
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1,benchmark.input_shapes.sequence_length=64
-    id: '2'
-    num: 2
-    config_name: bge_seq_len_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/fast-embedders/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml
deleted file mode 100644
index cba39030..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1,2 +0,0 @@
-- benchmark.input_shapes.batch_size=1
-- benchmark.input_shapes.sequence_length=64
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/hydra_config.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/hydra_config.yaml
deleted file mode 100644
index ad3cfaeb..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/hydra_config.yaml
+++ /dev/null
@@ -1,82 +0,0 @@
-backend:
-  name: onnxruntime
-  version: ort-gpu:1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    trt_engine_cache_enable: true
-    trt_engine_cache_path: tmp/trt_cache
-    device_id: 0
-    trt_fp16_enable: true
-  use_io_binding: false
-  session_options:
-    enable_profiling: false
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: true
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 64
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: false
-  can_generate: false
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/inference_results.csv b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/inference_results.csv
deleted file mode 100644
index 26698cd4..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(1)_sequence_length(64)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB)
-0,0.0011,909.0,3857
diff --git a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(None)_sequence_length(None)/multirun.yaml b/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(None)_sequence_length(None)/multirun.yaml
deleted file mode 100644
index f58dc5f7..00000000
--- a/examples/fast-mteb/experiments/bge_seq_len_sweep_ort_trt_fp16_batch_size(None)_sequence_length(None)/multirun.yaml
+++ /dev/null
@@ -1,253 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-  sweep:
-    dir: experiments/${experiment_name}_batch_size(${benchmark.input_shapes.batch_size})_sequence_length(${benchmark.input_shapes.sequence_length})
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: '1'
-      benchmark.input_shapes.sequence_length: 16,32,64,128,256,512
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task: []
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: ''
-    id: ???
-    num: ???
-    config_name: bge_seq_len_sweep_ort_trt_fp16.yaml
-    env_set:
-      CUDA_VISIBLE_DEVICES: '3'
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/fast-embedders
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/fast-embedders/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: ???
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
-backend:
-  name: onnxruntime
-  version: ${onnxruntime_version:}
-  _target_: optimum_benchmark.backends.onnxruntime.backend.ORTBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  export: true
-  use_cache: true
-  use_merged: false
-  torch_dtype: null
-  provider: TensorrtExecutionProvider
-  provider_options:
-    device_id: ${infer_device_id:${device}}
-    trt_fp16_enable: true
-  use_io_binding: ${io_bind:${device}}
-  session_options:
-    enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config: {}
-  quantization: false
-  quantization_config: {}
-  calibration: false
-  calibration_config: {}
-  auto_optimization: null
-  auto_optimization_config: {}
-  auto_quantization: null
-  auto_quantization_config: {}
-  use_inference_session: ${is_inference:${benchmark.name}}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: null
-    sequence_length: null
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: null
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bge_seq_len_sweep_ort_trt_fp16
-model: BAAI/bge-base-en-v1.5
-device: cuda
-task: feature-extraction
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.0
-  transformers_version: 4.34.0.dev0
-  accelerate_version: 0.23.0.dev0
-  diffusers_version: 0.21.0.dev0
-  python_version: 3.8.10
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/fast-mteb/report.py b/examples/fast-mteb/report.py
deleted file mode 100644
index 750e824f..00000000
--- a/examples/fast-mteb/report.py
+++ /dev/null
@@ -1,222 +0,0 @@
-from argparse import ArgumentParser
-from pathlib import Path
-
-import matplotlib.pyplot as plt
-import numpy as np
-import pandas as pd
-from flatten_dict import flatten
-from omegaconf import OmegaConf
-from pandas import DataFrame
-from rich.console import Console
-from rich.table import Table
-from rich.terminal_theme import MONOKAI
-
-
-def gather_inference_report(root_folder: Path) -> DataFrame:
-    # key is path to inference file as string, value is dataframe
-    inference_dfs = {
-        f.parent.absolute().as_posix(): pd.read_csv(f) for f in root_folder.glob("**/inference_results.csv")
-    }
-
-    # key is path to config file as string, value is flattened dict
-    config_dfs = {
-        f.parent.absolute()
-        .as_posix(): pd.DataFrame.from_dict(flatten(OmegaConf.load(f), reducer="dot"), orient="index")
-        .T
-        for f in root_folder.glob("**/hydra_config.yaml")
-        if f.parent.absolute().as_posix() in inference_dfs.keys()
-    }
-
-    if len(inference_dfs) == 0 or len(config_dfs) == 0:
-        raise ValueError(f"No results found in {root_folder}")
-
-    # Merge inference and config dataframes
-    inference_reports = [
-        config_dfs[name].merge(inference_dfs[name], left_index=True, right_index=True) for name in inference_dfs.keys()
-    ]
-
-    # Concatenate all reports
-    inference_report = pd.concat(inference_reports, axis=0, ignore_index=True)
-    inference_report.set_index("experiment_name", inplace=True)
-    return inference_report
-
-
-def style_element(element, style=""):
-    if style:
-        return f"[{style}]{element}[/{style}]"
-    else:
-        return element
-
-
-def format_element(element, style=""):
-    if isinstance(element, float):
-        if element != element:  # nan
-            formated_element = ""
-        elif abs(element) >= 1:
-            formated_element = f"{element:.2f}"
-        elif abs(element) > 1e-6:
-            formated_element = f"{element:.2e}"
-        else:
-            formated_element = f"{element}"
-    elif element is None:
-        formated_element = ""
-    elif isinstance(element, bool):
-        if element:
-            formated_element = style_element("✔", style="green")
-        else:
-            formated_element = style_element("✘", style="red")
-    else:
-        formated_element = str(element)
-
-    return style_element(formated_element, style=style)
-
-
-def format_row(row, style=""):
-    formated_row = []
-    for element in row:
-        formated_row.append(format_element(element, style=style))
-    return formated_row
-
-
-def get_short_report(inference_report):
-    short_columns = {
-        "backend.name": "Backend",
-        "backend.provider": "Provider",
-        "benchmark.input_shapes.batch_size": "Batch Size",
-        "benchmark.input_shapes.sequence_length": "Sequence Length",
-        "forward.latency(s)": "Forward Latency (s)",
-        "forward.throughput(samples/s)": "Forward Throughput (samples/s)",
-    }
-    short_report = (
-        inference_report[list(short_columns.keys())]
-        .rename(columns=short_columns)
-        .sort_values(by=["Batch Size", "Sequence Length"], ascending=True)
-    )
-
-    short_report["Backend"] = short_report["Backend"].str.replace("pytorch", "PyTorch")
-    short_report["Backend"] = short_report["Backend"].str.replace("onnxruntime", "OnnxRuntime")
-
-    return short_report
-
-
-def get_rich_table(short_report):
-    # create rich table
-    rich_table = Table(show_header=True, show_lines=True)
-    # we add a column for the index
-    rich_table.add_column("Experiment Name", justify="left", header_style="")
-    # we populate the table with values
-    for column in short_report.columns:
-        rich_table.add_column(column, justify="right", header_style="bold")
-    # we add rows
-    for index, row in short_report.iterrows():
-        rich_table.add_row(index, *format_row(row.values, style=""))
-
-    return rich_table
-
-
-def get_throughput_plot(short_report):
-    fig1, ax1 = plt.subplots()
-    fig2, ax2 = plt.subplots()
-
-    short_report["Forward Latency (ms)"] = short_report["Forward Latency (s)"] * 1000
-    short_report["Backend"] = short_report[["Backend", "Provider"]].apply(
-        lambda x: f"{x.iloc[0]}+{x.iloc[1]}" if x.iloc[1] == x.iloc[1] else f"{x.iloc[0]}", axis=1
-    )
-
-    width = 0.3
-    n_backends = len(short_report["Backend"].unique())
-    for i, backend in enumerate(short_report["Backend"].unique(), start=-n_backends // 2):
-        # for latency, we study the case of batch size 1 across all sequence lengths
-        backend_report = (
-            short_report[(short_report["Backend"] == backend) & (short_report["Batch Size"] == 1)]
-            .drop_duplicates(subset=["Sequence Length"])
-            .sort_values(by="Sequence Length", ascending=True)
-        )
-        seq_lens_axis = np.arange(backend_report["Sequence Length"].nunique()) + width * i
-        ax1.bar(
-            seq_lens_axis,
-            backend_report["Forward Latency (ms)"],
-            width=width,
-            label=backend,
-        )
-
-        # for throughput, we study the case of sequence length 256 across all batch sizes
-        backend_report = (
-            short_report[
-                (short_report["Backend"] == backend)
-                & (short_report["Sequence Length"] == 256)
-                & (short_report["Batch Size"] <= 256)
-            ]
-            .drop_duplicates(subset=["Batch Size"])
-            .sort_values(by="Batch Size", ascending=True)
-        )
-        ax2.plot(
-            backend_report["Batch Size"],
-            backend_report["Forward Throughput (samples/s)"],
-            label=backend,
-            marker="o",
-        )
-
-    ax1.legend()
-    ax1.set_xlabel("Sequence Length")
-    ax1.set_ylabel("Forward Latency (ms)")
-    ax1.set_title("Forward Latency per Sequence Length")
-    ax1.set_xticks(np.arange(len(short_report["Sequence Length"].unique())))
-    ax1.set_xticklabels(short_report["Sequence Length"].unique())
-    ax1.axhline(y=1, color="black", linestyle="--")
-    ax1.axhline(y=2, color="red", linestyle="--")
-
-    ax2.legend()
-    ax2.set_xlabel("Batch Size")
-    ax2.set_ylabel("Forward Throughput (samples/s)")
-    ax2.set_title("Forward Throughput per Batch Size")
-
-    return fig1, fig2
-
-
-def generate_report():
-    parser = ArgumentParser()
-    parser.add_argument(
-        "--experiments",
-        "-e",
-        type=Path,
-        required=True,
-        help="The folder containing the results of experiments.",
-    )
-    parser.add_argument(
-        "--report-name",
-        "-r",
-        type=str,
-        required=False,
-        help="The name of the report.",
-    )
-
-    args = parser.parse_args()
-    experiments_folders = args.experiments
-
-    if args.report_name:
-        report_folder = f"artifacts/{args.report_name}"
-    else:
-        report_folder = "artifacts"
-    Path(report_folder).mkdir(parents=True, exist_ok=True)
-
-    # gather experiments results
-    inference_report = gather_inference_report(experiments_folders)
-    inference_report.sort_values(by="forward.throughput(samples/s)", ascending=False, inplace=True)
-    inference_report.to_csv(f"{report_folder}/full_report.csv")
-
-    short_report = get_short_report(inference_report)
-    short_report.to_csv(f"{report_folder}/short_report.csv")
-
-    rich_table = get_rich_table(short_report)
-    console = Console(record=True)
-    console.print(rich_table, justify="center")
-    console.save_svg(f"{report_folder}/rich_table.svg", theme=MONOKAI, title="Inference Report")
-
-    forward_latency_plot, forward_throughput_plot = get_throughput_plot(short_report)
-    forward_latency_plot.savefig(f"{report_folder}/forward_latency_plot.png")
-    forward_throughput_plot.savefig(f"{report_folder}/forward_throughput_plot.png")
-
-
-if __name__ == "__main__":
-    generate_report()
diff --git a/examples/fast-mteb/script.sh b/examples/fast-mteb/script.sh
deleted file mode 100644
index ef7bf418..00000000
--- a/examples/fast-mteb/script.sh
+++ /dev/null
@@ -1,7 +0,0 @@
-for f in configs/*.yaml; do
-    if [ "$f" = "configs/bge_base_config.yaml" ]; then
-        # skip
-        continue
-    fi
-    optimum-benchmark --config-dir configs --config-name $(basename $f .json) -m
-done
diff --git a/examples/openvino_diffusion.yaml b/examples/openvino_diffusion.yaml
index f9f62e64..b7b325f0 100644
--- a/examples/openvino_diffusion.yaml
+++ b/examples/openvino_diffusion.yaml
@@ -7,10 +7,9 @@ defaults:
   - override hydra/job_logging: colorlog # colorful logging
   - override hydra/hydra_logging: colorlog # colorful logging
 
-model: stabilityai/stable-diffusion-2-1
-
 backend:
   device: cpu
+  model: stabilityai/stable-diffusion-2-1
   experiment_name: openvino_diffusion
   reshape: true
   export: true
diff --git a/examples/running-llamas/README.md b/examples/running-llamas/README.md
deleted file mode 100644
index f4c9036c..00000000
--- a/examples/running-llamas/README.md
+++ /dev/null
@@ -1,66 +0,0 @@
-# Optimum-Benchmark x LLaMA
-
-A set of benchmarks on Meta's LLaMA2's inference.
-
-## Setup
-
-You will need to install any necessary third-party libraries like `deepspeed` or `auto-gptq` depending on the hardware and benchmarks you want to run.
-
-For example running FlashAttentionV2 on two devices with Tensor Parallelism (i.e. `fp16+fa2+tp=2`) will require: `deepspeed` and `flash-attn`
-
-## Running
-
-Then run the benchmarks from this directory with:
-
-```bash
-optimum-benchmark --config-dir configs/ --config-name fp16 --multirun
-optimum-benchmark --config-dir configs/ --config-name fp16+fa2+tp=2 --multirun
-[...]
-```
-
-This will create a folder called `experiments` with the results of the benchmarks with an inference `batch_size` ranging from 1 to 128 and an input `sequence_length` (prompt size) of 256.
-
-## Reporting
-
-To create a report for 7B models on A100-80GB, run:
-
-```bash
-python report.py -e experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/ experiments/hf-dgx-01/TheBloke/LLaMa-7B-GPTQ/ -r artifacts/Llama-7b/
-python report.py -e experiments/hf-dgx-01/NousResearch/Llama-2-13b-hf/ experiments/hf-dgx-01/TheBloke/LLaMa-13B-GPTQ/ -r artifacts/Llama-13b/
-python report.py -e experiments/hf-dgx-01/NousResearch/Llama-2-65b-hf/ experiments/hf-dgx-01/TheBloke/LLaMa-65B-GPTQ/ -r artifacts/Llama-65b/
-```
-
-Which will create some quick reporting artifacts like a `full_report.csv`, `short_report.csv`, and some interesting analysis plots.
-
-
-## Results
-
-### LLaMA-7B on A100-80GB
-
-<p align="center">
-<img src="artifacts/Llama-7b/decode_throughput_bar_plot.png" alt="throughput_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/Llama-7b/prefill_latency_bar_plot.png" alt="latency_plot" width="60%"/>
-</p>
-
-### LLaMA-13B on A100-80GB
-
-<p align="center">
-<img src="artifacts/Llama-13b/decode_throughput_bar_plot.png" alt="throughput_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/Llama-13b/prefill_latency_bar_plot.png" alt="latency_plot" width="60%"/>
-</p>
-
-### LLaMA-65B on A100-80GB
-
-<p align="center">
-<img src="artifacts/Llama-65b/decode_throughput_bar_plot.png" alt="throughput_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/Llama-65b/prefill_latency_bar_plot.png" alt="latency_plot" width="60%"/>
-</p>
\ No newline at end of file
diff --git a/examples/running-llamas/artifacts/Llama-13b/decode_throughput_bar_plot.png b/examples/running-llamas/artifacts/Llama-13b/decode_throughput_bar_plot.png
deleted file mode 100644
index 9c8f6b34..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/decode_throughput_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/decode_throughput_line_plot.png b/examples/running-llamas/artifacts/Llama-13b/decode_throughput_line_plot.png
deleted file mode 100644
index fa374c90..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/decode_throughput_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/full_report.csv b/examples/running-llamas/artifacts/Llama-13b/full_report.csv
deleted file mode 100644
index 313d3b63..00000000
--- a/examples/running-llamas/artifacts/Llama-13b/full_report.csv
+++ /dev/null
@@ -1,31 +0,0 @@
-,launcher.name,launcher._target_,launcher.start_method,backend.name,backend.version,backend._target_,backend.seed,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.continuous_isolation,backend.isolation_check_interval,backend.delete_cache,backend.no_weights,backend.device_map,backend.torch_dtype,backend.eval_mode,backend.disable_grad,backend.amp_autocast,backend.amp_dtype,backend.torch_compile,backend.to_bettertransformer,backend.use_flash_attention_2,backend.quantization_scheme,backend.data_parallel,backend.deepspeed_inference,backend.peft_strategy,benchmark.name,benchmark._target_,benchmark.duration,benchmark.warmup_runs,benchmark.memory,benchmark.energy,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,benchmark.can_diffuse,benchmark.can_generate,benchmark.generate_kwargs.num_return_sequences,benchmark.generate_kwargs.max_new_tokens,benchmark.generate_kwargs.min_new_tokens,benchmark.generate_kwargs.do_sample,benchmark.generate_kwargs.use_cache,benchmark.generate_kwargs.pad_token_id,benchmark.generate_kwargs.num_beams,experiment_name,model,task,device,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,environment.optimum_version,environment.optimum_commit,environment.transformers_version,environment.transformers_commit,environment.accelerate_version,environment.accelerate_commit,environment.diffusers_version,environment.diffusers_commit,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,environment.gpus,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),forward.max_memory_used(MB),forward.max_memory_allocated(MB),forward.max_memory_reserved(MB),generate.latency(s),generate.throughput(tokens/s),decode.latency(s),decode.throughput(tokens/s),generate.peak_memory(MB),generate.max_memory_used(MB),generate.max_memory_allocated(MB),generate.max_memory_reserved(MB),backend.quantization_config.exllama_config.version
-0,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0543,18.4,28034,28034,26512,26562,17.1,29.9,17.0,30.1,29420,29420,27506,27946,
-1,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.206,19.4,29265,29265,27297,27793,17.8,115.0,17.6,116.0,53638,53638,31284,52164,
-2,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.52,21.1,39721,39721,34617,38249,42.6,385.0,41.1,398.0,68242,68242,66527,84414,
-3,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.363,22.0,30728,30728,28342,29257,20.3,202.0,19.9,205.0,79217,79217,36318,84401,
-4,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.707,22.6,33732,33732,30433,32260,28.2,290.0,27.5,297.0,67049,67049,46388,84422,
-5,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.106,18.9,28497,28497,26773,27025,17.1,59.9,17.0,60.1,32882,32882,28762,31409,
-6,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0508,19.7,28023,28023,26512,26552,15.4,33.2,15.3,33.4,29409,29409,27506,27936,
-7,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.194,20.6,29248,29248,27297,27776,16.7,123.0,16.5,124.0,53583,53583,31284,52110,
-8,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.43,22.4,39562,39562,34617,38090,42.6,385.0,41.2,397.0,68075,68075,66524,84422,
-9,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.348,23.0,30689,30689,28342,29217,20.3,202.0,20.0,204.0,79317,79317,36318,84418,
-10,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.678,23.6,33652,33652,30433,32180,28.1,292.0,27.4,298.0,67211,67211,46387,84408,
-11,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.101,19.8,28493,28493,26773,27021,16.2,63.2,16.1,63.5,32857,32857,28762,31383,
-12,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0518,19.3,28023,28023,26512,26552,15.8,32.4,15.7,32.5,29409,29409,27506,27936,
-13,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.194,20.6,29246,29246,27297,27774,16.6,123.0,16.4,125.0,53583,53583,31284,52110,
-14,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.44,22.2,39583,39583,34617,38111,42.6,385.0,41.2,397.0,68473,68473,66524,84418,
-15,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.353,22.7,30684,30684,28342,29213,20.2,203.0,19.8,206.0,79320,79320,36318,84416,
-16,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.697,23.0,33650,33650,30433,32178,28.0,293.0,27.3,299.0,67523,67523,46387,84412,
-17,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-13b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.101,19.8,28493,28493,26773,27021,16.2,63.2,16.1,63.5,32857,32857,28762,31383,
-18,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0772,13.0,10300,10300,8714,8824,18.4,27.8,18.3,27.9,11684,11684,9708,10208,2
-19,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.208,19.2,11542,11542,9499,10066,18.8,109.0,18.6,110.0,35894,35894,13487,34418,2
-20,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.49,21.5,21998,21998,16820,20522,59.1,277.0,57.6,284.0,50767,50767,48729,84418,2
-21,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.382,20.9,13005,13005,10545,11530,20.3,202.0,19.9,205.0,42821,42821,18521,84370,2
-22,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.749,21.4,16120,16120,12636,14644,32.6,251.0,31.9,256.0,30456,30456,28590,84420,2
-23,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.122,16.4,10772,10772,8976,9296,18.6,55.1,18.5,55.2,15145,15145,10965,13669,2
-24,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0683,14.6,9392,9392,7802,7916,19.2,26.7,19.1,26.8,10776,10776,8796,9300,1
-25,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.177,22.6,10621,10621,8586,9145,25.5,80.3,25.3,80.8,34992,34992,12574,33516,1
-26,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.21,26.4,21079,21079,15907,19604,54.3,302.0,53.1,308.0,67565,67565,47817,84418,1
-27,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.328,24.4,12085,12085,9632,10609,32.8,125.0,32.5,126.0,41900,41900,17608,84389,1
-28,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.733,21.8,15088,15088,11723,13612,40.0,205.0,39.3,208.0,85422,85422,27678,84418,1
-29,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-13B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.106,18.9,9851,9851,8063,8376,18.4,55.7,18.3,55.8,14197,14197,10052,12721,1
diff --git a/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_allocated_bar_plot.png b/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_allocated_bar_plot.png
deleted file mode 100644
index e93e3e4d..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_allocated_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_allocated_line_plot.png b/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_allocated_line_plot.png
deleted file mode 100644
index 8b1327ad..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_allocated_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_reserved_bar_plot.png b/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_reserved_bar_plot.png
deleted file mode 100644
index 80b9dbd6..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_reserved_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_reserved_line_plot.png b/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_reserved_line_plot.png
deleted file mode 100644
index 12a57525..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/generate_max_memory_reserved_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/peak_decode_throughput_bar_plot.png b/examples/running-llamas/artifacts/Llama-13b/peak_decode_throughput_bar_plot.png
deleted file mode 100644
index 65a4ae32..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/peak_decode_throughput_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/prefill_latency_bar_plot.png b/examples/running-llamas/artifacts/Llama-13b/prefill_latency_bar_plot.png
deleted file mode 100644
index 903dc1b6..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/prefill_latency_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/prefill_latency_line_plot.png b/examples/running-llamas/artifacts/Llama-13b/prefill_latency_line_plot.png
deleted file mode 100644
index 4d47c480..00000000
Binary files a/examples/running-llamas/artifacts/Llama-13b/prefill_latency_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-13b/short_report.csv b/examples/running-llamas/artifacts/Llama-13b/short_report.csv
deleted file mode 100644
index 27e5a935..00000000
--- a/examples/running-llamas/artifacts/Llama-13b/short_report.csv
+++ /dev/null
@@ -1,31 +0,0 @@
-,Model,GPUs,Experiment Name,Per Process Batch Size,Sequence Length,Decode Latency (s),Prefill Latency (s),Decode Throughput (tokens/s),Prefill Throughput (samples/s),Generate Max Memory Allocated (MB),Generate Max Memory Reserved (MB),GPU Name,Num GPUs,Effective Batch Size,Group
-0,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16,1,256,17.0,0.0543,30.1,18.4,27506,27946,1xA100,1,1,1xA100-fp16
-1,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16,4,256,17.6,0.206,116.0,19.4,31284,52164,1xA100,1,4,1xA100-fp16
-2,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16,32,256,41.1,1.52,398.0,21.1,66527,84414,1xA100,1,32,1xA100-fp16
-3,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16,8,256,19.9,0.363,205.0,22.0,36318,84401,1xA100,1,8,1xA100-fp16
-4,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16,16,256,27.5,0.707,297.0,22.6,46388,84422,1xA100,1,16,1xA100-fp16
-5,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16,2,256,17.0,0.106,60.1,18.9,28762,31409,1xA100,1,2,1xA100-fp16
-6,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,1,256,15.3,0.0508,33.4,19.7,27506,27936,1xA100,1,1,1xA100-fp16+bt
-7,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,4,256,16.5,0.194,124.0,20.6,31284,52110,1xA100,1,4,1xA100-fp16+bt
-8,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,32,256,41.2,1.43,397.0,22.4,66524,84422,1xA100,1,32,1xA100-fp16+bt
-9,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,8,256,20.0,0.348,204.0,23.0,36318,84418,1xA100,1,8,1xA100-fp16+bt
-10,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,16,256,27.4,0.678,298.0,23.6,46387,84408,1xA100,1,16,1xA100-fp16+bt
-11,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,2,256,16.1,0.101,63.5,19.8,28762,31383,1xA100,1,2,1xA100-fp16+bt
-12,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,1,256,15.7,0.0518,32.5,19.3,27506,27936,1xA100,1,1,1xA100-fp16+fa2
-13,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,4,256,16.4,0.194,125.0,20.6,31284,52110,1xA100,1,4,1xA100-fp16+fa2
-14,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,32,256,41.2,1.44,397.0,22.2,66524,84418,1xA100,1,32,1xA100-fp16+fa2
-15,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,8,256,19.8,0.353,206.0,22.7,36318,84416,1xA100,1,8,1xA100-fp16+fa2
-16,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,16,256,27.3,0.697,299.0,23.0,46387,84412,1xA100,1,16,1xA100-fp16+fa2
-17,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,2,256,16.1,0.101,63.5,19.8,28762,31383,1xA100,1,2,1xA100-fp16+fa2
-18,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,1,256,18.3,0.0772,27.9,13.0,9708,10208,1xA100,1,1,1xA100-fp16+gptq+exllamav2
-19,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,4,256,18.6,0.208,110.0,19.2,13487,34418,1xA100,1,4,1xA100-fp16+gptq+exllamav2
-20,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,32,256,57.6,1.49,284.0,21.5,48729,84418,1xA100,1,32,1xA100-fp16+gptq+exllamav2
-21,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,8,256,19.9,0.382,205.0,20.9,18521,84370,1xA100,1,8,1xA100-fp16+gptq+exllamav2
-22,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,16,256,31.9,0.749,256.0,21.4,28590,84420,1xA100,1,16,1xA100-fp16+gptq+exllamav2
-23,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,2,256,18.5,0.122,55.2,16.4,10965,13669,1xA100,1,2,1xA100-fp16+gptq+exllamav2
-24,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,1,256,19.1,0.0683,26.8,14.6,8796,9300,1xA100,1,1,1xA100-fp16+gptq+exllamav1
-25,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,4,256,25.3,0.177,80.8,22.6,12574,33516,1xA100,1,4,1xA100-fp16+gptq+exllamav1
-26,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,32,256,53.1,1.21,308.0,26.4,47817,84418,1xA100,1,32,1xA100-fp16+gptq+exllamav1
-27,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,8,256,32.5,0.328,126.0,24.4,17608,84389,1xA100,1,8,1xA100-fp16+gptq+exllamav1
-28,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,16,256,39.3,0.733,208.0,21.8,27678,84418,1xA100,1,16,1xA100-fp16+gptq+exllamav1
-29,TheBloke/LLaMa-13B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,2,256,18.3,0.106,55.8,18.9,10052,12721,1xA100,1,2,1xA100-fp16+gptq+exllamav1
diff --git a/examples/running-llamas/artifacts/Llama-65b/decode_throughput_bar_plot.png b/examples/running-llamas/artifacts/Llama-65b/decode_throughput_bar_plot.png
deleted file mode 100644
index 2f0547b3..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/decode_throughput_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/decode_throughput_line_plot.png b/examples/running-llamas/artifacts/Llama-65b/decode_throughput_line_plot.png
deleted file mode 100644
index 912bb8f1..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/decode_throughput_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/full_report.csv b/examples/running-llamas/artifacts/Llama-65b/full_report.csv
deleted file mode 100644
index 7ebf49b1..00000000
--- a/examples/running-llamas/artifacts/Llama-65b/full_report.csv
+++ /dev/null
@@ -1,9 +0,0 @@
-,launcher.name,launcher._target_,launcher.start_method,backend.name,backend.version,backend._target_,backend.seed,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.continuous_isolation,backend.isolation_check_interval,backend.delete_cache,backend.no_weights,backend.device_map,backend.torch_dtype,backend.eval_mode,backend.disable_grad,backend.amp_autocast,backend.amp_dtype,backend.torch_compile,backend.to_bettertransformer,backend.use_flash_attention_2,backend.quantization_scheme,backend.quantization_config.exllama_config.version,backend.data_parallel,backend.deepspeed_inference,backend.peft_strategy,benchmark.name,benchmark._target_,benchmark.duration,benchmark.warmup_runs,benchmark.memory,benchmark.energy,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,benchmark.can_diffuse,benchmark.can_generate,benchmark.generate_kwargs.num_return_sequences,benchmark.generate_kwargs.max_new_tokens,benchmark.generate_kwargs.min_new_tokens,benchmark.generate_kwargs.do_sample,benchmark.generate_kwargs.use_cache,benchmark.generate_kwargs.pad_token_id,benchmark.generate_kwargs.num_beams,experiment_name,model,task,device,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,environment.optimum_version,environment.optimum_commit,environment.transformers_version,environment.transformers_commit,environment.accelerate_version,environment.accelerate_commit,environment.diffusers_version,environment.diffusers_commit,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,environment.gpus,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),forward.max_memory_used(MB),forward.max_memory_allocated(MB),forward.max_memory_reserved(MB),generate.latency(s),generate.throughput(tokens/s),decode.latency(s),decode.throughput(tokens/s),generate.peak_memory(MB),generate.max_memory_used(MB),generate.max_memory_allocated(MB),generate.max_memory_reserved(MB)
-0,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,2,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-65B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.348,2.87,37657,37657,36106,36182,36.3,14.1,36.0,14.2,42020,42020,39404,40544
-1,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,2,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-65B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.957,4.18,40956,40956,38279,39480,41.4,49.5,40.4,50.6,60776,60776,51488,84401
-2,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,2,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-65B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.77,4.52,44979,44979,41176,43503,67.0,61.1,65.2,62.7,84835,84835,67597,84408
-3,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,2,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-65B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.56,3.57,38916,38916,36830,37440,39.3,26.1,38.7,26.4,67076,67076,43434,65601
-4,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,1,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-65B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.355,2.82,36315,36315,34753,34819,49.1,10.4,48.7,10.5,40694,40694,38052,39197
-5,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,1,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-65B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.967,4.14,39623,39623,36926,38126,136.0,15.1,135.0,15.1,51725,51725,50136,84397
-6,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,1,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-65B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.78,4.49,43645,43645,39823,42148,139.0,29.5,137.0,29.8,83501,83501,66244,84391
-7,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,1,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-65B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.574,3.48,37582,37582,35477,36085,77.0,13.3,76.4,13.4,65743,65743,42082,64246
diff --git a/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_allocated_bar_plot.png b/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_allocated_bar_plot.png
deleted file mode 100644
index 8258f208..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_allocated_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_allocated_line_plot.png b/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_allocated_line_plot.png
deleted file mode 100644
index dccd8188..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_allocated_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_reserved_bar_plot.png b/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_reserved_bar_plot.png
deleted file mode 100644
index 762ea0f7..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_reserved_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_reserved_line_plot.png b/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_reserved_line_plot.png
deleted file mode 100644
index 716aeeef..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/generate_max_memory_reserved_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/peak_decode_throughput_bar_plot.png b/examples/running-llamas/artifacts/Llama-65b/peak_decode_throughput_bar_plot.png
deleted file mode 100644
index af19789f..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/peak_decode_throughput_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/prefill_latency_bar_plot.png b/examples/running-llamas/artifacts/Llama-65b/prefill_latency_bar_plot.png
deleted file mode 100644
index 81d1ac85..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/prefill_latency_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/prefill_latency_line_plot.png b/examples/running-llamas/artifacts/Llama-65b/prefill_latency_line_plot.png
deleted file mode 100644
index de56dbba..00000000
Binary files a/examples/running-llamas/artifacts/Llama-65b/prefill_latency_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-65b/short_report.csv b/examples/running-llamas/artifacts/Llama-65b/short_report.csv
deleted file mode 100644
index 943f7f5b..00000000
--- a/examples/running-llamas/artifacts/Llama-65b/short_report.csv
+++ /dev/null
@@ -1,9 +0,0 @@
-,Model,GPUs,Experiment Name,Per Process Batch Size,Sequence Length,Decode Latency (s),Prefill Latency (s),Decode Throughput (tokens/s),Prefill Throughput (samples/s),Generate Max Memory Allocated (MB),Generate Max Memory Reserved (MB),GPU Name,Num GPUs,Effective Batch Size,Group
-0,TheBloke/LLaMa-65B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,1,256,36.0,0.348,14.2,2.87,39404,40544,1xA100,1,1,1xA100-fp16+gptq+exllamav2
-1,TheBloke/LLaMa-65B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,4,256,40.4,0.957,50.6,4.18,51488,84401,1xA100,1,4,1xA100-fp16+gptq+exllamav2
-2,TheBloke/LLaMa-65B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,8,256,65.2,1.77,62.7,4.52,67597,84408,1xA100,1,8,1xA100-fp16+gptq+exllamav2
-3,TheBloke/LLaMa-65B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,2,256,38.7,0.56,26.4,3.57,43434,65601,1xA100,1,2,1xA100-fp16+gptq+exllamav2
-4,TheBloke/LLaMa-65B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,1,256,48.7,0.355,10.5,2.82,38052,39197,1xA100,1,1,1xA100-fp16+gptq+exllamav1
-5,TheBloke/LLaMa-65B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,4,256,135.0,0.967,15.1,4.14,50136,84397,1xA100,1,4,1xA100-fp16+gptq+exllamav1
-6,TheBloke/LLaMa-65B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,8,256,137.0,1.78,29.8,4.49,66244,84391,1xA100,1,8,1xA100-fp16+gptq+exllamav1
-7,TheBloke/LLaMa-65B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,2,256,76.4,0.574,13.4,3.48,42082,64246,1xA100,1,2,1xA100-fp16+gptq+exllamav1
diff --git a/examples/running-llamas/artifacts/Llama-7b/decode_throughput_bar_plot.png b/examples/running-llamas/artifacts/Llama-7b/decode_throughput_bar_plot.png
deleted file mode 100644
index ccff3652..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/decode_throughput_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/decode_throughput_line_plot.png b/examples/running-llamas/artifacts/Llama-7b/decode_throughput_line_plot.png
deleted file mode 100644
index 378f1494..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/decode_throughput_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/full_report.csv b/examples/running-llamas/artifacts/Llama-7b/full_report.csv
deleted file mode 100644
index abbe8b67..00000000
--- a/examples/running-llamas/artifacts/Llama-7b/full_report.csv
+++ /dev/null
@@ -1,36 +0,0 @@
-,launcher.name,launcher._target_,launcher.start_method,backend.name,backend.version,backend._target_,backend.seed,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.continuous_isolation,backend.isolation_check_interval,backend.delete_cache,backend.no_weights,backend.device_map,backend.torch_dtype,backend.eval_mode,backend.disable_grad,backend.amp_autocast,backend.amp_dtype,backend.torch_compile,backend.to_bettertransformer,backend.use_flash_attention_2,backend.quantization_scheme,backend.data_parallel,backend.deepspeed_inference,backend.peft_strategy,benchmark.name,benchmark._target_,benchmark.duration,benchmark.warmup_runs,benchmark.memory,benchmark.energy,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,benchmark.can_diffuse,benchmark.can_generate,benchmark.generate_kwargs.num_return_sequences,benchmark.generate_kwargs.max_new_tokens,benchmark.generate_kwargs.min_new_tokens,benchmark.generate_kwargs.do_sample,benchmark.generate_kwargs.use_cache,benchmark.generate_kwargs.pad_token_id,benchmark.generate_kwargs.num_beams,experiment_name,model,task,device,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,environment.optimum_version,environment.optimum_commit,environment.transformers_version,environment.transformers_commit,environment.accelerate_version,environment.accelerate_commit,environment.diffusers_version,environment.diffusers_commit,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,environment.gpus,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),forward.max_memory_used(MB),forward.max_memory_allocated(MB),forward.max_memory_reserved(MB),generate.latency(s),generate.throughput(tokens/s),decode.latency(s),decode.throughput(tokens/s),generate.peak_memory(MB),generate.max_memory_used(MB),generate.max_memory_allocated(MB),generate.max_memory_reserved(MB),backend.quantization_config.exllama_config.version
-0,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0336,29.8,15239,15239,13738,13767,13.2,38.8,13.2,38.7,15954,15954,14356,14480,
-1,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.109,36.7,16107,16107,14295,14636,13.8,148.0,13.7,149.0,26434,26434,16774,24960,
-2,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.826,38.7,23464,23464,19487,21992,27.2,602.0,26.4,619.0,53264,53264,39331,84422,
-3,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,64,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.65,38.8,31911,31911,25422,30440,45.9,714.0,44.2,740.0,67584,67584,65112,84420,
-4,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.21,38.1,17172,17172,15037,15701,14.1,290.0,13.9,294.0,64977,64977,19997,63503,
-5,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.412,38.8,19251,19251,16520,17779,17.5,468.0,17.1,478.0,28076,28076,26442,84420,
-6,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.059,33.9,15478,15478,13924,14006,13.5,75.9,13.4,76.3,17091,17091,15162,15617,
-7,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0318,31.4,15239,15239,13738,13767,12.2,42.0,12.2,41.9,15954,15954,14356,14480,
-8,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.104,38.5,16093,16093,14295,14621,13.1,156.0,13.0,157.0,26457,26457,16774,24983,
-9,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.804,39.8,23334,23334,19487,21862,27.3,600.0,26.5,617.0,53531,53531,39331,84408,
-10,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,64,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.65,38.8,31651,31651,25422,30180,46.7,702.0,45.1,725.0,66915,66915,65111,84420,
-11,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.2,40.0,17143,17143,15037,15672,13.3,308.0,13.1,312.0,65229,65229,19997,63755,
-12,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.4,40.0,19186,19186,16520,17714,17.4,471.0,17.0,481.0,28109,28109,26441,84410,
-13,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,True,False,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+bt,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0558,35.8,15470,15470,13924,13998,12.7,80.6,12.6,81.1,17087,17087,15162,15613,
-14,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0321,31.2,15239,15239,13738,13767,12.2,42.0,12.2,41.9,15954,15954,14356,14480,
-15,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.104,38.5,16097,16097,14295,14625,12.7,161.0,12.6,162.0,26268,26268,16774,24794,
-16,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.786,40.7,23347,23347,19487,21875,27.2,602.0,26.4,619.0,54047,54047,39331,84412,
-17,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,64,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.56,41.0,31676,31676,25422,30205,46.3,708.0,44.7,732.0,67563,67563,65110,84422,
-18,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.197,40.6,17139,17139,15037,15667,13.1,313.0,12.9,317.0,65229,65229,19997,63755,
-19,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.392,40.8,19182,19182,16520,17710,17.2,476.0,16.8,487.0,28256,28256,26442,84404,
-20,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,True,,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+fa2,NousResearch/Llama-2-7b-hf,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0548,36.5,15470,15470,13924,13998,13.0,78.8,12.9,79.2,17087,17087,15162,15613,
-21,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0457,21.9,6620,6620,4991,5144,14.5,35.3,14.5,35.2,7479,7479,5609,6004,2
-22,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.122,32.8,7635,7635,5548,6159,15.1,136.0,15.0,136.0,17959,17959,8027,16483,2
-23,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.833,38.4,15184,15184,10740,13709,35.8,458.0,35.0,467.0,45304,45304,30585,84418,2
-24,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,64,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.61,39.8,23439,23439,16675,21963,53.4,614.0,51.8,631.0,59111,59111,56364,84418,2
-25,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.223,35.9,8700,8700,6289,7224,15.3,268.0,15.1,271.0,56502,56502,11250,55027,2
-26,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.425,37.6,10866,10866,7772,9391,20.5,400.0,20.1,407.0,65550,65550,17694,84385,2
-27,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,False,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav2,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0708,28.2,6745,6745,5176,5270,14.7,69.7,14.6,70.0,8696,8696,6414,7220,2
-28,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0416,24.0,5892,5892,4265,4416,14.6,35.1,14.6,35.0,6752,6752,4883,5276,1
-29,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.106,37.7,6907,6907,4822,5431,15.5,132.0,15.4,133.0,17231,17231,7301,15755,1
-30,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,32,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.688,46.5,14457,14457,10014,12981,33.0,496.0,32.3,506.0,32224,32224,29858,84420,1
-31,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,64,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],1.32,48.5,22711,22711,15949,21235,51.1,641.0,49.8,657.0,83617,83617,55638,84418,1
-32,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.191,41.9,7972,7972,5563,6496,19.6,209.0,19.4,211.0,55775,55775,10524,54299,1
-33,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.356,44.9,10137,10137,7046,8661,24.6,333.0,24.2,338.0,59378,59378,16969,84406,1
-34,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu121,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,True,True,False,,False,False,False,gptq,False,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,256,1,80,3000,16000,512,False,True,1,512,512,False,True,0,1,fp16+gptq+exllamav1,TheBloke/LLaMa-7B-GPTQ,text-generation,cuda,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],0.0621,32.2,6018,6018,4450,4542,14.8,69.2,14.7,69.5,7968,7968,5688,6492,1
diff --git a/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_allocated_bar_plot.png b/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_allocated_bar_plot.png
deleted file mode 100644
index 1df43ed8..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_allocated_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_allocated_line_plot.png b/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_allocated_line_plot.png
deleted file mode 100644
index 1a10388a..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_allocated_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_reserved_bar_plot.png b/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_reserved_bar_plot.png
deleted file mode 100644
index 7681b998..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_reserved_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_reserved_line_plot.png b/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_reserved_line_plot.png
deleted file mode 100644
index cbb732e0..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/generate_max_memory_reserved_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/peak_decode_throughput_bar_plot.png b/examples/running-llamas/artifacts/Llama-7b/peak_decode_throughput_bar_plot.png
deleted file mode 100644
index 6afda2bf..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/peak_decode_throughput_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/prefill_latency_bar_plot.png b/examples/running-llamas/artifacts/Llama-7b/prefill_latency_bar_plot.png
deleted file mode 100644
index 305a84de..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/prefill_latency_bar_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/prefill_latency_line_plot.png b/examples/running-llamas/artifacts/Llama-7b/prefill_latency_line_plot.png
deleted file mode 100644
index 5399864e..00000000
Binary files a/examples/running-llamas/artifacts/Llama-7b/prefill_latency_line_plot.png and /dev/null differ
diff --git a/examples/running-llamas/artifacts/Llama-7b/short_report.csv b/examples/running-llamas/artifacts/Llama-7b/short_report.csv
deleted file mode 100644
index bda8c65e..00000000
--- a/examples/running-llamas/artifacts/Llama-7b/short_report.csv
+++ /dev/null
@@ -1,36 +0,0 @@
-,Model,GPUs,Experiment Name,Per Process Batch Size,Sequence Length,Decode Latency (s),Prefill Latency (s),Decode Throughput (tokens/s),Prefill Throughput (samples/s),Generate Max Memory Allocated (MB),Generate Max Memory Reserved (MB),GPU Name,Num GPUs,Effective Batch Size,Group
-0,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,1,256,13.2,0.0336,38.7,29.8,14356,14480,1xA100,1,1,1xA100-fp16
-1,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,4,256,13.7,0.109,149.0,36.7,16774,24960,1xA100,1,4,1xA100-fp16
-2,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,32,256,26.4,0.826,619.0,38.7,39331,84422,1xA100,1,32,1xA100-fp16
-3,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,64,256,44.2,1.65,740.0,38.8,65112,84420,1xA100,1,64,1xA100-fp16
-4,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,8,256,13.9,0.21,294.0,38.1,19997,63503,1xA100,1,8,1xA100-fp16
-5,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,16,256,17.1,0.412,478.0,38.8,26442,84420,1xA100,1,16,1xA100-fp16
-6,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,2,256,13.4,0.059,76.3,33.9,15162,15617,1xA100,1,2,1xA100-fp16
-7,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,1,256,12.2,0.0318,41.9,31.4,14356,14480,1xA100,1,1,1xA100-fp16+bt
-8,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,4,256,13.0,0.104,157.0,38.5,16774,24983,1xA100,1,4,1xA100-fp16+bt
-9,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,32,256,26.5,0.804,617.0,39.8,39331,84408,1xA100,1,32,1xA100-fp16+bt
-10,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,64,256,45.1,1.65,725.0,38.8,65111,84420,1xA100,1,64,1xA100-fp16+bt
-11,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,8,256,13.1,0.2,312.0,40.0,19997,63755,1xA100,1,8,1xA100-fp16+bt
-12,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,16,256,17.0,0.4,481.0,40.0,26441,84410,1xA100,1,16,1xA100-fp16+bt
-13,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+bt,2,256,12.6,0.0558,81.1,35.8,15162,15613,1xA100,1,2,1xA100-fp16+bt
-14,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,1,256,12.2,0.0321,41.9,31.2,14356,14480,1xA100,1,1,1xA100-fp16+fa2
-15,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,4,256,12.6,0.104,162.0,38.5,16774,24794,1xA100,1,4,1xA100-fp16+fa2
-16,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,32,256,26.4,0.786,619.0,40.7,39331,84412,1xA100,1,32,1xA100-fp16+fa2
-17,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,64,256,44.7,1.56,732.0,41.0,65110,84422,1xA100,1,64,1xA100-fp16+fa2
-18,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,8,256,12.9,0.197,317.0,40.6,19997,63755,1xA100,1,8,1xA100-fp16+fa2
-19,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,16,256,16.8,0.392,487.0,40.8,26442,84404,1xA100,1,16,1xA100-fp16+fa2
-20,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+fa2,2,256,12.9,0.0548,79.2,36.5,15162,15613,1xA100,1,2,1xA100-fp16+fa2
-21,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,1,256,14.5,0.0457,35.2,21.9,5609,6004,1xA100,1,1,1xA100-fp16+gptq+exllamav2
-22,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,4,256,15.0,0.122,136.0,32.8,8027,16483,1xA100,1,4,1xA100-fp16+gptq+exllamav2
-23,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,32,256,35.0,0.833,467.0,38.4,30585,84418,1xA100,1,32,1xA100-fp16+gptq+exllamav2
-24,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,64,256,51.8,1.61,631.0,39.8,56364,84418,1xA100,1,64,1xA100-fp16+gptq+exllamav2
-25,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,8,256,15.1,0.223,271.0,35.9,11250,55027,1xA100,1,8,1xA100-fp16+gptq+exllamav2
-26,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,16,256,20.1,0.425,407.0,37.6,17694,84385,1xA100,1,16,1xA100-fp16+gptq+exllamav2
-27,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav2,2,256,14.6,0.0708,70.0,28.2,6414,7220,1xA100,1,2,1xA100-fp16+gptq+exllamav2
-28,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,1,256,14.6,0.0416,35.0,24.0,4883,5276,1xA100,1,1,1xA100-fp16+gptq+exllamav1
-29,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,4,256,15.4,0.106,133.0,37.7,7301,15755,1xA100,1,4,1xA100-fp16+gptq+exllamav1
-30,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,32,256,32.3,0.688,506.0,46.5,29858,84420,1xA100,1,32,1xA100-fp16+gptq+exllamav1
-31,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,64,256,49.8,1.32,657.0,48.5,55638,84418,1xA100,1,64,1xA100-fp16+gptq+exllamav1
-32,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,8,256,19.4,0.191,211.0,41.9,10524,54299,1xA100,1,8,1xA100-fp16+gptq+exllamav1
-33,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,16,256,24.2,0.356,338.0,44.9,16969,84406,1xA100,1,16,1xA100-fp16+gptq+exllamav1
-34,TheBloke/LLaMa-7B-GPTQ,['NVIDIA A100-SXM4-80GB'],fp16+gptq+exllamav1,2,256,14.7,0.0621,69.5,32.2,5688,6492,1xA100,1,2,1xA100-fp16+gptq+exllamav1
diff --git a/examples/running-llamas/configs/_base_.yaml b/examples/running-llamas/configs/_base_.yaml
deleted file mode 100644
index 5df2bd58..00000000
--- a/examples/running-llamas/configs/_base_.yaml
+++ /dev/null
@@ -1,40 +0,0 @@
-defaults:
-  - backend: pytorch # default backend
-  - launcher: inline # default launcher
-  - benchmark: inference # default benchmark
-  - experiment # inheriting from experiment config
-  - _self_ # for hydra 1.1 compatibility
-  - override hydra/job_logging: colorlog # colorful logging
-  - override hydra/hydra_logging: colorlog # colorful logging
-
-experiment_name: llama-experiment
-model: llama-2-model
-device: cuda
-
-backend:
-  no_weights: true
-  torch_dtype: float16
-
-benchmark:
-  memory: true
-  warmup_runs: 10
-  new_tokens: 512
-  input_shapes:
-    batch_size: 1
-    sequence_length: 256
-
-hydra:
-  run:
-    dir: experiments/${oc.env:HOSTNAME}/${model}/${experiment_name}
-  sweep:
-    dir: experiments/${oc.env:HOSTNAME}/${model}/${experiment_name}
-    subdir: ${benchmark.input_shapes.batch_size}
-  job:
-    chdir: true
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-  sweeper:
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16,32,64,128
-      model: NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf
diff --git a/examples/running-llamas/configs/fp16+bt+tp=2.yaml b/examples/running-llamas/configs/fp16+bt+tp=2.yaml
deleted file mode 100644
index efaddd22..00000000
--- a/examples/running-llamas/configs/fp16+bt+tp=2.yaml
+++ /dev/null
@@ -1,22 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+bt+tp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29500
-
-backend:
-  to_bettertransformer: true
-  deepspeed_inference: true
-  deepspeed_inference_config:
-    tensor_parallel:
-      tp_size: 2
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/running-llamas/configs/fp16+bt.yaml b/examples/running-llamas/configs/fp16+bt.yaml
deleted file mode 100644
index bee86deb..00000000
--- a/examples/running-llamas/configs/fp16+bt.yaml
+++ /dev/null
@@ -1,9 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16+bt
-
-backend:
-  to_bettertransformer: true
diff --git a/examples/running-llamas/configs/fp16+dp=2.yaml b/examples/running-llamas/configs/fp16+dp=2.yaml
deleted file mode 100644
index 80adde9d..00000000
--- a/examples/running-llamas/configs/fp16+dp=2.yaml
+++ /dev/null
@@ -1,15 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+dp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29511
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/running-llamas/configs/fp16+fa2+tp=2.yaml b/examples/running-llamas/configs/fp16+fa2+tp=2.yaml
deleted file mode 100644
index a239e767..00000000
--- a/examples/running-llamas/configs/fp16+fa2+tp=2.yaml
+++ /dev/null
@@ -1,22 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+fa2+tp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29544
-
-backend:
-  use_flash_attention_2: true
-  deepspeed_inference: true
-  deepspeed_inference_config:
-    tensor_parallel:
-      tp_size: 2
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/running-llamas/configs/fp16+fa2.yaml b/examples/running-llamas/configs/fp16+fa2.yaml
deleted file mode 100644
index b045ebd1..00000000
--- a/examples/running-llamas/configs/fp16+fa2.yaml
+++ /dev/null
@@ -1,9 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16+fa2
-
-backend:
-  use_flash_attention_2: true
diff --git a/examples/running-llamas/configs/fp16+gptq+exllamav1+dp=2.yaml b/examples/running-llamas/configs/fp16+gptq+exllamav1+dp=2.yaml
deleted file mode 100644
index f9a58bd4..00000000
--- a/examples/running-llamas/configs/fp16+gptq+exllamav1+dp=2.yaml
+++ /dev/null
@@ -1,27 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+gptq+exllamav1+dp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29522
-
-backend:
-  # for some reason core gets dumped
-  # with dummy weights + exllamav1 for 65B
-  no_weights: false
-  quantization_scheme: gptq
-  quantization_config:
-    exllama_config:
-      version: 1
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
-  sweeper:
-    params:
-      model: TheBloke/LLaMa-7B-GPTQ,TheBloke/LLaMa-13B-GPTQ,TheBloke/LLaMa-65B-GPTQ
diff --git a/examples/running-llamas/configs/fp16+gptq+exllamav1.yaml b/examples/running-llamas/configs/fp16+gptq+exllamav1.yaml
deleted file mode 100644
index c7555a8b..00000000
--- a/examples/running-llamas/configs/fp16+gptq+exllamav1.yaml
+++ /dev/null
@@ -1,20 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16+gptq+exllamav1
-
-backend:
-  # for some reason core gets dumped
-  # with 65B + exllamav1
-  no_weights: false
-  quantization_scheme: gptq
-  quantization_config:
-    exllama_config:
-      version: 1
-
-hydra:
-  sweeper:
-    params:
-      model: TheBloke/LLaMa-7B-GPTQ,TheBloke/LLaMa-13B-GPTQ,TheBloke/LLaMa-65B-GPTQ
diff --git a/examples/running-llamas/configs/fp16+gptq+exllamav2+dp=2.yaml b/examples/running-llamas/configs/fp16+gptq+exllamav2+dp=2.yaml
deleted file mode 100644
index fdb85109..00000000
--- a/examples/running-llamas/configs/fp16+gptq+exllamav2+dp=2.yaml
+++ /dev/null
@@ -1,27 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+gptq+exllamav2+dp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29533
-
-backend:
-  # for some reason core gets dumped
-  # with dummy weights + exllamav2
-  no_weights: false
-  quantization_scheme: gptq
-  quantization_config:
-    exllama_config:
-      version: 2
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
-  sweeper:
-    params:
-      model: TheBloke/LLaMa-7B-GPTQ,TheBloke/LLaMa-13B-GPTQ,TheBloke/LLaMa-65B-GPTQ
diff --git a/examples/running-llamas/configs/fp16+gptq+exllamav2.yaml b/examples/running-llamas/configs/fp16+gptq+exllamav2.yaml
deleted file mode 100644
index dd314d5d..00000000
--- a/examples/running-llamas/configs/fp16+gptq+exllamav2.yaml
+++ /dev/null
@@ -1,20 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16+gptq+exllamav2
-
-backend:
-  # for some reason core gets dumped
-  # with dummy weights + exllamav2
-  no_weights: false
-  quantization_scheme: gptq
-  quantization_config:
-    exllama_config:
-      version: 2
-
-hydra:
-  sweeper:
-    params:
-      model: TheBloke/LLaMa-7B-GPTQ,TheBloke/LLaMa-13B-GPTQ,TheBloke/LLaMa-65B-GPTQ
diff --git a/examples/running-llamas/configs/fp16+tp=2.yaml b/examples/running-llamas/configs/fp16+tp=2.yaml
deleted file mode 100644
index 712149df..00000000
--- a/examples/running-llamas/configs/fp16+tp=2.yaml
+++ /dev/null
@@ -1,21 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+tp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29544
-
-backend:
-  deepspeed_inference: true
-  deepspeed_inference_config:
-    tensor_parallel:
-      tp_size: 2
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/running-llamas/configs/fp16.yaml b/examples/running-llamas/configs/fp16.yaml
deleted file mode 100644
index 432d986f..00000000
--- a/examples/running-llamas/configs/fp16.yaml
+++ /dev/null
@@ -1,6 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16
diff --git a/examples/running-llamas/report.py b/examples/running-llamas/report.py
deleted file mode 100644
index 316f5bc1..00000000
--- a/examples/running-llamas/report.py
+++ /dev/null
@@ -1,289 +0,0 @@
-from argparse import ArgumentParser
-from pathlib import Path
-from typing import List
-
-import matplotlib.pyplot as plt
-import numpy as np
-import pandas as pd
-from flatten_dict import flatten
-from omegaconf import OmegaConf
-from pandas import DataFrame
-
-
-def gather_full_report(root_folders: List[Path], report_folder: str = "artifacts") -> DataFrame:
-    # key is path to inference file as string, value is dataframe
-
-    config_dfs = {}
-    inference_dfs = {}
-
-    for root_folder in root_folders:
-        inference_dfs.update(
-            {f.parent.absolute().as_posix(): pd.read_csv(f) for f in root_folder.glob("**/inference_results.csv")}
-        )
-        config_dfs.update(
-            {
-                f.parent.absolute()
-                .as_posix(): pd.DataFrame.from_dict(flatten(OmegaConf.load(f), reducer="dot"), orient="index")
-                .T
-                for f in root_folder.glob("**/hydra_config.yaml")
-                if f.parent.absolute().as_posix() in inference_dfs.keys()
-            }
-        )
-
-    if len(inference_dfs) == 0 or len(config_dfs) == 0:
-        raise ValueError(f"No results found in {root_folder}")
-
-    # Merge inference and config dataframes
-    inference_reports = [
-        config_dfs[name].merge(inference_dfs[name], left_index=True, right_index=True) for name in inference_dfs.keys()
-    ]
-
-    # Concatenate all reports
-    inference_report = pd.concat(inference_reports, axis=0, ignore_index=True)
-    inference_report.to_csv(f"{report_folder}/full_report.csv")
-
-    return inference_report
-
-
-def get_short_report(full_report, report_folder: str = "artifacts"):
-    short_columns = {
-        "model": "Model",
-        "environment.gpus": "GPUs",
-        "experiment_name": "Experiment Name",
-        "benchmark.input_shapes.batch_size": "Per Process Batch Size",
-        "benchmark.input_shapes.sequence_length": "Sequence Length",
-        #
-        "decode.latency(s)": "Decode Latency (s)",
-        "forward.latency(s)": "Prefill Latency (s)",
-        #
-        "decode.throughput(tokens/s)": "Decode Throughput (tokens/s)",
-        "forward.throughput(samples/s)": "Prefill Throughput (samples/s)",
-        #
-        "generate.max_memory_allocated(MB)": "Generate Max Memory Allocated (MB)",
-        "generate.max_memory_reserved(MB)": "Generate Max Memory Reserved (MB)",
-    }
-    short_report = full_report[list(short_columns.keys())].rename(columns=short_columns)
-
-    short_report["GPU Name"] = short_report["GPUs"].str[0]
-    short_report["Num GPUs"] = short_report["GPUs"].str.len()
-    short_report["GPU Name"].replace("NVIDIA A100-SXM4-80GB", "1xA100", inplace=True)
-    short_report["GPU Name"].replace("AMD INSTINCT MI250 (MCM) OAM AC MBA", "1xMI250", inplace=True)
-    short_report["Effective Batch Size"] = short_report["Per Process Batch Size"] * short_report["Num GPUs"]
-    short_report["Group"] = short_report["GPU Name"] + "-" + short_report["Experiment Name"]
-    short_report.to_csv(f"{report_folder}/short_report.csv")
-
-    return short_report
-
-
-def get_batch_plots(short_report, report_folder, plot="bar", memory=True):
-    fig1, ax1 = plt.subplots()
-    fig2, ax2 = plt.subplots()
-    fig3, ax3 = plt.subplots()
-    fig4, ax4 = plt.subplots()
-
-    batch_column = "Effective Batch Size"
-    short_report = short_report.sort_values(by="Group", ascending=True)
-    groups = short_report["Group"].unique().tolist()
-    x = np.arange(len(short_report[batch_column].unique()))
-    width = 0.8 / len(short_report["Group"].unique().tolist())
-    offset = -(width * (len(groups) - 1) / 2)
-
-    for group in groups:
-        mask = short_report["Group"] == group
-        group_report = short_report[mask].sort_values(by=batch_column)
-        x_ = np.arange(
-            group_report[batch_column].min() - 1,
-            len(group_report[batch_column].unique()) + (group_report[batch_column].min() - 1),
-        )
-        if plot == "bar":
-            ax1.bar(
-                x_ + offset,
-                group_report["Prefill Latency (s)"],
-                label=group,
-                width=width,
-            )
-            ax2.bar(
-                x_ + offset,
-                group_report["Decode Throughput (tokens/s)"],
-                label=group,
-                width=width,
-            )
-            ax3.bar(
-                x_ + offset,
-                group_report["Generate Max Memory Allocated (MB)"],
-                label=group,
-                width=width,
-            )
-            ax4.bar(
-                x_ + offset,
-                group_report["Generate Max Memory Reserved (MB)"],
-                label=group,
-                width=width,
-            )
-            offset += width
-        elif plot == "line":
-            ax1.plot(
-                x_,
-                group_report["Prefill Latency (s)"],
-                label=group,
-                marker="o",
-            )
-            ax2.plot(
-                x_,
-                group_report["Decode Throughput (tokens/s)"],
-                label=group,
-                marker="o",
-            )
-            ax3.plot(
-                x_,
-                group_report["Generate Max Memory Allocated (MB)"],
-                label=group,
-                marker="o",
-            )
-            ax4.plot(
-                x_,
-                group_report["Generate Max Memory Reserved (MB)"],
-                label=group,
-                marker="o",
-            )
-
-    ax1.set_xticks(x)
-    ax1.set_ylim(bottom=0)
-    ax1.set_xticklabels(short_report[batch_column].sort_values().unique().tolist())
-    ax1.set_xlabel(batch_column)
-    ax1.set_ylabel("Prefill Latency (s)")
-    ax1.set_title(f"Prefill Latency per Batch Size ({short_report['Model'].unique()[0]})")
-    ax1.legend(fancybox=True, shadow=True)
-
-    ax2.set_xticks(x)
-    ax2.set_ylim(bottom=0)
-    ax2.set_xticklabels(short_report[batch_column].sort_values().unique().tolist())
-    ax2.set_xlabel(batch_column)
-    ax2.set_ylabel("Effective Decode Throughput (tokens/s)")
-    ax2.set_title(f"Decode Throughput per Batch Size ({short_report['Model'].unique()[0]})")
-    ax2.legend(fancybox=True, shadow=True)
-
-    ax3.set_xticks(x)
-    ax3.set_ylim(bottom=0)
-    ax3.set_xticklabels(short_report[batch_column].sort_values().unique().tolist())
-    ax3.set_xlabel(batch_column)
-    ax3.set_ylabel("Generate Max Memory Allocated (MB)")
-    ax3.set_title(f"Generate Max Memory Allocated per Batch Size ({short_report['Model'].unique()[0]})")
-    ax3.legend(fancybox=True, shadow=True)
-
-    ax4.set_xticks(x)
-    ax4.set_ylim(bottom=0)
-    ax4.set_xticklabels(short_report[batch_column].sort_values().unique().tolist())
-    ax4.set_xlabel(batch_column)
-    ax4.set_ylabel("Generate Max Memory Reserved (MB)")
-    ax4.set_title(f"Generate Max Memory Reserved per Batch Size ({short_report['Model'].unique()[0]})")
-    ax4.legend(fancybox=True, shadow=True)
-
-    legend = plt.legend(loc="upper center")
-    legend.get_frame().set_facecolor((0, 0, 1, 0.1))
-    legend.get_frame().set_alpha(None)
-    plt.tight_layout()
-
-    fig1.savefig(f"{report_folder}/prefill_latency_{plot}_plot.png")
-    fig2.savefig(f"{report_folder}/decode_throughput_{plot}_plot.png")
-
-    if memory:
-        fig3.savefig(f"{report_folder}/generate_max_memory_allocated_{plot}_plot.png")
-        fig4.savefig(f"{report_folder}/generate_max_memory_reserved_{plot}_plot.png")
-        return fig1, fig2, fig3, fig4
-
-    return fig1, fig2
-
-
-def get_peak_decode_throughput_plot(short_report, report_folder):
-    # a bar plot with one bar per group, representing the max attainable throughput in tokens/s
-    fig, ax = plt.subplots()
-
-    #
-    max_decode_throughput = short_report.groupby("Group")["Decode Throughput (tokens/s)"].max().reset_index()
-    max_decode_throughput = (
-        short_report.merge(max_decode_throughput, on=["Group", "Decode Throughput (tokens/s)"])
-        .sort_values(by="Decode Throughput (tokens/s)", ascending=True)
-        .reset_index()
-    )
-
-    ax.bar(
-        max_decode_throughput["Group"],
-        max_decode_throughput["Decode Throughput (tokens/s)"],
-        color=plt.cm.Paired(np.arange(len(max_decode_throughput))),
-    )
-
-    # add batch size on top of each bar
-    for i, v in enumerate(max_decode_throughput["Effective Batch Size"]):
-        ax.text(
-            i,
-            max_decode_throughput["Decode Throughput (tokens/s)"].iloc[i],
-            f"bs={v}",
-            ha="center",
-            va="bottom",
-        )
-
-    ax.set_xlabel("Group")
-    ax.set_ylabel("Peak Decode Throughput (tokens/s)")
-    ax.set_title(f"Peak Decode Throughput ({short_report['Model'].unique()[0]})")
-    ax.set_ylim(top=max_decode_throughput["Decode Throughput (tokens/s)"].max() * 1.1)
-
-    plt.xticks(rotation=45, ha="right")
-    plt.tight_layout()
-
-    fig.savefig(f"{report_folder}/peak_decode_throughput_bar_plot.png")
-
-    return fig
-
-
-def generate_report():
-    parser = ArgumentParser()
-    parser.add_argument(
-        "--experiments-folders",
-        "-e",
-        type=Path,
-        nargs="+",
-        required=True,
-        help="The folder containing the results of experiments.",
-    )
-    parser.add_argument(
-        "--report-name",
-        "-r",
-        type=str,
-        required=False,
-        default="artifacts",
-        help="The name of the report.",
-    )
-
-    args = parser.parse_args()
-    report_folder = args.report_name
-    experiments_folders = args.experiments_folders
-
-    Path(report_folder).mkdir(parents=True, exist_ok=True)
-
-    # gather experiments results
-    full_report = gather_full_report(
-        root_folders=experiments_folders,
-        report_folder=report_folder,
-    )
-    short_report = get_short_report(
-        full_report,
-        report_folder=report_folder,
-    )
-    for plot in ["bar", "line"]:
-        _ = get_batch_plots(
-            short_report,
-            report_folder,
-            plot=plot,
-            memory=True,
-        )
-
-    _ = get_peak_decode_throughput_plot(
-        short_report,
-        report_folder,
-    )
-    print("Report generated successfully!")
-
-
-if __name__ == "__main__":
-    generate_report()
diff --git a/examples/running-mistrals/README.md b/examples/running-mistrals/README.md
deleted file mode 100644
index 8d122cf8..00000000
--- a/examples/running-mistrals/README.md
+++ /dev/null
@@ -1,60 +0,0 @@
-# Optimum-Benchmark x Mistral x BnB & GPTQ & AWQ
-
-A set of benchmarks on quantizing Misral AI's model.
-
-## Setup
-
-You will need to install these quantization packages:
-
-```bash
-pip install bitsandbytes
-pip install auto-gptq
-pip install autoawq
-```
-
-## Running
-
-Then run these commands from this directory:
-
-```bash
-optimum-benchmark --config-dir configs/ --config-name _base_ --multirun
-optimum-benchmark --config-dir configs/ --config-name bnb --multirun
-optimum-benchmark --config-dir configs/ --config-name gptq --multirun
-optimum-benchmark --config-dir configs/ --config-name awq --multirun
-```
-
-This will create a folder called `experiments` with the results of the benchmarks with an inference `batch_size` ranging from 1 to 16 and an input `sequence_length` (prompt size) of 512.
-
-## Reporting
-
-To create a report run:
-
-```bash
-python report.py -e experiments
-```
-
-Which will create some quick reporting artifacts like a `full_report.csv`, `short_report.csv`, some plots and a `rich_table.svg`.
-
-## Results
-
-### On A100-80GB
-
-<p align="center">
-<img src="artifacts/A100-80GB/forward_latency_plot.png" alt="latency_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/A100-80GB/generate_throughput_plot.png" alt="throughput_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/A100-80GB/forward_memory_plot.png" alt="memory_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/A100-80GB/generate_memory_plot.png" alt="memory_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/A100-80GB/rich_table.svg" alt="rich_table" width="90%"/>
-</p>
diff --git a/examples/running-mistrals/artifacts/A100-80GB/forward_latency_plot.png b/examples/running-mistrals/artifacts/A100-80GB/forward_latency_plot.png
deleted file mode 100644
index 8a5c64b1..00000000
Binary files a/examples/running-mistrals/artifacts/A100-80GB/forward_latency_plot.png and /dev/null differ
diff --git a/examples/running-mistrals/artifacts/A100-80GB/forward_memory_plot.png b/examples/running-mistrals/artifacts/A100-80GB/forward_memory_plot.png
deleted file mode 100644
index 0143c4de..00000000
Binary files a/examples/running-mistrals/artifacts/A100-80GB/forward_memory_plot.png and /dev/null differ
diff --git a/examples/running-mistrals/artifacts/A100-80GB/full_report.csv b/examples/running-mistrals/artifacts/A100-80GB/full_report.csv
deleted file mode 100644
index 01e5b19f..00000000
--- a/examples/running-mistrals/artifacts/A100-80GB/full_report.csv
+++ /dev/null
@@ -1,21 +0,0 @@
-experiment_name,backend.name,backend.version,backend._target_,backend.seed,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.initial_isolation_check,backend.continous_isolation_check,backend.delete_cache,backend.no_weights,backend.device_map,backend.torch_dtype,backend.disable_grad,backend.eval_mode,backend.amp_autocast,backend.amp_dtype,backend.torch_compile,backend.bettertransformer,backend.quantization_scheme,backend.use_ddp,backend.peft_strategy,benchmark.name,benchmark._target_,benchmark.duration,benchmark.warmup_runs,benchmark.memory,benchmark.energy,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,benchmark.can_diffuse,benchmark.can_generate,benchmark.generate_kwargs.max_new_tokens,benchmark.generate_kwargs.min_new_tokens,benchmark.generate_kwargs.do_sample,benchmark.generate_kwargs.use_cache,benchmark.generate_kwargs.pad_token_id,benchmark.generate_kwargs.num_beams,model,device,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,environment.optimum_version,environment.optimum_commit,environment.transformers_version,environment.transformers_commit,environment.accelerate_version,environment.accelerate_commit,environment.diffusers_version,environment.diffusers_commit,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,environment.gpus,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB),backend.quantization_config.llm_int8_threshold,backend.quantization_config.load_in_4bit,backend.quantization_config.bnb_4bit_compute_dtype
-fp16-batch_size(4)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.233,17.2,17865,29.2,137.0,18509,,,
-fp16-batch_size(8)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.467,17.1,19463,33.9,236.0,20524,,,
-fp16-batch_size(16)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.937,17.1,22458,50.1,319.0,24393,,,
-bnb-batch_size(16)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.94,17.0,13155,76.0,211.0,15254,0.0,True,float16
-fp16-batch_size(2)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.118,16.9,17158,29.4,68.0,17523,,,
-gptq-batch_size(16)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,TheBloke/Mistral-7B-v0.1-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.34.1,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.963,16.6,13314,66.1,242.0,15235,,,
-bnb-batch_size(8)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.483,16.6,10261,59.9,134.0,11330,0.0,True,float16
-gptq-batch_size(8)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,TheBloke/Mistral-7B-v0.1-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.34.1,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.486,16.5,10303,48.9,164.0,11280,,,
-fp16-batch_size(1)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.0633,15.8,16907,28.3,35.3,17066,,,
-bnb-batch_size(4)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.254,15.7,8797,58.4,68.5,9317,0.0,True,float16
-gptq-batch_size(4)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,TheBloke/Mistral-7B-v0.1-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.34.1,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.261,15.3,8747,36.0,111.0,9239,,,
-bnb-batch_size(2)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.141,14.2,8166,57.2,35.0,8401,0.0,True,float16
-gptq-batch_size(2)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,TheBloke/Mistral-7B-v0.1-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.34.1,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.142,14.1,7918,31.8,62.9,8279,,,
-gptq-batch_size(1)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,TheBloke/Mistral-7B-v0.1-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.34.1,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.0828,12.1,7669,31.5,31.7,7824,,,
-bnb-batch_size(1)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,mistralai/Mistral-7B-v0.1,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.0865,11.6,7822,43.4,23.0,7960,0.0,True,float16
-awq-batch_size(16)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,ybelkada/test-mistral-7b-v0.1-awq,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",2.52,6.35,14486,51.3,312.0,15080,,,
-awq-batch_size(8)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,ybelkada/test-mistral-7b-v0.1-awq,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",1.27,6.3,10787,34.9,229.0,11175,,,
-awq-batch_size(4)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,ybelkada/test-mistral-7b-v0.1-awq,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.638,6.27,8958,32.8,122.0,9101,,,
-awq-batch_size(2)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,ybelkada/test-mistral-7b-v0.1-awq,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.321,6.23,7824,31.8,62.9,8136,,,
-awq-batch_size(1)-sequence_length(512)-new_tokens(1000),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,512,1,80,3000,16000,1000,False,True,1000,1000,False,True,0,1,ybelkada/test-mistral-7b-v0.1-awq,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,"['NVIDIA A100-SXM4-80GB', 'NVIDIA A100-SXM4-80GB']",0.164,6.1,7589,32.1,31.2,7660,,,
diff --git a/examples/running-mistrals/artifacts/A100-80GB/generate_memory_plot.png b/examples/running-mistrals/artifacts/A100-80GB/generate_memory_plot.png
deleted file mode 100644
index 74a91ef8..00000000
Binary files a/examples/running-mistrals/artifacts/A100-80GB/generate_memory_plot.png and /dev/null differ
diff --git a/examples/running-mistrals/artifacts/A100-80GB/generate_throughput_plot.png b/examples/running-mistrals/artifacts/A100-80GB/generate_throughput_plot.png
deleted file mode 100644
index 27784503..00000000
Binary files a/examples/running-mistrals/artifacts/A100-80GB/generate_throughput_plot.png and /dev/null differ
diff --git a/examples/running-mistrals/artifacts/A100-80GB/rich_table.svg b/examples/running-mistrals/artifacts/A100-80GB/rich_table.svg
deleted file mode 100644
index 2c839c7a..00000000
--- a/examples/running-mistrals/artifacts/A100-80GB/rich_table.svg
+++ /dev/null
@@ -1,235 +0,0 @@
-<svg class="rich-terminal" viewBox="0 0 2031 1148.0" xmlns="http://www.w3.org/2000/svg">
-    <!-- Generated with Rich https://www.textualize.io -->
-    <style>
-
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Regular"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Regular.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Regular.woff") format("woff");
-        font-style: normal;
-        font-weight: 400;
-    }
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Bold"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Bold.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Bold.woff") format("woff");
-        font-style: bold;
-        font-weight: 700;
-    }
-
-    .terminal-1762864435-matrix {
-        font-family: Fira Code, monospace;
-        font-size: 20px;
-        line-height: 24.4px;
-        font-variant-east-asian: full-width;
-    }
-
-    .terminal-1762864435-title {
-        font-size: 18px;
-        font-weight: bold;
-        font-family: arial;
-    }
-
-    .terminal-1762864435-r1 { fill: #d9d9d9 }
-.terminal-1762864435-r2 { fill: #d9d9d9;font-weight: bold }
-    </style>
-
-    <defs>
-    <clipPath id="terminal-1762864435-clip-terminal">
-      <rect x="0" y="0" width="2011.9999999999998" height="1097.0" />
-    </clipPath>
-    <clipPath id="terminal-1762864435-line-0">
-    <rect x="0" y="1.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-1">
-    <rect x="0" y="25.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-2">
-    <rect x="0" y="50.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-3">
-    <rect x="0" y="74.7" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-4">
-    <rect x="0" y="99.1" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-5">
-    <rect x="0" y="123.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-6">
-    <rect x="0" y="147.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-7">
-    <rect x="0" y="172.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-8">
-    <rect x="0" y="196.7" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-9">
-    <rect x="0" y="221.1" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-10">
-    <rect x="0" y="245.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-11">
-    <rect x="0" y="269.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-12">
-    <rect x="0" y="294.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-13">
-    <rect x="0" y="318.7" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-14">
-    <rect x="0" y="343.1" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-15">
-    <rect x="0" y="367.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-16">
-    <rect x="0" y="391.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-17">
-    <rect x="0" y="416.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-18">
-    <rect x="0" y="440.7" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-19">
-    <rect x="0" y="465.1" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-20">
-    <rect x="0" y="489.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-21">
-    <rect x="0" y="513.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-22">
-    <rect x="0" y="538.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-23">
-    <rect x="0" y="562.7" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-24">
-    <rect x="0" y="587.1" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-25">
-    <rect x="0" y="611.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-26">
-    <rect x="0" y="635.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-27">
-    <rect x="0" y="660.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-28">
-    <rect x="0" y="684.7" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-29">
-    <rect x="0" y="709.1" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-30">
-    <rect x="0" y="733.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-31">
-    <rect x="0" y="757.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-32">
-    <rect x="0" y="782.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-33">
-    <rect x="0" y="806.7" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-34">
-    <rect x="0" y="831.1" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-35">
-    <rect x="0" y="855.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-36">
-    <rect x="0" y="879.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-37">
-    <rect x="0" y="904.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-38">
-    <rect x="0" y="928.7" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-39">
-    <rect x="0" y="953.1" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-40">
-    <rect x="0" y="977.5" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-41">
-    <rect x="0" y="1001.9" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-42">
-    <rect x="0" y="1026.3" width="2013" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1762864435-line-43">
-    <rect x="0" y="1050.7" width="2013" height="24.65"/>
-            </clipPath>
-    </defs>
-
-    <rect fill="#0c0c0c" stroke="rgba(255,255,255,0.35)" stroke-width="1" x="1" y="1" width="2029" height="1146" rx="8"/><text class="terminal-1762864435-title" fill="#d9d9d9" text-anchor="middle" x="1014" y="27">Inference&#160;Report</text>
-            <g transform="translate(26,22)">
-            <circle cx="0" cy="0" r="7" fill="#ff5f57"/>
-            <circle cx="22" cy="0" r="7" fill="#febc2e"/>
-            <circle cx="44" cy="0" r="7" fill="#28c840"/>
-            </g>
-        
-    <g transform="translate(9, 41)" clip-path="url(#terminal-1762864435-clip-terminal)">
-    
-    <g class="terminal-1762864435-matrix">
-    <text class="terminal-1762864435-r1" x="0" y="20" textLength="2013" clip-path="url(#terminal-1762864435-line-0)">┏━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━┓</text><text class="terminal-1762864435-r1" x="2013" y="20" textLength="12.2" clip-path="url(#terminal-1762864435-line-0)">
-</text><text class="terminal-1762864435-r1" x="0" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r1" x="268.4" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r1" x="427" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r1" x="695.4" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r1" x="951.6" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r1" x="1220" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r2" x="1244.4" y="44.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-1)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;Generate</text><text class="terminal-1762864435-r1" x="1476.2" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r1" x="1744.6" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r1" x="2000.8" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">┃</text><text class="terminal-1762864435-r1" x="2013" y="44.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-1)">
-</text><text class="terminal-1762864435-r1" x="0" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r1" x="268.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r1" x="427" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r1" x="695.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r2" x="719.8" y="68.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-2)">Forward&#160;Throughput</text><text class="terminal-1762864435-r1" x="951.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r2" x="976" y="68.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-2)">Forward&#160;Peak&#160;Memory</text><text class="terminal-1762864435-r1" x="1220" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r2" x="1244.4" y="68.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-2)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;Throughput</text><text class="terminal-1762864435-r1" x="1476.2" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r2" x="1500.6" y="68.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-2)">&#160;&#160;&#160;&#160;&#160;&#160;Generate&#160;Peak</text><text class="terminal-1762864435-r1" x="1744.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r2" x="1769" y="68.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-2)">&#160;&#160;&#160;&#160;&#160;&#160;Quantization</text><text class="terminal-1762864435-r1" x="2000.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">┃</text><text class="terminal-1762864435-r1" x="2013" y="68.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-2)">
-</text><text class="terminal-1762864435-r1" x="0" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r2" x="24.4" y="93.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-3)">Experiment&#160;Name&#160;&#160;&#160;&#160;</text><text class="terminal-1762864435-r1" x="268.4" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r2" x="292.8" y="93.2" textLength="122" clip-path="url(#terminal-1762864435-line-3)">Batch&#160;Size</text><text class="terminal-1762864435-r1" x="427" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r2" x="451.4" y="93.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-3)">Forward&#160;Latency&#160;(s)</text><text class="terminal-1762864435-r1" x="695.4" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r2" x="719.8" y="93.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-3)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;(samples/s)</text><text class="terminal-1762864435-r1" x="951.6" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r2" x="976" y="93.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-3)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;(MB)</text><text class="terminal-1762864435-r1" x="1220" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r2" x="1244.4" y="93.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-3)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;(tokens/s)</text><text class="terminal-1762864435-r1" x="1476.2" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r2" x="1500.6" y="93.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-3)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;Memory&#160;(MB)</text><text class="terminal-1762864435-r1" x="1744.6" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r2" x="1769" y="93.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-3)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;Scheme</text><text class="terminal-1762864435-r1" x="2000.8" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">┃</text><text class="terminal-1762864435-r1" x="2013" y="93.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-3)">
-</text><text class="terminal-1762864435-r1" x="0" y="117.6" textLength="2013" clip-path="url(#terminal-1762864435-line-4)">┡━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━┩</text><text class="terminal-1762864435-r1" x="2013" y="117.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-4)">
-</text><text class="terminal-1762864435-r1" x="0" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="24.4" y="142" textLength="231.8" clip-path="url(#terminal-1762864435-line-5)">fp16-batch_size(4)…</text><text class="terminal-1762864435-r1" x="268.4" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="292.8" y="142" textLength="122" clip-path="url(#terminal-1762864435-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1762864435-r1" x="427" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="451.4" y="142" textLength="231.8" clip-path="url(#terminal-1762864435-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.33e-01</text><text class="terminal-1762864435-r1" x="695.4" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="719.8" y="142" textLength="219.6" clip-path="url(#terminal-1762864435-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;17.20</text><text class="terminal-1762864435-r1" x="951.6" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="976" y="142" textLength="231.8" clip-path="url(#terminal-1762864435-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;17865</text><text class="terminal-1762864435-r1" x="1220" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="142" textLength="219.6" clip-path="url(#terminal-1762864435-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;137.00</text><text class="terminal-1762864435-r1" x="1476.2" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="142" textLength="231.8" clip-path="url(#terminal-1762864435-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;18509</text><text class="terminal-1762864435-r1" x="1744.6" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="1769" y="142" textLength="219.6" clip-path="url(#terminal-1762864435-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1762864435-r1" x="2000.8" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">│</text><text class="terminal-1762864435-r1" x="2013" y="142" textLength="12.2" clip-path="url(#terminal-1762864435-line-5)">
-</text><text class="terminal-1762864435-r1" x="0" y="166.4" textLength="2013" clip-path="url(#terminal-1762864435-line-6)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="166.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-6)">
-</text><text class="terminal-1762864435-r1" x="0" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="24.4" y="190.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-7)">fp16-batch_size(8)…</text><text class="terminal-1762864435-r1" x="268.4" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="292.8" y="190.8" textLength="122" clip-path="url(#terminal-1762864435-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1762864435-r1" x="427" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="451.4" y="190.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.67e-01</text><text class="terminal-1762864435-r1" x="695.4" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="719.8" y="190.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;17.10</text><text class="terminal-1762864435-r1" x="951.6" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="976" y="190.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;19463</text><text class="terminal-1762864435-r1" x="1220" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="190.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;236.00</text><text class="terminal-1762864435-r1" x="1476.2" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="190.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;20524</text><text class="terminal-1762864435-r1" x="1744.6" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="1769" y="190.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1762864435-r1" x="2000.8" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">│</text><text class="terminal-1762864435-r1" x="2013" y="190.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-7)">
-</text><text class="terminal-1762864435-r1" x="0" y="215.2" textLength="2013" clip-path="url(#terminal-1762864435-line-8)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="215.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-8)">
-</text><text class="terminal-1762864435-r1" x="0" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="24.4" y="239.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-9)">fp16-batch_size(16…</text><text class="terminal-1762864435-r1" x="268.4" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="292.8" y="239.6" textLength="122" clip-path="url(#terminal-1762864435-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1762864435-r1" x="427" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="451.4" y="239.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9.37e-01</text><text class="terminal-1762864435-r1" x="695.4" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="719.8" y="239.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;17.10</text><text class="terminal-1762864435-r1" x="951.6" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="976" y="239.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;22458</text><text class="terminal-1762864435-r1" x="1220" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="239.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;319.00</text><text class="terminal-1762864435-r1" x="1476.2" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="239.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;24393</text><text class="terminal-1762864435-r1" x="1744.6" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="1769" y="239.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1762864435-r1" x="2000.8" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">│</text><text class="terminal-1762864435-r1" x="2013" y="239.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-9)">
-</text><text class="terminal-1762864435-r1" x="0" y="264" textLength="2013" clip-path="url(#terminal-1762864435-line-10)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="264" textLength="12.2" clip-path="url(#terminal-1762864435-line-10)">
-</text><text class="terminal-1762864435-r1" x="0" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="24.4" y="288.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-11)">bnb-batch_size(16)…</text><text class="terminal-1762864435-r1" x="268.4" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="292.8" y="288.4" textLength="122" clip-path="url(#terminal-1762864435-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1762864435-r1" x="427" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="451.4" y="288.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9.40e-01</text><text class="terminal-1762864435-r1" x="695.4" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="719.8" y="288.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;17.00</text><text class="terminal-1762864435-r1" x="951.6" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="976" y="288.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;13155</text><text class="terminal-1762864435-r1" x="1220" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="288.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;211.00</text><text class="terminal-1762864435-r1" x="1476.2" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="288.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15254</text><text class="terminal-1762864435-r1" x="1744.6" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="1769" y="288.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1762864435-r1" x="2000.8" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">│</text><text class="terminal-1762864435-r1" x="2013" y="288.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-11)">
-</text><text class="terminal-1762864435-r1" x="0" y="312.8" textLength="2013" clip-path="url(#terminal-1762864435-line-12)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="312.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-12)">
-</text><text class="terminal-1762864435-r1" x="0" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="24.4" y="337.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-13)">fp16-batch_size(2)…</text><text class="terminal-1762864435-r1" x="268.4" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="292.8" y="337.2" textLength="122" clip-path="url(#terminal-1762864435-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1762864435-r1" x="427" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="451.4" y="337.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.18e-01</text><text class="terminal-1762864435-r1" x="695.4" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="719.8" y="337.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16.90</text><text class="terminal-1762864435-r1" x="951.6" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="976" y="337.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;17158</text><text class="terminal-1762864435-r1" x="1220" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="337.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;68.00</text><text class="terminal-1762864435-r1" x="1476.2" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="337.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;17523</text><text class="terminal-1762864435-r1" x="1744.6" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="1769" y="337.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1762864435-r1" x="2000.8" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">│</text><text class="terminal-1762864435-r1" x="2013" y="337.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-13)">
-</text><text class="terminal-1762864435-r1" x="0" y="361.6" textLength="2013" clip-path="url(#terminal-1762864435-line-14)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="361.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-14)">
-</text><text class="terminal-1762864435-r1" x="0" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="24.4" y="386" textLength="231.8" clip-path="url(#terminal-1762864435-line-15)">gptq-batch_size(16…</text><text class="terminal-1762864435-r1" x="268.4" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="292.8" y="386" textLength="122" clip-path="url(#terminal-1762864435-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1762864435-r1" x="427" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="451.4" y="386" textLength="231.8" clip-path="url(#terminal-1762864435-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9.63e-01</text><text class="terminal-1762864435-r1" x="695.4" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="719.8" y="386" textLength="219.6" clip-path="url(#terminal-1762864435-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16.60</text><text class="terminal-1762864435-r1" x="951.6" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="976" y="386" textLength="231.8" clip-path="url(#terminal-1762864435-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;13314</text><text class="terminal-1762864435-r1" x="1220" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="386" textLength="219.6" clip-path="url(#terminal-1762864435-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;242.00</text><text class="terminal-1762864435-r1" x="1476.2" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="386" textLength="231.8" clip-path="url(#terminal-1762864435-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15235</text><text class="terminal-1762864435-r1" x="1744.6" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="1769" y="386" textLength="219.6" clip-path="url(#terminal-1762864435-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1762864435-r1" x="2000.8" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">│</text><text class="terminal-1762864435-r1" x="2013" y="386" textLength="12.2" clip-path="url(#terminal-1762864435-line-15)">
-</text><text class="terminal-1762864435-r1" x="0" y="410.4" textLength="2013" clip-path="url(#terminal-1762864435-line-16)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="410.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-16)">
-</text><text class="terminal-1762864435-r1" x="0" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="24.4" y="434.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-17)">bnb-batch_size(8)-…</text><text class="terminal-1762864435-r1" x="268.4" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="292.8" y="434.8" textLength="122" clip-path="url(#terminal-1762864435-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1762864435-r1" x="427" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="451.4" y="434.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.83e-01</text><text class="terminal-1762864435-r1" x="695.4" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="719.8" y="434.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16.60</text><text class="terminal-1762864435-r1" x="951.6" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="976" y="434.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;10261</text><text class="terminal-1762864435-r1" x="1220" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="434.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;134.00</text><text class="terminal-1762864435-r1" x="1476.2" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="434.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;11330</text><text class="terminal-1762864435-r1" x="1744.6" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="1769" y="434.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1762864435-r1" x="2000.8" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">│</text><text class="terminal-1762864435-r1" x="2013" y="434.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-17)">
-</text><text class="terminal-1762864435-r1" x="0" y="459.2" textLength="2013" clip-path="url(#terminal-1762864435-line-18)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="459.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-18)">
-</text><text class="terminal-1762864435-r1" x="0" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="24.4" y="483.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-19)">gptq-batch_size(8)…</text><text class="terminal-1762864435-r1" x="268.4" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="292.8" y="483.6" textLength="122" clip-path="url(#terminal-1762864435-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1762864435-r1" x="427" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="451.4" y="483.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.86e-01</text><text class="terminal-1762864435-r1" x="695.4" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="719.8" y="483.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16.50</text><text class="terminal-1762864435-r1" x="951.6" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="976" y="483.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;10303</text><text class="terminal-1762864435-r1" x="1220" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="483.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;164.00</text><text class="terminal-1762864435-r1" x="1476.2" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="483.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;11280</text><text class="terminal-1762864435-r1" x="1744.6" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="1769" y="483.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1762864435-r1" x="2000.8" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">│</text><text class="terminal-1762864435-r1" x="2013" y="483.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-19)">
-</text><text class="terminal-1762864435-r1" x="0" y="508" textLength="2013" clip-path="url(#terminal-1762864435-line-20)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="508" textLength="12.2" clip-path="url(#terminal-1762864435-line-20)">
-</text><text class="terminal-1762864435-r1" x="0" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="24.4" y="532.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-21)">fp16-batch_size(1)…</text><text class="terminal-1762864435-r1" x="268.4" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="292.8" y="532.4" textLength="122" clip-path="url(#terminal-1762864435-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1762864435-r1" x="427" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="451.4" y="532.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.33e-02</text><text class="terminal-1762864435-r1" x="695.4" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="719.8" y="532.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15.80</text><text class="terminal-1762864435-r1" x="951.6" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="976" y="532.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16907</text><text class="terminal-1762864435-r1" x="1220" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="532.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;35.30</text><text class="terminal-1762864435-r1" x="1476.2" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="532.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;17066</text><text class="terminal-1762864435-r1" x="1744.6" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="1769" y="532.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1762864435-r1" x="2000.8" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">│</text><text class="terminal-1762864435-r1" x="2013" y="532.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-21)">
-</text><text class="terminal-1762864435-r1" x="0" y="556.8" textLength="2013" clip-path="url(#terminal-1762864435-line-22)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="556.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-22)">
-</text><text class="terminal-1762864435-r1" x="0" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="24.4" y="581.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-23)">bnb-batch_size(4)-…</text><text class="terminal-1762864435-r1" x="268.4" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="292.8" y="581.2" textLength="122" clip-path="url(#terminal-1762864435-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1762864435-r1" x="427" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="451.4" y="581.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.54e-01</text><text class="terminal-1762864435-r1" x="695.4" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="719.8" y="581.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15.70</text><text class="terminal-1762864435-r1" x="951.6" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="976" y="581.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8797</text><text class="terminal-1762864435-r1" x="1220" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="581.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;68.50</text><text class="terminal-1762864435-r1" x="1476.2" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="581.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9317</text><text class="terminal-1762864435-r1" x="1744.6" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="1769" y="581.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1762864435-r1" x="2000.8" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">│</text><text class="terminal-1762864435-r1" x="2013" y="581.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-23)">
-</text><text class="terminal-1762864435-r1" x="0" y="605.6" textLength="2013" clip-path="url(#terminal-1762864435-line-24)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="605.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-24)">
-</text><text class="terminal-1762864435-r1" x="0" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="24.4" y="630" textLength="231.8" clip-path="url(#terminal-1762864435-line-25)">gptq-batch_size(4)…</text><text class="terminal-1762864435-r1" x="268.4" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="292.8" y="630" textLength="122" clip-path="url(#terminal-1762864435-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1762864435-r1" x="427" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="451.4" y="630" textLength="231.8" clip-path="url(#terminal-1762864435-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.61e-01</text><text class="terminal-1762864435-r1" x="695.4" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="719.8" y="630" textLength="219.6" clip-path="url(#terminal-1762864435-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15.30</text><text class="terminal-1762864435-r1" x="951.6" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="976" y="630" textLength="231.8" clip-path="url(#terminal-1762864435-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8747</text><text class="terminal-1762864435-r1" x="1220" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="630" textLength="219.6" clip-path="url(#terminal-1762864435-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;111.00</text><text class="terminal-1762864435-r1" x="1476.2" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="630" textLength="231.8" clip-path="url(#terminal-1762864435-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9239</text><text class="terminal-1762864435-r1" x="1744.6" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="1769" y="630" textLength="219.6" clip-path="url(#terminal-1762864435-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1762864435-r1" x="2000.8" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">│</text><text class="terminal-1762864435-r1" x="2013" y="630" textLength="12.2" clip-path="url(#terminal-1762864435-line-25)">
-</text><text class="terminal-1762864435-r1" x="0" y="654.4" textLength="2013" clip-path="url(#terminal-1762864435-line-26)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="654.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-26)">
-</text><text class="terminal-1762864435-r1" x="0" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="24.4" y="678.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-27)">bnb-batch_size(2)-…</text><text class="terminal-1762864435-r1" x="268.4" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="292.8" y="678.8" textLength="122" clip-path="url(#terminal-1762864435-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1762864435-r1" x="427" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="451.4" y="678.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.41e-01</text><text class="terminal-1762864435-r1" x="695.4" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="719.8" y="678.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;14.20</text><text class="terminal-1762864435-r1" x="951.6" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="976" y="678.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8166</text><text class="terminal-1762864435-r1" x="1220" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="678.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;35.00</text><text class="terminal-1762864435-r1" x="1476.2" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="678.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8401</text><text class="terminal-1762864435-r1" x="1744.6" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="1769" y="678.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1762864435-r1" x="2000.8" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">│</text><text class="terminal-1762864435-r1" x="2013" y="678.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-27)">
-</text><text class="terminal-1762864435-r1" x="0" y="703.2" textLength="2013" clip-path="url(#terminal-1762864435-line-28)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="703.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-28)">
-</text><text class="terminal-1762864435-r1" x="0" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="24.4" y="727.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-29)">gptq-batch_size(2)…</text><text class="terminal-1762864435-r1" x="268.4" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="292.8" y="727.6" textLength="122" clip-path="url(#terminal-1762864435-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1762864435-r1" x="427" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="451.4" y="727.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.42e-01</text><text class="terminal-1762864435-r1" x="695.4" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="719.8" y="727.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;14.10</text><text class="terminal-1762864435-r1" x="951.6" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="976" y="727.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7918</text><text class="terminal-1762864435-r1" x="1220" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="727.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;62.90</text><text class="terminal-1762864435-r1" x="1476.2" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="727.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8279</text><text class="terminal-1762864435-r1" x="1744.6" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="1769" y="727.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1762864435-r1" x="2000.8" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">│</text><text class="terminal-1762864435-r1" x="2013" y="727.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-29)">
-</text><text class="terminal-1762864435-r1" x="0" y="752" textLength="2013" clip-path="url(#terminal-1762864435-line-30)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="752" textLength="12.2" clip-path="url(#terminal-1762864435-line-30)">
-</text><text class="terminal-1762864435-r1" x="0" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="24.4" y="776.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-31)">gptq-batch_size(1)…</text><text class="terminal-1762864435-r1" x="268.4" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="292.8" y="776.4" textLength="122" clip-path="url(#terminal-1762864435-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1762864435-r1" x="427" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="451.4" y="776.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8.28e-02</text><text class="terminal-1762864435-r1" x="695.4" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="719.8" y="776.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;12.10</text><text class="terminal-1762864435-r1" x="951.6" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="976" y="776.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7669</text><text class="terminal-1762864435-r1" x="1220" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="776.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;31.70</text><text class="terminal-1762864435-r1" x="1476.2" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="776.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7824</text><text class="terminal-1762864435-r1" x="1744.6" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="1769" y="776.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1762864435-r1" x="2000.8" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">│</text><text class="terminal-1762864435-r1" x="2013" y="776.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-31)">
-</text><text class="terminal-1762864435-r1" x="0" y="800.8" textLength="2013" clip-path="url(#terminal-1762864435-line-32)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="800.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-32)">
-</text><text class="terminal-1762864435-r1" x="0" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="24.4" y="825.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-33)">bnb-batch_size(1)-…</text><text class="terminal-1762864435-r1" x="268.4" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="292.8" y="825.2" textLength="122" clip-path="url(#terminal-1762864435-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1762864435-r1" x="427" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="451.4" y="825.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8.65e-02</text><text class="terminal-1762864435-r1" x="695.4" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="719.8" y="825.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;11.60</text><text class="terminal-1762864435-r1" x="951.6" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="976" y="825.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7822</text><text class="terminal-1762864435-r1" x="1220" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="825.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;23.00</text><text class="terminal-1762864435-r1" x="1476.2" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="825.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7960</text><text class="terminal-1762864435-r1" x="1744.6" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="1769" y="825.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1762864435-r1" x="2000.8" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">│</text><text class="terminal-1762864435-r1" x="2013" y="825.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-33)">
-</text><text class="terminal-1762864435-r1" x="0" y="849.6" textLength="2013" clip-path="url(#terminal-1762864435-line-34)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="849.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-34)">
-</text><text class="terminal-1762864435-r1" x="0" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="24.4" y="874" textLength="231.8" clip-path="url(#terminal-1762864435-line-35)">awq-batch_size(16)…</text><text class="terminal-1762864435-r1" x="268.4" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="292.8" y="874" textLength="122" clip-path="url(#terminal-1762864435-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1762864435-r1" x="427" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="451.4" y="874" textLength="231.8" clip-path="url(#terminal-1762864435-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.52</text><text class="terminal-1762864435-r1" x="695.4" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="719.8" y="874" textLength="219.6" clip-path="url(#terminal-1762864435-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.35</text><text class="terminal-1762864435-r1" x="951.6" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="976" y="874" textLength="231.8" clip-path="url(#terminal-1762864435-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;14486</text><text class="terminal-1762864435-r1" x="1220" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="874" textLength="219.6" clip-path="url(#terminal-1762864435-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;312.00</text><text class="terminal-1762864435-r1" x="1476.2" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="874" textLength="231.8" clip-path="url(#terminal-1762864435-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15080</text><text class="terminal-1762864435-r1" x="1744.6" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="1769" y="874" textLength="219.6" clip-path="url(#terminal-1762864435-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;AWQ</text><text class="terminal-1762864435-r1" x="2000.8" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">│</text><text class="terminal-1762864435-r1" x="2013" y="874" textLength="12.2" clip-path="url(#terminal-1762864435-line-35)">
-</text><text class="terminal-1762864435-r1" x="0" y="898.4" textLength="2013" clip-path="url(#terminal-1762864435-line-36)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="898.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-36)">
-</text><text class="terminal-1762864435-r1" x="0" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="24.4" y="922.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-37)">awq-batch_size(8)-…</text><text class="terminal-1762864435-r1" x="268.4" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="292.8" y="922.8" textLength="122" clip-path="url(#terminal-1762864435-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1762864435-r1" x="427" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="451.4" y="922.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.27</text><text class="terminal-1762864435-r1" x="695.4" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="719.8" y="922.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.30</text><text class="terminal-1762864435-r1" x="951.6" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="976" y="922.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;10787</text><text class="terminal-1762864435-r1" x="1220" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="922.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;229.00</text><text class="terminal-1762864435-r1" x="1476.2" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="922.8" textLength="231.8" clip-path="url(#terminal-1762864435-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;11175</text><text class="terminal-1762864435-r1" x="1744.6" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="1769" y="922.8" textLength="219.6" clip-path="url(#terminal-1762864435-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;AWQ</text><text class="terminal-1762864435-r1" x="2000.8" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">│</text><text class="terminal-1762864435-r1" x="2013" y="922.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-37)">
-</text><text class="terminal-1762864435-r1" x="0" y="947.2" textLength="2013" clip-path="url(#terminal-1762864435-line-38)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="947.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-38)">
-</text><text class="terminal-1762864435-r1" x="0" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="24.4" y="971.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-39)">awq-batch_size(4)-…</text><text class="terminal-1762864435-r1" x="268.4" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="292.8" y="971.6" textLength="122" clip-path="url(#terminal-1762864435-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1762864435-r1" x="427" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="451.4" y="971.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.38e-01</text><text class="terminal-1762864435-r1" x="695.4" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="719.8" y="971.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.27</text><text class="terminal-1762864435-r1" x="951.6" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="976" y="971.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8958</text><text class="terminal-1762864435-r1" x="1220" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="971.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;122.00</text><text class="terminal-1762864435-r1" x="1476.2" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="971.6" textLength="231.8" clip-path="url(#terminal-1762864435-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9101</text><text class="terminal-1762864435-r1" x="1744.6" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="1769" y="971.6" textLength="219.6" clip-path="url(#terminal-1762864435-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;AWQ</text><text class="terminal-1762864435-r1" x="2000.8" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">│</text><text class="terminal-1762864435-r1" x="2013" y="971.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-39)">
-</text><text class="terminal-1762864435-r1" x="0" y="996" textLength="2013" clip-path="url(#terminal-1762864435-line-40)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="996" textLength="12.2" clip-path="url(#terminal-1762864435-line-40)">
-</text><text class="terminal-1762864435-r1" x="0" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="24.4" y="1020.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-41)">awq-batch_size(2)-…</text><text class="terminal-1762864435-r1" x="268.4" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="292.8" y="1020.4" textLength="122" clip-path="url(#terminal-1762864435-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1762864435-r1" x="427" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="451.4" y="1020.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.21e-01</text><text class="terminal-1762864435-r1" x="695.4" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="719.8" y="1020.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.23</text><text class="terminal-1762864435-r1" x="951.6" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="976" y="1020.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7824</text><text class="terminal-1762864435-r1" x="1220" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="1020.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;62.90</text><text class="terminal-1762864435-r1" x="1476.2" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="1020.4" textLength="231.8" clip-path="url(#terminal-1762864435-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8136</text><text class="terminal-1762864435-r1" x="1744.6" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="1769" y="1020.4" textLength="219.6" clip-path="url(#terminal-1762864435-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;AWQ</text><text class="terminal-1762864435-r1" x="2000.8" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">│</text><text class="terminal-1762864435-r1" x="2013" y="1020.4" textLength="12.2" clip-path="url(#terminal-1762864435-line-41)">
-</text><text class="terminal-1762864435-r1" x="0" y="1044.8" textLength="2013" clip-path="url(#terminal-1762864435-line-42)">├─────────────────────┼────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤</text><text class="terminal-1762864435-r1" x="2013" y="1044.8" textLength="12.2" clip-path="url(#terminal-1762864435-line-42)">
-</text><text class="terminal-1762864435-r1" x="0" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="24.4" y="1069.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-43)">awq-batch_size(1)-…</text><text class="terminal-1762864435-r1" x="268.4" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="292.8" y="1069.2" textLength="122" clip-path="url(#terminal-1762864435-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1762864435-r1" x="427" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="451.4" y="1069.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.64e-01</text><text class="terminal-1762864435-r1" x="695.4" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="719.8" y="1069.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.10</text><text class="terminal-1762864435-r1" x="951.6" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="976" y="1069.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7589</text><text class="terminal-1762864435-r1" x="1220" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="1244.4" y="1069.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;31.20</text><text class="terminal-1762864435-r1" x="1476.2" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="1500.6" y="1069.2" textLength="231.8" clip-path="url(#terminal-1762864435-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7660</text><text class="terminal-1762864435-r1" x="1744.6" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="1769" y="1069.2" textLength="219.6" clip-path="url(#terminal-1762864435-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;AWQ</text><text class="terminal-1762864435-r1" x="2000.8" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">│</text><text class="terminal-1762864435-r1" x="2013" y="1069.2" textLength="12.2" clip-path="url(#terminal-1762864435-line-43)">
-</text><text class="terminal-1762864435-r1" x="0" y="1093.6" textLength="2013" clip-path="url(#terminal-1762864435-line-44)">└─────────────────────┴────────────┴─────────────────────┴────────────────────┴─────────────────────┴────────────────────┴─────────────────────┴────────────────────┘</text><text class="terminal-1762864435-r1" x="2013" y="1093.6" textLength="12.2" clip-path="url(#terminal-1762864435-line-44)">
-</text>
-    </g>
-    </g>
-</svg>
diff --git a/examples/running-mistrals/artifacts/A100-80GB/short_report.csv b/examples/running-mistrals/artifacts/A100-80GB/short_report.csv
deleted file mode 100644
index 197e1c68..00000000
--- a/examples/running-mistrals/artifacts/A100-80GB/short_report.csv
+++ /dev/null
@@ -1,21 +0,0 @@
-experiment_name,Batch Size,Forward Latency (s),Forward Throughput (samples/s),Forward Peak Memory (MB),Generate Throughput (tokens/s),Generate Peak Memory (MB),Quantization Scheme
-fp16-batch_size(4)-sequence_length(512)-new_tokens(1000),4,0.233,17.2,17865,137.0,18509,fp16
-fp16-batch_size(8)-sequence_length(512)-new_tokens(1000),8,0.467,17.1,19463,236.0,20524,fp16
-fp16-batch_size(16)-sequence_length(512)-new_tokens(1000),16,0.937,17.1,22458,319.0,24393,fp16
-bnb-batch_size(16)-sequence_length(512)-new_tokens(1000),16,0.94,17.0,13155,211.0,15254,bnb
-fp16-batch_size(2)-sequence_length(512)-new_tokens(1000),2,0.118,16.9,17158,68.0,17523,fp16
-gptq-batch_size(16)-sequence_length(512)-new_tokens(1000),16,0.963,16.6,13314,242.0,15235,gptq
-bnb-batch_size(8)-sequence_length(512)-new_tokens(1000),8,0.483,16.6,10261,134.0,11330,bnb
-gptq-batch_size(8)-sequence_length(512)-new_tokens(1000),8,0.486,16.5,10303,164.0,11280,gptq
-fp16-batch_size(1)-sequence_length(512)-new_tokens(1000),1,0.0633,15.8,16907,35.3,17066,fp16
-bnb-batch_size(4)-sequence_length(512)-new_tokens(1000),4,0.254,15.7,8797,68.5,9317,bnb
-gptq-batch_size(4)-sequence_length(512)-new_tokens(1000),4,0.261,15.3,8747,111.0,9239,gptq
-bnb-batch_size(2)-sequence_length(512)-new_tokens(1000),2,0.141,14.2,8166,35.0,8401,bnb
-gptq-batch_size(2)-sequence_length(512)-new_tokens(1000),2,0.142,14.1,7918,62.9,8279,gptq
-gptq-batch_size(1)-sequence_length(512)-new_tokens(1000),1,0.0828,12.1,7669,31.7,7824,gptq
-bnb-batch_size(1)-sequence_length(512)-new_tokens(1000),1,0.0865,11.6,7822,23.0,7960,bnb
-awq-batch_size(16)-sequence_length(512)-new_tokens(1000),16,2.52,6.35,14486,312.0,15080,awq
-awq-batch_size(8)-sequence_length(512)-new_tokens(1000),8,1.27,6.3,10787,229.0,11175,awq
-awq-batch_size(4)-sequence_length(512)-new_tokens(1000),4,0.638,6.27,8958,122.0,9101,awq
-awq-batch_size(2)-sequence_length(512)-new_tokens(1000),2,0.321,6.23,7824,62.9,8136,awq
-awq-batch_size(1)-sequence_length(512)-new_tokens(1000),1,0.164,6.1,7589,31.2,7660,awq
diff --git a/examples/running-mistrals/configs/_base_.yaml b/examples/running-mistrals/configs/_base_.yaml
deleted file mode 100644
index b02223bb..00000000
--- a/examples/running-mistrals/configs/_base_.yaml
+++ /dev/null
@@ -1,36 +0,0 @@
-defaults:
-  - backend: pytorch # default backend
-  - benchmark: inference # default benchmark
-  - experiment # inheriting from experiment config
-  - _self_ # for hydra 1.1 compatibility
-  - override hydra/job_logging: colorlog # colorful logging
-  - override hydra/hydra_logging: colorlog # colorful logging
-
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-  job:
-    chdir: true
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-  sweeper:
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-
-backend:
-  torch_dtype: float16
-
-benchmark:
-  memory: true
-  warmup_runs: 10
-
-  new_tokens: 1000
-  input_shapes:
-    sequence_length: 512
diff --git a/examples/running-mistrals/configs/awq.yaml b/examples/running-mistrals/configs/awq.yaml
deleted file mode 100644
index 88f22cb5..00000000
--- a/examples/running-mistrals/configs/awq.yaml
+++ /dev/null
@@ -1,6 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-
-experiment_name: awq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: ybelkada/test-mistral-7b-v0.1-awq
diff --git a/examples/running-mistrals/configs/bnb.yaml b/examples/running-mistrals/configs/bnb.yaml
deleted file mode 100644
index 61cf1ebd..00000000
--- a/examples/running-mistrals/configs/bnb.yaml
+++ /dev/null
@@ -1,11 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-
-backend:
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
diff --git a/examples/running-mistrals/configs/gptq.yaml b/examples/running-mistrals/configs/gptq.yaml
deleted file mode 100644
index 927a172e..00000000
--- a/examples/running-mistrals/configs/gptq.yaml
+++ /dev/null
@@ -1,6 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/Mistral-7B-v0.1-GPTQ
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml
deleted file mode 100644
index dd8a2808..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml
deleted file mode 100644
index bcfd32be..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: awq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml
deleted file mode 100644
index 8b6686c5..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq-batch_size(1)-sequence_length(512)-new_tokens(1000)
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv
deleted file mode 100644
index 5b69d36b..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.164,6.1,7589,32.1,31.2,7660
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml
deleted file mode 100644
index 23deebd5..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml
deleted file mode 100644
index 472713b3..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: awq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml
deleted file mode 100644
index 56f693fb..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq-batch_size(16)-sequence_length(512)-new_tokens(1000)
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv
deleted file mode 100644
index 709cdc10..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-2.52,6.35,14486,51.3,312.0,15080
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml
deleted file mode 100644
index 15ca6c32..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml
deleted file mode 100644
index ab5e3ddb..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: awq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml
deleted file mode 100644
index 52724f0c..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq-batch_size(2)-sequence_length(512)-new_tokens(1000)
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv
deleted file mode 100644
index 44139984..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.321,6.23,7824,31.8,62.9,8136
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml
deleted file mode 100644
index c5659988..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml
deleted file mode 100644
index 676eb33b..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: awq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml
deleted file mode 100644
index 528e56a1..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq-batch_size(4)-sequence_length(512)-new_tokens(1000)
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv
deleted file mode 100644
index 8aafc741..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.638,6.27,8958,32.8,122.0,9101
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml
deleted file mode 100644
index 37a3bdb1..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml
deleted file mode 100644
index 6403b0cb..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: awq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml
deleted file mode 100644
index c830c5f3..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq-batch_size(8)-sequence_length(512)-new_tokens(1000)
-model: ybelkada/test-mistral-7b-v0.1-awq
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv
deleted file mode 100644
index 7f765da2..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/awq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-1.27,6.3,10787,34.9,229.0,11175
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml
deleted file mode 100644
index 5aa1ffa3..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,73 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml
deleted file mode 100644
index 19bb99b5..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml
deleted file mode 100644
index 4c3edbf9..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv
deleted file mode 100644
index ce9e3c78..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0865,11.6,7822,43.4,23.0,7960
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml
deleted file mode 100644
index 18995afe..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,73 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml
deleted file mode 100644
index 9e9c5d39..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml
deleted file mode 100644
index 0ba30c00..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv
deleted file mode 100644
index ea01621e..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.94,17.0,13155,76.0,211.0,15254
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml
deleted file mode 100644
index f1495501..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,73 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml
deleted file mode 100644
index f841c4ac..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml
deleted file mode 100644
index 53535c91..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv
deleted file mode 100644
index b2ba03ea..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.141,14.2,8166,57.2,35.0,8401
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml
deleted file mode 100644
index 8e5f788e..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,73 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml
deleted file mode 100644
index f998b572..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml
deleted file mode 100644
index 57923542..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv
deleted file mode 100644
index 332ef801..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.254,15.7,8797,58.4,68.5,9317
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml
deleted file mode 100644
index a53fdf3f..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,73 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml
deleted file mode 100644
index e54389aa..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml
deleted file mode 100644
index 730f327e..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml
+++ /dev/null
@@ -1,80 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv
deleted file mode 100644
index 454db2cb..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.483,16.6,10261,59.9,134.0,11330
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml
deleted file mode 100644
index 76483dd5..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml
deleted file mode 100644
index b6c71a98..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/quantized-mistrals
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/quantized-mistrals/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/quantized-mistrals/experiments/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml
deleted file mode 100644
index 3387d1ab..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv
deleted file mode 100644
index d6eb5712..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0633,15.8,16907,28.3,35.3,17066
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml
deleted file mode 100644
index 82aec418..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml
deleted file mode 100644
index 385d4305..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/quantized-mistrals
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/quantized-mistrals/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/quantized-mistrals/experiments/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml
deleted file mode 100644
index e8f7d723..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv
deleted file mode 100644
index c5489483..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.937,17.1,22458,50.1,319.0,24393
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml
deleted file mode 100644
index 9431c98f..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml
deleted file mode 100644
index 52ce2bdf..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/quantized-mistrals
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/quantized-mistrals/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/quantized-mistrals/experiments/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml
deleted file mode 100644
index efdcc561..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv
deleted file mode 100644
index caa1d8d5..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.118,16.9,17158,29.4,68.0,17523
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml
deleted file mode 100644
index be5a83f3..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml
deleted file mode 100644
index 565f1bd3..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/quantized-mistrals
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/quantized-mistrals/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/quantized-mistrals/experiments/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml
deleted file mode 100644
index a6c8cec3..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv
deleted file mode 100644
index 6073280e..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.233,17.2,17865,29.2,137.0,18509
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml
deleted file mode 100644
index 3cbb0127..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml
deleted file mode 100644
index 0f896a1f..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/quantized-mistrals
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/quantized-mistrals/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/quantized-mistrals/experiments/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml
deleted file mode 100644
index f5a98c47..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv
deleted file mode 100644
index 8a714ff6..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.467,17.1,19463,33.9,236.0,20524
diff --git a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(None)-sequence_length(512)-new_tokens(1000)/multirun.yaml b/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(None)-sequence_length(512)-new_tokens(1000)/multirun.yaml
deleted file mode 100644
index 1dd373a8..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/fp16-batch_size(None)-sequence_length(512)-new_tokens(1000)/multirun.yaml
+++ /dev/null
@@ -1,243 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task: []
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: ''
-    id: ???
-    num: ???
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '1'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/quantized-mistrals
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/quantized-mistrals/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: ???
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: null
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: mistralai/Mistral-7B-v0.1
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml
deleted file mode 100644
index 41b761b2..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml
deleted file mode 100644
index 6f61abfc..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml
deleted file mode 100644
index 94c0b06a..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv
deleted file mode 100644
index 56fdbc88..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(512)-new_tokens(1000)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0828,12.1,7669,31.5,31.7,7824
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml
deleted file mode 100644
index 7779b85a..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml
deleted file mode 100644
index 83e7db7c..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml
deleted file mode 100644
index c6285181..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv
deleted file mode 100644
index ebe0ae57..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(512)-new_tokens(1000)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.963,16.6,13314,66.1,242.0,15235
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml
deleted file mode 100644
index c431c470..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml
deleted file mode 100644
index ab240c24..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml
deleted file mode 100644
index 3cb39040..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv
deleted file mode 100644
index e8493eb9..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(512)-new_tokens(1000)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.142,14.1,7918,31.8,62.9,8279
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml
deleted file mode 100644
index e2d6f89f..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml
deleted file mode 100644
index 4506944a..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml
deleted file mode 100644
index 5ac36e22..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv
deleted file mode 100644
index 3ebc2394..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(512)-new_tokens(1000)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.261,15.3,8747,36.0,111.0,9239
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml
deleted file mode 100644
index b7e4ef0d..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,71 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml
deleted file mode 100644
index 237d4fbf..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/running-mistral
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/running-mistral/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/running-mistral/experiments/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml
deleted file mode 100644
index a8d78a9e..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/hydra_config.yaml
+++ /dev/null
@@ -1,77 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 512
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 1000
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 1000
-    min_new_tokens: 1000
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)
-model: TheBloke/Mistral-7B-v0.1-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.34.1
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv b/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv
deleted file mode 100644
index 4c6fecd9..00000000
--- a/examples/running-mistrals/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(512)-new_tokens(1000)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.486,16.5,10303,48.9,164.0,11280
diff --git a/examples/running-mistrals/report.py b/examples/running-mistrals/report.py
deleted file mode 100644
index 559ea695..00000000
--- a/examples/running-mistrals/report.py
+++ /dev/null
@@ -1,229 +0,0 @@
-from argparse import ArgumentParser
-from pathlib import Path
-
-import matplotlib.pyplot as plt
-import pandas as pd
-from flatten_dict import flatten
-from omegaconf import OmegaConf
-from pandas import DataFrame
-from rich.console import Console
-from rich.table import Table
-from rich.terminal_theme import MONOKAI
-
-
-def gather_inference_report(root_folder: Path) -> DataFrame:
-    # key is path to inference file as string, value is dataframe
-    inference_dfs = {
-        f.parent.absolute().as_posix(): pd.read_csv(f) for f in root_folder.glob("**/inference_results.csv")
-    }
-
-    # key is path to config file as string, value is flattened dict
-    config_dfs = {
-        f.parent.absolute()
-        .as_posix(): pd.DataFrame.from_dict(flatten(OmegaConf.load(f), reducer="dot"), orient="index")
-        .T
-        for f in root_folder.glob("**/hydra_config.yaml")
-        if f.parent.absolute().as_posix() in inference_dfs.keys()
-    }
-
-    if len(inference_dfs) == 0 or len(config_dfs) == 0:
-        raise ValueError(f"No results found in {root_folder}")
-
-    # Merge inference and config dataframes
-    inference_reports = [
-        config_dfs[name].merge(inference_dfs[name], left_index=True, right_index=True) for name in inference_dfs.keys()
-    ]
-
-    # Concatenate all reports
-    inference_report = pd.concat(inference_reports, axis=0, ignore_index=True)
-    inference_report.set_index("experiment_name", inplace=True)
-    return inference_report
-
-
-def style_element(element, style=""):
-    if style:
-        return f"[{style}]{element}[/{style}]"
-    else:
-        return element
-
-
-def format_element(element, style=""):
-    if isinstance(element, float):
-        if element != element:  # nan
-            formated_element = ""
-        elif abs(element) >= 1:
-            formated_element = f"{element:.2f}"
-        elif abs(element) > 1e-6:
-            formated_element = f"{element:.2e}"
-        else:
-            formated_element = f"{element}"
-    elif element is None:
-        formated_element = ""
-    elif isinstance(element, bool):
-        if element:
-            formated_element = style_element("✔", style="green")
-        else:
-            formated_element = style_element("✘", style="red")
-    else:
-        formated_element = str(element)
-
-    return style_element(formated_element, style=style)
-
-
-def format_row(row, style=""):
-    formated_row = []
-    for element in row:
-        formated_row.append(format_element(element, style=style))
-    return formated_row
-
-
-def get_short_report(inference_report):
-    short_columns = {
-        "benchmark.input_shapes.batch_size": "Batch Size",
-        "forward.latency(s)": "Forward Latency (s)",
-        "forward.throughput(samples/s)": "Forward Throughput (samples/s)",
-        "forward.peak_memory(MB)": "Forward Peak Memory (MB)",
-        "generate.throughput(tokens/s)": "Generate Throughput (tokens/s)",
-        "generate.peak_memory(MB)": "Generate Peak Memory (MB)",
-    }
-    short_report = inference_report[list(short_columns.keys())].rename(columns=short_columns)
-    short_report["Quantization Scheme"] = inference_report.index.str.split("-").str[0]
-
-    return short_report
-
-
-def get_rich_table(short_report):
-    # create rich table
-    rich_table = Table(show_header=True, show_lines=True)
-    # we add a column for the index
-    rich_table.add_column("Experiment Name", justify="left", header_style="")
-    # we populate the table with values
-    for column in short_report.columns:
-        rich_table.add_column(column, justify="right", header_style="bold")
-    # we add rows
-    for index, row in short_report.iterrows():
-        rich_table.add_row(index, *format_row(row.values, style=""))
-
-    return rich_table
-
-
-def get_throughput_plot(short_report):
-    # for each quantization scheme we plot the throughput vs batch size
-    fig1, ax1 = plt.subplots()
-    fig2, ax2 = plt.subplots()
-    fig3, ax3 = plt.subplots()
-    fig4, ax4 = plt.subplots()
-
-    short_report["Quantization Scheme"].fillna("unquantized", inplace=True)
-    short_report["Quantization Scheme"].replace("bnb", "BnB", inplace=True)
-    short_report["Quantization Scheme"].replace("awq", "AWQ", inplace=True)
-    short_report["Quantization Scheme"].replace("gptq", "GPTQ", inplace=True)
-
-    for quantization_scheme in short_report["Quantization Scheme"].unique():
-        mask = short_report["Quantization Scheme"] == quantization_scheme
-
-        forward_latency = short_report[mask][["Batch Size", "Forward Latency (s)"]].sort_values(by="Batch Size")
-        generate_throughput = short_report[mask][["Batch Size", "Generate Throughput (tokens/s)"]].sort_values(
-            by="Batch Size"
-        )
-        forward_memory = short_report[mask][["Batch Size", "Forward Peak Memory (MB)"]].sort_values(by="Batch Size")
-        generate_memory = short_report[mask][["Batch Size", "Generate Peak Memory (MB)"]].sort_values(by="Batch Size")
-        ax1.plot(
-            forward_latency["Batch Size"],
-            forward_latency["Forward Latency (s)"],
-            label=quantization_scheme,
-            marker="o",
-        )
-        ax2.plot(
-            generate_throughput["Batch Size"],
-            generate_throughput["Generate Throughput (tokens/s)"],
-            label=quantization_scheme,
-            marker="o",
-        )
-        ax3.plot(
-            forward_memory["Batch Size"],
-            forward_memory["Forward Peak Memory (MB)"],
-            label=quantization_scheme,
-            marker="*",
-        )
-        ax4.plot(
-            generate_memory["Batch Size"],
-            generate_memory["Generate Peak Memory (MB)"],
-            label=quantization_scheme,
-            marker="*",
-        )
-
-    ax1.set_xlabel("Batch Size")
-    ax1.set_ylabel("Forward Latency (s)")
-    ax1.set_title("Forward Latency per Batch Size")
-
-    ax2.set_xlabel("Batch Size")
-    ax2.set_ylabel("Generate Throughput (tokens/s)")
-    ax2.set_title("Generate Throughput per Batch Size")
-
-    ax3.set_xlabel("Batch Size")
-    ax3.set_ylabel("Forward Peak Memory (MB)")
-    ax3.set_title("Forward Peak Memory per Batch Size")
-
-    ax4.set_xlabel("Batch Size")
-    ax4.set_ylabel("Generate Peak Memory (MB)")
-    ax4.set_title("Generate Peak Memory per Batch Size")
-
-    ax1.legend()
-    ax2.legend()
-    ax3.legend()
-    ax4.legend()
-
-    return fig1, fig2, fig3, fig4
-
-
-def generate_report():
-    parser = ArgumentParser()
-    parser.add_argument(
-        "--experiments",
-        "-e",
-        type=Path,
-        required=True,
-        help="The folder containing the results of experiments.",
-    )
-    parser.add_argument(
-        "--report-name",
-        "-r",
-        type=str,
-        required=False,
-        help="The name of the report.",
-    )
-
-    args = parser.parse_args()
-    experiments_folders = args.experiments
-
-    if args.report_name:
-        report_folder = f"artifacts/{args.report_name}"
-    else:
-        report_folder = "artifacts"
-    Path(report_folder).mkdir(parents=True, exist_ok=True)
-
-    # gather experiments results
-    inference_report = gather_inference_report(experiments_folders)
-    inference_report.sort_values(by="forward.throughput(samples/s)", ascending=False, inplace=True)
-    inference_report.to_csv(f"{report_folder}/full_report.csv")
-
-    short_report = get_short_report(inference_report)
-    short_report.to_csv(f"{report_folder}/short_report.csv")
-
-    forward_throughput_plot, generate_throughput_plot, forward_memory_plot, generate_memory_plot = get_throughput_plot(
-        short_report
-    )
-    forward_throughput_plot.savefig(f"{report_folder}/forward_latency_plot.png")
-    generate_throughput_plot.savefig(f"{report_folder}/generate_throughput_plot.png")
-    forward_memory_plot.savefig(f"{report_folder}/forward_memory_plot.png")
-    generate_memory_plot.savefig(f"{report_folder}/generate_memory_plot.png")
-
-    rich_table = get_rich_table(short_report)
-    console = Console(record=True)
-    console.print(rich_table, justify="center")
-    console.save_svg(f"{report_folder}/rich_table.svg", theme=MONOKAI, title="Inference Report")
-
-
-if __name__ == "__main__":
-    generate_report()
diff --git a/examples/running-vicunas/README.md b/examples/running-vicunas/README.md
deleted file mode 100644
index 755172b8..00000000
--- a/examples/running-vicunas/README.md
+++ /dev/null
@@ -1,61 +0,0 @@
-# Optimum-Benchmark x Vicuna x BnB & GPTQ & (AWQ+GEMM vs AWQ+GEMV)
-
-A set of benchmarks on quantizing Vicuna.
-
-## Setup
-
-You will need to install these quantization packages:
-
-```bash
-pip install autoawq
-pip install auto-gptq
-pip install bitsandbytes
-```
-
-## Running
-
-Then run these commands from this directory:
-
-```bash
-optimum-benchmark --config-dir configs/ --config-name _base_ --multirun
-optimum-benchmark --config-dir configs/ --config-name bnb --multirun
-optimum-benchmark --config-dir configs/ --config-name gptq --multirun
-optimum-benchmark --config-dir configs/ --config-name awq+gemm --multirun
-optimum-benchmark --config-dir configs/ --config-name awq+gemv --multirun
-```
-
-This will create a folder called `experiments` with the results of the benchmarks with an inference `batch_size` ranging from 1 to 16 and an input `sequence_length` (prompt size) of 128.
-
-## Reporting
-
-To create a report run:
-
-```bash
-python report.py -e experiments
-```
-
-Which will create some quick reporting artifacts like a `full_report.csv`, `short_report.csv`, some plots and a `rich_table.svg`.
-
-## Results
-
-### On A100-80GB
-
-<p align="center">
-<img src="artifacts/A100-80GB/forward_latency_plot.png" alt="latency_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/A100-80GB/generate_throughput_plot.png" alt="throughput_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/A100-80GB/forward_memory_plot.png" alt="memory_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/A100-80GB/generate_memory_plot.png" alt="memory_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/A100-80GB/rich_table.svg" alt="rich_table" width="90%"/>
-</p>
diff --git a/examples/running-vicunas/artifacts/A100-80GB/forward_latency_plot.png b/examples/running-vicunas/artifacts/A100-80GB/forward_latency_plot.png
deleted file mode 100644
index 2b407eb2..00000000
Binary files a/examples/running-vicunas/artifacts/A100-80GB/forward_latency_plot.png and /dev/null differ
diff --git a/examples/running-vicunas/artifacts/A100-80GB/forward_memory_plot.png b/examples/running-vicunas/artifacts/A100-80GB/forward_memory_plot.png
deleted file mode 100644
index a7011009..00000000
Binary files a/examples/running-vicunas/artifacts/A100-80GB/forward_memory_plot.png and /dev/null differ
diff --git a/examples/running-vicunas/artifacts/A100-80GB/full_report.csv b/examples/running-vicunas/artifacts/A100-80GB/full_report.csv
deleted file mode 100644
index 6244d33a..00000000
--- a/examples/running-vicunas/artifacts/A100-80GB/full_report.csv
+++ /dev/null
@@ -1,26 +0,0 @@
-experiment_name,backend.name,backend.version,backend._target_,backend.seed,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.initial_isolation_check,backend.continous_isolation_check,backend.delete_cache,backend.no_weights,backend.device_map,backend.torch_dtype,backend.disable_grad,backend.eval_mode,backend.amp_autocast,backend.amp_dtype,backend.torch_compile,backend.bettertransformer,backend.quantization_scheme,backend.use_ddp,backend.peft_strategy,benchmark.name,benchmark._target_,benchmark.duration,benchmark.warmup_runs,benchmark.memory,benchmark.energy,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,benchmark.can_diffuse,benchmark.can_generate,benchmark.generate_kwargs.max_new_tokens,benchmark.generate_kwargs.min_new_tokens,benchmark.generate_kwargs.do_sample,benchmark.generate_kwargs.use_cache,benchmark.generate_kwargs.pad_token_id,benchmark.generate_kwargs.num_beams,model,device,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,environment.optimum_version,environment.optimum_commit,environment.transformers_version,environment.transformers_commit,environment.accelerate_version,environment.accelerate_commit,environment.diffusers_version,environment.diffusers_commit,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,environment.gpus,forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB),backend.quantization_config.llm_int8_threshold,backend.quantization_config.load_in_4bit,backend.quantization_config.bnb_4bit_compute_dtype
-fp16-batch_size(16)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.2,80.0,18706,6.87,596.0,49664,,,
-fp16-batch_size(8)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.105,76.2,16829,6.9,297.0,24551,,,
-gptq-batch_size(16)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,TheBloke/vicuna-7B-v1.5-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.212,75.5,10441,10.1,406.0,40774,,,
-bnb-batch_size(16)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.221,72.4,9917,13.9,295.0,20260,0.0,True,float16
-fp16-batch_size(4)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0577,69.3,15690,6.69,153.0,16896,,,
-gptq-batch_size(8)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,TheBloke/vicuna-7B-v1.5-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.116,69.0,8568,8.88,231.0,16290,,,
-bnb-batch_size(8)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.126,63.5,8323,13.4,153.0,10760,0.0,True,float16
-fp16-batch_size(2)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0337,59.3,15313,6.68,76.6,15858,,,
-gptq-batch_size(4)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,TheBloke/vicuna-7B-v1.5-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0684,58.5,7170,7.3,140.0,8717,,,
-bnb-batch_size(4)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0781,51.2,7545,13.4,76.4,8539,0.0,True,float16
-gptq-batch_size(2)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,TheBloke/vicuna-7B-v1.5-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0456,43.9,6800,7.17,71.4,7597,,,
-fp16-batch_size(1)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.026,38.5,15128,6.67,38.4,15548,,,
-bnb-batch_size(2)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0553,36.2,7073,13.6,37.6,7704,0.0,True,float16
-awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.47,34.0,10183,9.27,442.0,31247,,,
-awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.24,33.3,8394,10.7,191.0,14176,,,
-awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.124,32.3,7245,7.01,146.0,8602,,,
-awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0675,29.6,6756,6.89,74.3,7511,,,
-gptq-batch_size(1)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,TheBloke/vicuna-7B-v1.5-GPTQ,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0351,28.5,6868,7.29,35.1,7077,,,
-awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,8,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.289,27.7,8394,7.84,261.0,14176,,,
-awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,16,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.58,27.6,10183,8.33,492.0,31245,,,
-awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,4,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.149,26.8,7155,7.67,134.0,8642,,,
-awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.039,25.6,6792,6.85,37.4,6981,,,
-awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,2,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0801,25.0,6754,7.71,66.4,7509,,,
-awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0437,22.9,6792,7.61,33.6,6981,,,
-bnb-batch_size(1)-sequence_length(128)-new_tokens(256),pytorch,2.1.0+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,True,False,False,,float16,True,True,False,,False,False,bnb,False,,inference,optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark,10,10,True,False,1,128,1,80,3000,16000,256,False,True,256,256,False,True,0,1,lmsys/vicuna-7b-v1.5,cuda,text-generation,main,,False,False,1.13.2,,4.35.0.dev0,,0.24.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540684,['NVIDIA A100-SXM4-80GB'],0.0526,19.0,6945,10.8,23.7,7281,0.0,True,float16
diff --git a/examples/running-vicunas/artifacts/A100-80GB/generate_memory_plot.png b/examples/running-vicunas/artifacts/A100-80GB/generate_memory_plot.png
deleted file mode 100644
index 134393ea..00000000
Binary files a/examples/running-vicunas/artifacts/A100-80GB/generate_memory_plot.png and /dev/null differ
diff --git a/examples/running-vicunas/artifacts/A100-80GB/generate_throughput_plot.png b/examples/running-vicunas/artifacts/A100-80GB/generate_throughput_plot.png
deleted file mode 100644
index ff3d6338..00000000
Binary files a/examples/running-vicunas/artifacts/A100-80GB/generate_throughput_plot.png and /dev/null differ
diff --git a/examples/running-vicunas/artifacts/A100-80GB/rich_table.svg b/examples/running-vicunas/artifacts/A100-80GB/rich_table.svg
deleted file mode 100644
index 9206e272..00000000
--- a/examples/running-vicunas/artifacts/A100-80GB/rich_table.svg
+++ /dev/null
@@ -1,275 +0,0 @@
-<svg class="rich-terminal" viewBox="0 0 1714 1392.0" xmlns="http://www.w3.org/2000/svg">
-    <!-- Generated with Rich https://www.textualize.io -->
-    <style>
-
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Regular"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Regular.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Regular.woff") format("woff");
-        font-style: normal;
-        font-weight: 400;
-    }
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Bold"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Bold.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Bold.woff") format("woff");
-        font-style: bold;
-        font-weight: 700;
-    }
-
-    .terminal-1162717233-matrix {
-        font-family: Fira Code, monospace;
-        font-size: 20px;
-        line-height: 24.4px;
-        font-variant-east-asian: full-width;
-    }
-
-    .terminal-1162717233-title {
-        font-size: 18px;
-        font-weight: bold;
-        font-family: arial;
-    }
-
-    .terminal-1162717233-r1 { fill: #d9d9d9 }
-.terminal-1162717233-r2 { fill: #d9d9d9;font-weight: bold }
-    </style>
-
-    <defs>
-    <clipPath id="terminal-1162717233-clip-terminal">
-      <rect x="0" y="0" width="1694.8" height="1341.0" />
-    </clipPath>
-    <clipPath id="terminal-1162717233-line-0">
-    <rect x="0" y="1.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-1">
-    <rect x="0" y="25.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-2">
-    <rect x="0" y="50.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-3">
-    <rect x="0" y="74.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-4">
-    <rect x="0" y="99.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-5">
-    <rect x="0" y="123.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-6">
-    <rect x="0" y="147.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-7">
-    <rect x="0" y="172.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-8">
-    <rect x="0" y="196.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-9">
-    <rect x="0" y="221.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-10">
-    <rect x="0" y="245.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-11">
-    <rect x="0" y="269.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-12">
-    <rect x="0" y="294.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-13">
-    <rect x="0" y="318.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-14">
-    <rect x="0" y="343.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-15">
-    <rect x="0" y="367.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-16">
-    <rect x="0" y="391.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-17">
-    <rect x="0" y="416.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-18">
-    <rect x="0" y="440.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-19">
-    <rect x="0" y="465.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-20">
-    <rect x="0" y="489.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-21">
-    <rect x="0" y="513.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-22">
-    <rect x="0" y="538.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-23">
-    <rect x="0" y="562.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-24">
-    <rect x="0" y="587.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-25">
-    <rect x="0" y="611.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-26">
-    <rect x="0" y="635.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-27">
-    <rect x="0" y="660.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-28">
-    <rect x="0" y="684.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-29">
-    <rect x="0" y="709.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-30">
-    <rect x="0" y="733.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-31">
-    <rect x="0" y="757.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-32">
-    <rect x="0" y="782.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-33">
-    <rect x="0" y="806.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-34">
-    <rect x="0" y="831.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-35">
-    <rect x="0" y="855.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-36">
-    <rect x="0" y="879.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-37">
-    <rect x="0" y="904.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-38">
-    <rect x="0" y="928.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-39">
-    <rect x="0" y="953.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-40">
-    <rect x="0" y="977.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-41">
-    <rect x="0" y="1001.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-42">
-    <rect x="0" y="1026.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-43">
-    <rect x="0" y="1050.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-44">
-    <rect x="0" y="1075.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-45">
-    <rect x="0" y="1099.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-46">
-    <rect x="0" y="1123.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-47">
-    <rect x="0" y="1148.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-48">
-    <rect x="0" y="1172.7" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-49">
-    <rect x="0" y="1197.1" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-50">
-    <rect x="0" y="1221.5" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-51">
-    <rect x="0" y="1245.9" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-52">
-    <rect x="0" y="1270.3" width="1695.8" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1162717233-line-53">
-    <rect x="0" y="1294.7" width="1695.8" height="24.65"/>
-            </clipPath>
-    </defs>
-
-    <rect fill="#0c0c0c" stroke="rgba(255,255,255,0.35)" stroke-width="1" x="1" y="1" width="1712" height="1390" rx="8"/><text class="terminal-1162717233-title" fill="#d9d9d9" text-anchor="middle" x="856" y="27">Inference&#160;Report</text>
-            <g transform="translate(26,22)">
-            <circle cx="0" cy="0" r="7" fill="#ff5f57"/>
-            <circle cx="22" cy="0" r="7" fill="#febc2e"/>
-            <circle cx="44" cy="0" r="7" fill="#28c840"/>
-            </g>
-        
-    <g transform="translate(9, 41)" clip-path="url(#terminal-1162717233-clip-terminal)">
-    
-    <g class="terminal-1162717233-matrix">
-    <text class="terminal-1162717233-r1" x="0" y="20" textLength="1695.8" clip-path="url(#terminal-1162717233-line-0)">┏━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━┓</text><text class="terminal-1162717233-r1" x="1695.8" y="20" textLength="12.2" clip-path="url(#terminal-1162717233-line-0)">
-</text><text class="terminal-1162717233-r1" x="0" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r1" x="219.6" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r1" x="378.2" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r1" x="597.8" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r2" x="622.2" y="44.4" textLength="183" clip-path="url(#terminal-1162717233-line-1)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;Forward</text><text class="terminal-1162717233-r1" x="817.4" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r1" x="1037" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r2" x="1061.4" y="44.4" textLength="183" clip-path="url(#terminal-1162717233-line-1)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;Generate</text><text class="terminal-1162717233-r1" x="1256.6" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r1" x="1476.2" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r1" x="1683.6" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">┃</text><text class="terminal-1162717233-r1" x="1695.8" y="44.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-1)">
-</text><text class="terminal-1162717233-r1" x="0" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r1" x="219.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r1" x="378.2" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r2" x="402.6" y="68.8" textLength="183" clip-path="url(#terminal-1162717233-line-2)">Forward&#160;Latency</text><text class="terminal-1162717233-r1" x="597.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r2" x="622.2" y="68.8" textLength="183" clip-path="url(#terminal-1162717233-line-2)">&#160;&#160;&#160;&#160;&#160;Throughput</text><text class="terminal-1162717233-r1" x="817.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r2" x="841.8" y="68.8" textLength="183" clip-path="url(#terminal-1162717233-line-2)">&#160;&#160;&#160;Forward&#160;Peak</text><text class="terminal-1162717233-r1" x="1037" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r2" x="1061.4" y="68.8" textLength="183" clip-path="url(#terminal-1162717233-line-2)">&#160;&#160;&#160;&#160;&#160;Throughput</text><text class="terminal-1162717233-r1" x="1256.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r2" x="1281" y="68.8" textLength="183" clip-path="url(#terminal-1162717233-line-2)">&#160;&#160;Generate&#160;Peak</text><text class="terminal-1162717233-r1" x="1476.2" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r2" x="1500.6" y="68.8" textLength="170.8" clip-path="url(#terminal-1162717233-line-2)">&#160;&#160;Quantization</text><text class="terminal-1162717233-r1" x="1683.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">┃</text><text class="terminal-1162717233-r1" x="1695.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-2)">
-</text><text class="terminal-1162717233-r1" x="0" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r2" x="24.4" y="93.2" textLength="183" clip-path="url(#terminal-1162717233-line-3)">Experiment&#160;Name</text><text class="terminal-1162717233-r1" x="219.6" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r2" x="244" y="93.2" textLength="122" clip-path="url(#terminal-1162717233-line-3)">Batch&#160;Size</text><text class="terminal-1162717233-r1" x="378.2" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r2" x="402.6" y="93.2" textLength="183" clip-path="url(#terminal-1162717233-line-3)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;(s)</text><text class="terminal-1162717233-r1" x="597.8" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r2" x="622.2" y="93.2" textLength="183" clip-path="url(#terminal-1162717233-line-3)">&#160;&#160;&#160;&#160;(samples/s)</text><text class="terminal-1162717233-r1" x="817.4" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r2" x="841.8" y="93.2" textLength="183" clip-path="url(#terminal-1162717233-line-3)">&#160;&#160;&#160;&#160;Memory&#160;(MB)</text><text class="terminal-1162717233-r1" x="1037" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r2" x="1061.4" y="93.2" textLength="183" clip-path="url(#terminal-1162717233-line-3)">&#160;&#160;&#160;&#160;&#160;(tokens/s)</text><text class="terminal-1162717233-r1" x="1256.6" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r2" x="1281" y="93.2" textLength="183" clip-path="url(#terminal-1162717233-line-3)">&#160;&#160;&#160;&#160;Memory&#160;(MB)</text><text class="terminal-1162717233-r1" x="1476.2" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r2" x="1500.6" y="93.2" textLength="170.8" clip-path="url(#terminal-1162717233-line-3)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;Scheme</text><text class="terminal-1162717233-r1" x="1683.6" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">┃</text><text class="terminal-1162717233-r1" x="1695.8" y="93.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-3)">
-</text><text class="terminal-1162717233-r1" x="0" y="117.6" textLength="1695.8" clip-path="url(#terminal-1162717233-line-4)">┡━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━┩</text><text class="terminal-1162717233-r1" x="1695.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-4)">
-</text><text class="terminal-1162717233-r1" x="0" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="24.4" y="142" textLength="183" clip-path="url(#terminal-1162717233-line-5)">fp16-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="244" y="142" textLength="122" clip-path="url(#terminal-1162717233-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1162717233-r1" x="378.2" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="402.6" y="142" textLength="183" clip-path="url(#terminal-1162717233-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.00e-01</text><text class="terminal-1162717233-r1" x="597.8" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="622.2" y="142" textLength="183" clip-path="url(#terminal-1162717233-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;80.00</text><text class="terminal-1162717233-r1" x="817.4" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="841.8" y="142" textLength="183" clip-path="url(#terminal-1162717233-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;18706</text><text class="terminal-1162717233-r1" x="1037" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="142" textLength="183" clip-path="url(#terminal-1162717233-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;596.00</text><text class="terminal-1162717233-r1" x="1256.6" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="1281" y="142" textLength="183" clip-path="url(#terminal-1162717233-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;49664</text><text class="terminal-1162717233-r1" x="1476.2" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="142" textLength="170.8" clip-path="url(#terminal-1162717233-line-5)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1162717233-r1" x="1683.6" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="142" textLength="12.2" clip-path="url(#terminal-1162717233-line-5)">
-</text><text class="terminal-1162717233-r1" x="0" y="166.4" textLength="1695.8" clip-path="url(#terminal-1162717233-line-6)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-6)">
-</text><text class="terminal-1162717233-r1" x="0" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="24.4" y="190.8" textLength="183" clip-path="url(#terminal-1162717233-line-7)">fp16-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="244" y="190.8" textLength="122" clip-path="url(#terminal-1162717233-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1162717233-r1" x="378.2" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="402.6" y="190.8" textLength="183" clip-path="url(#terminal-1162717233-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.05e-01</text><text class="terminal-1162717233-r1" x="597.8" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="622.2" y="190.8" textLength="183" clip-path="url(#terminal-1162717233-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;76.20</text><text class="terminal-1162717233-r1" x="817.4" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="841.8" y="190.8" textLength="183" clip-path="url(#terminal-1162717233-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16829</text><text class="terminal-1162717233-r1" x="1037" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="190.8" textLength="183" clip-path="url(#terminal-1162717233-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;297.00</text><text class="terminal-1162717233-r1" x="1256.6" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="1281" y="190.8" textLength="183" clip-path="url(#terminal-1162717233-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;24551</text><text class="terminal-1162717233-r1" x="1476.2" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="190.8" textLength="170.8" clip-path="url(#terminal-1162717233-line-7)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1162717233-r1" x="1683.6" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="190.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-7)">
-</text><text class="terminal-1162717233-r1" x="0" y="215.2" textLength="1695.8" clip-path="url(#terminal-1162717233-line-8)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-8)">
-</text><text class="terminal-1162717233-r1" x="0" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="24.4" y="239.6" textLength="183" clip-path="url(#terminal-1162717233-line-9)">gptq-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="244" y="239.6" textLength="122" clip-path="url(#terminal-1162717233-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1162717233-r1" x="378.2" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="402.6" y="239.6" textLength="183" clip-path="url(#terminal-1162717233-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.12e-01</text><text class="terminal-1162717233-r1" x="597.8" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="622.2" y="239.6" textLength="183" clip-path="url(#terminal-1162717233-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;75.50</text><text class="terminal-1162717233-r1" x="817.4" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="841.8" y="239.6" textLength="183" clip-path="url(#terminal-1162717233-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;10441</text><text class="terminal-1162717233-r1" x="1037" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="239.6" textLength="183" clip-path="url(#terminal-1162717233-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;406.00</text><text class="terminal-1162717233-r1" x="1256.6" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="1281" y="239.6" textLength="183" clip-path="url(#terminal-1162717233-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;40774</text><text class="terminal-1162717233-r1" x="1476.2" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="239.6" textLength="170.8" clip-path="url(#terminal-1162717233-line-9)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1162717233-r1" x="1683.6" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="239.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-9)">
-</text><text class="terminal-1162717233-r1" x="0" y="264" textLength="1695.8" clip-path="url(#terminal-1162717233-line-10)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="264" textLength="12.2" clip-path="url(#terminal-1162717233-line-10)">
-</text><text class="terminal-1162717233-r1" x="0" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="24.4" y="288.4" textLength="183" clip-path="url(#terminal-1162717233-line-11)">bnb-batch_size…</text><text class="terminal-1162717233-r1" x="219.6" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="244" y="288.4" textLength="122" clip-path="url(#terminal-1162717233-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1162717233-r1" x="378.2" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="402.6" y="288.4" textLength="183" clip-path="url(#terminal-1162717233-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.21e-01</text><text class="terminal-1162717233-r1" x="597.8" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="622.2" y="288.4" textLength="183" clip-path="url(#terminal-1162717233-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;72.40</text><text class="terminal-1162717233-r1" x="817.4" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="841.8" y="288.4" textLength="183" clip-path="url(#terminal-1162717233-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;9917</text><text class="terminal-1162717233-r1" x="1037" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="288.4" textLength="183" clip-path="url(#terminal-1162717233-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;295.00</text><text class="terminal-1162717233-r1" x="1256.6" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="1281" y="288.4" textLength="183" clip-path="url(#terminal-1162717233-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;20260</text><text class="terminal-1162717233-r1" x="1476.2" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="288.4" textLength="170.8" clip-path="url(#terminal-1162717233-line-11)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1162717233-r1" x="1683.6" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="288.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-11)">
-</text><text class="terminal-1162717233-r1" x="0" y="312.8" textLength="1695.8" clip-path="url(#terminal-1162717233-line-12)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-12)">
-</text><text class="terminal-1162717233-r1" x="0" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="24.4" y="337.2" textLength="183" clip-path="url(#terminal-1162717233-line-13)">fp16-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="244" y="337.2" textLength="122" clip-path="url(#terminal-1162717233-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1162717233-r1" x="378.2" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="402.6" y="337.2" textLength="183" clip-path="url(#terminal-1162717233-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;5.77e-02</text><text class="terminal-1162717233-r1" x="597.8" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="622.2" y="337.2" textLength="183" clip-path="url(#terminal-1162717233-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;69.30</text><text class="terminal-1162717233-r1" x="817.4" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="841.8" y="337.2" textLength="183" clip-path="url(#terminal-1162717233-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15690</text><text class="terminal-1162717233-r1" x="1037" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="337.2" textLength="183" clip-path="url(#terminal-1162717233-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;153.00</text><text class="terminal-1162717233-r1" x="1256.6" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="1281" y="337.2" textLength="183" clip-path="url(#terminal-1162717233-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16896</text><text class="terminal-1162717233-r1" x="1476.2" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="337.2" textLength="170.8" clip-path="url(#terminal-1162717233-line-13)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1162717233-r1" x="1683.6" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="337.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-13)">
-</text><text class="terminal-1162717233-r1" x="0" y="361.6" textLength="1695.8" clip-path="url(#terminal-1162717233-line-14)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-14)">
-</text><text class="terminal-1162717233-r1" x="0" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="24.4" y="386" textLength="183" clip-path="url(#terminal-1162717233-line-15)">gptq-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="244" y="386" textLength="122" clip-path="url(#terminal-1162717233-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1162717233-r1" x="378.2" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="402.6" y="386" textLength="183" clip-path="url(#terminal-1162717233-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.16e-01</text><text class="terminal-1162717233-r1" x="597.8" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="622.2" y="386" textLength="183" clip-path="url(#terminal-1162717233-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;69.00</text><text class="terminal-1162717233-r1" x="817.4" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="841.8" y="386" textLength="183" clip-path="url(#terminal-1162717233-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8568</text><text class="terminal-1162717233-r1" x="1037" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="386" textLength="183" clip-path="url(#terminal-1162717233-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;231.00</text><text class="terminal-1162717233-r1" x="1256.6" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="1281" y="386" textLength="183" clip-path="url(#terminal-1162717233-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16290</text><text class="terminal-1162717233-r1" x="1476.2" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="386" textLength="170.8" clip-path="url(#terminal-1162717233-line-15)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1162717233-r1" x="1683.6" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="386" textLength="12.2" clip-path="url(#terminal-1162717233-line-15)">
-</text><text class="terminal-1162717233-r1" x="0" y="410.4" textLength="1695.8" clip-path="url(#terminal-1162717233-line-16)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-16)">
-</text><text class="terminal-1162717233-r1" x="0" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="24.4" y="434.8" textLength="183" clip-path="url(#terminal-1162717233-line-17)">bnb-batch_size…</text><text class="terminal-1162717233-r1" x="219.6" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="244" y="434.8" textLength="122" clip-path="url(#terminal-1162717233-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1162717233-r1" x="378.2" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="402.6" y="434.8" textLength="183" clip-path="url(#terminal-1162717233-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.26e-01</text><text class="terminal-1162717233-r1" x="597.8" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="622.2" y="434.8" textLength="183" clip-path="url(#terminal-1162717233-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;63.50</text><text class="terminal-1162717233-r1" x="817.4" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="841.8" y="434.8" textLength="183" clip-path="url(#terminal-1162717233-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8323</text><text class="terminal-1162717233-r1" x="1037" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="434.8" textLength="183" clip-path="url(#terminal-1162717233-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;153.00</text><text class="terminal-1162717233-r1" x="1256.6" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="1281" y="434.8" textLength="183" clip-path="url(#terminal-1162717233-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;10760</text><text class="terminal-1162717233-r1" x="1476.2" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="434.8" textLength="170.8" clip-path="url(#terminal-1162717233-line-17)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1162717233-r1" x="1683.6" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="434.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-17)">
-</text><text class="terminal-1162717233-r1" x="0" y="459.2" textLength="1695.8" clip-path="url(#terminal-1162717233-line-18)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="459.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-18)">
-</text><text class="terminal-1162717233-r1" x="0" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="24.4" y="483.6" textLength="183" clip-path="url(#terminal-1162717233-line-19)">fp16-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="244" y="483.6" textLength="122" clip-path="url(#terminal-1162717233-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1162717233-r1" x="378.2" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="402.6" y="483.6" textLength="183" clip-path="url(#terminal-1162717233-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.37e-02</text><text class="terminal-1162717233-r1" x="597.8" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="622.2" y="483.6" textLength="183" clip-path="url(#terminal-1162717233-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;59.30</text><text class="terminal-1162717233-r1" x="817.4" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="841.8" y="483.6" textLength="183" clip-path="url(#terminal-1162717233-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15313</text><text class="terminal-1162717233-r1" x="1037" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="483.6" textLength="183" clip-path="url(#terminal-1162717233-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;76.60</text><text class="terminal-1162717233-r1" x="1256.6" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="1281" y="483.6" textLength="183" clip-path="url(#terminal-1162717233-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15858</text><text class="terminal-1162717233-r1" x="1476.2" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="483.6" textLength="170.8" clip-path="url(#terminal-1162717233-line-19)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1162717233-r1" x="1683.6" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="483.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-19)">
-</text><text class="terminal-1162717233-r1" x="0" y="508" textLength="1695.8" clip-path="url(#terminal-1162717233-line-20)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="508" textLength="12.2" clip-path="url(#terminal-1162717233-line-20)">
-</text><text class="terminal-1162717233-r1" x="0" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="24.4" y="532.4" textLength="183" clip-path="url(#terminal-1162717233-line-21)">gptq-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="244" y="532.4" textLength="122" clip-path="url(#terminal-1162717233-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1162717233-r1" x="378.2" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="402.6" y="532.4" textLength="183" clip-path="url(#terminal-1162717233-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.84e-02</text><text class="terminal-1162717233-r1" x="597.8" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="622.2" y="532.4" textLength="183" clip-path="url(#terminal-1162717233-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;58.50</text><text class="terminal-1162717233-r1" x="817.4" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="841.8" y="532.4" textLength="183" clip-path="url(#terminal-1162717233-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7170</text><text class="terminal-1162717233-r1" x="1037" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="532.4" textLength="183" clip-path="url(#terminal-1162717233-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;140.00</text><text class="terminal-1162717233-r1" x="1256.6" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="1281" y="532.4" textLength="183" clip-path="url(#terminal-1162717233-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8717</text><text class="terminal-1162717233-r1" x="1476.2" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="532.4" textLength="170.8" clip-path="url(#terminal-1162717233-line-21)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1162717233-r1" x="1683.6" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="532.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-21)">
-</text><text class="terminal-1162717233-r1" x="0" y="556.8" textLength="1695.8" clip-path="url(#terminal-1162717233-line-22)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="556.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-22)">
-</text><text class="terminal-1162717233-r1" x="0" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="24.4" y="581.2" textLength="183" clip-path="url(#terminal-1162717233-line-23)">bnb-batch_size…</text><text class="terminal-1162717233-r1" x="219.6" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="244" y="581.2" textLength="122" clip-path="url(#terminal-1162717233-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1162717233-r1" x="378.2" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="402.6" y="581.2" textLength="183" clip-path="url(#terminal-1162717233-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;7.81e-02</text><text class="terminal-1162717233-r1" x="597.8" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="622.2" y="581.2" textLength="183" clip-path="url(#terminal-1162717233-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;51.20</text><text class="terminal-1162717233-r1" x="817.4" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="841.8" y="581.2" textLength="183" clip-path="url(#terminal-1162717233-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7545</text><text class="terminal-1162717233-r1" x="1037" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="581.2" textLength="183" clip-path="url(#terminal-1162717233-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;76.40</text><text class="terminal-1162717233-r1" x="1256.6" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="1281" y="581.2" textLength="183" clip-path="url(#terminal-1162717233-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8539</text><text class="terminal-1162717233-r1" x="1476.2" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="581.2" textLength="170.8" clip-path="url(#terminal-1162717233-line-23)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1162717233-r1" x="1683.6" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="581.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-23)">
-</text><text class="terminal-1162717233-r1" x="0" y="605.6" textLength="1695.8" clip-path="url(#terminal-1162717233-line-24)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="605.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-24)">
-</text><text class="terminal-1162717233-r1" x="0" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="24.4" y="630" textLength="183" clip-path="url(#terminal-1162717233-line-25)">gptq-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="244" y="630" textLength="122" clip-path="url(#terminal-1162717233-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1162717233-r1" x="378.2" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="402.6" y="630" textLength="183" clip-path="url(#terminal-1162717233-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.56e-02</text><text class="terminal-1162717233-r1" x="597.8" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="622.2" y="630" textLength="183" clip-path="url(#terminal-1162717233-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;43.90</text><text class="terminal-1162717233-r1" x="817.4" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="841.8" y="630" textLength="183" clip-path="url(#terminal-1162717233-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6800</text><text class="terminal-1162717233-r1" x="1037" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="630" textLength="183" clip-path="url(#terminal-1162717233-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;71.40</text><text class="terminal-1162717233-r1" x="1256.6" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="1281" y="630" textLength="183" clip-path="url(#terminal-1162717233-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7597</text><text class="terminal-1162717233-r1" x="1476.2" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="630" textLength="170.8" clip-path="url(#terminal-1162717233-line-25)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1162717233-r1" x="1683.6" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="630" textLength="12.2" clip-path="url(#terminal-1162717233-line-25)">
-</text><text class="terminal-1162717233-r1" x="0" y="654.4" textLength="1695.8" clip-path="url(#terminal-1162717233-line-26)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="654.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-26)">
-</text><text class="terminal-1162717233-r1" x="0" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="24.4" y="678.8" textLength="183" clip-path="url(#terminal-1162717233-line-27)">fp16-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="244" y="678.8" textLength="122" clip-path="url(#terminal-1162717233-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1162717233-r1" x="378.2" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="402.6" y="678.8" textLength="183" clip-path="url(#terminal-1162717233-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.60e-02</text><text class="terminal-1162717233-r1" x="597.8" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="622.2" y="678.8" textLength="183" clip-path="url(#terminal-1162717233-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;38.50</text><text class="terminal-1162717233-r1" x="817.4" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="841.8" y="678.8" textLength="183" clip-path="url(#terminal-1162717233-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15128</text><text class="terminal-1162717233-r1" x="1037" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="678.8" textLength="183" clip-path="url(#terminal-1162717233-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;38.40</text><text class="terminal-1162717233-r1" x="1256.6" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="1281" y="678.8" textLength="183" clip-path="url(#terminal-1162717233-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;15548</text><text class="terminal-1162717233-r1" x="1476.2" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="678.8" textLength="170.8" clip-path="url(#terminal-1162717233-line-27)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;fp16</text><text class="terminal-1162717233-r1" x="1683.6" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="678.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-27)">
-</text><text class="terminal-1162717233-r1" x="0" y="703.2" textLength="1695.8" clip-path="url(#terminal-1162717233-line-28)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="703.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-28)">
-</text><text class="terminal-1162717233-r1" x="0" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="24.4" y="727.6" textLength="183" clip-path="url(#terminal-1162717233-line-29)">bnb-batch_size…</text><text class="terminal-1162717233-r1" x="219.6" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="244" y="727.6" textLength="122" clip-path="url(#terminal-1162717233-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1162717233-r1" x="378.2" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="402.6" y="727.6" textLength="183" clip-path="url(#terminal-1162717233-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;5.53e-02</text><text class="terminal-1162717233-r1" x="597.8" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="622.2" y="727.6" textLength="183" clip-path="url(#terminal-1162717233-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;36.20</text><text class="terminal-1162717233-r1" x="817.4" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="841.8" y="727.6" textLength="183" clip-path="url(#terminal-1162717233-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7073</text><text class="terminal-1162717233-r1" x="1037" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="727.6" textLength="183" clip-path="url(#terminal-1162717233-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;37.60</text><text class="terminal-1162717233-r1" x="1256.6" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="1281" y="727.6" textLength="183" clip-path="url(#terminal-1162717233-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7704</text><text class="terminal-1162717233-r1" x="1476.2" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="727.6" textLength="170.8" clip-path="url(#terminal-1162717233-line-29)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1162717233-r1" x="1683.6" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="727.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-29)">
-</text><text class="terminal-1162717233-r1" x="0" y="752" textLength="1695.8" clip-path="url(#terminal-1162717233-line-30)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="752" textLength="12.2" clip-path="url(#terminal-1162717233-line-30)">
-</text><text class="terminal-1162717233-r1" x="0" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="24.4" y="776.4" textLength="183" clip-path="url(#terminal-1162717233-line-31)">awq+gemv-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="244" y="776.4" textLength="122" clip-path="url(#terminal-1162717233-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1162717233-r1" x="378.2" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="402.6" y="776.4" textLength="183" clip-path="url(#terminal-1162717233-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.70e-01</text><text class="terminal-1162717233-r1" x="597.8" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="622.2" y="776.4" textLength="183" clip-path="url(#terminal-1162717233-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;34.00</text><text class="terminal-1162717233-r1" x="817.4" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="841.8" y="776.4" textLength="183" clip-path="url(#terminal-1162717233-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;10183</text><text class="terminal-1162717233-r1" x="1037" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="776.4" textLength="183" clip-path="url(#terminal-1162717233-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;442.00</text><text class="terminal-1162717233-r1" x="1256.6" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="1281" y="776.4" textLength="183" clip-path="url(#terminal-1162717233-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;31247</text><text class="terminal-1162717233-r1" x="1476.2" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="776.4" textLength="170.8" clip-path="url(#terminal-1162717233-line-31)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMV</text><text class="terminal-1162717233-r1" x="1683.6" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="776.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-31)">
-</text><text class="terminal-1162717233-r1" x="0" y="800.8" textLength="1695.8" clip-path="url(#terminal-1162717233-line-32)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="800.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-32)">
-</text><text class="terminal-1162717233-r1" x="0" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="24.4" y="825.2" textLength="183" clip-path="url(#terminal-1162717233-line-33)">awq+gemv-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="244" y="825.2" textLength="122" clip-path="url(#terminal-1162717233-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1162717233-r1" x="378.2" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="402.6" y="825.2" textLength="183" clip-path="url(#terminal-1162717233-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.40e-01</text><text class="terminal-1162717233-r1" x="597.8" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="622.2" y="825.2" textLength="183" clip-path="url(#terminal-1162717233-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;33.30</text><text class="terminal-1162717233-r1" x="817.4" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="841.8" y="825.2" textLength="183" clip-path="url(#terminal-1162717233-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8394</text><text class="terminal-1162717233-r1" x="1037" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="825.2" textLength="183" clip-path="url(#terminal-1162717233-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;191.00</text><text class="terminal-1162717233-r1" x="1256.6" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="1281" y="825.2" textLength="183" clip-path="url(#terminal-1162717233-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;14176</text><text class="terminal-1162717233-r1" x="1476.2" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="825.2" textLength="170.8" clip-path="url(#terminal-1162717233-line-33)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMV</text><text class="terminal-1162717233-r1" x="1683.6" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="825.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-33)">
-</text><text class="terminal-1162717233-r1" x="0" y="849.6" textLength="1695.8" clip-path="url(#terminal-1162717233-line-34)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="849.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-34)">
-</text><text class="terminal-1162717233-r1" x="0" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="24.4" y="874" textLength="183" clip-path="url(#terminal-1162717233-line-35)">awq+gemv-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="244" y="874" textLength="122" clip-path="url(#terminal-1162717233-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1162717233-r1" x="378.2" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="402.6" y="874" textLength="183" clip-path="url(#terminal-1162717233-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.24e-01</text><text class="terminal-1162717233-r1" x="597.8" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="622.2" y="874" textLength="183" clip-path="url(#terminal-1162717233-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;32.30</text><text class="terminal-1162717233-r1" x="817.4" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="841.8" y="874" textLength="183" clip-path="url(#terminal-1162717233-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7245</text><text class="terminal-1162717233-r1" x="1037" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="874" textLength="183" clip-path="url(#terminal-1162717233-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;146.00</text><text class="terminal-1162717233-r1" x="1256.6" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="1281" y="874" textLength="183" clip-path="url(#terminal-1162717233-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8602</text><text class="terminal-1162717233-r1" x="1476.2" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="874" textLength="170.8" clip-path="url(#terminal-1162717233-line-35)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMV</text><text class="terminal-1162717233-r1" x="1683.6" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="874" textLength="12.2" clip-path="url(#terminal-1162717233-line-35)">
-</text><text class="terminal-1162717233-r1" x="0" y="898.4" textLength="1695.8" clip-path="url(#terminal-1162717233-line-36)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="898.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-36)">
-</text><text class="terminal-1162717233-r1" x="0" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="24.4" y="922.8" textLength="183" clip-path="url(#terminal-1162717233-line-37)">awq+gemv-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="244" y="922.8" textLength="122" clip-path="url(#terminal-1162717233-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1162717233-r1" x="378.2" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="402.6" y="922.8" textLength="183" clip-path="url(#terminal-1162717233-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;6.75e-02</text><text class="terminal-1162717233-r1" x="597.8" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="622.2" y="922.8" textLength="183" clip-path="url(#terminal-1162717233-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;29.60</text><text class="terminal-1162717233-r1" x="817.4" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="841.8" y="922.8" textLength="183" clip-path="url(#terminal-1162717233-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6756</text><text class="terminal-1162717233-r1" x="1037" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="922.8" textLength="183" clip-path="url(#terminal-1162717233-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;74.30</text><text class="terminal-1162717233-r1" x="1256.6" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="1281" y="922.8" textLength="183" clip-path="url(#terminal-1162717233-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7511</text><text class="terminal-1162717233-r1" x="1476.2" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="922.8" textLength="170.8" clip-path="url(#terminal-1162717233-line-37)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMV</text><text class="terminal-1162717233-r1" x="1683.6" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="922.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-37)">
-</text><text class="terminal-1162717233-r1" x="0" y="947.2" textLength="1695.8" clip-path="url(#terminal-1162717233-line-38)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="947.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-38)">
-</text><text class="terminal-1162717233-r1" x="0" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="24.4" y="971.6" textLength="183" clip-path="url(#terminal-1162717233-line-39)">gptq-batch_siz…</text><text class="terminal-1162717233-r1" x="219.6" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="244" y="971.6" textLength="122" clip-path="url(#terminal-1162717233-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1162717233-r1" x="378.2" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="402.6" y="971.6" textLength="183" clip-path="url(#terminal-1162717233-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.51e-02</text><text class="terminal-1162717233-r1" x="597.8" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="622.2" y="971.6" textLength="183" clip-path="url(#terminal-1162717233-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;28.50</text><text class="terminal-1162717233-r1" x="817.4" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="841.8" y="971.6" textLength="183" clip-path="url(#terminal-1162717233-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6868</text><text class="terminal-1162717233-r1" x="1037" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="971.6" textLength="183" clip-path="url(#terminal-1162717233-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;35.10</text><text class="terminal-1162717233-r1" x="1256.6" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="1281" y="971.6" textLength="183" clip-path="url(#terminal-1162717233-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7077</text><text class="terminal-1162717233-r1" x="1476.2" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="971.6" textLength="170.8" clip-path="url(#terminal-1162717233-line-39)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;GPTQ</text><text class="terminal-1162717233-r1" x="1683.6" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="971.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-39)">
-</text><text class="terminal-1162717233-r1" x="0" y="996" textLength="1695.8" clip-path="url(#terminal-1162717233-line-40)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="996" textLength="12.2" clip-path="url(#terminal-1162717233-line-40)">
-</text><text class="terminal-1162717233-r1" x="0" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="24.4" y="1020.4" textLength="183" clip-path="url(#terminal-1162717233-line-41)">awq+gemm-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="244" y="1020.4" textLength="122" clip-path="url(#terminal-1162717233-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8</text><text class="terminal-1162717233-r1" x="378.2" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="402.6" y="1020.4" textLength="183" clip-path="url(#terminal-1162717233-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;2.89e-01</text><text class="terminal-1162717233-r1" x="597.8" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="622.2" y="1020.4" textLength="183" clip-path="url(#terminal-1162717233-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;27.70</text><text class="terminal-1162717233-r1" x="817.4" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="841.8" y="1020.4" textLength="183" clip-path="url(#terminal-1162717233-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8394</text><text class="terminal-1162717233-r1" x="1037" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="1020.4" textLength="183" clip-path="url(#terminal-1162717233-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;261.00</text><text class="terminal-1162717233-r1" x="1256.6" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="1281" y="1020.4" textLength="183" clip-path="url(#terminal-1162717233-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;14176</text><text class="terminal-1162717233-r1" x="1476.2" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="1020.4" textLength="170.8" clip-path="url(#terminal-1162717233-line-41)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMM</text><text class="terminal-1162717233-r1" x="1683.6" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="1020.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-41)">
-</text><text class="terminal-1162717233-r1" x="0" y="1044.8" textLength="1695.8" clip-path="url(#terminal-1162717233-line-42)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="1044.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-42)">
-</text><text class="terminal-1162717233-r1" x="0" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="24.4" y="1069.2" textLength="183" clip-path="url(#terminal-1162717233-line-43)">awq+gemm-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="244" y="1069.2" textLength="122" clip-path="url(#terminal-1162717233-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;16</text><text class="terminal-1162717233-r1" x="378.2" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="402.6" y="1069.2" textLength="183" clip-path="url(#terminal-1162717233-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;5.80e-01</text><text class="terminal-1162717233-r1" x="597.8" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="622.2" y="1069.2" textLength="183" clip-path="url(#terminal-1162717233-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;27.60</text><text class="terminal-1162717233-r1" x="817.4" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="841.8" y="1069.2" textLength="183" clip-path="url(#terminal-1162717233-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;10183</text><text class="terminal-1162717233-r1" x="1037" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="1069.2" textLength="183" clip-path="url(#terminal-1162717233-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;492.00</text><text class="terminal-1162717233-r1" x="1256.6" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="1281" y="1069.2" textLength="183" clip-path="url(#terminal-1162717233-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;31245</text><text class="terminal-1162717233-r1" x="1476.2" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="1069.2" textLength="170.8" clip-path="url(#terminal-1162717233-line-43)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMM</text><text class="terminal-1162717233-r1" x="1683.6" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="1069.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-43)">
-</text><text class="terminal-1162717233-r1" x="0" y="1093.6" textLength="1695.8" clip-path="url(#terminal-1162717233-line-44)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="1093.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-44)">
-</text><text class="terminal-1162717233-r1" x="0" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="24.4" y="1118" textLength="183" clip-path="url(#terminal-1162717233-line-45)">awq+gemm-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="244" y="1118" textLength="122" clip-path="url(#terminal-1162717233-line-45)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;4</text><text class="terminal-1162717233-r1" x="378.2" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="402.6" y="1118" textLength="183" clip-path="url(#terminal-1162717233-line-45)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;1.49e-01</text><text class="terminal-1162717233-r1" x="597.8" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="622.2" y="1118" textLength="183" clip-path="url(#terminal-1162717233-line-45)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;26.80</text><text class="terminal-1162717233-r1" x="817.4" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="841.8" y="1118" textLength="183" clip-path="url(#terminal-1162717233-line-45)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7155</text><text class="terminal-1162717233-r1" x="1037" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="1118" textLength="183" clip-path="url(#terminal-1162717233-line-45)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;134.00</text><text class="terminal-1162717233-r1" x="1256.6" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="1281" y="1118" textLength="183" clip-path="url(#terminal-1162717233-line-45)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;8642</text><text class="terminal-1162717233-r1" x="1476.2" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="1118" textLength="170.8" clip-path="url(#terminal-1162717233-line-45)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMM</text><text class="terminal-1162717233-r1" x="1683.6" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="1118" textLength="12.2" clip-path="url(#terminal-1162717233-line-45)">
-</text><text class="terminal-1162717233-r1" x="0" y="1142.4" textLength="1695.8" clip-path="url(#terminal-1162717233-line-46)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="1142.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-46)">
-</text><text class="terminal-1162717233-r1" x="0" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="24.4" y="1166.8" textLength="183" clip-path="url(#terminal-1162717233-line-47)">awq+gemv-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="244" y="1166.8" textLength="122" clip-path="url(#terminal-1162717233-line-47)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1162717233-r1" x="378.2" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="402.6" y="1166.8" textLength="183" clip-path="url(#terminal-1162717233-line-47)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;3.90e-02</text><text class="terminal-1162717233-r1" x="597.8" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="622.2" y="1166.8" textLength="183" clip-path="url(#terminal-1162717233-line-47)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;25.60</text><text class="terminal-1162717233-r1" x="817.4" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="841.8" y="1166.8" textLength="183" clip-path="url(#terminal-1162717233-line-47)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6792</text><text class="terminal-1162717233-r1" x="1037" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="1166.8" textLength="183" clip-path="url(#terminal-1162717233-line-47)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;37.40</text><text class="terminal-1162717233-r1" x="1256.6" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="1281" y="1166.8" textLength="183" clip-path="url(#terminal-1162717233-line-47)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6981</text><text class="terminal-1162717233-r1" x="1476.2" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="1166.8" textLength="170.8" clip-path="url(#terminal-1162717233-line-47)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMV</text><text class="terminal-1162717233-r1" x="1683.6" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="1166.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-47)">
-</text><text class="terminal-1162717233-r1" x="0" y="1191.2" textLength="1695.8" clip-path="url(#terminal-1162717233-line-48)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="1191.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-48)">
-</text><text class="terminal-1162717233-r1" x="0" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="24.4" y="1215.6" textLength="183" clip-path="url(#terminal-1162717233-line-49)">awq+gemm-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="244" y="1215.6" textLength="122" clip-path="url(#terminal-1162717233-line-49)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;2</text><text class="terminal-1162717233-r1" x="378.2" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="402.6" y="1215.6" textLength="183" clip-path="url(#terminal-1162717233-line-49)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;8.01e-02</text><text class="terminal-1162717233-r1" x="597.8" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="622.2" y="1215.6" textLength="183" clip-path="url(#terminal-1162717233-line-49)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;25.00</text><text class="terminal-1162717233-r1" x="817.4" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="841.8" y="1215.6" textLength="183" clip-path="url(#terminal-1162717233-line-49)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6754</text><text class="terminal-1162717233-r1" x="1037" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="1215.6" textLength="183" clip-path="url(#terminal-1162717233-line-49)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;66.40</text><text class="terminal-1162717233-r1" x="1256.6" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="1281" y="1215.6" textLength="183" clip-path="url(#terminal-1162717233-line-49)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7509</text><text class="terminal-1162717233-r1" x="1476.2" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="1215.6" textLength="170.8" clip-path="url(#terminal-1162717233-line-49)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMM</text><text class="terminal-1162717233-r1" x="1683.6" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="1215.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-49)">
-</text><text class="terminal-1162717233-r1" x="0" y="1240" textLength="1695.8" clip-path="url(#terminal-1162717233-line-50)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="1240" textLength="12.2" clip-path="url(#terminal-1162717233-line-50)">
-</text><text class="terminal-1162717233-r1" x="0" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="24.4" y="1264.4" textLength="183" clip-path="url(#terminal-1162717233-line-51)">awq+gemm-batch…</text><text class="terminal-1162717233-r1" x="219.6" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="244" y="1264.4" textLength="122" clip-path="url(#terminal-1162717233-line-51)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1162717233-r1" x="378.2" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="402.6" y="1264.4" textLength="183" clip-path="url(#terminal-1162717233-line-51)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;4.37e-02</text><text class="terminal-1162717233-r1" x="597.8" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="622.2" y="1264.4" textLength="183" clip-path="url(#terminal-1162717233-line-51)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;22.90</text><text class="terminal-1162717233-r1" x="817.4" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="841.8" y="1264.4" textLength="183" clip-path="url(#terminal-1162717233-line-51)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6792</text><text class="terminal-1162717233-r1" x="1037" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="1264.4" textLength="183" clip-path="url(#terminal-1162717233-line-51)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;33.60</text><text class="terminal-1162717233-r1" x="1256.6" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="1281" y="1264.4" textLength="183" clip-path="url(#terminal-1162717233-line-51)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6981</text><text class="terminal-1162717233-r1" x="1476.2" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="1264.4" textLength="170.8" clip-path="url(#terminal-1162717233-line-51)">&#160;&#160;&#160;&#160;&#160;&#160;AWQ+GEMM</text><text class="terminal-1162717233-r1" x="1683.6" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="1264.4" textLength="12.2" clip-path="url(#terminal-1162717233-line-51)">
-</text><text class="terminal-1162717233-r1" x="0" y="1288.8" textLength="1695.8" clip-path="url(#terminal-1162717233-line-52)">├─────────────────┼────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼─────────────────┼────────────────┤</text><text class="terminal-1162717233-r1" x="1695.8" y="1288.8" textLength="12.2" clip-path="url(#terminal-1162717233-line-52)">
-</text><text class="terminal-1162717233-r1" x="0" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="24.4" y="1313.2" textLength="183" clip-path="url(#terminal-1162717233-line-53)">bnb-batch_size…</text><text class="terminal-1162717233-r1" x="219.6" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="244" y="1313.2" textLength="122" clip-path="url(#terminal-1162717233-line-53)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;1</text><text class="terminal-1162717233-r1" x="378.2" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="402.6" y="1313.2" textLength="183" clip-path="url(#terminal-1162717233-line-53)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;5.26e-02</text><text class="terminal-1162717233-r1" x="597.8" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="622.2" y="1313.2" textLength="183" clip-path="url(#terminal-1162717233-line-53)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;19.00</text><text class="terminal-1162717233-r1" x="817.4" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="841.8" y="1313.2" textLength="183" clip-path="url(#terminal-1162717233-line-53)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;6945</text><text class="terminal-1162717233-r1" x="1037" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="1061.4" y="1313.2" textLength="183" clip-path="url(#terminal-1162717233-line-53)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;23.70</text><text class="terminal-1162717233-r1" x="1256.6" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="1281" y="1313.2" textLength="183" clip-path="url(#terminal-1162717233-line-53)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;7281</text><text class="terminal-1162717233-r1" x="1476.2" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="1500.6" y="1313.2" textLength="170.8" clip-path="url(#terminal-1162717233-line-53)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;BnB</text><text class="terminal-1162717233-r1" x="1683.6" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">│</text><text class="terminal-1162717233-r1" x="1695.8" y="1313.2" textLength="12.2" clip-path="url(#terminal-1162717233-line-53)">
-</text><text class="terminal-1162717233-r1" x="0" y="1337.6" textLength="1695.8" clip-path="url(#terminal-1162717233-line-54)">└─────────────────┴────────────┴─────────────────┴─────────────────┴─────────────────┴─────────────────┴─────────────────┴────────────────┘</text><text class="terminal-1162717233-r1" x="1695.8" y="1337.6" textLength="12.2" clip-path="url(#terminal-1162717233-line-54)">
-</text>
-    </g>
-    </g>
-</svg>
diff --git a/examples/running-vicunas/artifacts/A100-80GB/short_report.csv b/examples/running-vicunas/artifacts/A100-80GB/short_report.csv
deleted file mode 100644
index 93e417ce..00000000
--- a/examples/running-vicunas/artifacts/A100-80GB/short_report.csv
+++ /dev/null
@@ -1,26 +0,0 @@
-experiment_name,Batch Size,Forward Latency (s),Forward Throughput (samples/s),Forward Peak Memory (MB),Generate Throughput (tokens/s),Generate Peak Memory (MB),Quantization Scheme
-fp16-batch_size(16)-sequence_length(128)-new_tokens(256),16,0.2,80.0,18706,596.0,49664,fp16
-fp16-batch_size(8)-sequence_length(128)-new_tokens(256),8,0.105,76.2,16829,297.0,24551,fp16
-gptq-batch_size(16)-sequence_length(128)-new_tokens(256),16,0.212,75.5,10441,406.0,40774,gptq
-bnb-batch_size(16)-sequence_length(128)-new_tokens(256),16,0.221,72.4,9917,295.0,20260,bnb
-fp16-batch_size(4)-sequence_length(128)-new_tokens(256),4,0.0577,69.3,15690,153.0,16896,fp16
-gptq-batch_size(8)-sequence_length(128)-new_tokens(256),8,0.116,69.0,8568,231.0,16290,gptq
-bnb-batch_size(8)-sequence_length(128)-new_tokens(256),8,0.126,63.5,8323,153.0,10760,bnb
-fp16-batch_size(2)-sequence_length(128)-new_tokens(256),2,0.0337,59.3,15313,76.6,15858,fp16
-gptq-batch_size(4)-sequence_length(128)-new_tokens(256),4,0.0684,58.5,7170,140.0,8717,gptq
-bnb-batch_size(4)-sequence_length(128)-new_tokens(256),4,0.0781,51.2,7545,76.4,8539,bnb
-gptq-batch_size(2)-sequence_length(128)-new_tokens(256),2,0.0456,43.9,6800,71.4,7597,gptq
-fp16-batch_size(1)-sequence_length(128)-new_tokens(256),1,0.026,38.5,15128,38.4,15548,fp16
-bnb-batch_size(2)-sequence_length(128)-new_tokens(256),2,0.0553,36.2,7073,37.6,7704,bnb
-awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256),16,0.47,34.0,10183,442.0,31247,awq+gemv
-awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256),8,0.24,33.3,8394,191.0,14176,awq+gemv
-awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256),4,0.124,32.3,7245,146.0,8602,awq+gemv
-awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256),2,0.0675,29.6,6756,74.3,7511,awq+gemv
-gptq-batch_size(1)-sequence_length(128)-new_tokens(256),1,0.0351,28.5,6868,35.1,7077,gptq
-awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256),8,0.289,27.7,8394,261.0,14176,awq+gemm
-awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256),16,0.58,27.6,10183,492.0,31245,awq+gemm
-awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256),4,0.149,26.8,7155,134.0,8642,awq+gemm
-awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256),1,0.039,25.6,6792,37.4,6981,awq+gemv
-awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256),2,0.0801,25.0,6754,66.4,7509,awq+gemm
-awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256),1,0.0437,22.9,6792,33.6,6981,awq+gemm
-bnb-batch_size(1)-sequence_length(128)-new_tokens(256),1,0.0526,19.0,6945,23.7,7281,bnb
diff --git a/examples/running-vicunas/configs/_base_.yaml b/examples/running-vicunas/configs/_base_.yaml
deleted file mode 100644
index 82507ea4..00000000
--- a/examples/running-vicunas/configs/_base_.yaml
+++ /dev/null
@@ -1,36 +0,0 @@
-defaults:
-  - backend: pytorch # default backend
-  - benchmark: inference # default benchmark
-  - experiment # inheriting from experiment config
-  - _self_ # for hydra 1.1 compatibility
-  - override hydra/job_logging: colorlog # colorful logging
-  - override hydra/hydra_logging: colorlog # colorful logging
-
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-  job:
-    chdir: true
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-  sweeper:
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-
-backend:
-  torch_dtype: float16
-
-benchmark:
-  memory: true
-  warmup_runs: 10
-
-  new_tokens: 256
-  input_shapes:
-    sequence_length: 128
diff --git a/examples/running-vicunas/configs/awq+gemm.yaml b/examples/running-vicunas/configs/awq+gemm.yaml
deleted file mode 100644
index bfea3e7a..00000000
--- a/examples/running-vicunas/configs/awq+gemm.yaml
+++ /dev/null
@@ -1,6 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-
-experiment_name: awq+gemm-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
diff --git a/examples/running-vicunas/configs/awq+gemv.yaml b/examples/running-vicunas/configs/awq+gemv.yaml
deleted file mode 100644
index cd6aa33a..00000000
--- a/examples/running-vicunas/configs/awq+gemv.yaml
+++ /dev/null
@@ -1,6 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-
-experiment_name: awq+gemv-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
diff --git a/examples/running-vicunas/configs/bnb.yaml b/examples/running-vicunas/configs/bnb.yaml
deleted file mode 100644
index 61cf1ebd..00000000
--- a/examples/running-vicunas/configs/bnb.yaml
+++ /dev/null
@@ -1,11 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-
-backend:
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
diff --git a/examples/running-vicunas/configs/gptq.yaml b/examples/running-vicunas/configs/gptq.yaml
deleted file mode 100644
index ff6890a7..00000000
--- a/examples/running-vicunas/configs/gptq.yaml
+++ /dev/null
@@ -1,6 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/vicuna-7B-v1.5-GPTQ
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
deleted file mode 100644
index 4d10ff67..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemm-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
deleted file mode 100644
index 3ad5c0b9..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: awq+gemm
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
deleted file mode 100644
index a7fc331f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
deleted file mode 100644
index 27c8266d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0437,22.9,6792,7.61,33.6,6981
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
deleted file mode 100644
index 35df0e1a..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemm-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index cc8e9be9..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: awq+gemm
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
deleted file mode 100644
index 9e3fb6c4..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
deleted file mode 100644
index c1055877..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.58,27.6,10183,8.33,492.0,31245
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
deleted file mode 100644
index 271b5596..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemm-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
deleted file mode 100644
index 4c5bf363..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: awq+gemm
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
deleted file mode 100644
index cd938d98..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
deleted file mode 100644
index 38cc2ad1..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0801,25.0,6754,7.71,66.4,7509
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
deleted file mode 100644
index b28d4709..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemm-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
deleted file mode 100644
index f986b5d8..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: awq+gemm
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
deleted file mode 100644
index 0d38b107..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
deleted file mode 100644
index c4dcb12d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.149,26.8,7155,7.67,134.0,8642
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
deleted file mode 100644
index f7b17e95..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemm-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
deleted file mode 100644
index e312b8af..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: awq+gemm
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
deleted file mode 100644
index 4039e79c..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemm
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
deleted file mode 100644
index 7d352638..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemm-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.289,27.7,8394,7.84,261.0,14176
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
deleted file mode 100644
index 06a5987c..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemv-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
deleted file mode 100644
index 6f4c8be4..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: awq+gemv
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
deleted file mode 100644
index e9981adf..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
deleted file mode 100644
index b51690e0..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.039,25.6,6792,6.85,37.4,6981
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
deleted file mode 100644
index 853eb511..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemv-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index 33f6d907..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: awq+gemv
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
deleted file mode 100644
index 964c8911..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
deleted file mode 100644
index ee379e6e..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.47,34.0,10183,9.27,442.0,31247
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
deleted file mode 100644
index 57e25e56..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemv-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
deleted file mode 100644
index b9ec1b7b..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: awq+gemv
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
deleted file mode 100644
index 2a087cb1..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
deleted file mode 100644
index 9af67a3d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0675,29.6,6756,6.89,74.3,7511
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
deleted file mode 100644
index 7b422c4d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemv-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
deleted file mode 100644
index 8c75d0ea..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: awq+gemv
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
deleted file mode 100644
index abfbfcdc..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
deleted file mode 100644
index 1ea01ae7..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.124,32.3,7245,7.01,146.0,8602
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
deleted file mode 100644
index 6b493dfb..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: awq+gemv-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
deleted file mode 100644
index cae0cb49..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: awq+gemv
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
deleted file mode 100644
index 28b611b1..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)
-model: IlyasMoutawwakil/vicuna-7b-v1.5-awq-gemv
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
deleted file mode 100644
index 11aa5b46..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/awq+gemv-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.24,33.3,8394,10.7,191.0,14176
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
deleted file mode 100644
index 011fb2db..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,72 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
deleted file mode 100644
index 82545db0..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
deleted file mode 100644
index 9ff1ad9d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(1)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
deleted file mode 100644
index bb71d438..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0526,19.0,6945,10.8,23.7,7281
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
deleted file mode 100644
index 1b66ca17..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,72 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index e904559d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
deleted file mode 100644
index 3c85dd65..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(16)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
deleted file mode 100644
index 8b6dfb2e..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.221,72.4,9917,13.9,295.0,20260
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
deleted file mode 100644
index a5aaa817..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,72 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
deleted file mode 100644
index 2ae6349f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
deleted file mode 100644
index 28ffa32f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(2)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
deleted file mode 100644
index 227b9932..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0553,36.2,7073,13.6,37.6,7704
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
deleted file mode 100644
index 2ce98288..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,72 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
deleted file mode 100644
index d8cd9ab9..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
deleted file mode 100644
index d6d04dfa..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(4)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
deleted file mode 100644
index 21ff66e4..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0781,51.2,7545,13.4,76.4,8539
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
deleted file mode 100644
index 15192fa9..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,72 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: bnb-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
deleted file mode 100644
index dae7feac..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: bnb
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
deleted file mode 100644
index 5c2f68dd..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
+++ /dev/null
@@ -1,79 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: bnb
-  quantization_config:
-    llm_int8_threshold: 0.0
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: bnb-batch_size(8)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
deleted file mode 100644
index 694df838..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/bnb-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.126,63.5,8323,13.4,153.0,10760
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
deleted file mode 100644
index 58bc0553..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
deleted file mode 100644
index 4a2b3ce5..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
deleted file mode 100644
index 97782bd7..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(1)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
deleted file mode 100644
index 531b9c5d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.026,38.5,15128,6.67,38.4,15548
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
deleted file mode 100644
index 4a397dfe..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index ff9bd759..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
deleted file mode 100644
index d34ba391..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(16)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
deleted file mode 100644
index 6cd91656..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.2,80.0,18706,6.87,596.0,49664
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
deleted file mode 100644
index d222d15c..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
deleted file mode 100644
index 9b00c477..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
deleted file mode 100644
index e46da2b1..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(2)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
deleted file mode 100644
index cd257bc1..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0337,59.3,15313,6.68,76.6,15858
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
deleted file mode 100644
index 5952fe8f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
deleted file mode 100644
index a8e88740..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
deleted file mode 100644
index 2173beeb..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(4)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
deleted file mode 100644
index 5e96af21..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0577,69.3,15690,6.69,153.0,16896
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
deleted file mode 100644
index 50cf10c9..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: fp16-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
deleted file mode 100644
index 08aafc5e..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: _base_
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
deleted file mode 100644
index b2ff40e5..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: fp16-batch_size(8)-sequence_length(128)-new_tokens(256)
-model: lmsys/vicuna-7b-v1.5
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
deleted file mode 100644
index 742a27ac..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/fp16-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.105,76.2,16829,6.9,297.0,24551
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
deleted file mode 100644
index eafc68e2..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
deleted file mode 100644
index f5988a61..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=1
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=1
-    id: '0'
-    num: 0
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
deleted file mode 100644
index 989520ff..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=1
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
deleted file mode 100644
index b474c3df..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 1
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(1)-sequence_length(128)-new_tokens(256)
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
deleted file mode 100644
index 75f51632..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(1)-sequence_length(128)-new_tokens(256)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0351,28.5,6868,7.29,35.1,7077
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
deleted file mode 100644
index 88a1cbb3..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
deleted file mode 100644
index 904f449f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=16
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=16
-    id: '4'
-    num: 4
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
deleted file mode 100644
index fdb7f01d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=16
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
deleted file mode 100644
index 9f78a060..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 16
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(16)-sequence_length(128)-new_tokens(256)
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
deleted file mode 100644
index d8802536..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(16)-sequence_length(128)-new_tokens(256)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.212,75.5,10441,10.1,406.0,40774
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
deleted file mode 100644
index 308bf1d2..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
deleted file mode 100644
index e2fd14be..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=2
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=2
-    id: '1'
-    num: 1
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
deleted file mode 100644
index 8211b85f..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=2
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
deleted file mode 100644
index 1a41cd98..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 2
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(2)-sequence_length(128)-new_tokens(256)
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
deleted file mode 100644
index 8c7d08c5..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(2)-sequence_length(128)-new_tokens(256)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0456,43.9,6800,7.17,71.4,7597
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
deleted file mode 100644
index 9bb84dff..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
deleted file mode 100644
index fe585a3d..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=4
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=4
-    id: '2'
-    num: 2
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
deleted file mode 100644
index eef8c9ca..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=4
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
deleted file mode 100644
index 8515f46c..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 4
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(4)-sequence_length(128)-new_tokens(256)
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
deleted file mode 100644
index 38edc30a..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(4)-sequence_length(128)-new_tokens(256)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.0684,58.5,7170,7.3,140.0,8717
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
deleted file mode 100644
index aad9d7b2..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,70 +0,0 @@
-backend:
-  name: pytorch
-  version: ${pytorch_version:}
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: ${can_diffuse:${task}}
-  can_generate: ${can_generate:${task}}
-  forward_kwargs: {}
-  generate_kwargs: {}
-experiment_name: gptq-batch_size(${benchmark.input_shapes.batch_size})-sequence_length(${benchmark.input_shapes.sequence_length})-new_tokens(${benchmark.new_tokens})
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: ${infer_task:${model}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
deleted file mode 100644
index 516c3ed5..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,174 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${experiment_name}
-  sweep:
-    dir: experiments/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.input_shapes.batch_size: 1,2,4,8,16
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.input_shapes.batch_size=8
-  job:
-    name: experiment
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=8
-    id: '3'
-    num: 3
-    config_name: gptq
-    env_set:
-      CUDA_VISIBLE_DEVICES: '0'
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /workspace/optimum-benchmark/examples/gemm-vs-gemv
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /workspace/optimum-benchmark/examples/gemm-vs-gemv/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /workspace/optimum-benchmark/examples/gemm-vs-gemv/experiments/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
deleted file mode 100644
index 8cd14374..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1 +0,0 @@
-- benchmark.input_shapes.batch_size=8
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
deleted file mode 100644
index 7e234d3a..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/hydra_config.yaml
+++ /dev/null
@@ -1,76 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.1.0+cu118
-  _target_: optimum_benchmark.backends.pytorch.backend.PyTorchBackend
-  seed: 42
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: true
-  continous_isolation_check: true
-  delete_cache: false
-  no_weights: false
-  device_map: null
-  torch_dtype: float16
-  disable_grad: true
-  eval_mode: true
-  amp_autocast: false
-  amp_dtype: null
-  torch_compile: false
-  torch_compile_config: {}
-  bettertransformer: false
-  quantization_scheme: null
-  quantization_config: {}
-  use_ddp: false
-  ddp_config: {}
-  peft_strategy: null
-  peft_config: {}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.benchmark.InferenceBenchmark
-  duration: 10
-  warmup_runs: 10
-  memory: true
-  energy: false
-  input_shapes:
-    batch_size: 8
-    sequence_length: 128
-    num_choices: 1
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 256
-  can_diffuse: false
-  can_generate: true
-  forward_kwargs: {}
-  generate_kwargs:
-    max_new_tokens: 256
-    min_new_tokens: 256
-    do_sample: false
-    use_cache: true
-    pad_token_id: 0
-    num_beams: 1
-experiment_name: gptq-batch_size(8)-sequence_length(128)-new_tokens(256)
-model: TheBloke/vicuna-7B-v1.5-GPTQ
-device: cuda
-task: text-generation
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-environment:
-  optimum_version: 1.13.2
-  optimum_commit: null
-  transformers_version: 4.35.0.dev0
-  transformers_commit: null
-  accelerate_version: 0.24.0
-  accelerate_commit: null
-  diffusers_version: null
-  diffusers_commit: null
-  python_version: 3.10.12
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 540684
-  gpus:
-  - NVIDIA A100-SXM4-80GB
diff --git a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv b/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
deleted file mode 100644
index 544369d4..00000000
--- a/examples/running-vicunas/experiments/A100-80GB/gptq-batch_size(8)-sequence_length(128)-new_tokens(256)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-forward.latency(s),forward.throughput(samples/s),forward.peak_memory(MB),generate.latency(s),generate.throughput(tokens/s),generate.peak_memory(MB)
-0.116,69.0,8568,8.88,231.0,16290
diff --git a/examples/running-vicunas/report.py b/examples/running-vicunas/report.py
deleted file mode 100644
index 7313c910..00000000
--- a/examples/running-vicunas/report.py
+++ /dev/null
@@ -1,231 +0,0 @@
-from argparse import ArgumentParser
-from pathlib import Path
-
-import matplotlib.pyplot as plt
-import pandas as pd
-from flatten_dict import flatten
-from omegaconf import OmegaConf
-from pandas import DataFrame
-from rich.console import Console
-from rich.table import Table
-from rich.terminal_theme import MONOKAI
-
-
-def gather_inference_report(root_folder: Path) -> DataFrame:
-    # key is path to inference file as string, value is dataframe
-    inference_dfs = {
-        f.parent.absolute().as_posix(): pd.read_csv(f) for f in root_folder.glob("**/inference_results.csv")
-    }
-
-    # key is path to config file as string, value is flattened dict
-    config_dfs = {
-        f.parent.absolute()
-        .as_posix(): pd.DataFrame.from_dict(flatten(OmegaConf.load(f), reducer="dot"), orient="index")
-        .T
-        for f in root_folder.glob("**/hydra_config.yaml")
-        if f.parent.absolute().as_posix() in inference_dfs.keys()
-    }
-
-    if len(inference_dfs) == 0 or len(config_dfs) == 0:
-        raise ValueError(f"No results found in {root_folder}")
-
-    # Merge inference and config dataframes
-    inference_reports = [
-        config_dfs[name].merge(inference_dfs[name], left_index=True, right_index=True) for name in inference_dfs.keys()
-    ]
-
-    # Concatenate all reports
-    inference_report = pd.concat(inference_reports, axis=0, ignore_index=True)
-    inference_report.set_index("experiment_name", inplace=True)
-    return inference_report
-
-
-def style_element(element, style=""):
-    if style:
-        return f"[{style}]{element}[/{style}]"
-    else:
-        return element
-
-
-def format_element(element, style=""):
-    if isinstance(element, float):
-        if element != element:  # nan
-            formated_element = ""
-        elif abs(element) >= 1:
-            formated_element = f"{element:.2f}"
-        elif abs(element) > 1e-6:
-            formated_element = f"{element:.2e}"
-        else:
-            formated_element = f"{element}"
-    elif element is None:
-        formated_element = ""
-    elif isinstance(element, bool):
-        if element:
-            formated_element = style_element("✔", style="green")
-        else:
-            formated_element = style_element("✘", style="red")
-    else:
-        formated_element = str(element)
-
-    return style_element(formated_element, style=style)
-
-
-def format_row(row, style=""):
-    formated_row = []
-    for element in row:
-        formated_row.append(format_element(element, style=style))
-    return formated_row
-
-
-def get_short_report(inference_report):
-    short_columns = {
-        "benchmark.input_shapes.batch_size": "Batch Size",
-        "forward.latency(s)": "Forward Latency (s)",
-        "forward.throughput(samples/s)": "Forward Throughput (samples/s)",
-        "forward.peak_memory(MB)": "Forward Peak Memory (MB)",
-        "generate.throughput(tokens/s)": "Generate Throughput (tokens/s)",
-        "generate.peak_memory(MB)": "Generate Peak Memory (MB)",
-    }
-    short_report = inference_report[list(short_columns.keys())].rename(columns=short_columns)
-    short_report["Quantization Scheme"] = inference_report.index.str.split("-").str[0]
-
-    return short_report
-
-
-def get_rich_table(short_report):
-    # create rich table
-    rich_table = Table(show_header=True, show_lines=True)
-    # we add a column for the index
-    rich_table.add_column("Experiment Name", justify="left", header_style="")
-    # we populate the table with values
-    for column in short_report.columns:
-        rich_table.add_column(column, justify="right", header_style="bold")
-    # we add rows
-    for index, row in short_report.iterrows():
-        rich_table.add_row(index, *format_row(row.values, style=""))
-
-    return rich_table
-
-
-def get_throughput_plot(short_report):
-    # for each quantization scheme we plot the throughput vs batch size
-    fig1, ax1 = plt.subplots()
-    fig2, ax2 = plt.subplots()
-    fig3, ax3 = plt.subplots()
-    fig4, ax4 = plt.subplots()
-
-    short_report["Quantization Scheme"].fillna("unquantized", inplace=True)
-    short_report["Quantization Scheme"].replace("bnb", "BnB", inplace=True)
-    short_report["Quantization Scheme"].replace("awq", "AWQ", inplace=True)
-    short_report["Quantization Scheme"].replace("gptq", "GPTQ", inplace=True)
-    short_report["Quantization Scheme"].replace("awq+gemm", "AWQ+GEMM", inplace=True)
-    short_report["Quantization Scheme"].replace("awq+gemv", "AWQ+GEMV", inplace=True)
-
-    for quantization_scheme in short_report["Quantization Scheme"].unique():
-        mask = short_report["Quantization Scheme"] == quantization_scheme
-
-        forward_latency = short_report[mask][["Batch Size", "Forward Latency (s)"]].sort_values(by="Batch Size")
-        generate_throughput = short_report[mask][["Batch Size", "Generate Throughput (tokens/s)"]].sort_values(
-            by="Batch Size"
-        )
-        forward_memory = short_report[mask][["Batch Size", "Forward Peak Memory (MB)"]].sort_values(by="Batch Size")
-        generate_memory = short_report[mask][["Batch Size", "Generate Peak Memory (MB)"]].sort_values(by="Batch Size")
-        ax1.plot(
-            forward_latency["Batch Size"],
-            forward_latency["Forward Latency (s)"],
-            label=quantization_scheme,
-            marker="o",
-        )
-        ax2.plot(
-            generate_throughput["Batch Size"],
-            generate_throughput["Generate Throughput (tokens/s)"],
-            label=quantization_scheme,
-            marker="o",
-        )
-        ax3.plot(
-            forward_memory["Batch Size"],
-            forward_memory["Forward Peak Memory (MB)"],
-            label=quantization_scheme,
-            marker="*",
-        )
-        ax4.plot(
-            generate_memory["Batch Size"],
-            generate_memory["Generate Peak Memory (MB)"],
-            label=quantization_scheme,
-            marker="*",
-        )
-
-    ax1.set_xlabel("Batch Size")
-    ax1.set_ylabel("Forward Latency (s)")
-    ax1.set_title("Forward Latency per Batch Size")
-
-    ax2.set_xlabel("Batch Size")
-    ax2.set_ylabel("Generate Throughput (tokens/s)")
-    ax2.set_title("Generate Throughput per Batch Size")
-
-    ax3.set_xlabel("Batch Size")
-    ax3.set_ylabel("Forward Peak Memory (MB)")
-    ax3.set_title("Forward Peak Memory per Batch Size")
-
-    ax4.set_xlabel("Batch Size")
-    ax4.set_ylabel("Generate Peak Memory (MB)")
-    ax4.set_title("Generate Peak Memory per Batch Size")
-
-    ax1.legend()
-    ax2.legend()
-    ax3.legend()
-    ax4.legend()
-
-    return fig1, fig2, fig3, fig4
-
-
-def generate_report():
-    parser = ArgumentParser()
-    parser.add_argument(
-        "--experiments",
-        "-e",
-        type=Path,
-        required=True,
-        help="The folder containing the results of experiments.",
-    )
-    parser.add_argument(
-        "--report-name",
-        "-r",
-        type=str,
-        required=False,
-        help="The name of the report.",
-    )
-
-    args = parser.parse_args()
-    experiments_folders = args.experiments
-
-    if args.report_name:
-        report_folder = f"artifacts/{args.report_name}"
-    else:
-        report_folder = "artifacts"
-    Path(report_folder).mkdir(parents=True, exist_ok=True)
-
-    # gather experiments results
-    inference_report = gather_inference_report(experiments_folders)
-    inference_report.sort_values(by="forward.throughput(samples/s)", ascending=False, inplace=True)
-    inference_report.to_csv(f"{report_folder}/full_report.csv")
-
-    short_report = get_short_report(inference_report)
-    short_report.to_csv(f"{report_folder}/short_report.csv")
-
-    forward_throughput_plot, generate_throughput_plot, forward_memory_plot, generate_memory_plot = get_throughput_plot(
-        short_report
-    )
-    forward_throughput_plot.savefig(f"{report_folder}/forward_latency_plot.png")
-    generate_throughput_plot.savefig(f"{report_folder}/generate_throughput_plot.png")
-    forward_memory_plot.savefig(f"{report_folder}/forward_memory_plot.png")
-    generate_memory_plot.savefig(f"{report_folder}/generate_memory_plot.png")
-
-    rich_table = get_rich_table(short_report)
-    console = Console(record=True)
-    console.print(rich_table, justify="center")
-    console.save_svg(f"{report_folder}/rich_table.svg", theme=MONOKAI, title="Inference Report")
-
-
-if __name__ == "__main__":
-    generate_report()
diff --git a/examples/training-llamas/README.md b/examples/training-llamas/README.md
deleted file mode 100644
index ea8bfb12..00000000
--- a/examples/training-llamas/README.md
+++ /dev/null
@@ -1,54 +0,0 @@
-# Optimum-Benchmark x LLaMAs x PEFT
-
-A set of benchmarks on Meta's LLaMA2's training.
-
-## Setup
-
-You will need to install any necessary third-party libraries like `deepspeed` or `auto-gptq` depending on the hardware and benchmarks you want to run.
-
-For example running PEFT on two devices with Model Parallelism (i.e. `fp16+peft+dp=2+zero3`) will require: `peft` and `deepspeed`
-
-## Running
-
-Then run the benchmarks from this directory with:
-
-```bash
-optimum-benchmark --config-dir configs/ --config-name fp16 --multirun
-optimum-benchmark --config-dir configs/ --config-name fp16+peft+dp=2+zero3 --multirun
-[...]
-```
-
-This will create a folder called `experiments` with the results of the benchmarks with a training `batch_size` ranging from 1 to 128 and a `sequence_length` (sample size) of 256.
-
-## Reporting
-
-To create a report for 7B models on A100-80GB, run:
-
-```bash
-python report.py -e experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/ -r artifacts/Llama-2-7b-hf/
-python report.py -e experiments/hf-dgx-01/NousResearch/Llama-2-13b-hf/  -r artifacts/Llama-2-13b-hf/
-```
-
-Which will create some quick reporting artifacts like a `full_report.csv`, `short_report.csv`, and some interesting analysis plots.
-
-## Results
-
-### LLaMA-7B on A100-80GB
-
-<p align="center">
-<img src="artifacts/Llama-2-7b-hf/peak_training_throughput.png" alt="throughput_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/Llama-2-7b-hf/training_throughput_bar_plot.png" alt="latency_plot" width="60%"/>
-</p>
-
-### LLaMA-13B on A100-80GB
-
-<p align="center">
-<img src="artifacts/Llama-2-13b-hf/peak_training_throughput.png" alt="throughput_plot" width="60%"/>
-</p>
-
-<p align="center">
-<img src="artifacts/Llama-2-13b-hf/training_throughput_bar_plot.png" alt="latency_plot" width="60%"/>
-</p>
diff --git a/examples/training-llamas/artifacts/Llama-2-13b-hf/full_report.csv b/examples/training-llamas/artifacts/Llama-2-13b-hf/full_report.csv
deleted file mode 100644
index bb28621b..00000000
--- a/examples/training-llamas/artifacts/Llama-2-13b-hf/full_report.csv
+++ /dev/null
@@ -1,393 +0,0 @@
-,launcher.name,launcher._target_,launcher.start_method,backend.name,backend.version,backend._target_,backend.seed,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.continuous_isolation,backend.isolation_check_interval,backend.delete_cache,backend.no_weights,backend.device_map,backend.torch_dtype,backend.eval_mode,backend.disable_grad,backend.amp_autocast,backend.amp_dtype,backend.torch_compile,backend.to_bettertransformer,backend.use_flash_attention_2,backend.quantization_scheme,backend.data_parallel,backend.deepspeed_inference,backend.peft_strategy,backend.peft_config.base_model_name_or_path,backend.peft_config.revision,backend.peft_config.peft_type,backend.peft_config.task_type,backend.peft_config.inference_mode,backend.peft_config.auto_mapping,backend.peft_config.r,backend.peft_config.target_modules,backend.peft_config.lora_alpha,backend.peft_config.lora_dropout,backend.peft_config.fan_in_fan_out,backend.peft_config.bias,backend.peft_config.modules_to_save,backend.peft_config.init_lora_weights,backend.peft_config.layers_to_transform,backend.peft_config.layers_pattern,benchmark.name,benchmark._target_,benchmark.warmup_steps,benchmark.dataset_shapes.dataset_size,benchmark.dataset_shapes.sequence_length,benchmark.dataset_shapes.num_choices,benchmark.dataset_shapes.feature_size,benchmark.dataset_shapes.nb_max_frames,benchmark.dataset_shapes.audio_sequence_length,benchmark.training_arguments.skip_memory_metrics,benchmark.training_arguments.output_dir,benchmark.training_arguments.use_cpu,benchmark.training_arguments.ddp_find_unused_parameters,benchmark.training_arguments.do_train,benchmark.training_arguments.do_eval,benchmark.training_arguments.do_predict,benchmark.training_arguments.report_to,benchmark.training_arguments.max_steps,benchmark.training_arguments.per_device_train_batch_size,experiment_name,device,model,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,environment.optimum_version,environment.optimum_commit,environment.transformers_version,environment.transformers_commit,environment.accelerate_version,environment.accelerate_commit,environment.diffusers_version,environment.diffusers_commit,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,environment.gpus,warmup.runtime(s),warmup.throughput(samples/s),training.runtime(s),training.throughput(samples/s),overall_training.runtime(s),overall_training.throughput(samples/s),hydra.run.dir,hydra.sweep.dir,hydra.sweep.subdir,hydra.launcher._target_,hydra.sweeper._target_,hydra.sweeper.max_batch_size,hydra.sweeper.params.benchmark.training_arguments.per_device_train_batch_size,hydra.sweeper.params.model,hydra.help.app_name,hydra.help.header,hydra.help.footer,hydra.help.template,hydra.hydra_help.template,hydra.hydra_help.hydra_help,hydra.hydra_logging.version,hydra.hydra_logging.formatters.colorlog.(),hydra.hydra_logging.formatters.colorlog.format,hydra.hydra_logging.handlers.console.class,hydra.hydra_logging.handlers.console.formatter,hydra.hydra_logging.handlers.console.stream,hydra.hydra_logging.root.level,hydra.hydra_logging.root.handlers,hydra.hydra_logging.disable_existing_loggers,hydra.job_logging.version,hydra.job_logging.formatters.simple.format,hydra.job_logging.formatters.colorlog.(),hydra.job_logging.formatters.colorlog.format,hydra.job_logging.formatters.colorlog.log_colors.DEBUG,hydra.job_logging.formatters.colorlog.log_colors.INFO,hydra.job_logging.formatters.colorlog.log_colors.WARNING,hydra.job_logging.formatters.colorlog.log_colors.ERROR,hydra.job_logging.formatters.colorlog.log_colors.CRITICAL,hydra.job_logging.handlers.console.class,hydra.job_logging.handlers.console.formatter,hydra.job_logging.handlers.console.stream,hydra.job_logging.handlers.file.class,hydra.job_logging.handlers.file.formatter,hydra.job_logging.handlers.file.filename,hydra.job_logging.root.level,hydra.job_logging.root.handlers,hydra.job_logging.disable_existing_loggers,hydra.mode,hydra.searchpath,hydra.output_subdir,hydra.overrides.hydra,hydra.overrides.task,hydra.job.name,hydra.job.chdir,hydra.job.override_dirname,hydra.job.id,hydra.job.num,hydra.job.config_name,hydra.job.env_set.CUDA_VISIBLE_DEVICES,hydra.job.env_set.CUDA_DEVICE_ORDER,hydra.job.env_copy,hydra.job.config.override_dirname.kv_sep,hydra.job.config.override_dirname.item_sep,hydra.job.config.override_dirname.exclude_keys,hydra.runtime.version,hydra.runtime.version_base,hydra.runtime.cwd,hydra.runtime.config_sources,hydra.runtime.output_dir,hydra.runtime.choices.benchmark,hydra.runtime.choices.launcher,hydra.runtime.choices.backend,hydra.runtime.choices.hydra/env,hydra.runtime.choices.hydra/callbacks,hydra.runtime.choices.hydra/job_logging,hydra.runtime.choices.hydra/hydra_logging,hydra.runtime.choices.hydra/hydra_help,hydra.runtime.choices.hydra/help,hydra.runtime.choices.hydra/sweeper,hydra.runtime.choices.hydra/launcher,hydra.runtime.choices.hydra/output,hydra.verbose,backend.quantization_config.llm_int8_threshold,backend.quantization_config.load_in_4bit,backend.quantization_config.bnb_4bit_compute_dtype,backend.quantization_config.bits,backend.quantization_config.disable_exllama
-0,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,16,fp16+peft,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],63.59784197807312,10.06323453900614,159.16368579864502,10.0525442846563,222.7615296840668,7.182568741870341,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=16', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=16,model=NousResearch/Llama-2-13b-hf",9,9,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft/16,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-1,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,4,fp16+peft,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],18.260884523391724,8.761897584700462,44.20054507255554,9.049662155600046,62.4614315032959,6.403951852734807,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=4', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=4,model=NousResearch/Llama-2-13b-hf",5,5,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft/4,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-2,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,1,fp16+peft,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],6.025439023971558,6.6385204199833945,14.0109965801239,7.137251046214708,20.036437034606934,4.990907306886948,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=1', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=1,model=NousResearch/Llama-2-13b-hf",1,1,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft/1,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-3,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,2,fp16+peft,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],10.59528875350952,7.550525696951984,25.423195123672485,7.866831805643994,36.01848530769348,5.552704348655116,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=2', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=2,model=NousResearch/Llama-2-13b-hf",3,3,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft/2,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-4,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,8,fp16+peft,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],32.72411274909973,9.77872196118758,80.59089398384094,9.926679807775873,113.31500816345216,7.059965074052975,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=8', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=8,model=NousResearch/Llama-2-13b-hf",7,7,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft/8,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-5,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,16,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],56.82151055335999,11.263340128893413,140.7813069820404,11.365145233408818,197.6028189659119,8.097050479204011,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=16', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=16,model=NousResearch/Llama-2-13b-hf",9,9,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+bnb-4bit/16,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-6,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,4,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],18.608861923217773,8.59805401642388,45.62080240249634,8.767929955964831,64.22966575622559,6.227651900262757,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=4', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=4,model=NousResearch/Llama-2-13b-hf",5,5,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+bnb-4bit/4,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-7,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,1,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],8.35726809501648,4.78625306083604,19.78277015686035,5.054903797955798,28.140039443969727,3.553655288902927,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=1', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=1,model=NousResearch/Llama-2-13b-hf",1,1,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+bnb-4bit/1,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-8,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,2,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],12.181357860565186,6.567412345628946,29.56349492073059,6.765100017310723,41.74485445022583,4.791009637809817,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=2', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=2,model=NousResearch/Llama-2-13b-hf",3,3,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+bnb-4bit/2,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-9,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,8,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],30.924877405166622,10.34765621889054,76.05532646179199,10.518658419037845,106.98020553588869,7.4780189100648515,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=8', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=8,model=NousResearch/Llama-2-13b-hf",7,7,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+bnb-4bit/8,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-10,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,4,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],27.047818660736084,5.915449301361359,66.39001893997192,6.02500204679365,93.4378387928009,4.280920932760473,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=4', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=4,model=NousResearch/Llama-2-13b-hf",7,7,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+gptq-4bit/4,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
-11,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,1,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],16.171680450439453,2.473459707702364,39.22436714172363,2.54943565153479,55.39604926109314,1.805182884589461,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=1', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=1,model=NousResearch/Llama-2-13b-hf",1,1,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+gptq-4bit/1,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
-12,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,2,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],20.308139324188232,3.939307226670201,49.545104026794434,4.036725806284275,69.85324501991272,2.863145440744907,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=2', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=2,model=NousResearch/Llama-2-13b-hf",4,4,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+gptq-4bit/2,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
-13,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,8,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-13b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],39.81309175491333,8.037557142507247,98.25630164146423,8.141971422038537,138.06939482688904,5.794187777841986,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=8', 'model=NousResearch/Llama-2-13b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=8,model=NousResearch/Llama-2-13b-hf",7,7,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-13b-hf/fp16+peft+gptq-4bit/8,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
diff --git a/examples/training-llamas/artifacts/Llama-2-13b-hf/peak_training_throughput.png b/examples/training-llamas/artifacts/Llama-2-13b-hf/peak_training_throughput.png
deleted file mode 100644
index c5be42f5..00000000
Binary files a/examples/training-llamas/artifacts/Llama-2-13b-hf/peak_training_throughput.png and /dev/null differ
diff --git a/examples/training-llamas/artifacts/Llama-2-13b-hf/short_report.csv b/examples/training-llamas/artifacts/Llama-2-13b-hf/short_report.csv
deleted file mode 100644
index eb2a3c8a..00000000
--- a/examples/training-llamas/artifacts/Llama-2-13b-hf/short_report.csv
+++ /dev/null
@@ -1,15 +0,0 @@
-,Model,GPUs,Experiment Name,CUDAs,Per Process Batch Size,Sequence Length,Training Throughput (samples/s),GPU Name,Num GPUs,Num CUDAs,Num Processes,Effective Batch Size,Group
-0,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,16,256,10.0525442846563,1xA100,1,1,1,16,1xA100-fp16+peft
-1,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,4,256,9.049662155600046,1xA100,1,1,1,4,1xA100-fp16+peft
-2,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,1,256,7.137251046214708,1xA100,1,1,1,1,1xA100-fp16+peft
-3,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,2,256,7.866831805643994,1xA100,1,1,1,2,1xA100-fp16+peft
-4,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,8,256,9.926679807775873,1xA100,1,1,1,8,1xA100-fp16+peft
-5,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,16,256,11.365145233408818,1xA100,1,1,1,16,1xA100-fp16+peft+bnb-4bit
-6,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,4,256,8.767929955964831,1xA100,1,1,1,4,1xA100-fp16+peft+bnb-4bit
-7,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,1,256,5.054903797955798,1xA100,1,1,1,1,1xA100-fp16+peft+bnb-4bit
-8,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,2,256,6.765100017310723,1xA100,1,1,1,2,1xA100-fp16+peft+bnb-4bit
-9,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,8,256,10.518658419037845,1xA100,1,1,1,8,1xA100-fp16+peft+bnb-4bit
-10,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,4,256,6.02500204679365,1xA100,1,1,1,4,1xA100-fp16+peft+gptq-4bit
-11,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,1,256,2.54943565153479,1xA100,1,1,1,1,1xA100-fp16+peft+gptq-4bit
-12,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,2,256,4.036725806284275,1xA100,1,1,1,2,1xA100-fp16+peft+gptq-4bit
-13,NousResearch/Llama-2-13b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,8,256,8.141971422038537,1xA100,1,1,1,8,1xA100-fp16+peft+gptq-4bit
diff --git a/examples/training-llamas/artifacts/Llama-2-13b-hf/training_throughput_bar_plot.png b/examples/training-llamas/artifacts/Llama-2-13b-hf/training_throughput_bar_plot.png
deleted file mode 100644
index 76fe3f70..00000000
Binary files a/examples/training-llamas/artifacts/Llama-2-13b-hf/training_throughput_bar_plot.png and /dev/null differ
diff --git a/examples/training-llamas/artifacts/Llama-2-13b-hf/training_throughput_line_plot.png b/examples/training-llamas/artifacts/Llama-2-13b-hf/training_throughput_line_plot.png
deleted file mode 100644
index 967ec405..00000000
Binary files a/examples/training-llamas/artifacts/Llama-2-13b-hf/training_throughput_line_plot.png and /dev/null differ
diff --git a/examples/training-llamas/artifacts/Llama-2-7b-hf/full_report.csv b/examples/training-llamas/artifacts/Llama-2-7b-hf/full_report.csv
deleted file mode 100644
index 4dfdee19..00000000
--- a/examples/training-llamas/artifacts/Llama-2-7b-hf/full_report.csv
+++ /dev/null
@@ -1,561 +0,0 @@
-,launcher.name,launcher._target_,launcher.start_method,backend.name,backend.version,backend._target_,backend.seed,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.continuous_isolation,backend.isolation_check_interval,backend.delete_cache,backend.no_weights,backend.device_map,backend.torch_dtype,backend.eval_mode,backend.disable_grad,backend.amp_autocast,backend.amp_dtype,backend.torch_compile,backend.to_bettertransformer,backend.use_flash_attention_2,backend.quantization_scheme,backend.data_parallel,backend.deepspeed_inference,backend.peft_strategy,backend.peft_config.base_model_name_or_path,backend.peft_config.revision,backend.peft_config.peft_type,backend.peft_config.task_type,backend.peft_config.inference_mode,backend.peft_config.auto_mapping,backend.peft_config.r,backend.peft_config.target_modules,backend.peft_config.lora_alpha,backend.peft_config.lora_dropout,backend.peft_config.fan_in_fan_out,backend.peft_config.bias,backend.peft_config.modules_to_save,backend.peft_config.init_lora_weights,backend.peft_config.layers_to_transform,backend.peft_config.layers_pattern,benchmark.name,benchmark._target_,benchmark.warmup_steps,benchmark.dataset_shapes.dataset_size,benchmark.dataset_shapes.sequence_length,benchmark.dataset_shapes.num_choices,benchmark.dataset_shapes.feature_size,benchmark.dataset_shapes.nb_max_frames,benchmark.dataset_shapes.audio_sequence_length,benchmark.training_arguments.skip_memory_metrics,benchmark.training_arguments.output_dir,benchmark.training_arguments.use_cpu,benchmark.training_arguments.ddp_find_unused_parameters,benchmark.training_arguments.do_train,benchmark.training_arguments.do_eval,benchmark.training_arguments.do_predict,benchmark.training_arguments.report_to,benchmark.training_arguments.max_steps,benchmark.training_arguments.per_device_train_batch_size,experiment_name,device,model,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,environment.optimum_version,environment.optimum_commit,environment.transformers_version,environment.transformers_commit,environment.accelerate_version,environment.accelerate_commit,environment.diffusers_version,environment.diffusers_commit,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,environment.gpus,warmup.runtime(s),warmup.throughput(samples/s),training.runtime(s),training.throughput(samples/s),overall_training.runtime(s),overall_training.throughput(samples/s),hydra.run.dir,hydra.sweep.dir,hydra.sweep.subdir,hydra.launcher._target_,hydra.sweeper._target_,hydra.sweeper.max_batch_size,hydra.sweeper.params.benchmark.training_arguments.per_device_train_batch_size,hydra.sweeper.params.model,hydra.help.app_name,hydra.help.header,hydra.help.footer,hydra.help.template,hydra.hydra_help.template,hydra.hydra_help.hydra_help,hydra.hydra_logging.version,hydra.hydra_logging.formatters.colorlog.(),hydra.hydra_logging.formatters.colorlog.format,hydra.hydra_logging.handlers.console.class,hydra.hydra_logging.handlers.console.formatter,hydra.hydra_logging.handlers.console.stream,hydra.hydra_logging.root.level,hydra.hydra_logging.root.handlers,hydra.hydra_logging.disable_existing_loggers,hydra.job_logging.version,hydra.job_logging.formatters.simple.format,hydra.job_logging.formatters.colorlog.(),hydra.job_logging.formatters.colorlog.format,hydra.job_logging.formatters.colorlog.log_colors.DEBUG,hydra.job_logging.formatters.colorlog.log_colors.INFO,hydra.job_logging.formatters.colorlog.log_colors.WARNING,hydra.job_logging.formatters.colorlog.log_colors.ERROR,hydra.job_logging.formatters.colorlog.log_colors.CRITICAL,hydra.job_logging.handlers.console.class,hydra.job_logging.handlers.console.formatter,hydra.job_logging.handlers.console.stream,hydra.job_logging.handlers.file.class,hydra.job_logging.handlers.file.formatter,hydra.job_logging.handlers.file.filename,hydra.job_logging.root.level,hydra.job_logging.root.handlers,hydra.job_logging.disable_existing_loggers,hydra.mode,hydra.searchpath,hydra.output_subdir,hydra.overrides.hydra,hydra.overrides.task,hydra.job.name,hydra.job.chdir,hydra.job.override_dirname,hydra.job.id,hydra.job.num,hydra.job.config_name,hydra.job.env_set.CUDA_VISIBLE_DEVICES,hydra.job.env_set.CUDA_DEVICE_ORDER,hydra.job.env_copy,hydra.job.config.override_dirname.kv_sep,hydra.job.config.override_dirname.item_sep,hydra.job.config.override_dirname.exclude_keys,hydra.runtime.version,hydra.runtime.version_base,hydra.runtime.cwd,hydra.runtime.config_sources,hydra.runtime.output_dir,hydra.runtime.choices.benchmark,hydra.runtime.choices.launcher,hydra.runtime.choices.backend,hydra.runtime.choices.hydra/env,hydra.runtime.choices.hydra/callbacks,hydra.runtime.choices.hydra/job_logging,hydra.runtime.choices.hydra/hydra_logging,hydra.runtime.choices.hydra/hydra_help,hydra.runtime.choices.hydra/help,hydra.runtime.choices.hydra/sweeper,hydra.runtime.choices.hydra/launcher,hydra.runtime.choices.hydra/output,hydra.verbose,backend.quantization_config.llm_int8_threshold,backend.quantization_config.load_in_4bit,backend.quantization_config.bnb_4bit_compute_dtype,backend.quantization_config.bits,backend.quantization_config.disable_exllama
-0,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,16,fp16+peft,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],36.81096434593201,17.38612425324105,90.82892441749571,17.61553393108114,127.63988995552064,12.535266213074618,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=16', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=16,model=NousResearch/Llama-2-7b-hf",8,8,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft/16,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-1,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,4,fp16+peft,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],10.65952181816101,15.01005417779644,26.17747592926025,15.280312016365723,36.83699917793274,10.858647797772315,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=4', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=4,model=NousResearch/Llama-2-7b-hf",4,4,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft/4,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-2,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,1,fp16+peft,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],4.55856728553772,8.774686758908217,10.863666772842407,9.204995154121027,15.422235250473022,6.484144378288669,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=1', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=1,model=NousResearch/Llama-2-7b-hf",0,0,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft/1,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-3,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,2,fp16+peft,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],6.038196802139282,13.248988501278507,14.59524655342102,13.703091569434395,20.63344502449036,9.693000842206184,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=2', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=2,model=NousResearch/Llama-2-7b-hf",2,2,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft/2,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-4,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,8,fp16+peft,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],19.43790316581726,16.4626810448742,47.72488141059876,16.762744638739655,67.16278600692749,11.911358172626793,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=8', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=8,model=NousResearch/Llama-2-7b-hf",6,6,fp16+peft,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft/8,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-5,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,16,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],33.6070408821106,19.043628454080263,83.09710359573364,19.25458205840699,116.70414614677428,13.70988137805954,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=16', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=16,model=NousResearch/Llama-2-7b-hf",8,8,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+bnb-4bit/16,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-6,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,4,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],11.067278146743774,14.45703251319073,26.702176094055176,14.980052509243013,37.769455671310425,10.590568301566467,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=4', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=4,model=NousResearch/Llama-2-7b-hf",4,4,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+bnb-4bit/4,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-7,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,1,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],6.390275239944458,6.259511288335002,15.36588716506958,6.507922316865925,21.75616407394409,4.596398503896343,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=1', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=1,model=NousResearch/Llama-2-7b-hf",0,0,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+bnb-4bit/1,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-8,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,2,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],7.136318206787109,11.210262446525258,16.748042583465576,11.94169402204942,23.88436245918274,8.37367965512124,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=2', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=2,model=NousResearch/Llama-2-7b-hf",2,2,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+bnb-4bit/2,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-9,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,bnb,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,8,fp16+peft+bnb-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],18.616926193237305,17.188659216806784,45.44451022148132,17.60388650028503,64.06143808364868,12.488011882521189,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=8', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=8,model=NousResearch/Llama-2-7b-hf",6,6,fp16+peft+bnb-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+bnb-4bit/8,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,0.0,True,float16,,
-10,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,,,,,,,,,,,,,,,,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,16,fp16,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.25.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],45.30532383918762,14.12637513135754,111.96182560920715,14.290585128404912,157.26715087890625,10.173771134392712,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=16', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=16,model=NousResearch/Llama-2-7b-hf",12,12,fp16,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16/16,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-11,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,,,,,,,,,,,,,,,,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,4,fp16,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.25.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],19.096375942230225,8.378553107879062,46.270344257354736,8.644845989803057,65.36672186851501,6.1193217063049135,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=4', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=4,model=NousResearch/Llama-2-7b-hf",6,6,fp16,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16/4,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-12,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,,,,,,,,,,,,,,,,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,1,fp16,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.25.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],12.218624591827393,3.273690888805487,29.746723175048828,3.361714815159161,41.965349197387695,2.3829183341151587,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=1', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=1,model=NousResearch/Llama-2-7b-hf",0,0,fp16,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16/1,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-13,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,,,,,,,,,,,,,,,,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,2,fp16,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.25.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],14.054343223571776,5.692190572507505,34.34596490859985,5.823100341837308,48.40031003952026,4.132204934982734,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=2', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=2,model=NousResearch/Llama-2-7b-hf",2,2,fp16,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16/2,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-14,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,,False,False,,,,,,,,,,,,,,,,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,8,fp16,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.25.0,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],27.57860779762268,11.603196301576345,67.7247965335846,11.812512417121573,95.30340623855592,8.394243517356594,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=8', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=8,model=NousResearch/Llama-2-7b-hf",9,9,fp16,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16/8,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,,
-15,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,16,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],38.72175240516663,16.528177580997216,95.55383205413818,16.744488060860643,134.27558636665344,11.91579231410715,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=16', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=16,model=NousResearch/Llama-2-7b-hf",8,8,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+gptq-4bit/16,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
-16,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,4,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],15.456857919692991,10.351392296629063,37.6063711643219,10.63649556220649,53.06323051452637,7.538176551284372,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=4', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=4,model=NousResearch/Llama-2-7b-hf",6,6,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+gptq-4bit/4,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
-17,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,1,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],9.378505945205688,4.26507166852606,22.25546908378601,4.493277568022772,31.63397645950317,3.161158070912042,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=1', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=1,model=NousResearch/Llama-2-7b-hf",0,0,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+gptq-4bit/1,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
-18,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,2,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],11.28474497795105,7.089216473771431,27.20784854888916,7.350820100333349,38.49259519577026,5.195804517279647,experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf,NousResearch/Llama-2-70b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=2', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=2,model=NousResearch/Llama-2-7b-hf",3,3,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+gptq-4bit/2,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
-19,process,optimum_benchmark.launchers.process.launcher.ProcessLauncher,spawn,pytorch,2.1.1+cu118,optimum_benchmark.backends.pytorch.backend.PyTorchBackend,42,,,True,1.0,False,True,,float16,False,False,False,,False,False,False,gptq,False,False,lora,,,,CAUSAL_LM,False,,8,,8,0,False,none,,True,,,training,optimum_benchmark.benchmarks.training.benchmark.TrainingBenchmark,40,160,256,1,80,3000,16000,True,./trainer_output,False,False,True,False,False,none,140,8,fp16+peft+gptq-4bit,cuda,NousResearch/Llama-2-7b-hf,text-generation,main,,False,False,1.14.1,,4.35.2,,0.24.1,,,,3.10.12,Linux, AMD EPYC 7742 64-Core Processor,128,540671,['NVIDIA A100-SXM4-80GB'],23.256840229034424,13.759392800080551,57.13273501396179,14.002480360943691,80.38957738876343,9.951538818660604,experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},experiments/${benchmark.name}/${oc.env:HOSTNAME}/${model}/${experiment_name},${benchmark.training_arguments.per_device_train_batch_size},hydra._internal.core_plugins.basic_launcher.BasicLauncher,hydra._internal.core_plugins.basic_sweeper.BasicSweeper,,"1,2,4,8,16,32,64,128","NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf",${hydra.job.name},"${hydra.help.app_name} is powered by Hydra.
-","Powered by Hydra (https://hydra.cc)
-Use --hydra-help to view Hydra specific help
-","${hydra.help.header}
-== Configuration groups ==
-Compose your configuration from those groups (group=option)
-
-$APP_CONFIG_GROUPS
-
-== Config ==
-Override anything in the config (foo.bar=value)
-
-$CONFIG
-
-${hydra.help.footer}
-","Hydra (${hydra.runtime.version})
-See https://hydra.cc for more info.
-
-== Flags ==
-$FLAGS_HELP
-
-== Configuration groups ==
-Compose your configuration from those groups (For example, append hydra/job_logging=disabled to command line)
-
-$HYDRA_CONFIG_GROUPS
-
-Use '--cfg hydra' to Show the Hydra config.
-",???,1,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s,logging.StreamHandler,colorlog,ext://sys.stdout,INFO,['console'],False,1,[%(asctime)s][%(name)s][%(levelname)s] - %(message)s,colorlog.ColoredFormatter,[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s] - %(message)s,purple,green,yellow,red,red,logging.StreamHandler,colorlog,ext://sys.stdout,logging.FileHandler,simple,${hydra.job.name}.log,INFO,"['console', 'file']",False,MULTIRUN,[],.hydra,['hydra.mode=MULTIRUN'],"['benchmark.training_arguments.per_device_train_batch_size=8', 'model=NousResearch/Llama-2-7b-hf']",cli,True,"benchmark.training_arguments.per_device_train_batch_size=8,model=NousResearch/Llama-2-7b-hf",6,6,fp16+peft+gptq-4bit,0,PCI_BUS_ID,[],=,",",[],1.3.2,1.3,/workspace/optimum-benchmark/examples/training-llamas,"[{'path': 'hydra.conf', 'schema': 'pkg', 'provider': 'hydra'}, {'path': 'optimum_benchmark', 'schema': 'pkg', 'provider': 'main'}, {'path': 'hydra_plugins.hydra_colorlog.conf', 'schema': 'pkg', 'provider': 'hydra-colorlog'}, {'path': '/workspace/optimum-benchmark/examples/training-llamas/configs', 'schema': 'file', 'provider': 'command-line'}, {'path': '', 'schema': 'structured', 'provider': 'schema'}]",/workspace/optimum-benchmark/examples/training-llamas/experiments/training/hf-dgx-01/NousResearch/Llama-2-7b-hf/fp16+peft+gptq-4bit/8,training,process,pytorch,default,,colorlog,colorlog,default,default,basic,basic,default,False,,,,4,True
diff --git a/examples/training-llamas/artifacts/Llama-2-7b-hf/peak_training_throughput.png b/examples/training-llamas/artifacts/Llama-2-7b-hf/peak_training_throughput.png
deleted file mode 100644
index ed456949..00000000
Binary files a/examples/training-llamas/artifacts/Llama-2-7b-hf/peak_training_throughput.png and /dev/null differ
diff --git a/examples/training-llamas/artifacts/Llama-2-7b-hf/short_report.csv b/examples/training-llamas/artifacts/Llama-2-7b-hf/short_report.csv
deleted file mode 100644
index d987510c..00000000
--- a/examples/training-llamas/artifacts/Llama-2-7b-hf/short_report.csv
+++ /dev/null
@@ -1,21 +0,0 @@
-,Model,GPUs,Experiment Name,CUDAs,Per Process Batch Size,Sequence Length,Training Throughput (samples/s),GPU Name,Num GPUs,Num CUDAs,Num Processes,Effective Batch Size,Group
-0,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,16,256,17.61553393108114,1xA100,1,1,1,16,1xA100-fp16+peft
-1,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,4,256,15.280312016365723,1xA100,1,1,1,4,1xA100-fp16+peft
-2,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,1,256,9.204995154121027,1xA100,1,1,1,1,1xA100-fp16+peft
-3,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,2,256,13.703091569434395,1xA100,1,1,1,2,1xA100-fp16+peft
-4,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft,0,8,256,16.762744638739655,1xA100,1,1,1,8,1xA100-fp16+peft
-5,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,16,256,19.25458205840699,1xA100,1,1,1,16,1xA100-fp16+peft+bnb-4bit
-6,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,4,256,14.980052509243013,1xA100,1,1,1,4,1xA100-fp16+peft+bnb-4bit
-7,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,1,256,6.507922316865925,1xA100,1,1,1,1,1xA100-fp16+peft+bnb-4bit
-8,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,2,256,11.94169402204942,1xA100,1,1,1,2,1xA100-fp16+peft+bnb-4bit
-9,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+bnb-4bit,0,8,256,17.60388650028503,1xA100,1,1,1,8,1xA100-fp16+peft+bnb-4bit
-10,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,0,16,256,14.290585128404912,1xA100,1,1,1,16,1xA100-fp16
-11,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,0,4,256,8.644845989803057,1xA100,1,1,1,4,1xA100-fp16
-12,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,0,1,256,3.361714815159161,1xA100,1,1,1,1,1xA100-fp16
-13,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,0,2,256,5.823100341837308,1xA100,1,1,1,2,1xA100-fp16
-14,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16,0,8,256,11.812512417121573,1xA100,1,1,1,8,1xA100-fp16
-15,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,16,256,16.744488060860643,1xA100,1,1,1,16,1xA100-fp16+peft+gptq-4bit
-16,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,4,256,10.63649556220649,1xA100,1,1,1,4,1xA100-fp16+peft+gptq-4bit
-17,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,1,256,4.493277568022772,1xA100,1,1,1,1,1xA100-fp16+peft+gptq-4bit
-18,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,2,256,7.350820100333349,1xA100,1,1,1,2,1xA100-fp16+peft+gptq-4bit
-19,NousResearch/Llama-2-7b-hf,['NVIDIA A100-SXM4-80GB'],fp16+peft+gptq-4bit,0,8,256,14.002480360943691,1xA100,1,1,1,8,1xA100-fp16+peft+gptq-4bit
diff --git a/examples/training-llamas/artifacts/Llama-2-7b-hf/training_throughput_bar_plot.png b/examples/training-llamas/artifacts/Llama-2-7b-hf/training_throughput_bar_plot.png
deleted file mode 100644
index e17bb8c4..00000000
Binary files a/examples/training-llamas/artifacts/Llama-2-7b-hf/training_throughput_bar_plot.png and /dev/null differ
diff --git a/examples/training-llamas/artifacts/Llama-2-7b-hf/training_throughput_line_plot.png b/examples/training-llamas/artifacts/Llama-2-7b-hf/training_throughput_line_plot.png
deleted file mode 100644
index 340767f1..00000000
Binary files a/examples/training-llamas/artifacts/Llama-2-7b-hf/training_throughput_line_plot.png and /dev/null differ
diff --git a/examples/training-llamas/configs/_base_.yaml b/examples/training-llamas/configs/_base_.yaml
deleted file mode 100644
index 36efa0f3..00000000
--- a/examples/training-llamas/configs/_base_.yaml
+++ /dev/null
@@ -1,41 +0,0 @@
-defaults:
-  - backend: pytorch # default backend
-  - launcher: inline # default launcher
-  - benchmark: training # default benchmark
-  - experiment # inheriting from experiment config
-  - _self_ # for hydra 1.1 compatibility
-  - override hydra/job_logging: colorlog # colorful logging
-  - override hydra/hydra_logging: colorlog # colorful logging
-
-experiment_name: llama-experiment
-model: llama-2-model
-device: cuda
-
-backend:
-  no_weights: true
-  torch_dtype: float16
-
-benchmark:
-  warmup_steps: 40
-  dataset_shapes:
-    dataset_size: 160
-    sequence_length: 256
-  training_arguments:
-    max_steps: 140
-    per_device_train_batch_size: 1
-
-hydra:
-  run:
-    dir: experiments/${oc.env:HOSTNAME}/${model}/${experiment_name}
-  sweep:
-    dir: experiments/${oc.env:HOSTNAME}/${model}/${experiment_name}
-    subdir: ${benchmark.training_arguments.per_device_train_batch_size}
-  job:
-    chdir: true
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0
-      CUDA_DEVICE_ORDER: PCI_BUS_ID
-  sweeper:
-    params:
-      benchmark.training_arguments.per_device_train_batch_size: 1,2,4,8,16,32,64,128
-      model: NousResearch/Llama-2-7b-hf,NousResearch/Llama-2-13b-hf
diff --git a/examples/training-llamas/configs/fp16+dp=2.yaml b/examples/training-llamas/configs/fp16+dp=2.yaml
deleted file mode 100644
index 60043450..00000000
--- a/examples/training-llamas/configs/fp16+dp=2.yaml
+++ /dev/null
@@ -1,15 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+dp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29500
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/training-llamas/configs/fp16+fsdp=2.yaml b/examples/training-llamas/configs/fp16+fsdp=2.yaml
deleted file mode 100644
index bb57da37..00000000
--- a/examples/training-llamas/configs/fp16+fsdp=2.yaml
+++ /dev/null
@@ -1,19 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+fsdp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29522
-
-benchmark:
-  training_arguments:
-    fsdp: full_shard
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/training-llamas/configs/fp16+peft+bnb-4bit+dp=2.yaml b/examples/training-llamas/configs/fp16+peft+bnb-4bit+dp=2.yaml
deleted file mode 100644
index 6e3ca8bd..00000000
--- a/examples/training-llamas/configs/fp16+peft+bnb-4bit+dp=2.yaml
+++ /dev/null
@@ -1,24 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+peft+bnb-4bit+dp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29511
-
-backend:
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  peft_strategy: lora
-  peft_config:
-    task_type: CAUSAL_LM
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/training-llamas/configs/fp16+peft+bnb-4bit.yaml b/examples/training-llamas/configs/fp16+peft+bnb-4bit.yaml
deleted file mode 100644
index 4440d565..00000000
--- a/examples/training-llamas/configs/fp16+peft+bnb-4bit.yaml
+++ /dev/null
@@ -1,15 +0,0 @@
-defaults:
-  - _base_ # we can extend fp16+peft as a base here
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16+peft+bnb-4bit
-
-backend:
-  quantization_scheme: bnb
-  quantization_config:
-    load_in_4bit: true
-    bnb_4bit_compute_dtype: float16
-  peft_strategy: lora
-  peft_config:
-    task_type: CAUSAL_LM
diff --git a/examples/training-llamas/configs/fp16+peft+dp=2+zero3.yaml b/examples/training-llamas/configs/fp16+peft+dp=2+zero3.yaml
deleted file mode 100644
index 8182c413..00000000
--- a/examples/training-llamas/configs/fp16+peft+dp=2+zero3.yaml
+++ /dev/null
@@ -1,28 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+peft+dp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29511
-
-backend:
-  peft_strategy: lora
-  peft_config:
-    task_type: CAUSAL_LM
-
-benchmark:
-  training_arguments:
-    deepspeed:
-      train_batch_size: auto
-      train_micro_batch_size_per_gpu: auto
-      zero_optimization:
-        stage: 3
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/training-llamas/configs/fp16+peft+dp=2.yaml b/examples/training-llamas/configs/fp16+peft+dp=2.yaml
deleted file mode 100644
index b6c19980..00000000
--- a/examples/training-llamas/configs/fp16+peft+dp=2.yaml
+++ /dev/null
@@ -1,20 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: torchrun
-
-experiment_name: fp16+peft+dp=2
-
-launcher:
-  nproc_per_node: 2
-  rdzv_endpoint: localhost:29511
-
-backend:
-  peft_strategy: lora
-  peft_config:
-    task_type: CAUSAL_LM
-
-hydra:
-  job:
-    env_set:
-      CUDA_VISIBLE_DEVICES: 0,1
diff --git a/examples/training-llamas/configs/fp16+peft+gptq-4bit+dp=2.yaml b/examples/training-llamas/configs/fp16+peft+gptq-4bit+dp=2.yaml
deleted file mode 100644
index fd7c3c7e..00000000
--- a/examples/training-llamas/configs/fp16+peft+gptq-4bit+dp=2.yaml
+++ /dev/null
@@ -1,16 +0,0 @@
-defaults:
-  - _base_ # we can extend fp16+peft as a base here
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16+peft+gptq-4bit
-
-backend:
-  no_weights: true
-  quantization_scheme: gptq
-  quantization_config:
-    bits: 4
-    disable_exllama: true
-  peft_strategy: lora
-  peft_config:
-    task_type: CAUSAL_LM
diff --git a/examples/training-llamas/configs/fp16+peft+gptq-4bit.yaml b/examples/training-llamas/configs/fp16+peft+gptq-4bit.yaml
deleted file mode 100644
index fd7c3c7e..00000000
--- a/examples/training-llamas/configs/fp16+peft+gptq-4bit.yaml
+++ /dev/null
@@ -1,16 +0,0 @@
-defaults:
-  - _base_ # we can extend fp16+peft as a base here
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16+peft+gptq-4bit
-
-backend:
-  no_weights: true
-  quantization_scheme: gptq
-  quantization_config:
-    bits: 4
-    disable_exllama: true
-  peft_strategy: lora
-  peft_config:
-    task_type: CAUSAL_LM
diff --git a/examples/training-llamas/configs/fp16+peft.yaml b/examples/training-llamas/configs/fp16+peft.yaml
deleted file mode 100644
index 1a52b6e2..00000000
--- a/examples/training-llamas/configs/fp16+peft.yaml
+++ /dev/null
@@ -1,11 +0,0 @@
-defaults:
-  - _base_ # we can also extend fp16 as a base here
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16+peft
-
-backend:
-  peft_strategy: lora
-  peft_config:
-    task_type: CAUSAL_LM
diff --git a/examples/training-llamas/configs/fp16.yaml b/examples/training-llamas/configs/fp16.yaml
deleted file mode 100644
index 432d986f..00000000
--- a/examples/training-llamas/configs/fp16.yaml
+++ /dev/null
@@ -1,6 +0,0 @@
-defaults:
-  - _base_
-  - _self_
-  - override launcher: process
-
-experiment_name: fp16
diff --git a/examples/training-llamas/report.py b/examples/training-llamas/report.py
deleted file mode 100644
index 39220499..00000000
--- a/examples/training-llamas/report.py
+++ /dev/null
@@ -1,242 +0,0 @@
-from argparse import ArgumentParser
-from pathlib import Path
-from typing import List
-
-import matplotlib.pyplot as plt
-import numpy as np
-import pandas as pd
-from flatten_dict import flatten
-from omegaconf import OmegaConf
-from pandas import DataFrame
-
-
-def gather_full_report(root_folders: List[Path], report_folder: str = "artifacts") -> DataFrame:
-    # key is path to inference file as string, value is dataframe
-
-    hydra_dfs = {}
-    config_dfs = {}
-    inference_dfs = {}
-
-    for root_folder in root_folders:
-        inference_dfs.update(
-            {f.parent.absolute().as_posix(): pd.read_csv(f) for f in root_folder.glob("**/training_results.csv")}
-        )
-        config_dfs.update(
-            {
-                f.parent.absolute()
-                .as_posix(): pd.DataFrame.from_dict(flatten(OmegaConf.load(f), reducer="dot"), orient="index")
-                .T
-                for f in root_folder.glob("**/hydra_config.yaml")
-                if f.parent.absolute().as_posix() in inference_dfs.keys()
-            }
-        )
-        hydra_dfs.update(
-            {
-                f.parent.parent.absolute()
-                .as_posix(): pd.DataFrame.from_dict(
-                    flatten(
-                        OmegaConf.to_container(OmegaConf.load(f), resolve=False),
-                        reducer="dot",
-                    ),
-                    orient="index",
-                )
-                .T
-                for f in root_folder.glob("**/.hydra/hydra.yaml")
-                if f.parent.parent.absolute().as_posix() in inference_dfs.keys()
-            }
-        )
-
-    if len(inference_dfs) == 0 or len(config_dfs) == 0:
-        raise ValueError(f"No results found in {root_folder}")
-
-    # Merge inference and config dataframes
-    inference_reports = [
-        config_dfs[name]
-        .merge(inference_dfs[name], left_index=True, right_index=True)
-        .merge(hydra_dfs[name], left_index=True, right_index=True)
-        for name in inference_dfs.keys()
-    ]
-
-    # Concatenate all reports
-    inference_report = pd.concat(inference_reports, axis=0, ignore_index=True)
-    inference_report.to_csv(f"{report_folder}/full_report.csv")
-
-    return inference_report
-
-
-def get_short_report(full_report, report_folder: str = "artifacts"):
-    short_columns = {
-        "model": "Model",
-        "environment.gpus": "GPUs",
-        "experiment_name": "Experiment Name",
-        "launcher.name": "Launcher",
-        "launcher.nproc_per_node": "Processes per Node",
-        "benchmark.dataset_shapes.sequence_length": "Sequence Length",
-        "benchmark.training_arguments.per_device_train_batch_size": "Per Process Batch Size",
-        #
-        "training.throughput(samples/s)": "Training Throughput (samples/s)",
-    }
-    short_report = full_report[list(short_columns.keys())].rename(columns=short_columns)
-
-    short_report["GPU Name"] = short_report["GPUs"].str[0]
-    short_report["Num Processes"] = short_report[["Launcher", "Processes per Node"]].apply(
-        lambda x: x["Processes per Node"] if x["Launcher"] == "torchrun" else 1,
-        axis=1,
-    )
-
-    short_report["GPU Name"].replace("NVIDIA A100-SXM4-80GB", "1xA100", inplace=True)
-    short_report["GPU Name"].replace("AMD INSTINCT MI250 (MCM) OAM AC MBA", "1xMI250", inplace=True)
-    short_report["GPU Name"] = short_report[["GPU Name", "Num Processes"]].apply(
-        lambda x: "1xGCD-MI250" if x["GPU Name"] == "1xMI250" and x["Num Processes"] == 1 else x["GPU Name"],
-        axis=1,
-    )
-    short_report["Effective Batch Size"] = short_report["Per Process Batch Size"] * short_report["Num Processes"]
-    short_report["Group"] = short_report["GPU Name"] + "-" + short_report["Experiment Name"]
-    short_report.to_csv(f"{report_folder}/short_report.csv")
-
-    return short_report
-
-
-def get_batch_plots(short_report, report_folder, plot="bar"):
-    fig1, ax1 = plt.subplots()
-
-    batch_column = "Effective Batch Size"
-    short_report = short_report.sort_values(by="Group", ascending=True)
-    groups = short_report["Group"].unique().tolist()
-    x = np.arange(
-        short_report[batch_column].min() - 1,
-        len(short_report[batch_column].unique()) + (short_report[batch_column].min() - 1),
-    )
-    width = 0.8 / len(short_report["Group"].unique().tolist())
-    offset = -(width * (len(groups) - 1) / 2)
-
-    for group in groups:
-        mask = short_report["Group"] == group
-        group_report = short_report[mask].sort_values(by=batch_column)
-        x_ = np.arange(
-            group_report[batch_column].min() - 1,
-            len(group_report[batch_column].unique()) + (group_report[batch_column].min() - 1),
-        )
-        if plot == "bar":
-            ax1.bar(
-                x_ + offset,
-                group_report["Training Throughput (samples/s)"],
-                label=group,
-                width=width,
-            )
-            offset += width
-        elif plot == "line":
-            ax1.plot(
-                x_,
-                group_report["Training Throughput (samples/s)"],
-                label=group,
-                marker="o",
-            )
-
-    ax1.set_xticks(x)
-    ax1.set_ylim(bottom=0)
-    ax1.set_xticklabels(short_report[batch_column].sort_values().unique().tolist())
-    ax1.set_xlabel(batch_column)
-    ax1.set_ylabel("Training Throughput (samples/s)")
-    ax1.set_title(f"Training Throughput per Batch Size ({short_report['Model'].unique()[0]})")
-    ax1.legend(fancybox=True, shadow=True)
-
-    legend = plt.legend(loc="upper center")
-    legend.get_frame().set_facecolor((0, 0, 1, 0.1))
-    legend.get_frame().set_alpha(None)
-    plt.tight_layout()
-
-    fig1.savefig(f"{report_folder}/training_throughput_{plot}_plot.png")
-
-    return fig1
-
-
-def get_peak_trainong_throughput_plot(short_report, report_folder):
-    # a bar plot with one bar per group, representing the max attainable throughput in tokens/s
-    fig, ax = plt.subplots()
-
-    max_training_throughput = short_report.groupby("Group")["Training Throughput (samples/s)"].max().reset_index()
-    max_training_throughput = (
-        short_report.merge(max_training_throughput, on=["Group", "Training Throughput (samples/s)"])
-        .sort_values(by="Training Throughput (samples/s)", ascending=True)
-        .reset_index()
-    )
-
-    ax.bar(
-        max_training_throughput["Group"],
-        max_training_throughput["Training Throughput (samples/s)"],
-        color=plt.cm.Paired(np.arange(len(max_training_throughput))),
-    )
-
-    for i, v in enumerate(max_training_throughput["Effective Batch Size"]):
-        ax.text(
-            i,
-            max_training_throughput["Training Throughput (samples/s)"].iloc[i],
-            f"bs={v}",
-            ha="center",
-            va="bottom",
-        )
-
-    ax.set_xlabel("Group")
-    ax.set_ylabel("Peak Training Throughput (samples/s)")
-    ax.set_title(f"Peak Training Throughput ({short_report['Model'].unique()[0]})")
-    ax.set_ylim(top=max_training_throughput["Training Throughput (samples/s)"].max() * 1.1)
-
-    plt.xticks(rotation=45, ha="right")
-    plt.tight_layout()
-
-    fig.savefig(f"{report_folder}/peak_training_throughput.png")
-
-    return fig
-
-
-def generate_report():
-    parser = ArgumentParser()
-    parser.add_argument(
-        "--experiments-folders",
-        "-e",
-        type=Path,
-        nargs="+",
-        required=True,
-        help="The folder containing the results of experiments.",
-    )
-    parser.add_argument(
-        "--report-name",
-        "-r",
-        type=str,
-        required=False,
-        default="artifacts",
-        help="The name of the report.",
-    )
-
-    args = parser.parse_args()
-    report_folder = args.report_name
-    experiments_folders = args.experiments_folders
-
-    Path(report_folder).mkdir(parents=True, exist_ok=True)
-
-    # gather experiments results
-    full_report = gather_full_report(
-        root_folders=experiments_folders,
-        report_folder=report_folder,
-    )
-    short_report = get_short_report(
-        full_report,
-        report_folder=report_folder,
-    )
-    for plot in ["bar", "line"]:
-        _ = get_batch_plots(
-            short_report,
-            report_folder,
-            plot=plot,
-        )
-
-    _ = get_peak_trainong_throughput_plot(
-        short_report,
-        report_folder,
-    )
-    print("Report generated successfully!")
-
-
-if __name__ == "__main__":
-    generate_report()
diff --git a/examples/whisper/README.md b/examples/whisper/README.md
deleted file mode 100644
index 8adc3fd2..00000000
--- a/examples/whisper/README.md
+++ /dev/null
@@ -1,72 +0,0 @@
-# Optimum-Benchmark x Whisper
-
-A set of benchmarks on OpenAI's Whisper model, using Optimum-Benchmark.
-
-With Optimum-Benchmark, once you clone the repo and install it, run:
-
-```bash
-sh benchmark.sh ${device}
-sh report.sh ${device}
-```
-
-Where `${device}` is either `cpu` or `cuda`.
-
-## Metrics
-
-For this benchmark I tried to compare `whisper-base` model's throughputs (forward and generate).
-
-Forward throughput is measured in `samples/second` with the formula `number_processed_samples / total_time`.
-Where `number_processed_samples = batch_size * number_forward_passes` is the number of samples processed by the model in `total_time`.
-
-Generate throughput is measured in `tokens/second` with the formula `number_generated_tokens / total_time`.
-Where `number_generated_tokens = batch_size * num_tokens * number_generate_passes` is the number of tokens generated by the model in `total_time`.
-
-## Search Space
-
-To be exhaustive, I benchmarked different auto optimization configurations supported by Optimum on GPU & CPU and auto quantization configurations on CPU only.
-
-I also added `benchmark.batch_size=64,128 benchmark.new_tokens=10,100` to compare behavior across different batch sizes and number of generated tokens.
-
-## GPU Results (NVIDIA A100)
-
-### Batch Size = 64, New Tokens = 10
-
-<div>
-  <img src="reports/cuda_64_10/rich_table.svg" style="width: 90%; display: inline-block;">
-</div>
-<div>
-  <img src="reports/cuda_64_10/forward_throughput.png" style="width: 45%; display: inline-block;">
-  <img src="reports/cuda_64_10/generate_throughput.png" style="width: 45%; display: inline-block">
-</div>
-
-### Batch Size = 64, New Tokens = 100
-
-<div>
-  <img src="reports/cuda_64_100/rich_table.svg" style="width: 90%; display: inline-block;">
-</div>
-<div>
-  <img src="reports/cuda_64_100/forward_throughput.png" style="width: 45%; display: inline-block;">
-  <img src="reports/cuda_64_100/generate_throughput.png" style="width: 45%; display: inline-block">
-</div>
-
-### Batch Size = 128, New Tokens = 10
-
-<div>
-  <img src="reports/cuda_128_10/rich_table.svg" style="width: 90%; display: inline-block;">
-</div>
-
-<div>
-  <img src="reports/cuda_128_10/forward_throughput.png" style="width: 45%; display: inline-block;">
-  <img src="reports/cuda_128_10/generate_throughput.png" style="width: 45%; display: inline-block">
-</div>
-
-### Batch Size = 128, New Tokens = 100
-
-<div>
-  <img src="reports/cuda_128_100/rich_table.svg" style="width: 90%; display: inline-block;">
-</div>
-
-<div>
-  <img src="reports/cuda_128_100/forward_throughput.png" style="width: 45%; display: inline-block;">
-  <img src="reports/cuda_128_100/generate_throughput.png" style="width: 45%; display: inline-block">
-</div>
diff --git a/examples/whisper/configs/whisper_auto_opt+qnt.yaml b/examples/whisper/configs/whisper_auto_opt+qnt.yaml
deleted file mode 100644
index 614e734e..00000000
--- a/examples/whisper/configs/whisper_auto_opt+qnt.yaml
+++ /dev/null
@@ -1,13 +0,0 @@
-defaults:
-  - whisper_baseline
-  - _self_
-  - override backend: onnxruntime
-
-hydra:
-  sweeper:
-    params:
-      backend.auto_optimization: O1,O2,O3,O4
-      backend.auto_quantization: arm64,avx2,avx512,avx512_vnni
-      backend.auto_quantization_config.per_channel: false # blocking decoder quantization
-
-experiment_name: whisper_auto_opt(${backend.auto_optimization})+auto_qnt(${backend.auto_quantization})
diff --git a/examples/whisper/configs/whisper_auto_opt.yaml b/examples/whisper/configs/whisper_auto_opt.yaml
deleted file mode 100644
index e3da38b1..00000000
--- a/examples/whisper/configs/whisper_auto_opt.yaml
+++ /dev/null
@@ -1,16 +0,0 @@
-defaults:
-  - whisper_baseline
-  - _self_
-  - override backend: onnxruntime
-
-hydra:
-  sweeper:
-    params:
-      backend.auto_optimization: null,O1,O2,O3,O4
-
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-
-backend:
-  no_weights: false
-  use_cache: true
-  use_merged: false
\ No newline at end of file
diff --git a/examples/whisper/configs/whisper_auto_qnt.yaml b/examples/whisper/configs/whisper_auto_qnt.yaml
deleted file mode 100644
index bfe447c9..00000000
--- a/examples/whisper/configs/whisper_auto_qnt.yaml
+++ /dev/null
@@ -1,12 +0,0 @@
-defaults:
-  - whisper_baseline
-  - _self_
-  - override backend: onnxruntime
-
-hydra:
-  sweeper:
-    params:
-      backend.auto_quantization: arm64,avx2,avx512,avx512_vnni
-      backend.auto_quantization_config.per_channel: false # blocking decoder quantization
-
-experiment_name: whisper_auto_qnt(${backend.auto_quantization})
diff --git a/examples/whisper/configs/whisper_baseline.yaml b/examples/whisper/configs/whisper_baseline.yaml
deleted file mode 100644
index dbfb5606..00000000
--- a/examples/whisper/configs/whisper_baseline.yaml
+++ /dev/null
@@ -1,29 +0,0 @@
-defaults:
-  - backend: pytorch # default backend
-  - benchmark: inference # default benchmark
-  - experiment # inheriting from experiment config
-  - _self_ # for hydra 1.1 compatibility
-  - override hydra/job_logging: colorlog # colorful logging
-  - override hydra/hydra_logging: colorlog # colorful logging
-
-# for whisper experiments I would like to separate them based
-# on device + backend + batch size + new tokens
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  job:
-    chdir: true # to change the working directory during the run/sweep directory
-  sweeper:
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-
-experiment_name: whisper_baseline
-model: openai/whisper-base
-
-backend:
-  no_weights: false
-  initial_isolation_check: false
-  continous_isolation_check: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/config.yaml
deleted file mode 100644
index bc53e9dd..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: null
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/hydra.yaml
deleted file mode 100644
index 735d6ff2..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=null
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=null,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=10,device=cuda\:1
-    id: '5'
-    num: 5
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_10/whisper_auto_opt(None)/5
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/overrides.yaml
deleted file mode 100644
index 674a028b..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=null
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/hydra_config.yaml
deleted file mode 100644
index 2b3b39a0..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: null
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(None)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/inference_results.csv
deleted file mode 100644
index f882c464..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(None)/5/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.655,195.0,0.696,1840.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/config.yaml
deleted file mode 100644
index a7997175..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O1
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/hydra.yaml
deleted file mode 100644
index b210edeb..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=O1
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O1,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=10,device=cuda\:1
-    id: '6'
-    num: 6
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_10/whisper_auto_opt(O1)/6
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/overrides.yaml
deleted file mode 100644
index f7b480cf..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=O1
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/hydra_config.yaml
deleted file mode 100644
index 379f39e6..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O1
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(O1)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/inference_results.csv
deleted file mode 100644
index a3e0ccea..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O1)/6/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.656,195.0,0.7,1830.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/config.yaml
deleted file mode 100644
index b4121189..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O2
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/hydra.yaml
deleted file mode 100644
index a587623c..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=O2
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O2,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=10,device=cuda\:1
-    id: '7'
-    num: 7
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_10/whisper_auto_opt(O2)/7
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/overrides.yaml
deleted file mode 100644
index 7cda9ff6..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=O2
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/hydra_config.yaml
deleted file mode 100644
index ce13e5b6..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O2
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(O2)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/inference_results.csv
deleted file mode 100644
index a9089161..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O2)/7/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.343,373.0,0.384,3330.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/config.yaml
deleted file mode 100644
index d23f77c8..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O3
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/hydra.yaml
deleted file mode 100644
index 05534707..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=O3
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O3,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=10,device=cuda\:1
-    id: '8'
-    num: 8
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_10/whisper_auto_opt(O3)/8
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/overrides.yaml
deleted file mode 100644
index 77aec7a3..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=O3
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/hydra_config.yaml
deleted file mode 100644
index e393f1e0..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O3
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(O3)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/inference_results.csv
deleted file mode 100644
index b7893057..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O3)/8/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.338,379.0,0.378,3390.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/config.yaml
deleted file mode 100644
index b3adf76b..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O4
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/hydra.yaml
deleted file mode 100644
index 3ccab146..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=O4
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O4,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=10,device=cuda\:1
-    id: '9'
-    num: 9
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_10/whisper_auto_opt(O4)/9
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/overrides.yaml
deleted file mode 100644
index 2187c855..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=O4
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/hydra_config.yaml
deleted file mode 100644
index da439386..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O4
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(O4)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/inference_results.csv
deleted file mode 100644
index a485ad31..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_10/whisper_auto_opt(O4)/9/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.133,962.0,0.209,6120.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/config.yaml
deleted file mode 100644
index ef40f58e..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: null
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/hydra.yaml
deleted file mode 100644
index 5d8d8e81..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=null
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=null,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=100,device=cuda\:1
-    id: '15'
-    num: 15
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_100/whisper_auto_opt(None)/15
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/overrides.yaml
deleted file mode 100644
index 0c7954e5..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=null
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/hydra_config.yaml
deleted file mode 100644
index 36667af5..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: null
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(None)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/inference_results.csv
deleted file mode 100644
index 8298cbc1..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(None)/15/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.655,195.0,1.3,9850.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/config.yaml
deleted file mode 100644
index e14dd026..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O1
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/hydra.yaml
deleted file mode 100644
index a71c9a31..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=O1
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O1,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=100,device=cuda\:1
-    id: '16'
-    num: 16
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_100/whisper_auto_opt(O1)/16
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/overrides.yaml
deleted file mode 100644
index ff8539d2..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=O1
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/hydra_config.yaml
deleted file mode 100644
index 5d62e515..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O1
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(O1)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/inference_results.csv
deleted file mode 100644
index c260de79..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O1)/16/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.657,195.0,1.29,9920.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/config.yaml
deleted file mode 100644
index 23bf174c..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O2
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/hydra.yaml
deleted file mode 100644
index 189ef951..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=O2
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O2,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=100,device=cuda\:1
-    id: '17'
-    num: 17
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_100/whisper_auto_opt(O2)/17
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/overrides.yaml
deleted file mode 100644
index b907d194..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=O2
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/hydra_config.yaml
deleted file mode 100644
index a016c199..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O2
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(O2)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/inference_results.csv
deleted file mode 100644
index ef286a15..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O2)/17/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.344,372.0,0.961,13300.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/config.yaml
deleted file mode 100644
index 15156ba3..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O3
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/hydra.yaml
deleted file mode 100644
index 0aad17e0..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=O3
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O3,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=100,device=cuda\:1
-    id: '18'
-    num: 18
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_100/whisper_auto_opt(O3)/18
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/overrides.yaml
deleted file mode 100644
index 2698a733..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=O3
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/hydra_config.yaml
deleted file mode 100644
index fde6745e..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O3
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(O3)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/inference_results.csv
deleted file mode 100644
index d4ea576c..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O3)/18/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.338,379.0,0.959,13300.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/config.yaml
deleted file mode 100644
index 6662c5b8..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O4
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/hydra.yaml
deleted file mode 100644
index 01fdc713..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=128
-    - backend.auto_optimization=O4
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O4,benchmark.input_shapes.batch_size=128,benchmark.new_tokens=100,device=cuda\:1
-    id: '19'
-    num: 19
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_128_100/whisper_auto_opt(O4)/19
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/overrides.yaml
deleted file mode 100644
index 88c44fa3..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=128
-- backend.auto_optimization=O4
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/hydra_config.yaml
deleted file mode 100644
index 2cf2c43e..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O4
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(O4)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/inference_results.csv
deleted file mode 100644
index aa15d519..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_128_100/whisper_auto_opt(O4)/19/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.133,962.0,1.04,12300.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/config.yaml
deleted file mode 100644
index ca0f6233..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: null
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/hydra.yaml
deleted file mode 100644
index 2330730d..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=null
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=null,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=10,device=cuda\:1
-    id: '0'
-    num: 0
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_10/whisper_auto_opt(None)/0
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/overrides.yaml
deleted file mode 100644
index 36d158bf..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=null
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/hydra_config.yaml
deleted file mode 100644
index 2180e94b..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: null
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(None)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/inference_results.csv
deleted file mode 100644
index b3d26ba0..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(None)/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.325,197.0,0.359,1780.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/config.yaml
deleted file mode 100644
index 9b99b8a7..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O1
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/hydra.yaml
deleted file mode 100644
index 82f48574..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=O1
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O1,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=10,device=cuda\:1
-    id: '1'
-    num: 1
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_10/whisper_auto_opt(O1)/1
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/overrides.yaml
deleted file mode 100644
index 0fec0b72..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=O1
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/hydra_config.yaml
deleted file mode 100644
index 167e904b..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O1
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(O1)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/inference_results.csv
deleted file mode 100644
index f35e5774..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O1)/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.325,197.0,0.362,1770.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/config.yaml
deleted file mode 100644
index ea8da583..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O2
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/hydra.yaml
deleted file mode 100644
index 8b2a3ef1..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=O2
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O2,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=10,device=cuda\:1
-    id: '2'
-    num: 2
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_10/whisper_auto_opt(O2)/2
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/overrides.yaml
deleted file mode 100644
index 254f2807..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=O2
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/hydra_config.yaml
deleted file mode 100644
index 3bfd6858..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O2
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(O2)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/inference_results.csv
deleted file mode 100644
index 83b7c49a..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O2)/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.171,374.0,0.203,3150.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/config.yaml
deleted file mode 100644
index 115e66c3..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O3
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/hydra.yaml
deleted file mode 100644
index 28f3f1af..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=O3
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O3,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=10,device=cuda\:1
-    id: '3'
-    num: 3
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_10/whisper_auto_opt(O3)/3
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/overrides.yaml
deleted file mode 100644
index 2a84d5af..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=O3
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/hydra_config.yaml
deleted file mode 100644
index 8e581058..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O3
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(O3)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/inference_results.csv
deleted file mode 100644
index e2041dcd..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O3)/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.169,379.0,0.2,3200.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/config.yaml
deleted file mode 100644
index 59d5cad1..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O4
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/hydra.yaml
deleted file mode 100644
index 231ae6c0..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=O4
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O4,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=10,device=cuda\:1
-    id: '4'
-    num: 4
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_10/whisper_auto_opt(O4)/4
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/overrides.yaml
deleted file mode 100644
index a5dbc9cb..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=O4
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/hydra_config.yaml
deleted file mode 100644
index 964686aa..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O4
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_auto_opt(O4)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/inference_results.csv
deleted file mode 100644
index 05dd1385..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_10/whisper_auto_opt(O4)/4/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.0668,958.0,0.116,5520.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/config.yaml
deleted file mode 100644
index f951b3db..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: null
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/hydra.yaml
deleted file mode 100644
index 794cedd2..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=null
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=null,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=100,device=cuda\:1
-    id: '10'
-    num: 10
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_100/whisper_auto_opt(None)/10
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/overrides.yaml
deleted file mode 100644
index aeedf8a5..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=null
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/hydra_config.yaml
deleted file mode 100644
index 2ab3377b..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: null
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(None)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/inference_results.csv
deleted file mode 100644
index 0b435dae..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(None)/10/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.325,197.0,0.796,8040.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/config.yaml
deleted file mode 100644
index 2367ab85..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O1
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/hydra.yaml
deleted file mode 100644
index efe66ce2..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=O1
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O1,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=100,device=cuda\:1
-    id: '11'
-    num: 11
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_100/whisper_auto_opt(O1)/11
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/overrides.yaml
deleted file mode 100644
index ffacc743..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=O1
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/hydra_config.yaml
deleted file mode 100644
index 53e6489e..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O1
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(O1)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/inference_results.csv
deleted file mode 100644
index c85e57bd..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O1)/11/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.325,197.0,0.791,8090.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/config.yaml
deleted file mode 100644
index 1420fa94..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O2
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/hydra.yaml
deleted file mode 100644
index 0a511123..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=O2
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O2,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=100,device=cuda\:1
-    id: '12'
-    num: 12
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_100/whisper_auto_opt(O2)/12
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/overrides.yaml
deleted file mode 100644
index 40bc5479..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=O2
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/hydra_config.yaml
deleted file mode 100644
index d8cc8673..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O2
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(O2)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/inference_results.csv
deleted file mode 100644
index c234c739..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O2)/12/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.172,372.0,0.622,10300.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/config.yaml
deleted file mode 100644
index 853d4167..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O3
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/hydra.yaml
deleted file mode 100644
index eace09c3..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=O3
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O3,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=100,device=cuda\:1
-    id: '13'
-    num: 13
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_100/whisper_auto_opt(O3)/13
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/overrides.yaml
deleted file mode 100644
index 6267be90..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=O3
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/hydra_config.yaml
deleted file mode 100644
index 3098e267..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O3
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(O3)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/inference_results.csv
deleted file mode 100644
index 7c50c820..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O3)/13/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.169,379.0,0.621,10300.0
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/config.yaml
deleted file mode 100644
index 1aadfd30..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/config.yaml
+++ /dev/null
@@ -1,110 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: ${infer_provider:${device}}
-  device_id: ${infer_device_id:${device}}
-  use_io_binding: ${is_gpu:${device}}
-  enable_profiling: ${is_profiling:${benchmark.name}}
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: ${is_gpu:${device}}
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O4
-  auto_optimization_config:
-    for_gpu: ${is_gpu:${device}}
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: ${requires_calibration:${backend.auto_quantization_config.is_static},
-    ${backend.quantization_config.is_static}}
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(${backend.auto_optimization})
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/hydra.yaml
deleted file mode 100644
index 3ae446cc..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/hydra.yaml
+++ /dev/null
@@ -1,177 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-      backend.auto_optimization: null,O1,O2,O3,O4
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=64
-    - backend.auto_optimization=O4
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: backend.auto_optimization=O4,benchmark.input_shapes.batch_size=64,benchmark.new_tokens=100,device=cuda\:1
-    id: '14'
-    num: 14
-    config_name: whisper_auto_opt
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_onnxruntime_64_100/whisper_auto_opt(O4)/14
-    choices:
-      benchmark: inference
-      backend: onnxruntime
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/overrides.yaml
deleted file mode 100644
index dafdebbc..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/.hydra/overrides.yaml
+++ /dev/null
@@ -1,4 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=64
-- backend.auto_optimization=O4
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/hydra_config.yaml b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/hydra_config.yaml
deleted file mode 100644
index 21fd8d41..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/hydra_config.yaml
+++ /dev/null
@@ -1,109 +0,0 @@
-backend:
-  name: onnxruntime
-  version: 1.15.1
-  _target_: optimum_benchmark.backends.onnxruntime.ORTBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  export: true
-  no_weights: false
-  use_merged: false
-  use_cache: true
-  torch_dtype: null
-  provider: CUDAExecutionProvider
-  device_id: 1
-  use_io_binding: true
-  enable_profiling: false
-  optimization: false
-  optimization_config:
-    optimization_level: 1
-    optimize_for_gpu: true
-    fp16: false
-    enable_transformers_specific_optimizations: true
-    enable_gelu_approximation: false
-    disable_gelu_fusion: false
-    disable_layer_norm_fusion: false
-    disable_attention_fusion: false
-    disable_skip_layer_norm_fusion: true
-    disable_bias_skip_layer_norm_fusion: false
-    disable_bias_gelu_fusion: false
-    use_mask_index: false
-    no_attention_mask: false
-    disable_embed_layer_norm_fusion: true
-    disable_shape_inference: false
-    use_multi_head_attention: false
-    enable_gemm_fast_gelu_fusion: false
-    use_raw_attention_mask: false
-    disable_group_norm_fusion: true
-    disable_packed_kv: true
-  auto_optimization: O4
-  auto_optimization_config:
-    for_gpu: true
-  quantization: false
-  quantization_config:
-    is_static: false
-    format: QOperator
-    mode: IntegerOps
-    activations_dtype: QUInt8
-    activations_symmetric: false
-    weights_dtype: QInt8
-    weights_symmetric: true
-    per_channel: false
-    reduce_range: false
-    operators_to_quantize:
-    - MatMul
-    - Add
-  auto_quantization: null
-  auto_quantization_config:
-    is_static: false
-  calibration: false
-  calibration_config:
-    dataset_name: glue
-    num_samples: 300
-    dataset_config_name: sst2
-    dataset_split: train
-    preprocess_batch: true
-    preprocess_class: optimum_benchmark.preprocessors.glue.GluePreprocessor
-  use_ortmodel: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_auto_opt(O4)
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/inference_results.csv b/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/inference_results.csv
deleted file mode 100644
index edee3b53..00000000
--- a/examples/whisper/experiments/cuda_onnxruntime_64_100/whisper_auto_opt(O4)/14/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.0666,961.0,0.65,9850.0
diff --git a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/config.yaml b/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/config.yaml
deleted file mode 100644
index c5b06a83..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/config.yaml
+++ /dev/null
@@ -1,66 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1+cu117
-  _target_: optimum_benchmark.backends.pytorch.PyTorchBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  torch_dtype: null
-  load_in_8bit: false
-  load_in_4bit: false
-  bettertransformer: false
-  torch_compile: false
-  torch_compile_config:
-    fullgraph: false
-    dynamic: false
-    backend: inductor
-    mode: null
-    options: null
-    disable: false
-  amp_autocast: false
-  amp_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_baseline
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/hydra.yaml
deleted file mode 100644
index 1acaa16d..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=128
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=128,benchmark.new_tokens=10,device=cuda\:1
-    id: '1'
-    num: 1
-    config_name: whisper_baseline
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_pytorch_128_10/whisper_baseline/1
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/overrides.yaml
deleted file mode 100644
index 1af87e77..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/.hydra/overrides.yaml
+++ /dev/null
@@ -1,3 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=128
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/hydra_config.yaml b/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/hydra_config.yaml
deleted file mode 100644
index d069d6c4..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/hydra_config.yaml
+++ /dev/null
@@ -1,66 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1+cu117
-  _target_: optimum_benchmark.backends.pytorch.PyTorchBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  torch_dtype: null
-  load_in_8bit: false
-  load_in_4bit: false
-  bettertransformer: false
-  torch_compile: false
-  torch_compile_config:
-    fullgraph: false
-    dynamic: false
-    backend: inductor
-    mode: null
-    options: null
-    disable: false
-  amp_autocast: false
-  amp_dtype: null
-  disable_grad: true
-  eval_mode: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_baseline
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/inference_results.csv b/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/inference_results.csv
deleted file mode 100644
index 4d412b59..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_10/whisper_baseline/1/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.41,312.0,1.07,1200.0
diff --git a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/config.yaml b/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/config.yaml
deleted file mode 100644
index b9a983d0..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/config.yaml
+++ /dev/null
@@ -1,66 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1+cu117
-  _target_: optimum_benchmark.backends.pytorch.PyTorchBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  torch_dtype: null
-  load_in_8bit: false
-  load_in_4bit: false
-  bettertransformer: false
-  torch_compile: false
-  torch_compile_config:
-    fullgraph: false
-    dynamic: false
-    backend: inductor
-    mode: null
-    options: null
-    disable: false
-  amp_autocast: false
-  amp_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_baseline
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/hydra.yaml
deleted file mode 100644
index a62ef43a..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=128
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=128,benchmark.new_tokens=100,device=cuda\:1
-    id: '3'
-    num: 3
-    config_name: whisper_baseline
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_pytorch_128_100/whisper_baseline/3
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/overrides.yaml
deleted file mode 100644
index 8463a032..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/.hydra/overrides.yaml
+++ /dev/null
@@ -1,3 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=128
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/hydra_config.yaml b/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/hydra_config.yaml
deleted file mode 100644
index 6561339e..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/hydra_config.yaml
+++ /dev/null
@@ -1,66 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1+cu117
-  _target_: optimum_benchmark.backends.pytorch.PyTorchBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  torch_dtype: null
-  load_in_8bit: false
-  load_in_4bit: false
-  bettertransformer: false
-  torch_compile: false
-  torch_compile_config:
-    fullgraph: false
-    dynamic: false
-    backend: inductor
-    mode: null
-    options: null
-    disable: false
-  amp_autocast: false
-  amp_dtype: null
-  disable_grad: true
-  eval_mode: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 128
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_baseline
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/inference_results.csv b/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/inference_results.csv
deleted file mode 100644
index 190a3cbc..00000000
--- a/examples/whisper/experiments/cuda_pytorch_128_100/whisper_baseline/3/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.411,311.0,1.66,7710.0
diff --git a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/config.yaml b/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/config.yaml
deleted file mode 100644
index b0df60af..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/config.yaml
+++ /dev/null
@@ -1,66 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1+cu117
-  _target_: optimum_benchmark.backends.pytorch.PyTorchBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  torch_dtype: null
-  load_in_8bit: false
-  load_in_4bit: false
-  bettertransformer: false
-  torch_compile: false
-  torch_compile_config:
-    fullgraph: false
-    dynamic: false
-    backend: inductor
-    mode: null
-    options: null
-    disable: false
-  amp_autocast: false
-  amp_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_baseline
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/hydra.yaml
deleted file mode 100644
index 6e5db4cb..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=10
-    - benchmark.input_shapes.batch_size=64
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=64,benchmark.new_tokens=10,device=cuda\:1
-    id: '0'
-    num: 0
-    config_name: whisper_baseline
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_pytorch_64_10/whisper_baseline/0
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/overrides.yaml
deleted file mode 100644
index 458105c5..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/.hydra/overrides.yaml
+++ /dev/null
@@ -1,3 +0,0 @@
-- benchmark.new_tokens=10
-- benchmark.input_shapes.batch_size=64
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/hydra_config.yaml b/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/hydra_config.yaml
deleted file mode 100644
index eae87554..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/hydra_config.yaml
+++ /dev/null
@@ -1,66 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1+cu117
-  _target_: optimum_benchmark.backends.pytorch.PyTorchBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  torch_dtype: null
-  load_in_8bit: false
-  load_in_4bit: false
-  bettertransformer: false
-  torch_compile: false
-  torch_compile_config:
-    fullgraph: false
-    dynamic: false
-    backend: inductor
-    mode: null
-    options: null
-    disable: false
-  amp_autocast: false
-  amp_dtype: null
-  disable_grad: true
-  eval_mode: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 10
-experiment_name: whisper_baseline
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/inference_results.csv b/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/inference_results.csv
deleted file mode 100644
index 1de7caf5..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_10/whisper_baseline/0/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.102,627.0,0.549,1170.0
diff --git a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/config.yaml b/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/config.yaml
deleted file mode 100644
index 6c25cb74..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/config.yaml
+++ /dev/null
@@ -1,66 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1+cu117
-  _target_: optimum_benchmark.backends.pytorch.PyTorchBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  torch_dtype: null
-  load_in_8bit: false
-  load_in_4bit: false
-  bettertransformer: false
-  torch_compile: false
-  torch_compile_config:
-    fullgraph: false
-    dynamic: false
-    backend: inductor
-    mode: null
-    options: null
-    disable: false
-  amp_autocast: false
-  amp_dtype: null
-  disable_grad: ${is_inference:${benchmark.name}}
-  eval_mode: ${is_inference:${benchmark.name}}
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_baseline
-model: openai/whisper-base
-device: cuda:1
-task: ${infer_task:${model}, ${hub_kwargs.revision}}
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/hydra.yaml b/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/hydra.yaml
deleted file mode 100644
index e5d45fe7..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/hydra.yaml
+++ /dev/null
@@ -1,175 +0,0 @@
-hydra:
-  run:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-  sweep:
-    dir: experiments/${device}_${backend.name}_${benchmark.input_shapes.batch_size}_${benchmark.new_tokens}/${experiment_name}
-    subdir: ${hydra.job.num}
-  launcher:
-    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
-  sweeper:
-    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
-    max_batch_size: null
-    params:
-      benchmark.new_tokens: 10,100
-      benchmark.input_shapes.batch_size: 64,128
-  help:
-    app_name: ${hydra.job.name}
-    header: '${hydra.help.app_name} is powered by Hydra.
-
-      '
-    footer: 'Powered by Hydra (https://hydra.cc)
-
-      Use --hydra-help to view Hydra specific help
-
-      '
-    template: '${hydra.help.header}
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (group=option)
-
-
-      $APP_CONFIG_GROUPS
-
-
-      == Config ==
-
-      Override anything in the config (foo.bar=value)
-
-
-      $CONFIG
-
-
-      ${hydra.help.footer}
-
-      '
-  hydra_help:
-    template: 'Hydra (${hydra.runtime.version})
-
-      See https://hydra.cc for more info.
-
-
-      == Flags ==
-
-      $FLAGS_HELP
-
-
-      == Configuration groups ==
-
-      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
-      to command line)
-
-
-      $HYDRA_CONFIG_GROUPS
-
-
-      Use ''--cfg hydra'' to Show the Hydra config.
-
-      '
-    hydra_help: ???
-  hydra_logging:
-    version: 1
-    formatters:
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-    root:
-      level: INFO
-      handlers:
-      - console
-    disable_existing_loggers: false
-  job_logging:
-    version: 1
-    formatters:
-      simple:
-        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
-      colorlog:
-        (): colorlog.ColoredFormatter
-        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
-          - %(message)s'
-        log_colors:
-          DEBUG: purple
-          INFO: green
-          WARNING: yellow
-          ERROR: red
-          CRITICAL: red
-    handlers:
-      console:
-        class: logging.StreamHandler
-        formatter: colorlog
-        stream: ext://sys.stdout
-      file:
-        class: logging.FileHandler
-        formatter: simple
-        filename: ${hydra.job.name}.log
-    root:
-      level: INFO
-      handlers:
-      - console
-      - file
-    disable_existing_loggers: false
-  env: {}
-  mode: MULTIRUN
-  searchpath: []
-  callbacks: {}
-  output_subdir: .hydra
-  overrides:
-    hydra:
-    - hydra.mode=MULTIRUN
-    task:
-    - benchmark.new_tokens=100
-    - benchmark.input_shapes.batch_size=64
-    - device=cuda\:1
-  job:
-    name: main
-    chdir: true
-    override_dirname: benchmark.input_shapes.batch_size=64,benchmark.new_tokens=100,device=cuda\:1
-    id: '2'
-    num: 2
-    config_name: whisper_baseline
-    env_set: {}
-    env_copy: []
-    config:
-      override_dirname:
-        kv_sep: '='
-        item_sep: ','
-        exclude_keys: []
-  runtime:
-    version: 1.3.2
-    version_base: '1.3'
-    cwd: /home/ilyas/optimum-benchmark/examples/whisper
-    config_sources:
-    - path: hydra.conf
-      schema: pkg
-      provider: hydra
-    - path: optimum_benchmark
-      schema: pkg
-      provider: main
-    - path: hydra_plugins.hydra_colorlog.conf
-      schema: pkg
-      provider: hydra-colorlog
-    - path: /home/ilyas/optimum-benchmark/examples/whisper/configs
-      schema: file
-      provider: command-line
-    - path: ''
-      schema: structured
-      provider: schema
-    output_dir: /home/ilyas/optimum-benchmark/examples/whisper/experiments/cuda:1_pytorch_64_100/whisper_baseline/2
-    choices:
-      benchmark: inference
-      backend: pytorch
-      hydra/env: default
-      hydra/callbacks: null
-      hydra/job_logging: colorlog
-      hydra/hydra_logging: colorlog
-      hydra/hydra_help: default
-      hydra/help: default
-      hydra/sweeper: basic
-      hydra/launcher: basic
-      hydra/output: default
-  verbose: false
diff --git a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/overrides.yaml b/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/overrides.yaml
deleted file mode 100644
index c4bb64aa..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/.hydra/overrides.yaml
+++ /dev/null
@@ -1,3 +0,0 @@
-- benchmark.new_tokens=100
-- benchmark.input_shapes.batch_size=64
-- device=cuda\:1
diff --git a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/hydra_config.yaml b/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/hydra_config.yaml
deleted file mode 100644
index f3c7fe0f..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/hydra_config.yaml
+++ /dev/null
@@ -1,66 +0,0 @@
-backend:
-  name: pytorch
-  version: 2.0.1+cu117
-  _target_: optimum_benchmark.backends.pytorch.PyTorchBackend
-  inter_op_num_threads: null
-  intra_op_num_threads: null
-  initial_isolation_check: false
-  continous_isolation_check: false
-  delete_cache: false
-  no_weights: false
-  torch_dtype: null
-  load_in_8bit: false
-  load_in_4bit: false
-  bettertransformer: false
-  torch_compile: false
-  torch_compile_config:
-    fullgraph: false
-    dynamic: false
-    backend: inductor
-    mode: null
-    options: null
-    disable: false
-  amp_autocast: false
-  amp_dtype: null
-  disable_grad: true
-  eval_mode: true
-benchmark:
-  name: inference
-  _target_: optimum_benchmark.benchmarks.inference.InferenceBenchmark
-  seed: 42
-  memory: false
-  warmup_runs: 10
-  benchmark_duration: 10
-  input_shapes:
-    batch_size: 64
-    sequence_length: 16
-    num_choices: 1
-    width: 64
-    height: 64
-    num_channels: 3
-    point_batch_size: 3
-    nb_points_per_image: 2
-    feature_size: 80
-    nb_max_frames: 3000
-    audio_sequence_length: 16000
-  new_tokens: 100
-experiment_name: whisper_baseline
-model: openai/whisper-base
-device: cuda:1
-task: automatic-speech-recognition
-hub_kwargs:
-  revision: main
-  cache_dir: null
-  force_download: false
-  local_files_only: false
-  use_auth_token: false
-environment:
-  optimum_version: 1.11.1.dev0
-  transformers_version: 4.32.0.dev0
-  accelerate_version: 0.22.0.dev0
-  diffusers_version: 0.20.0.dev0
-  python_version: 3.9.17
-  system: Linux
-  cpu: ' AMD EPYC 7742 64-Core Processor'
-  cpu_count: 128
-  cpu_ram_mb: 515637
diff --git a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/inference_results.csv b/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/inference_results.csv
deleted file mode 100644
index 34f95b1d..00000000
--- a/examples/whisper/experiments/cuda_pytorch_64_100/whisper_baseline/2/inference_results.csv
+++ /dev/null
@@ -1,2 +0,0 @@
-,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s)
-0,0.0911,703.0,0.966,6630.0
diff --git a/examples/whisper/reports/cuda_128_10/forward_throughput.png b/examples/whisper/reports/cuda_128_10/forward_throughput.png
deleted file mode 100644
index b43723e7..00000000
Binary files a/examples/whisper/reports/cuda_128_10/forward_throughput.png and /dev/null differ
diff --git a/examples/whisper/reports/cuda_128_10/generate_throughput.png b/examples/whisper/reports/cuda_128_10/generate_throughput.png
deleted file mode 100644
index e4beebd1..00000000
Binary files a/examples/whisper/reports/cuda_128_10/generate_throughput.png and /dev/null differ
diff --git a/examples/whisper/reports/cuda_128_10/inference_report.csv b/examples/whisper/reports/cuda_128_10/inference_report.csv
deleted file mode 100644
index 00aff69d..00000000
--- a/examples/whisper/reports/cuda_128_10/inference_report.csv
+++ /dev/null
@@ -1,7 +0,0 @@
-experiment_name,backend.name,backend.version,backend._target_,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.initial_isolation_check,backend.continous_isolation_check,backend.delete_cache,backend.export,backend.no_weights,backend.use_merged,backend.use_cache,backend.torch_dtype,backend.provider,backend.device_id,backend.use_io_binding,backend.enable_profiling,backend.optimization,backend.optimization_config.optimization_level,backend.optimization_config.optimize_for_gpu,backend.optimization_config.fp16,backend.optimization_config.enable_transformers_specific_optimizations,backend.optimization_config.enable_gelu_approximation,backend.optimization_config.disable_gelu_fusion,backend.optimization_config.disable_layer_norm_fusion,backend.optimization_config.disable_attention_fusion,backend.optimization_config.disable_skip_layer_norm_fusion,backend.optimization_config.disable_bias_skip_layer_norm_fusion,backend.optimization_config.disable_bias_gelu_fusion,backend.optimization_config.use_mask_index,backend.optimization_config.no_attention_mask,backend.optimization_config.disable_embed_layer_norm_fusion,backend.optimization_config.disable_shape_inference,backend.optimization_config.use_multi_head_attention,backend.optimization_config.enable_gemm_fast_gelu_fusion,backend.optimization_config.use_raw_attention_mask,backend.optimization_config.disable_group_norm_fusion,backend.optimization_config.disable_packed_kv,backend.auto_optimization,backend.auto_optimization_config.for_gpu,backend.quantization,backend.quantization_config.is_static,backend.quantization_config.format,backend.quantization_config.mode,backend.quantization_config.activations_dtype,backend.quantization_config.activations_symmetric,backend.quantization_config.weights_dtype,backend.quantization_config.weights_symmetric,backend.quantization_config.per_channel,backend.quantization_config.reduce_range,backend.quantization_config.operators_to_quantize,backend.auto_quantization,backend.auto_quantization_config.is_static,backend.calibration,backend.calibration_config.dataset_name,backend.calibration_config.num_samples,backend.calibration_config.dataset_config_name,backend.calibration_config.dataset_split,backend.calibration_config.preprocess_batch,backend.calibration_config.preprocess_class,backend.use_ortmodel,benchmark.name,benchmark._target_,benchmark.seed,benchmark.memory,benchmark.warmup_runs,benchmark.benchmark_duration,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.width,benchmark.input_shapes.height,benchmark.input_shapes.num_channels,benchmark.input_shapes.point_batch_size,benchmark.input_shapes.nb_points_per_image,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,model,device,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,hub_kwargs.use_auth_token,environment.optimum_version,environment.transformers_version,environment.accelerate_version,environment.diffusers_version,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,Unnamed: 0,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s),backend.load_in_8bit,backend.load_in_4bit,backend.bettertransformer,backend.torch_compile,backend.torch_compile_config.fullgraph,backend.torch_compile_config.dynamic,backend.torch_compile_config.backend,backend.torch_compile_config.mode,backend.torch_compile_config.options,backend.torch_compile_config.disable,backend.amp_autocast,backend.amp_dtype,backend.disable_grad,backend.eval_mode,forward.speedup(%),generate.speedup(%)
-whisper_auto_opt(O4),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O4,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.133,962.0,0.209,6120.0,,,,,,,,,,,,,,,208.33333333333334,409.99999999999994
-whisper_auto_opt(O3),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O3,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.338,379.0,0.378,3390.0,,,,,,,,,,,,,,,21.474358974358964,182.50000000000003
-whisper_auto_opt(O2),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O2,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.343,373.0,0.384,3330.0,,,,,,,,,,,,,,,19.551282051282048,177.5
-whisper_auto_opt(None),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.655,195.0,0.696,1840.0,,,,,,,,,,,,,,,-37.5,53.33333333333334
-whisper_auto_opt(O1),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O1,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.656,195.0,0.7,1830.0,,,,,,,,,,,,,,,-37.5,52.49999999999999
-whisper_baseline,pytorch,2.0.1+cu117,optimum_benchmark.backends.pytorch.PyTorchBackend,,,False,False,False,,False,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.41,312.0,1.07,1200.0,False,False,False,False,False,False,inductor,,,False,False,,True,True,0.0,0.0
diff --git a/examples/whisper/reports/cuda_128_10/rich_table.svg b/examples/whisper/reports/cuda_128_10/rich_table.svg
deleted file mode 100644
index ed21a49c..00000000
--- a/examples/whisper/reports/cuda_128_10/rich_table.svg
+++ /dev/null
@@ -1,129 +0,0 @@
-<svg class="rich-terminal" viewBox="0 0 1824 489.2" xmlns="http://www.w3.org/2000/svg">
-    <!-- Generated with Rich https://www.textualize.io -->
-    <style>
-
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Regular"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Regular.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Regular.woff") format("woff");
-        font-style: normal;
-        font-weight: 400;
-    }
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Bold"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Bold.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Bold.woff") format("woff");
-        font-style: bold;
-        font-weight: 700;
-    }
-
-    .terminal-716779081-matrix {
-        font-family: Fira Code, monospace;
-        font-size: 20px;
-        line-height: 24.4px;
-        font-variant-east-asian: full-width;
-    }
-
-    .terminal-716779081-title {
-        font-size: 18px;
-        font-weight: bold;
-        font-family: arial;
-    }
-
-    .terminal-716779081-r1 { fill: #d9d9d9;font-style: italic; }
-.terminal-716779081-r2 { fill: #d9d9d9 }
-.terminal-716779081-r3 { fill: #d9d9d9;font-weight: bold }
-.terminal-716779081-r4 { fill: #fd971f }
-    </style>
-
-    <defs>
-    <clipPath id="terminal-716779081-clip-terminal">
-      <rect x="0" y="0" width="1804.6" height="438.2" />
-    </clipPath>
-    <clipPath id="terminal-716779081-line-0">
-    <rect x="0" y="1.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-1">
-    <rect x="0" y="25.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-2">
-    <rect x="0" y="50.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-3">
-    <rect x="0" y="74.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-4">
-    <rect x="0" y="99.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-5">
-    <rect x="0" y="123.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-6">
-    <rect x="0" y="147.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-7">
-    <rect x="0" y="172.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-8">
-    <rect x="0" y="196.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-9">
-    <rect x="0" y="221.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-10">
-    <rect x="0" y="245.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-11">
-    <rect x="0" y="269.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-12">
-    <rect x="0" y="294.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-13">
-    <rect x="0" y="318.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-14">
-    <rect x="0" y="343.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-15">
-    <rect x="0" y="367.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-716779081-line-16">
-    <rect x="0" y="391.9" width="1805.6" height="24.65"/>
-            </clipPath>
-    </defs>
-
-    <rect fill="#0c0c0c" stroke="rgba(255,255,255,0.35)" stroke-width="1" x="1" y="1" width="1822" height="487.2" rx="8"/><text class="terminal-716779081-title" fill="#d9d9d9" text-anchor="middle" x="911" y="27">Rich</text>
-            <g transform="translate(26,22)">
-            <circle cx="0" cy="0" r="7" fill="#ff5f57"/>
-            <circle cx="22" cy="0" r="7" fill="#febc2e"/>
-            <circle cx="44" cy="0" r="7" fill="#28c840"/>
-            </g>
-        
-    <g transform="translate(9, 41)" clip-path="url(#terminal-716779081-clip-terminal)">
-    
-    <g class="terminal-716779081-matrix">
-    <text class="terminal-716779081-r1" x="0" y="20" textLength="1805.6" clip-path="url(#terminal-716779081-line-0)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;cuda_128_10&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1805.6" y="20" textLength="12.2" clip-path="url(#terminal-716779081-line-0)">
-</text><text class="terminal-716779081-r2" x="0" y="44.4" textLength="1805.6" clip-path="url(#terminal-716779081-line-1)">┏━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓</text><text class="terminal-716779081-r2" x="1805.6" y="44.4" textLength="12.2" clip-path="url(#terminal-716779081-line-1)">
-</text><text class="terminal-716779081-r2" x="0" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="24.4" y="68.8" textLength="207.4" clip-path="url(#terminal-716779081-line-2)">Experiment&#160;Name&#160;&#160;</text><text class="terminal-716779081-r2" x="244" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="268.4" y="68.8" textLength="134.2" clip-path="url(#terminal-716779081-line-2)">backend&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="414.8" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="439.2" y="68.8" textLength="207.4" clip-path="url(#terminal-716779081-line-2)">backend&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="658.8" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="683.2" y="68.8" textLength="122" clip-path="url(#terminal-716779081-line-2)">forward&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="817.4" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="841.8" y="68.8" textLength="219.6" clip-path="url(#terminal-716779081-line-2)">forward&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1073.6" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="1098" y="68.8" textLength="122" clip-path="url(#terminal-716779081-line-2)">forward&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1232.2" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="1256.6" y="68.8" textLength="122" clip-path="url(#terminal-716779081-line-2)">generate&#160;&#160;</text><text class="terminal-716779081-r2" x="1390.8" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="1415.2" y="68.8" textLength="207.4" clip-path="url(#terminal-716779081-line-2)">generate&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1634.8" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r3" x="1659.2" y="68.8" textLength="122" clip-path="url(#terminal-716779081-line-2)">generate&#160;&#160;</text><text class="terminal-716779081-r2" x="1793.4" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">┃</text><text class="terminal-716779081-r2" x="1805.6" y="68.8" textLength="12.2" clip-path="url(#terminal-716779081-line-2)">
-</text><text class="terminal-716779081-r2" x="0" y="93.2" textLength="1805.6" clip-path="url(#terminal-716779081-line-3)">┡━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩</text><text class="terminal-716779081-r2" x="1805.6" y="93.2" textLength="12.2" clip-path="url(#terminal-716779081-line-3)">
-</text><text class="terminal-716779081-r2" x="0" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="244" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="268.4" y="117.6" textLength="134.2" clip-path="url(#terminal-716779081-line-4)">name&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="414.8" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="439.2" y="117.6" textLength="207.4" clip-path="url(#terminal-716779081-line-4)">auto_optimization</text><text class="terminal-716779081-r2" x="658.8" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="683.2" y="117.6" textLength="122" clip-path="url(#terminal-716779081-line-4)">latency(s)</text><text class="terminal-716779081-r2" x="817.4" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="841.8" y="117.6" textLength="219.6" clip-path="url(#terminal-716779081-line-4)">throughput(sample…</text><text class="terminal-716779081-r2" x="1073.6" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="1098" y="117.6" textLength="122" clip-path="url(#terminal-716779081-line-4)">speedup(%)</text><text class="terminal-716779081-r2" x="1232.2" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="1256.6" y="117.6" textLength="122" clip-path="url(#terminal-716779081-line-4)">latency(s)</text><text class="terminal-716779081-r2" x="1390.8" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="1415.2" y="117.6" textLength="207.4" clip-path="url(#terminal-716779081-line-4)">throughput(token…</text><text class="terminal-716779081-r2" x="1634.8" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="1659.2" y="117.6" textLength="122" clip-path="url(#terminal-716779081-line-4)">speedup(%)</text><text class="terminal-716779081-r2" x="1793.4" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">│</text><text class="terminal-716779081-r2" x="1805.6" y="117.6" textLength="12.2" clip-path="url(#terminal-716779081-line-4)">
-</text><text class="terminal-716779081-r2" x="0" y="142" textLength="1805.6" clip-path="url(#terminal-716779081-line-5)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-716779081-r2" x="1805.6" y="142" textLength="12.2" clip-path="url(#terminal-716779081-line-5)">
-</text><text class="terminal-716779081-r2" x="0" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="24.4" y="166.4" textLength="207.4" clip-path="url(#terminal-716779081-line-6)">whisper_auto_opt…</text><text class="terminal-716779081-r2" x="244" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="268.4" y="166.4" textLength="134.2" clip-path="url(#terminal-716779081-line-6)">onnxruntime</text><text class="terminal-716779081-r2" x="414.8" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="439.2" y="166.4" textLength="207.4" clip-path="url(#terminal-716779081-line-6)">O4&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="658.8" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="683.2" y="166.4" textLength="122" clip-path="url(#terminal-716779081-line-6)">1.33e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="817.4" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="841.8" y="166.4" textLength="219.6" clip-path="url(#terminal-716779081-line-6)">962.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1073.6" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="1098" y="166.4" textLength="122" clip-path="url(#terminal-716779081-line-6)">208.33&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1232.2" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="1256.6" y="166.4" textLength="122" clip-path="url(#terminal-716779081-line-6)">2.09e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="1390.8" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="1415.2" y="166.4" textLength="207.4" clip-path="url(#terminal-716779081-line-6)">6120.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1634.8" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="1659.2" y="166.4" textLength="122" clip-path="url(#terminal-716779081-line-6)">410.00&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1793.4" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">│</text><text class="terminal-716779081-r2" x="1805.6" y="166.4" textLength="12.2" clip-path="url(#terminal-716779081-line-6)">
-</text><text class="terminal-716779081-r2" x="0" y="190.8" textLength="1805.6" clip-path="url(#terminal-716779081-line-7)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-716779081-r2" x="1805.6" y="190.8" textLength="12.2" clip-path="url(#terminal-716779081-line-7)">
-</text><text class="terminal-716779081-r2" x="0" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="24.4" y="215.2" textLength="207.4" clip-path="url(#terminal-716779081-line-8)">whisper_auto_opt…</text><text class="terminal-716779081-r2" x="244" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="268.4" y="215.2" textLength="134.2" clip-path="url(#terminal-716779081-line-8)">onnxruntime</text><text class="terminal-716779081-r2" x="414.8" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="439.2" y="215.2" textLength="207.4" clip-path="url(#terminal-716779081-line-8)">O3&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="658.8" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="683.2" y="215.2" textLength="122" clip-path="url(#terminal-716779081-line-8)">3.38e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="817.4" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="841.8" y="215.2" textLength="219.6" clip-path="url(#terminal-716779081-line-8)">379.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1073.6" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="1098" y="215.2" textLength="122" clip-path="url(#terminal-716779081-line-8)">21.47&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1232.2" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="1256.6" y="215.2" textLength="122" clip-path="url(#terminal-716779081-line-8)">3.78e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="1390.8" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="1415.2" y="215.2" textLength="207.4" clip-path="url(#terminal-716779081-line-8)">3390.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1634.8" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="1659.2" y="215.2" textLength="122" clip-path="url(#terminal-716779081-line-8)">182.50&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1793.4" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">│</text><text class="terminal-716779081-r2" x="1805.6" y="215.2" textLength="12.2" clip-path="url(#terminal-716779081-line-8)">
-</text><text class="terminal-716779081-r2" x="0" y="239.6" textLength="1805.6" clip-path="url(#terminal-716779081-line-9)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-716779081-r2" x="1805.6" y="239.6" textLength="12.2" clip-path="url(#terminal-716779081-line-9)">
-</text><text class="terminal-716779081-r2" x="0" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="24.4" y="264" textLength="207.4" clip-path="url(#terminal-716779081-line-10)">whisper_auto_opt…</text><text class="terminal-716779081-r2" x="244" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="268.4" y="264" textLength="134.2" clip-path="url(#terminal-716779081-line-10)">onnxruntime</text><text class="terminal-716779081-r2" x="414.8" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="439.2" y="264" textLength="207.4" clip-path="url(#terminal-716779081-line-10)">O2&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="658.8" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="683.2" y="264" textLength="122" clip-path="url(#terminal-716779081-line-10)">3.43e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="817.4" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="841.8" y="264" textLength="219.6" clip-path="url(#terminal-716779081-line-10)">373.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1073.6" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="1098" y="264" textLength="122" clip-path="url(#terminal-716779081-line-10)">19.55&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1232.2" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="1256.6" y="264" textLength="122" clip-path="url(#terminal-716779081-line-10)">3.84e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="1390.8" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="1415.2" y="264" textLength="207.4" clip-path="url(#terminal-716779081-line-10)">3330.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1634.8" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="1659.2" y="264" textLength="122" clip-path="url(#terminal-716779081-line-10)">177.50&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1793.4" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">│</text><text class="terminal-716779081-r2" x="1805.6" y="264" textLength="12.2" clip-path="url(#terminal-716779081-line-10)">
-</text><text class="terminal-716779081-r2" x="0" y="288.4" textLength="1805.6" clip-path="url(#terminal-716779081-line-11)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-716779081-r2" x="1805.6" y="288.4" textLength="12.2" clip-path="url(#terminal-716779081-line-11)">
-</text><text class="terminal-716779081-r2" x="0" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="24.4" y="312.8" textLength="207.4" clip-path="url(#terminal-716779081-line-12)">whisper_auto_opt…</text><text class="terminal-716779081-r2" x="244" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="268.4" y="312.8" textLength="134.2" clip-path="url(#terminal-716779081-line-12)">onnxruntime</text><text class="terminal-716779081-r2" x="414.8" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="658.8" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="683.2" y="312.8" textLength="122" clip-path="url(#terminal-716779081-line-12)">6.55e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="817.4" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="841.8" y="312.8" textLength="219.6" clip-path="url(#terminal-716779081-line-12)">195.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1073.6" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="1098" y="312.8" textLength="122" clip-path="url(#terminal-716779081-line-12)">-37.50&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1232.2" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="1256.6" y="312.8" textLength="122" clip-path="url(#terminal-716779081-line-12)">6.96e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="1390.8" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="1415.2" y="312.8" textLength="207.4" clip-path="url(#terminal-716779081-line-12)">1840.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1634.8" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="1659.2" y="312.8" textLength="122" clip-path="url(#terminal-716779081-line-12)">53.33&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1793.4" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">│</text><text class="terminal-716779081-r2" x="1805.6" y="312.8" textLength="12.2" clip-path="url(#terminal-716779081-line-12)">
-</text><text class="terminal-716779081-r2" x="0" y="337.2" textLength="1805.6" clip-path="url(#terminal-716779081-line-13)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-716779081-r2" x="1805.6" y="337.2" textLength="12.2" clip-path="url(#terminal-716779081-line-13)">
-</text><text class="terminal-716779081-r2" x="0" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="24.4" y="361.6" textLength="207.4" clip-path="url(#terminal-716779081-line-14)">whisper_auto_opt…</text><text class="terminal-716779081-r2" x="244" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="268.4" y="361.6" textLength="134.2" clip-path="url(#terminal-716779081-line-14)">onnxruntime</text><text class="terminal-716779081-r2" x="414.8" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="439.2" y="361.6" textLength="207.4" clip-path="url(#terminal-716779081-line-14)">O1&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="658.8" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="683.2" y="361.6" textLength="122" clip-path="url(#terminal-716779081-line-14)">6.56e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="817.4" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="841.8" y="361.6" textLength="219.6" clip-path="url(#terminal-716779081-line-14)">195.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1073.6" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="1098" y="361.6" textLength="122" clip-path="url(#terminal-716779081-line-14)">-37.50&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1232.2" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="1256.6" y="361.6" textLength="122" clip-path="url(#terminal-716779081-line-14)">7.00e-01&#160;&#160;</text><text class="terminal-716779081-r2" x="1390.8" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="1415.2" y="361.6" textLength="207.4" clip-path="url(#terminal-716779081-line-14)">1830.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1634.8" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="1659.2" y="361.6" textLength="122" clip-path="url(#terminal-716779081-line-14)">52.50&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-716779081-r2" x="1793.4" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">│</text><text class="terminal-716779081-r2" x="1805.6" y="361.6" textLength="12.2" clip-path="url(#terminal-716779081-line-14)">
-</text><text class="terminal-716779081-r2" x="0" y="386" textLength="1805.6" clip-path="url(#terminal-716779081-line-15)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-716779081-r2" x="1805.6" y="386" textLength="12.2" clip-path="url(#terminal-716779081-line-15)">
-</text><text class="terminal-716779081-r2" x="0" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r4" x="24.4" y="410.4" textLength="195.2" clip-path="url(#terminal-716779081-line-16)">whisper_baseline</text><text class="terminal-716779081-r2" x="244" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r4" x="268.4" y="410.4" textLength="85.4" clip-path="url(#terminal-716779081-line-16)">pytorch</text><text class="terminal-716779081-r2" x="414.8" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r2" x="658.8" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r4" x="683.2" y="410.4" textLength="97.6" clip-path="url(#terminal-716779081-line-16)">4.10e-01</text><text class="terminal-716779081-r2" x="817.4" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r4" x="841.8" y="410.4" textLength="73.2" clip-path="url(#terminal-716779081-line-16)">312.00</text><text class="terminal-716779081-r2" x="1073.6" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r4" x="1098" y="410.4" textLength="36.6" clip-path="url(#terminal-716779081-line-16)">0.0</text><text class="terminal-716779081-r2" x="1232.2" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r4" x="1256.6" y="410.4" textLength="48.8" clip-path="url(#terminal-716779081-line-16)">1.07</text><text class="terminal-716779081-r2" x="1390.8" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r4" x="1415.2" y="410.4" textLength="85.4" clip-path="url(#terminal-716779081-line-16)">1200.00</text><text class="terminal-716779081-r2" x="1634.8" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r4" x="1659.2" y="410.4" textLength="36.6" clip-path="url(#terminal-716779081-line-16)">0.0</text><text class="terminal-716779081-r2" x="1793.4" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">│</text><text class="terminal-716779081-r2" x="1805.6" y="410.4" textLength="12.2" clip-path="url(#terminal-716779081-line-16)">
-</text><text class="terminal-716779081-r2" x="0" y="434.8" textLength="1805.6" clip-path="url(#terminal-716779081-line-17)">└───────────────────┴─────────────┴───────────────────┴────────────┴────────────────────┴────────────┴────────────┴───────────────────┴────────────┘</text><text class="terminal-716779081-r2" x="1805.6" y="434.8" textLength="12.2" clip-path="url(#terminal-716779081-line-17)">
-</text>
-    </g>
-    </g>
-</svg>
diff --git a/examples/whisper/reports/cuda_128_100/forward_throughput.png b/examples/whisper/reports/cuda_128_100/forward_throughput.png
deleted file mode 100644
index de97128f..00000000
Binary files a/examples/whisper/reports/cuda_128_100/forward_throughput.png and /dev/null differ
diff --git a/examples/whisper/reports/cuda_128_100/generate_throughput.png b/examples/whisper/reports/cuda_128_100/generate_throughput.png
deleted file mode 100644
index 172dd547..00000000
Binary files a/examples/whisper/reports/cuda_128_100/generate_throughput.png and /dev/null differ
diff --git a/examples/whisper/reports/cuda_128_100/inference_report.csv b/examples/whisper/reports/cuda_128_100/inference_report.csv
deleted file mode 100644
index 098cc4cf..00000000
--- a/examples/whisper/reports/cuda_128_100/inference_report.csv
+++ /dev/null
@@ -1,7 +0,0 @@
-experiment_name,backend.name,backend.version,backend._target_,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.initial_isolation_check,backend.continous_isolation_check,backend.delete_cache,backend.export,backend.no_weights,backend.use_merged,backend.use_cache,backend.torch_dtype,backend.provider,backend.device_id,backend.use_io_binding,backend.enable_profiling,backend.optimization,backend.optimization_config.optimization_level,backend.optimization_config.optimize_for_gpu,backend.optimization_config.fp16,backend.optimization_config.enable_transformers_specific_optimizations,backend.optimization_config.enable_gelu_approximation,backend.optimization_config.disable_gelu_fusion,backend.optimization_config.disable_layer_norm_fusion,backend.optimization_config.disable_attention_fusion,backend.optimization_config.disable_skip_layer_norm_fusion,backend.optimization_config.disable_bias_skip_layer_norm_fusion,backend.optimization_config.disable_bias_gelu_fusion,backend.optimization_config.use_mask_index,backend.optimization_config.no_attention_mask,backend.optimization_config.disable_embed_layer_norm_fusion,backend.optimization_config.disable_shape_inference,backend.optimization_config.use_multi_head_attention,backend.optimization_config.enable_gemm_fast_gelu_fusion,backend.optimization_config.use_raw_attention_mask,backend.optimization_config.disable_group_norm_fusion,backend.optimization_config.disable_packed_kv,backend.auto_optimization,backend.auto_optimization_config.for_gpu,backend.quantization,backend.quantization_config.is_static,backend.quantization_config.format,backend.quantization_config.mode,backend.quantization_config.activations_dtype,backend.quantization_config.activations_symmetric,backend.quantization_config.weights_dtype,backend.quantization_config.weights_symmetric,backend.quantization_config.per_channel,backend.quantization_config.reduce_range,backend.quantization_config.operators_to_quantize,backend.auto_quantization,backend.auto_quantization_config.is_static,backend.calibration,backend.calibration_config.dataset_name,backend.calibration_config.num_samples,backend.calibration_config.dataset_config_name,backend.calibration_config.dataset_split,backend.calibration_config.preprocess_batch,backend.calibration_config.preprocess_class,backend.use_ortmodel,benchmark.name,benchmark._target_,benchmark.seed,benchmark.memory,benchmark.warmup_runs,benchmark.benchmark_duration,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.width,benchmark.input_shapes.height,benchmark.input_shapes.num_channels,benchmark.input_shapes.point_batch_size,benchmark.input_shapes.nb_points_per_image,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,model,device,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,hub_kwargs.use_auth_token,environment.optimum_version,environment.transformers_version,environment.accelerate_version,environment.diffusers_version,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,Unnamed: 0,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s),backend.load_in_8bit,backend.load_in_4bit,backend.bettertransformer,backend.torch_compile,backend.torch_compile_config.fullgraph,backend.torch_compile_config.dynamic,backend.torch_compile_config.backend,backend.torch_compile_config.mode,backend.torch_compile_config.options,backend.torch_compile_config.disable,backend.amp_autocast,backend.amp_dtype,backend.disable_grad,backend.eval_mode,forward.speedup(%),generate.speedup(%)
-whisper_auto_opt(O4),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O4,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.133,962.0,1.04,12300.0,,,,,,,,,,,,,,,209.32475884244374,59.5330739299611
-whisper_auto_opt(O3),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O3,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.338,379.0,0.959,13300.0,,,,,,,,,,,,,,,21.86495176848875,72.50324254215306
-whisper_auto_opt(O2),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O2,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.344,372.0,0.961,13300.0,,,,,,,,,,,,,,,19.614147909967848,72.50324254215306
-whisper_auto_opt(None),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.655,195.0,1.3,9850.0,,,,,,,,,,,,,,,-37.29903536977493,27.75616083009078
-whisper_auto_opt(O1),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O1,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.657,195.0,1.29,9920.0,,,,,,,,,,,,,,,-37.29903536977493,28.664072632944237
-whisper_baseline,pytorch,2.0.1+cu117,optimum_benchmark.backends.pytorch.PyTorchBackend,,,False,False,False,,False,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,128,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.411,311.0,1.66,7710.0,False,False,False,False,False,False,inductor,,,False,False,,True,True,0.0,0.0
diff --git a/examples/whisper/reports/cuda_128_100/rich_table.svg b/examples/whisper/reports/cuda_128_100/rich_table.svg
deleted file mode 100644
index 1340e809..00000000
--- a/examples/whisper/reports/cuda_128_100/rich_table.svg
+++ /dev/null
@@ -1,129 +0,0 @@
-<svg class="rich-terminal" viewBox="0 0 1824 489.2" xmlns="http://www.w3.org/2000/svg">
-    <!-- Generated with Rich https://www.textualize.io -->
-    <style>
-
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Regular"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Regular.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Regular.woff") format("woff");
-        font-style: normal;
-        font-weight: 400;
-    }
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Bold"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Bold.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Bold.woff") format("woff");
-        font-style: bold;
-        font-weight: 700;
-    }
-
-    .terminal-1429941537-matrix {
-        font-family: Fira Code, monospace;
-        font-size: 20px;
-        line-height: 24.4px;
-        font-variant-east-asian: full-width;
-    }
-
-    .terminal-1429941537-title {
-        font-size: 18px;
-        font-weight: bold;
-        font-family: arial;
-    }
-
-    .terminal-1429941537-r1 { fill: #d9d9d9;font-style: italic; }
-.terminal-1429941537-r2 { fill: #d9d9d9 }
-.terminal-1429941537-r3 { fill: #d9d9d9;font-weight: bold }
-.terminal-1429941537-r4 { fill: #fd971f }
-    </style>
-
-    <defs>
-    <clipPath id="terminal-1429941537-clip-terminal">
-      <rect x="0" y="0" width="1804.6" height="438.2" />
-    </clipPath>
-    <clipPath id="terminal-1429941537-line-0">
-    <rect x="0" y="1.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-1">
-    <rect x="0" y="25.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-2">
-    <rect x="0" y="50.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-3">
-    <rect x="0" y="74.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-4">
-    <rect x="0" y="99.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-5">
-    <rect x="0" y="123.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-6">
-    <rect x="0" y="147.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-7">
-    <rect x="0" y="172.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-8">
-    <rect x="0" y="196.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-9">
-    <rect x="0" y="221.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-10">
-    <rect x="0" y="245.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-11">
-    <rect x="0" y="269.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-12">
-    <rect x="0" y="294.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-13">
-    <rect x="0" y="318.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-14">
-    <rect x="0" y="343.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-15">
-    <rect x="0" y="367.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1429941537-line-16">
-    <rect x="0" y="391.9" width="1805.6" height="24.65"/>
-            </clipPath>
-    </defs>
-
-    <rect fill="#0c0c0c" stroke="rgba(255,255,255,0.35)" stroke-width="1" x="1" y="1" width="1822" height="487.2" rx="8"/><text class="terminal-1429941537-title" fill="#d9d9d9" text-anchor="middle" x="911" y="27">Rich</text>
-            <g transform="translate(26,22)">
-            <circle cx="0" cy="0" r="7" fill="#ff5f57"/>
-            <circle cx="22" cy="0" r="7" fill="#febc2e"/>
-            <circle cx="44" cy="0" r="7" fill="#28c840"/>
-            </g>
-        
-    <g transform="translate(9, 41)" clip-path="url(#terminal-1429941537-clip-terminal)">
-    
-    <g class="terminal-1429941537-matrix">
-    <text class="terminal-1429941537-r1" x="0" y="20" textLength="1805.6" clip-path="url(#terminal-1429941537-line-0)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;cuda_128_100&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1805.6" y="20" textLength="12.2" clip-path="url(#terminal-1429941537-line-0)">
-</text><text class="terminal-1429941537-r2" x="0" y="44.4" textLength="1805.6" clip-path="url(#terminal-1429941537-line-1)">┏━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓</text><text class="terminal-1429941537-r2" x="1805.6" y="44.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-1)">
-</text><text class="terminal-1429941537-r2" x="0" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="24.4" y="68.8" textLength="207.4" clip-path="url(#terminal-1429941537-line-2)">Experiment&#160;Name&#160;&#160;</text><text class="terminal-1429941537-r2" x="244" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="268.4" y="68.8" textLength="134.2" clip-path="url(#terminal-1429941537-line-2)">backend&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="414.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="439.2" y="68.8" textLength="207.4" clip-path="url(#terminal-1429941537-line-2)">backend&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="658.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="683.2" y="68.8" textLength="122" clip-path="url(#terminal-1429941537-line-2)">forward&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="817.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="841.8" y="68.8" textLength="219.6" clip-path="url(#terminal-1429941537-line-2)">forward&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1073.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="1098" y="68.8" textLength="122" clip-path="url(#terminal-1429941537-line-2)">forward&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1232.2" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="1256.6" y="68.8" textLength="122" clip-path="url(#terminal-1429941537-line-2)">generate&#160;&#160;</text><text class="terminal-1429941537-r2" x="1390.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="1415.2" y="68.8" textLength="207.4" clip-path="url(#terminal-1429941537-line-2)">generate&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1634.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r3" x="1659.2" y="68.8" textLength="122" clip-path="url(#terminal-1429941537-line-2)">generate&#160;&#160;</text><text class="terminal-1429941537-r2" x="1793.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">┃</text><text class="terminal-1429941537-r2" x="1805.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-2)">
-</text><text class="terminal-1429941537-r2" x="0" y="93.2" textLength="1805.6" clip-path="url(#terminal-1429941537-line-3)">┡━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩</text><text class="terminal-1429941537-r2" x="1805.6" y="93.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-3)">
-</text><text class="terminal-1429941537-r2" x="0" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="244" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="268.4" y="117.6" textLength="134.2" clip-path="url(#terminal-1429941537-line-4)">name&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="414.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="439.2" y="117.6" textLength="207.4" clip-path="url(#terminal-1429941537-line-4)">auto_optimization</text><text class="terminal-1429941537-r2" x="658.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="683.2" y="117.6" textLength="122" clip-path="url(#terminal-1429941537-line-4)">latency(s)</text><text class="terminal-1429941537-r2" x="817.4" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="841.8" y="117.6" textLength="219.6" clip-path="url(#terminal-1429941537-line-4)">throughput(sample…</text><text class="terminal-1429941537-r2" x="1073.6" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="1098" y="117.6" textLength="122" clip-path="url(#terminal-1429941537-line-4)">speedup(%)</text><text class="terminal-1429941537-r2" x="1232.2" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="1256.6" y="117.6" textLength="122" clip-path="url(#terminal-1429941537-line-4)">latency(s)</text><text class="terminal-1429941537-r2" x="1390.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="1415.2" y="117.6" textLength="207.4" clip-path="url(#terminal-1429941537-line-4)">throughput(token…</text><text class="terminal-1429941537-r2" x="1634.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="1659.2" y="117.6" textLength="122" clip-path="url(#terminal-1429941537-line-4)">speedup(%)</text><text class="terminal-1429941537-r2" x="1793.4" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">│</text><text class="terminal-1429941537-r2" x="1805.6" y="117.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-4)">
-</text><text class="terminal-1429941537-r2" x="0" y="142" textLength="1805.6" clip-path="url(#terminal-1429941537-line-5)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1429941537-r2" x="1805.6" y="142" textLength="12.2" clip-path="url(#terminal-1429941537-line-5)">
-</text><text class="terminal-1429941537-r2" x="0" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="24.4" y="166.4" textLength="207.4" clip-path="url(#terminal-1429941537-line-6)">whisper_auto_opt…</text><text class="terminal-1429941537-r2" x="244" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="268.4" y="166.4" textLength="134.2" clip-path="url(#terminal-1429941537-line-6)">onnxruntime</text><text class="terminal-1429941537-r2" x="414.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="439.2" y="166.4" textLength="207.4" clip-path="url(#terminal-1429941537-line-6)">O4&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="658.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="683.2" y="166.4" textLength="122" clip-path="url(#terminal-1429941537-line-6)">1.33e-01&#160;&#160;</text><text class="terminal-1429941537-r2" x="817.4" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="841.8" y="166.4" textLength="219.6" clip-path="url(#terminal-1429941537-line-6)">962.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1073.6" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="1098" y="166.4" textLength="122" clip-path="url(#terminal-1429941537-line-6)">209.32&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1232.2" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="1256.6" y="166.4" textLength="122" clip-path="url(#terminal-1429941537-line-6)">1.04&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1390.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="1415.2" y="166.4" textLength="207.4" clip-path="url(#terminal-1429941537-line-6)">12300.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1634.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="1659.2" y="166.4" textLength="122" clip-path="url(#terminal-1429941537-line-6)">59.53&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1793.4" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">│</text><text class="terminal-1429941537-r2" x="1805.6" y="166.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-6)">
-</text><text class="terminal-1429941537-r2" x="0" y="190.8" textLength="1805.6" clip-path="url(#terminal-1429941537-line-7)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1429941537-r2" x="1805.6" y="190.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-7)">
-</text><text class="terminal-1429941537-r2" x="0" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="24.4" y="215.2" textLength="207.4" clip-path="url(#terminal-1429941537-line-8)">whisper_auto_opt…</text><text class="terminal-1429941537-r2" x="244" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="268.4" y="215.2" textLength="134.2" clip-path="url(#terminal-1429941537-line-8)">onnxruntime</text><text class="terminal-1429941537-r2" x="414.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="439.2" y="215.2" textLength="207.4" clip-path="url(#terminal-1429941537-line-8)">O3&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="658.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="683.2" y="215.2" textLength="122" clip-path="url(#terminal-1429941537-line-8)">3.38e-01&#160;&#160;</text><text class="terminal-1429941537-r2" x="817.4" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="841.8" y="215.2" textLength="219.6" clip-path="url(#terminal-1429941537-line-8)">379.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1073.6" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="1098" y="215.2" textLength="122" clip-path="url(#terminal-1429941537-line-8)">21.86&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1232.2" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="1256.6" y="215.2" textLength="122" clip-path="url(#terminal-1429941537-line-8)">9.59e-01&#160;&#160;</text><text class="terminal-1429941537-r2" x="1390.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="1415.2" y="215.2" textLength="207.4" clip-path="url(#terminal-1429941537-line-8)">13300.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1634.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="1659.2" y="215.2" textLength="122" clip-path="url(#terminal-1429941537-line-8)">72.50&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1793.4" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">│</text><text class="terminal-1429941537-r2" x="1805.6" y="215.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-8)">
-</text><text class="terminal-1429941537-r2" x="0" y="239.6" textLength="1805.6" clip-path="url(#terminal-1429941537-line-9)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1429941537-r2" x="1805.6" y="239.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-9)">
-</text><text class="terminal-1429941537-r2" x="0" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="24.4" y="264" textLength="207.4" clip-path="url(#terminal-1429941537-line-10)">whisper_auto_opt…</text><text class="terminal-1429941537-r2" x="244" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="268.4" y="264" textLength="134.2" clip-path="url(#terminal-1429941537-line-10)">onnxruntime</text><text class="terminal-1429941537-r2" x="414.8" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="439.2" y="264" textLength="207.4" clip-path="url(#terminal-1429941537-line-10)">O2&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="658.8" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="683.2" y="264" textLength="122" clip-path="url(#terminal-1429941537-line-10)">3.44e-01&#160;&#160;</text><text class="terminal-1429941537-r2" x="817.4" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="841.8" y="264" textLength="219.6" clip-path="url(#terminal-1429941537-line-10)">372.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1073.6" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="1098" y="264" textLength="122" clip-path="url(#terminal-1429941537-line-10)">19.61&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1232.2" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="1256.6" y="264" textLength="122" clip-path="url(#terminal-1429941537-line-10)">9.61e-01&#160;&#160;</text><text class="terminal-1429941537-r2" x="1390.8" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="1415.2" y="264" textLength="207.4" clip-path="url(#terminal-1429941537-line-10)">13300.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1634.8" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="1659.2" y="264" textLength="122" clip-path="url(#terminal-1429941537-line-10)">72.50&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1793.4" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">│</text><text class="terminal-1429941537-r2" x="1805.6" y="264" textLength="12.2" clip-path="url(#terminal-1429941537-line-10)">
-</text><text class="terminal-1429941537-r2" x="0" y="288.4" textLength="1805.6" clip-path="url(#terminal-1429941537-line-11)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1429941537-r2" x="1805.6" y="288.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-11)">
-</text><text class="terminal-1429941537-r2" x="0" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="24.4" y="312.8" textLength="207.4" clip-path="url(#terminal-1429941537-line-12)">whisper_auto_opt…</text><text class="terminal-1429941537-r2" x="244" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="268.4" y="312.8" textLength="134.2" clip-path="url(#terminal-1429941537-line-12)">onnxruntime</text><text class="terminal-1429941537-r2" x="414.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="658.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="683.2" y="312.8" textLength="122" clip-path="url(#terminal-1429941537-line-12)">6.55e-01&#160;&#160;</text><text class="terminal-1429941537-r2" x="817.4" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="841.8" y="312.8" textLength="219.6" clip-path="url(#terminal-1429941537-line-12)">195.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1073.6" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="1098" y="312.8" textLength="122" clip-path="url(#terminal-1429941537-line-12)">-37.30&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1232.2" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="1256.6" y="312.8" textLength="122" clip-path="url(#terminal-1429941537-line-12)">1.30&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1390.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="1415.2" y="312.8" textLength="207.4" clip-path="url(#terminal-1429941537-line-12)">9850.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1634.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="1659.2" y="312.8" textLength="122" clip-path="url(#terminal-1429941537-line-12)">27.76&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1793.4" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">│</text><text class="terminal-1429941537-r2" x="1805.6" y="312.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-12)">
-</text><text class="terminal-1429941537-r2" x="0" y="337.2" textLength="1805.6" clip-path="url(#terminal-1429941537-line-13)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1429941537-r2" x="1805.6" y="337.2" textLength="12.2" clip-path="url(#terminal-1429941537-line-13)">
-</text><text class="terminal-1429941537-r2" x="0" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="24.4" y="361.6" textLength="207.4" clip-path="url(#terminal-1429941537-line-14)">whisper_auto_opt…</text><text class="terminal-1429941537-r2" x="244" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="268.4" y="361.6" textLength="134.2" clip-path="url(#terminal-1429941537-line-14)">onnxruntime</text><text class="terminal-1429941537-r2" x="414.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="439.2" y="361.6" textLength="207.4" clip-path="url(#terminal-1429941537-line-14)">O1&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="658.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="683.2" y="361.6" textLength="122" clip-path="url(#terminal-1429941537-line-14)">6.57e-01&#160;&#160;</text><text class="terminal-1429941537-r2" x="817.4" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="841.8" y="361.6" textLength="219.6" clip-path="url(#terminal-1429941537-line-14)">195.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1073.6" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="1098" y="361.6" textLength="122" clip-path="url(#terminal-1429941537-line-14)">-37.30&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1232.2" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="1256.6" y="361.6" textLength="122" clip-path="url(#terminal-1429941537-line-14)">1.29&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1390.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="1415.2" y="361.6" textLength="207.4" clip-path="url(#terminal-1429941537-line-14)">9920.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1634.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="1659.2" y="361.6" textLength="122" clip-path="url(#terminal-1429941537-line-14)">28.66&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1429941537-r2" x="1793.4" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">│</text><text class="terminal-1429941537-r2" x="1805.6" y="361.6" textLength="12.2" clip-path="url(#terminal-1429941537-line-14)">
-</text><text class="terminal-1429941537-r2" x="0" y="386" textLength="1805.6" clip-path="url(#terminal-1429941537-line-15)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1429941537-r2" x="1805.6" y="386" textLength="12.2" clip-path="url(#terminal-1429941537-line-15)">
-</text><text class="terminal-1429941537-r2" x="0" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r4" x="24.4" y="410.4" textLength="195.2" clip-path="url(#terminal-1429941537-line-16)">whisper_baseline</text><text class="terminal-1429941537-r2" x="244" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r4" x="268.4" y="410.4" textLength="85.4" clip-path="url(#terminal-1429941537-line-16)">pytorch</text><text class="terminal-1429941537-r2" x="414.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r2" x="658.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r4" x="683.2" y="410.4" textLength="97.6" clip-path="url(#terminal-1429941537-line-16)">4.11e-01</text><text class="terminal-1429941537-r2" x="817.4" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r4" x="841.8" y="410.4" textLength="73.2" clip-path="url(#terminal-1429941537-line-16)">311.00</text><text class="terminal-1429941537-r2" x="1073.6" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r4" x="1098" y="410.4" textLength="36.6" clip-path="url(#terminal-1429941537-line-16)">0.0</text><text class="terminal-1429941537-r2" x="1232.2" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r4" x="1256.6" y="410.4" textLength="48.8" clip-path="url(#terminal-1429941537-line-16)">1.66</text><text class="terminal-1429941537-r2" x="1390.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r4" x="1415.2" y="410.4" textLength="85.4" clip-path="url(#terminal-1429941537-line-16)">7710.00</text><text class="terminal-1429941537-r2" x="1634.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r4" x="1659.2" y="410.4" textLength="36.6" clip-path="url(#terminal-1429941537-line-16)">0.0</text><text class="terminal-1429941537-r2" x="1793.4" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">│</text><text class="terminal-1429941537-r2" x="1805.6" y="410.4" textLength="12.2" clip-path="url(#terminal-1429941537-line-16)">
-</text><text class="terminal-1429941537-r2" x="0" y="434.8" textLength="1805.6" clip-path="url(#terminal-1429941537-line-17)">└───────────────────┴─────────────┴───────────────────┴────────────┴────────────────────┴────────────┴────────────┴───────────────────┴────────────┘</text><text class="terminal-1429941537-r2" x="1805.6" y="434.8" textLength="12.2" clip-path="url(#terminal-1429941537-line-17)">
-</text>
-    </g>
-    </g>
-</svg>
diff --git a/examples/whisper/reports/cuda_64_10/forward_throughput.png b/examples/whisper/reports/cuda_64_10/forward_throughput.png
deleted file mode 100644
index a3997653..00000000
Binary files a/examples/whisper/reports/cuda_64_10/forward_throughput.png and /dev/null differ
diff --git a/examples/whisper/reports/cuda_64_10/generate_throughput.png b/examples/whisper/reports/cuda_64_10/generate_throughput.png
deleted file mode 100644
index 59c796ad..00000000
Binary files a/examples/whisper/reports/cuda_64_10/generate_throughput.png and /dev/null differ
diff --git a/examples/whisper/reports/cuda_64_10/inference_report.csv b/examples/whisper/reports/cuda_64_10/inference_report.csv
deleted file mode 100644
index ce7a584d..00000000
--- a/examples/whisper/reports/cuda_64_10/inference_report.csv
+++ /dev/null
@@ -1,7 +0,0 @@
-experiment_name,backend.name,backend.version,backend._target_,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.initial_isolation_check,backend.continous_isolation_check,backend.delete_cache,backend.export,backend.no_weights,backend.use_merged,backend.use_cache,backend.torch_dtype,backend.provider,backend.device_id,backend.use_io_binding,backend.enable_profiling,backend.optimization,backend.optimization_config.optimization_level,backend.optimization_config.optimize_for_gpu,backend.optimization_config.fp16,backend.optimization_config.enable_transformers_specific_optimizations,backend.optimization_config.enable_gelu_approximation,backend.optimization_config.disable_gelu_fusion,backend.optimization_config.disable_layer_norm_fusion,backend.optimization_config.disable_attention_fusion,backend.optimization_config.disable_skip_layer_norm_fusion,backend.optimization_config.disable_bias_skip_layer_norm_fusion,backend.optimization_config.disable_bias_gelu_fusion,backend.optimization_config.use_mask_index,backend.optimization_config.no_attention_mask,backend.optimization_config.disable_embed_layer_norm_fusion,backend.optimization_config.disable_shape_inference,backend.optimization_config.use_multi_head_attention,backend.optimization_config.enable_gemm_fast_gelu_fusion,backend.optimization_config.use_raw_attention_mask,backend.optimization_config.disable_group_norm_fusion,backend.optimization_config.disable_packed_kv,backend.auto_optimization,backend.auto_optimization_config.for_gpu,backend.quantization,backend.quantization_config.is_static,backend.quantization_config.format,backend.quantization_config.mode,backend.quantization_config.activations_dtype,backend.quantization_config.activations_symmetric,backend.quantization_config.weights_dtype,backend.quantization_config.weights_symmetric,backend.quantization_config.per_channel,backend.quantization_config.reduce_range,backend.quantization_config.operators_to_quantize,backend.auto_quantization,backend.auto_quantization_config.is_static,backend.calibration,backend.calibration_config.dataset_name,backend.calibration_config.num_samples,backend.calibration_config.dataset_config_name,backend.calibration_config.dataset_split,backend.calibration_config.preprocess_batch,backend.calibration_config.preprocess_class,backend.use_ortmodel,benchmark.name,benchmark._target_,benchmark.seed,benchmark.memory,benchmark.warmup_runs,benchmark.benchmark_duration,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.width,benchmark.input_shapes.height,benchmark.input_shapes.num_channels,benchmark.input_shapes.point_batch_size,benchmark.input_shapes.nb_points_per_image,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,model,device,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,hub_kwargs.use_auth_token,environment.optimum_version,environment.transformers_version,environment.accelerate_version,environment.diffusers_version,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,Unnamed: 0,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s),backend.load_in_8bit,backend.load_in_4bit,backend.bettertransformer,backend.torch_compile,backend.torch_compile_config.fullgraph,backend.torch_compile_config.dynamic,backend.torch_compile_config.backend,backend.torch_compile_config.mode,backend.torch_compile_config.options,backend.torch_compile_config.disable,backend.amp_autocast,backend.amp_dtype,backend.disable_grad,backend.eval_mode,forward.speedup(%),generate.speedup(%)
-whisper_auto_opt(O4),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O4,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.0668,958.0,0.116,5520.0,,,,,,,,,,,,,,,52.79106858054226,371.7948717948718
-whisper_auto_opt(O3),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O3,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.169,379.0,0.2,3200.0,,,,,,,,,,,,,,,-39.55342902711324,173.5042735042735
-whisper_auto_opt(O2),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O2,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.171,374.0,0.203,3150.0,,,,,,,,,,,,,,,-40.35087719298246,169.23076923076925
-whisper_auto_opt(None),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.325,197.0,0.359,1780.0,,,,,,,,,,,,,,,-68.58054226475278,52.13675213675213
-whisper_auto_opt(O1),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O1,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.325,197.0,0.362,1770.0,,,,,,,,,,,,,,,-68.58054226475278,51.28205128205128
-whisper_baseline,pytorch,2.0.1+cu117,optimum_benchmark.backends.pytorch.PyTorchBackend,,,False,False,False,,False,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,10,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.102,627.0,0.549,1170.0,False,False,False,False,False,False,inductor,,,False,False,,True,True,0.0,0.0
diff --git a/examples/whisper/reports/cuda_64_10/rich_table.svg b/examples/whisper/reports/cuda_64_10/rich_table.svg
deleted file mode 100644
index cd8fdb1f..00000000
--- a/examples/whisper/reports/cuda_64_10/rich_table.svg
+++ /dev/null
@@ -1,129 +0,0 @@
-<svg class="rich-terminal" viewBox="0 0 1824 489.2" xmlns="http://www.w3.org/2000/svg">
-    <!-- Generated with Rich https://www.textualize.io -->
-    <style>
-
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Regular"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Regular.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Regular.woff") format("woff");
-        font-style: normal;
-        font-weight: 400;
-    }
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Bold"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Bold.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Bold.woff") format("woff");
-        font-style: bold;
-        font-weight: 700;
-    }
-
-    .terminal-715206386-matrix {
-        font-family: Fira Code, monospace;
-        font-size: 20px;
-        line-height: 24.4px;
-        font-variant-east-asian: full-width;
-    }
-
-    .terminal-715206386-title {
-        font-size: 18px;
-        font-weight: bold;
-        font-family: arial;
-    }
-
-    .terminal-715206386-r1 { fill: #d9d9d9;font-style: italic; }
-.terminal-715206386-r2 { fill: #d9d9d9 }
-.terminal-715206386-r3 { fill: #d9d9d9;font-weight: bold }
-.terminal-715206386-r4 { fill: #fd971f }
-    </style>
-
-    <defs>
-    <clipPath id="terminal-715206386-clip-terminal">
-      <rect x="0" y="0" width="1804.6" height="438.2" />
-    </clipPath>
-    <clipPath id="terminal-715206386-line-0">
-    <rect x="0" y="1.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-1">
-    <rect x="0" y="25.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-2">
-    <rect x="0" y="50.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-3">
-    <rect x="0" y="74.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-4">
-    <rect x="0" y="99.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-5">
-    <rect x="0" y="123.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-6">
-    <rect x="0" y="147.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-7">
-    <rect x="0" y="172.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-8">
-    <rect x="0" y="196.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-9">
-    <rect x="0" y="221.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-10">
-    <rect x="0" y="245.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-11">
-    <rect x="0" y="269.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-12">
-    <rect x="0" y="294.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-13">
-    <rect x="0" y="318.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-14">
-    <rect x="0" y="343.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-15">
-    <rect x="0" y="367.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-715206386-line-16">
-    <rect x="0" y="391.9" width="1805.6" height="24.65"/>
-            </clipPath>
-    </defs>
-
-    <rect fill="#0c0c0c" stroke="rgba(255,255,255,0.35)" stroke-width="1" x="1" y="1" width="1822" height="487.2" rx="8"/><text class="terminal-715206386-title" fill="#d9d9d9" text-anchor="middle" x="911" y="27">Rich</text>
-            <g transform="translate(26,22)">
-            <circle cx="0" cy="0" r="7" fill="#ff5f57"/>
-            <circle cx="22" cy="0" r="7" fill="#febc2e"/>
-            <circle cx="44" cy="0" r="7" fill="#28c840"/>
-            </g>
-        
-    <g transform="translate(9, 41)" clip-path="url(#terminal-715206386-clip-terminal)">
-    
-    <g class="terminal-715206386-matrix">
-    <text class="terminal-715206386-r1" x="0" y="20" textLength="1805.6" clip-path="url(#terminal-715206386-line-0)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;cuda_64_10&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1805.6" y="20" textLength="12.2" clip-path="url(#terminal-715206386-line-0)">
-</text><text class="terminal-715206386-r2" x="0" y="44.4" textLength="1805.6" clip-path="url(#terminal-715206386-line-1)">┏━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓</text><text class="terminal-715206386-r2" x="1805.6" y="44.4" textLength="12.2" clip-path="url(#terminal-715206386-line-1)">
-</text><text class="terminal-715206386-r2" x="0" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="24.4" y="68.8" textLength="207.4" clip-path="url(#terminal-715206386-line-2)">Experiment&#160;Name&#160;&#160;</text><text class="terminal-715206386-r2" x="244" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="268.4" y="68.8" textLength="134.2" clip-path="url(#terminal-715206386-line-2)">backend&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="414.8" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="439.2" y="68.8" textLength="207.4" clip-path="url(#terminal-715206386-line-2)">backend&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="658.8" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="683.2" y="68.8" textLength="122" clip-path="url(#terminal-715206386-line-2)">forward&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="817.4" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="841.8" y="68.8" textLength="219.6" clip-path="url(#terminal-715206386-line-2)">forward&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1073.6" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="1098" y="68.8" textLength="122" clip-path="url(#terminal-715206386-line-2)">forward&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1232.2" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="1256.6" y="68.8" textLength="122" clip-path="url(#terminal-715206386-line-2)">generate&#160;&#160;</text><text class="terminal-715206386-r2" x="1390.8" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="1415.2" y="68.8" textLength="207.4" clip-path="url(#terminal-715206386-line-2)">generate&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1634.8" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r3" x="1659.2" y="68.8" textLength="122" clip-path="url(#terminal-715206386-line-2)">generate&#160;&#160;</text><text class="terminal-715206386-r2" x="1793.4" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">┃</text><text class="terminal-715206386-r2" x="1805.6" y="68.8" textLength="12.2" clip-path="url(#terminal-715206386-line-2)">
-</text><text class="terminal-715206386-r2" x="0" y="93.2" textLength="1805.6" clip-path="url(#terminal-715206386-line-3)">┡━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩</text><text class="terminal-715206386-r2" x="1805.6" y="93.2" textLength="12.2" clip-path="url(#terminal-715206386-line-3)">
-</text><text class="terminal-715206386-r2" x="0" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="244" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="268.4" y="117.6" textLength="134.2" clip-path="url(#terminal-715206386-line-4)">name&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="414.8" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="439.2" y="117.6" textLength="207.4" clip-path="url(#terminal-715206386-line-4)">auto_optimization</text><text class="terminal-715206386-r2" x="658.8" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="683.2" y="117.6" textLength="122" clip-path="url(#terminal-715206386-line-4)">latency(s)</text><text class="terminal-715206386-r2" x="817.4" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="841.8" y="117.6" textLength="219.6" clip-path="url(#terminal-715206386-line-4)">throughput(sample…</text><text class="terminal-715206386-r2" x="1073.6" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="1098" y="117.6" textLength="122" clip-path="url(#terminal-715206386-line-4)">speedup(%)</text><text class="terminal-715206386-r2" x="1232.2" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="1256.6" y="117.6" textLength="122" clip-path="url(#terminal-715206386-line-4)">latency(s)</text><text class="terminal-715206386-r2" x="1390.8" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="1415.2" y="117.6" textLength="207.4" clip-path="url(#terminal-715206386-line-4)">throughput(token…</text><text class="terminal-715206386-r2" x="1634.8" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="1659.2" y="117.6" textLength="122" clip-path="url(#terminal-715206386-line-4)">speedup(%)</text><text class="terminal-715206386-r2" x="1793.4" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">│</text><text class="terminal-715206386-r2" x="1805.6" y="117.6" textLength="12.2" clip-path="url(#terminal-715206386-line-4)">
-</text><text class="terminal-715206386-r2" x="0" y="142" textLength="1805.6" clip-path="url(#terminal-715206386-line-5)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-715206386-r2" x="1805.6" y="142" textLength="12.2" clip-path="url(#terminal-715206386-line-5)">
-</text><text class="terminal-715206386-r2" x="0" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="24.4" y="166.4" textLength="207.4" clip-path="url(#terminal-715206386-line-6)">whisper_auto_opt…</text><text class="terminal-715206386-r2" x="244" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="268.4" y="166.4" textLength="134.2" clip-path="url(#terminal-715206386-line-6)">onnxruntime</text><text class="terminal-715206386-r2" x="414.8" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="439.2" y="166.4" textLength="207.4" clip-path="url(#terminal-715206386-line-6)">O4&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="658.8" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="683.2" y="166.4" textLength="122" clip-path="url(#terminal-715206386-line-6)">6.68e-02&#160;&#160;</text><text class="terminal-715206386-r2" x="817.4" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="841.8" y="166.4" textLength="219.6" clip-path="url(#terminal-715206386-line-6)">958.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1073.6" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="1098" y="166.4" textLength="122" clip-path="url(#terminal-715206386-line-6)">52.79&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1232.2" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="1256.6" y="166.4" textLength="122" clip-path="url(#terminal-715206386-line-6)">1.16e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="1390.8" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="1415.2" y="166.4" textLength="207.4" clip-path="url(#terminal-715206386-line-6)">5520.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1634.8" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="1659.2" y="166.4" textLength="122" clip-path="url(#terminal-715206386-line-6)">371.79&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1793.4" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">│</text><text class="terminal-715206386-r2" x="1805.6" y="166.4" textLength="12.2" clip-path="url(#terminal-715206386-line-6)">
-</text><text class="terminal-715206386-r2" x="0" y="190.8" textLength="1805.6" clip-path="url(#terminal-715206386-line-7)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-715206386-r2" x="1805.6" y="190.8" textLength="12.2" clip-path="url(#terminal-715206386-line-7)">
-</text><text class="terminal-715206386-r2" x="0" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="24.4" y="215.2" textLength="207.4" clip-path="url(#terminal-715206386-line-8)">whisper_auto_opt…</text><text class="terminal-715206386-r2" x="244" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="268.4" y="215.2" textLength="134.2" clip-path="url(#terminal-715206386-line-8)">onnxruntime</text><text class="terminal-715206386-r2" x="414.8" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="439.2" y="215.2" textLength="207.4" clip-path="url(#terminal-715206386-line-8)">O3&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="658.8" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="683.2" y="215.2" textLength="122" clip-path="url(#terminal-715206386-line-8)">1.69e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="817.4" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="841.8" y="215.2" textLength="219.6" clip-path="url(#terminal-715206386-line-8)">379.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1073.6" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="1098" y="215.2" textLength="122" clip-path="url(#terminal-715206386-line-8)">-39.55&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1232.2" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="1256.6" y="215.2" textLength="122" clip-path="url(#terminal-715206386-line-8)">2.00e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="1390.8" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="1415.2" y="215.2" textLength="207.4" clip-path="url(#terminal-715206386-line-8)">3200.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1634.8" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="1659.2" y="215.2" textLength="122" clip-path="url(#terminal-715206386-line-8)">173.50&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1793.4" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">│</text><text class="terminal-715206386-r2" x="1805.6" y="215.2" textLength="12.2" clip-path="url(#terminal-715206386-line-8)">
-</text><text class="terminal-715206386-r2" x="0" y="239.6" textLength="1805.6" clip-path="url(#terminal-715206386-line-9)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-715206386-r2" x="1805.6" y="239.6" textLength="12.2" clip-path="url(#terminal-715206386-line-9)">
-</text><text class="terminal-715206386-r2" x="0" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="24.4" y="264" textLength="207.4" clip-path="url(#terminal-715206386-line-10)">whisper_auto_opt…</text><text class="terminal-715206386-r2" x="244" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="268.4" y="264" textLength="134.2" clip-path="url(#terminal-715206386-line-10)">onnxruntime</text><text class="terminal-715206386-r2" x="414.8" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="439.2" y="264" textLength="207.4" clip-path="url(#terminal-715206386-line-10)">O2&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="658.8" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="683.2" y="264" textLength="122" clip-path="url(#terminal-715206386-line-10)">1.71e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="817.4" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="841.8" y="264" textLength="219.6" clip-path="url(#terminal-715206386-line-10)">374.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1073.6" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="1098" y="264" textLength="122" clip-path="url(#terminal-715206386-line-10)">-40.35&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1232.2" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="1256.6" y="264" textLength="122" clip-path="url(#terminal-715206386-line-10)">2.03e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="1390.8" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="1415.2" y="264" textLength="207.4" clip-path="url(#terminal-715206386-line-10)">3150.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1634.8" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="1659.2" y="264" textLength="122" clip-path="url(#terminal-715206386-line-10)">169.23&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1793.4" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">│</text><text class="terminal-715206386-r2" x="1805.6" y="264" textLength="12.2" clip-path="url(#terminal-715206386-line-10)">
-</text><text class="terminal-715206386-r2" x="0" y="288.4" textLength="1805.6" clip-path="url(#terminal-715206386-line-11)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-715206386-r2" x="1805.6" y="288.4" textLength="12.2" clip-path="url(#terminal-715206386-line-11)">
-</text><text class="terminal-715206386-r2" x="0" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="24.4" y="312.8" textLength="207.4" clip-path="url(#terminal-715206386-line-12)">whisper_auto_opt…</text><text class="terminal-715206386-r2" x="244" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="268.4" y="312.8" textLength="134.2" clip-path="url(#terminal-715206386-line-12)">onnxruntime</text><text class="terminal-715206386-r2" x="414.8" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="658.8" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="683.2" y="312.8" textLength="122" clip-path="url(#terminal-715206386-line-12)">3.25e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="817.4" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="841.8" y="312.8" textLength="219.6" clip-path="url(#terminal-715206386-line-12)">197.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1073.6" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="1098" y="312.8" textLength="122" clip-path="url(#terminal-715206386-line-12)">-68.58&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1232.2" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="1256.6" y="312.8" textLength="122" clip-path="url(#terminal-715206386-line-12)">3.59e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="1390.8" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="1415.2" y="312.8" textLength="207.4" clip-path="url(#terminal-715206386-line-12)">1780.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1634.8" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="1659.2" y="312.8" textLength="122" clip-path="url(#terminal-715206386-line-12)">52.14&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1793.4" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">│</text><text class="terminal-715206386-r2" x="1805.6" y="312.8" textLength="12.2" clip-path="url(#terminal-715206386-line-12)">
-</text><text class="terminal-715206386-r2" x="0" y="337.2" textLength="1805.6" clip-path="url(#terminal-715206386-line-13)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-715206386-r2" x="1805.6" y="337.2" textLength="12.2" clip-path="url(#terminal-715206386-line-13)">
-</text><text class="terminal-715206386-r2" x="0" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="24.4" y="361.6" textLength="207.4" clip-path="url(#terminal-715206386-line-14)">whisper_auto_opt…</text><text class="terminal-715206386-r2" x="244" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="268.4" y="361.6" textLength="134.2" clip-path="url(#terminal-715206386-line-14)">onnxruntime</text><text class="terminal-715206386-r2" x="414.8" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="439.2" y="361.6" textLength="207.4" clip-path="url(#terminal-715206386-line-14)">O1&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="658.8" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="683.2" y="361.6" textLength="122" clip-path="url(#terminal-715206386-line-14)">3.25e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="817.4" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="841.8" y="361.6" textLength="219.6" clip-path="url(#terminal-715206386-line-14)">197.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1073.6" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="1098" y="361.6" textLength="122" clip-path="url(#terminal-715206386-line-14)">-68.58&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1232.2" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="1256.6" y="361.6" textLength="122" clip-path="url(#terminal-715206386-line-14)">3.62e-01&#160;&#160;</text><text class="terminal-715206386-r2" x="1390.8" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="1415.2" y="361.6" textLength="207.4" clip-path="url(#terminal-715206386-line-14)">1770.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1634.8" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="1659.2" y="361.6" textLength="122" clip-path="url(#terminal-715206386-line-14)">51.28&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-715206386-r2" x="1793.4" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">│</text><text class="terminal-715206386-r2" x="1805.6" y="361.6" textLength="12.2" clip-path="url(#terminal-715206386-line-14)">
-</text><text class="terminal-715206386-r2" x="0" y="386" textLength="1805.6" clip-path="url(#terminal-715206386-line-15)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-715206386-r2" x="1805.6" y="386" textLength="12.2" clip-path="url(#terminal-715206386-line-15)">
-</text><text class="terminal-715206386-r2" x="0" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r4" x="24.4" y="410.4" textLength="195.2" clip-path="url(#terminal-715206386-line-16)">whisper_baseline</text><text class="terminal-715206386-r2" x="244" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r4" x="268.4" y="410.4" textLength="85.4" clip-path="url(#terminal-715206386-line-16)">pytorch</text><text class="terminal-715206386-r2" x="414.8" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r2" x="658.8" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r4" x="683.2" y="410.4" textLength="97.6" clip-path="url(#terminal-715206386-line-16)">1.02e-01</text><text class="terminal-715206386-r2" x="817.4" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r4" x="841.8" y="410.4" textLength="73.2" clip-path="url(#terminal-715206386-line-16)">627.00</text><text class="terminal-715206386-r2" x="1073.6" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r4" x="1098" y="410.4" textLength="36.6" clip-path="url(#terminal-715206386-line-16)">0.0</text><text class="terminal-715206386-r2" x="1232.2" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r4" x="1256.6" y="410.4" textLength="97.6" clip-path="url(#terminal-715206386-line-16)">5.49e-01</text><text class="terminal-715206386-r2" x="1390.8" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r4" x="1415.2" y="410.4" textLength="85.4" clip-path="url(#terminal-715206386-line-16)">1170.00</text><text class="terminal-715206386-r2" x="1634.8" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r4" x="1659.2" y="410.4" textLength="36.6" clip-path="url(#terminal-715206386-line-16)">0.0</text><text class="terminal-715206386-r2" x="1793.4" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">│</text><text class="terminal-715206386-r2" x="1805.6" y="410.4" textLength="12.2" clip-path="url(#terminal-715206386-line-16)">
-</text><text class="terminal-715206386-r2" x="0" y="434.8" textLength="1805.6" clip-path="url(#terminal-715206386-line-17)">└───────────────────┴─────────────┴───────────────────┴────────────┴────────────────────┴────────────┴────────────┴───────────────────┴────────────┘</text><text class="terminal-715206386-r2" x="1805.6" y="434.8" textLength="12.2" clip-path="url(#terminal-715206386-line-17)">
-</text>
-    </g>
-    </g>
-</svg>
diff --git a/examples/whisper/reports/cuda_64_100/forward_throughput.png b/examples/whisper/reports/cuda_64_100/forward_throughput.png
deleted file mode 100644
index 59d6e259..00000000
Binary files a/examples/whisper/reports/cuda_64_100/forward_throughput.png and /dev/null differ
diff --git a/examples/whisper/reports/cuda_64_100/generate_throughput.png b/examples/whisper/reports/cuda_64_100/generate_throughput.png
deleted file mode 100644
index 48213d39..00000000
Binary files a/examples/whisper/reports/cuda_64_100/generate_throughput.png and /dev/null differ
diff --git a/examples/whisper/reports/cuda_64_100/inference_report.csv b/examples/whisper/reports/cuda_64_100/inference_report.csv
deleted file mode 100644
index 235f0e4c..00000000
--- a/examples/whisper/reports/cuda_64_100/inference_report.csv
+++ /dev/null
@@ -1,7 +0,0 @@
-experiment_name,backend.name,backend.version,backend._target_,backend.inter_op_num_threads,backend.intra_op_num_threads,backend.initial_isolation_check,backend.continous_isolation_check,backend.delete_cache,backend.export,backend.no_weights,backend.use_merged,backend.use_cache,backend.torch_dtype,backend.provider,backend.device_id,backend.use_io_binding,backend.enable_profiling,backend.optimization,backend.optimization_config.optimization_level,backend.optimization_config.optimize_for_gpu,backend.optimization_config.fp16,backend.optimization_config.enable_transformers_specific_optimizations,backend.optimization_config.enable_gelu_approximation,backend.optimization_config.disable_gelu_fusion,backend.optimization_config.disable_layer_norm_fusion,backend.optimization_config.disable_attention_fusion,backend.optimization_config.disable_skip_layer_norm_fusion,backend.optimization_config.disable_bias_skip_layer_norm_fusion,backend.optimization_config.disable_bias_gelu_fusion,backend.optimization_config.use_mask_index,backend.optimization_config.no_attention_mask,backend.optimization_config.disable_embed_layer_norm_fusion,backend.optimization_config.disable_shape_inference,backend.optimization_config.use_multi_head_attention,backend.optimization_config.enable_gemm_fast_gelu_fusion,backend.optimization_config.use_raw_attention_mask,backend.optimization_config.disable_group_norm_fusion,backend.optimization_config.disable_packed_kv,backend.auto_optimization,backend.auto_optimization_config.for_gpu,backend.quantization,backend.quantization_config.is_static,backend.quantization_config.format,backend.quantization_config.mode,backend.quantization_config.activations_dtype,backend.quantization_config.activations_symmetric,backend.quantization_config.weights_dtype,backend.quantization_config.weights_symmetric,backend.quantization_config.per_channel,backend.quantization_config.reduce_range,backend.quantization_config.operators_to_quantize,backend.auto_quantization,backend.auto_quantization_config.is_static,backend.calibration,backend.calibration_config.dataset_name,backend.calibration_config.num_samples,backend.calibration_config.dataset_config_name,backend.calibration_config.dataset_split,backend.calibration_config.preprocess_batch,backend.calibration_config.preprocess_class,backend.use_ortmodel,benchmark.name,benchmark._target_,benchmark.seed,benchmark.memory,benchmark.warmup_runs,benchmark.benchmark_duration,benchmark.input_shapes.batch_size,benchmark.input_shapes.sequence_length,benchmark.input_shapes.num_choices,benchmark.input_shapes.width,benchmark.input_shapes.height,benchmark.input_shapes.num_channels,benchmark.input_shapes.point_batch_size,benchmark.input_shapes.nb_points_per_image,benchmark.input_shapes.feature_size,benchmark.input_shapes.nb_max_frames,benchmark.input_shapes.audio_sequence_length,benchmark.new_tokens,model,device,task,hub_kwargs.revision,hub_kwargs.cache_dir,hub_kwargs.force_download,hub_kwargs.local_files_only,hub_kwargs.use_auth_token,environment.optimum_version,environment.transformers_version,environment.accelerate_version,environment.diffusers_version,environment.python_version,environment.system,environment.cpu,environment.cpu_count,environment.cpu_ram_mb,Unnamed: 0,forward.latency(s),forward.throughput(samples/s),generate.latency(s),generate.throughput(tokens/s),backend.load_in_8bit,backend.load_in_4bit,backend.bettertransformer,backend.torch_compile,backend.torch_compile_config.fullgraph,backend.torch_compile_config.dynamic,backend.torch_compile_config.backend,backend.torch_compile_config.mode,backend.torch_compile_config.options,backend.torch_compile_config.disable,backend.amp_autocast,backend.amp_dtype,backend.disable_grad,backend.eval_mode,forward.speedup(%),generate.speedup(%)
-whisper_auto_opt(O4),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O4,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.0666,961.0,0.65,9850.0,,,,,,,,,,,,,,,36.699857752489336,48.567119155354455
-whisper_auto_opt(O3),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O3,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.169,379.0,0.621,10300.0,,,,,,,,,,,,,,,-46.08819345661451,55.35444947209653
-whisper_auto_opt(O2),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O2,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.172,372.0,0.622,10300.0,,,,,,,,,,,,,,,-47.08392603129445,55.35444947209653
-whisper_auto_opt(None),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.325,197.0,0.796,8040.0,,,,,,,,,,,,,,,-71.97724039829303,21.266968325791847
-whisper_auto_opt(O1),onnxruntime,1.15.1,optimum_benchmark.backends.onnxruntime.ORTBackend,,,False,False,False,True,False,False,True,,CUDAExecutionProvider,1,True,False,False,1,True,False,True,False,False,False,False,True,False,False,False,False,True,False,False,False,False,True,True,O1,True,False,False,QOperator,IntegerOps,QUInt8,False,QInt8,True,False,False,"['MatMul', 'Add']",,False,False,glue,300,sst2,train,True,optimum_benchmark.preprocessors.glue.GluePreprocessor,True,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.325,197.0,0.791,8090.0,,,,,,,,,,,,,,,-71.97724039829303,22.021116138763208
-whisper_baseline,pytorch,2.0.1+cu117,optimum_benchmark.backends.pytorch.PyTorchBackend,,,False,False,False,,False,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,inference,optimum_benchmark.benchmarks.inference.InferenceBenchmark,42,False,10,10,64,16,1,64,64,3,3,2,80,3000,16000,100,openai/whisper-base,cuda:1,automatic-speech-recognition,main,,False,False,False,1.11.1.dev0,4.32.0.dev0,0.22.0.dev0,0.20.0.dev0,3.9.17,Linux, AMD EPYC 7742 64-Core Processor,128,515637,0,0.0911,703.0,0.966,6630.0,False,False,False,False,False,False,inductor,,,False,False,,True,True,0.0,0.0
diff --git a/examples/whisper/reports/cuda_64_100/rich_table.svg b/examples/whisper/reports/cuda_64_100/rich_table.svg
deleted file mode 100644
index 0b7687e8..00000000
--- a/examples/whisper/reports/cuda_64_100/rich_table.svg
+++ /dev/null
@@ -1,129 +0,0 @@
-<svg class="rich-terminal" viewBox="0 0 1824 489.2" xmlns="http://www.w3.org/2000/svg">
-    <!-- Generated with Rich https://www.textualize.io -->
-    <style>
-
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Regular"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Regular.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Regular.woff") format("woff");
-        font-style: normal;
-        font-weight: 400;
-    }
-    @font-face {
-        font-family: "Fira Code";
-        src: local("FiraCode-Bold"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff2/FiraCode-Bold.woff2") format("woff2"),
-                url("https://cdnjs.cloudflare.com/ajax/libs/firacode/6.2.0/woff/FiraCode-Bold.woff") format("woff");
-        font-style: bold;
-        font-weight: 700;
-    }
-
-    .terminal-1778986749-matrix {
-        font-family: Fira Code, monospace;
-        font-size: 20px;
-        line-height: 24.4px;
-        font-variant-east-asian: full-width;
-    }
-
-    .terminal-1778986749-title {
-        font-size: 18px;
-        font-weight: bold;
-        font-family: arial;
-    }
-
-    .terminal-1778986749-r1 { fill: #d9d9d9;font-style: italic; }
-.terminal-1778986749-r2 { fill: #d9d9d9 }
-.terminal-1778986749-r3 { fill: #d9d9d9;font-weight: bold }
-.terminal-1778986749-r4 { fill: #fd971f }
-    </style>
-
-    <defs>
-    <clipPath id="terminal-1778986749-clip-terminal">
-      <rect x="0" y="0" width="1804.6" height="438.2" />
-    </clipPath>
-    <clipPath id="terminal-1778986749-line-0">
-    <rect x="0" y="1.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-1">
-    <rect x="0" y="25.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-2">
-    <rect x="0" y="50.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-3">
-    <rect x="0" y="74.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-4">
-    <rect x="0" y="99.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-5">
-    <rect x="0" y="123.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-6">
-    <rect x="0" y="147.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-7">
-    <rect x="0" y="172.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-8">
-    <rect x="0" y="196.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-9">
-    <rect x="0" y="221.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-10">
-    <rect x="0" y="245.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-11">
-    <rect x="0" y="269.9" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-12">
-    <rect x="0" y="294.3" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-13">
-    <rect x="0" y="318.7" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-14">
-    <rect x="0" y="343.1" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-15">
-    <rect x="0" y="367.5" width="1805.6" height="24.65"/>
-            </clipPath>
-<clipPath id="terminal-1778986749-line-16">
-    <rect x="0" y="391.9" width="1805.6" height="24.65"/>
-            </clipPath>
-    </defs>
-
-    <rect fill="#0c0c0c" stroke="rgba(255,255,255,0.35)" stroke-width="1" x="1" y="1" width="1822" height="487.2" rx="8"/><text class="terminal-1778986749-title" fill="#d9d9d9" text-anchor="middle" x="911" y="27">Rich</text>
-            <g transform="translate(26,22)">
-            <circle cx="0" cy="0" r="7" fill="#ff5f57"/>
-            <circle cx="22" cy="0" r="7" fill="#febc2e"/>
-            <circle cx="44" cy="0" r="7" fill="#28c840"/>
-            </g>
-        
-    <g transform="translate(9, 41)" clip-path="url(#terminal-1778986749-clip-terminal)">
-    
-    <g class="terminal-1778986749-matrix">
-    <text class="terminal-1778986749-r1" x="0" y="20" textLength="1805.6" clip-path="url(#terminal-1778986749-line-0)">&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;cuda_64_100&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1805.6" y="20" textLength="12.2" clip-path="url(#terminal-1778986749-line-0)">
-</text><text class="terminal-1778986749-r2" x="0" y="44.4" textLength="1805.6" clip-path="url(#terminal-1778986749-line-1)">┏━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓</text><text class="terminal-1778986749-r2" x="1805.6" y="44.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-1)">
-</text><text class="terminal-1778986749-r2" x="0" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="24.4" y="68.8" textLength="207.4" clip-path="url(#terminal-1778986749-line-2)">Experiment&#160;Name&#160;&#160;</text><text class="terminal-1778986749-r2" x="244" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="268.4" y="68.8" textLength="134.2" clip-path="url(#terminal-1778986749-line-2)">backend&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="414.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="439.2" y="68.8" textLength="207.4" clip-path="url(#terminal-1778986749-line-2)">backend&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="658.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="683.2" y="68.8" textLength="122" clip-path="url(#terminal-1778986749-line-2)">forward&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="817.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="841.8" y="68.8" textLength="219.6" clip-path="url(#terminal-1778986749-line-2)">forward&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1073.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="1098" y="68.8" textLength="122" clip-path="url(#terminal-1778986749-line-2)">forward&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1232.2" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="1256.6" y="68.8" textLength="122" clip-path="url(#terminal-1778986749-line-2)">generate&#160;&#160;</text><text class="terminal-1778986749-r2" x="1390.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="1415.2" y="68.8" textLength="207.4" clip-path="url(#terminal-1778986749-line-2)">generate&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1634.8" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r3" x="1659.2" y="68.8" textLength="122" clip-path="url(#terminal-1778986749-line-2)">generate&#160;&#160;</text><text class="terminal-1778986749-r2" x="1793.4" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">┃</text><text class="terminal-1778986749-r2" x="1805.6" y="68.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-2)">
-</text><text class="terminal-1778986749-r2" x="0" y="93.2" textLength="1805.6" clip-path="url(#terminal-1778986749-line-3)">┡━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩</text><text class="terminal-1778986749-r2" x="1805.6" y="93.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-3)">
-</text><text class="terminal-1778986749-r2" x="0" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="244" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="268.4" y="117.6" textLength="134.2" clip-path="url(#terminal-1778986749-line-4)">name&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="414.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="439.2" y="117.6" textLength="207.4" clip-path="url(#terminal-1778986749-line-4)">auto_optimization</text><text class="terminal-1778986749-r2" x="658.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="683.2" y="117.6" textLength="122" clip-path="url(#terminal-1778986749-line-4)">latency(s)</text><text class="terminal-1778986749-r2" x="817.4" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="841.8" y="117.6" textLength="219.6" clip-path="url(#terminal-1778986749-line-4)">throughput(sample…</text><text class="terminal-1778986749-r2" x="1073.6" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="1098" y="117.6" textLength="122" clip-path="url(#terminal-1778986749-line-4)">speedup(%)</text><text class="terminal-1778986749-r2" x="1232.2" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="1256.6" y="117.6" textLength="122" clip-path="url(#terminal-1778986749-line-4)">latency(s)</text><text class="terminal-1778986749-r2" x="1390.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="1415.2" y="117.6" textLength="207.4" clip-path="url(#terminal-1778986749-line-4)">throughput(token…</text><text class="terminal-1778986749-r2" x="1634.8" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="1659.2" y="117.6" textLength="122" clip-path="url(#terminal-1778986749-line-4)">speedup(%)</text><text class="terminal-1778986749-r2" x="1793.4" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">│</text><text class="terminal-1778986749-r2" x="1805.6" y="117.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-4)">
-</text><text class="terminal-1778986749-r2" x="0" y="142" textLength="1805.6" clip-path="url(#terminal-1778986749-line-5)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1778986749-r2" x="1805.6" y="142" textLength="12.2" clip-path="url(#terminal-1778986749-line-5)">
-</text><text class="terminal-1778986749-r2" x="0" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="24.4" y="166.4" textLength="207.4" clip-path="url(#terminal-1778986749-line-6)">whisper_auto_opt…</text><text class="terminal-1778986749-r2" x="244" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="268.4" y="166.4" textLength="134.2" clip-path="url(#terminal-1778986749-line-6)">onnxruntime</text><text class="terminal-1778986749-r2" x="414.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="439.2" y="166.4" textLength="207.4" clip-path="url(#terminal-1778986749-line-6)">O4&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="658.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="683.2" y="166.4" textLength="122" clip-path="url(#terminal-1778986749-line-6)">6.66e-02&#160;&#160;</text><text class="terminal-1778986749-r2" x="817.4" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="841.8" y="166.4" textLength="219.6" clip-path="url(#terminal-1778986749-line-6)">961.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1073.6" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="1098" y="166.4" textLength="122" clip-path="url(#terminal-1778986749-line-6)">36.70&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1232.2" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="1256.6" y="166.4" textLength="122" clip-path="url(#terminal-1778986749-line-6)">6.50e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="1390.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="1415.2" y="166.4" textLength="207.4" clip-path="url(#terminal-1778986749-line-6)">9850.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1634.8" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="1659.2" y="166.4" textLength="122" clip-path="url(#terminal-1778986749-line-6)">48.57&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1793.4" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">│</text><text class="terminal-1778986749-r2" x="1805.6" y="166.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-6)">
-</text><text class="terminal-1778986749-r2" x="0" y="190.8" textLength="1805.6" clip-path="url(#terminal-1778986749-line-7)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1778986749-r2" x="1805.6" y="190.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-7)">
-</text><text class="terminal-1778986749-r2" x="0" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="24.4" y="215.2" textLength="207.4" clip-path="url(#terminal-1778986749-line-8)">whisper_auto_opt…</text><text class="terminal-1778986749-r2" x="244" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="268.4" y="215.2" textLength="134.2" clip-path="url(#terminal-1778986749-line-8)">onnxruntime</text><text class="terminal-1778986749-r2" x="414.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="439.2" y="215.2" textLength="207.4" clip-path="url(#terminal-1778986749-line-8)">O3&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="658.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="683.2" y="215.2" textLength="122" clip-path="url(#terminal-1778986749-line-8)">1.69e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="817.4" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="841.8" y="215.2" textLength="219.6" clip-path="url(#terminal-1778986749-line-8)">379.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1073.6" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="1098" y="215.2" textLength="122" clip-path="url(#terminal-1778986749-line-8)">-46.09&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1232.2" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="1256.6" y="215.2" textLength="122" clip-path="url(#terminal-1778986749-line-8)">6.21e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="1390.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="1415.2" y="215.2" textLength="207.4" clip-path="url(#terminal-1778986749-line-8)">10300.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1634.8" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="1659.2" y="215.2" textLength="122" clip-path="url(#terminal-1778986749-line-8)">55.35&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1793.4" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">│</text><text class="terminal-1778986749-r2" x="1805.6" y="215.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-8)">
-</text><text class="terminal-1778986749-r2" x="0" y="239.6" textLength="1805.6" clip-path="url(#terminal-1778986749-line-9)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1778986749-r2" x="1805.6" y="239.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-9)">
-</text><text class="terminal-1778986749-r2" x="0" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="24.4" y="264" textLength="207.4" clip-path="url(#terminal-1778986749-line-10)">whisper_auto_opt…</text><text class="terminal-1778986749-r2" x="244" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="268.4" y="264" textLength="134.2" clip-path="url(#terminal-1778986749-line-10)">onnxruntime</text><text class="terminal-1778986749-r2" x="414.8" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="439.2" y="264" textLength="207.4" clip-path="url(#terminal-1778986749-line-10)">O2&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="658.8" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="683.2" y="264" textLength="122" clip-path="url(#terminal-1778986749-line-10)">1.72e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="817.4" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="841.8" y="264" textLength="219.6" clip-path="url(#terminal-1778986749-line-10)">372.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1073.6" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="1098" y="264" textLength="122" clip-path="url(#terminal-1778986749-line-10)">-47.08&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1232.2" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="1256.6" y="264" textLength="122" clip-path="url(#terminal-1778986749-line-10)">6.22e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="1390.8" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="1415.2" y="264" textLength="207.4" clip-path="url(#terminal-1778986749-line-10)">10300.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1634.8" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="1659.2" y="264" textLength="122" clip-path="url(#terminal-1778986749-line-10)">55.35&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1793.4" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">│</text><text class="terminal-1778986749-r2" x="1805.6" y="264" textLength="12.2" clip-path="url(#terminal-1778986749-line-10)">
-</text><text class="terminal-1778986749-r2" x="0" y="288.4" textLength="1805.6" clip-path="url(#terminal-1778986749-line-11)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1778986749-r2" x="1805.6" y="288.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-11)">
-</text><text class="terminal-1778986749-r2" x="0" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="24.4" y="312.8" textLength="207.4" clip-path="url(#terminal-1778986749-line-12)">whisper_auto_opt…</text><text class="terminal-1778986749-r2" x="244" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="268.4" y="312.8" textLength="134.2" clip-path="url(#terminal-1778986749-line-12)">onnxruntime</text><text class="terminal-1778986749-r2" x="414.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="658.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="683.2" y="312.8" textLength="122" clip-path="url(#terminal-1778986749-line-12)">3.25e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="817.4" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="841.8" y="312.8" textLength="219.6" clip-path="url(#terminal-1778986749-line-12)">197.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1073.6" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="1098" y="312.8" textLength="122" clip-path="url(#terminal-1778986749-line-12)">-71.98&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1232.2" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="1256.6" y="312.8" textLength="122" clip-path="url(#terminal-1778986749-line-12)">7.96e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="1390.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="1415.2" y="312.8" textLength="207.4" clip-path="url(#terminal-1778986749-line-12)">8040.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1634.8" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="1659.2" y="312.8" textLength="122" clip-path="url(#terminal-1778986749-line-12)">21.27&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1793.4" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">│</text><text class="terminal-1778986749-r2" x="1805.6" y="312.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-12)">
-</text><text class="terminal-1778986749-r2" x="0" y="337.2" textLength="1805.6" clip-path="url(#terminal-1778986749-line-13)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1778986749-r2" x="1805.6" y="337.2" textLength="12.2" clip-path="url(#terminal-1778986749-line-13)">
-</text><text class="terminal-1778986749-r2" x="0" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="24.4" y="361.6" textLength="207.4" clip-path="url(#terminal-1778986749-line-14)">whisper_auto_opt…</text><text class="terminal-1778986749-r2" x="244" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="268.4" y="361.6" textLength="134.2" clip-path="url(#terminal-1778986749-line-14)">onnxruntime</text><text class="terminal-1778986749-r2" x="414.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="439.2" y="361.6" textLength="207.4" clip-path="url(#terminal-1778986749-line-14)">O1&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="658.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="683.2" y="361.6" textLength="122" clip-path="url(#terminal-1778986749-line-14)">3.25e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="817.4" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="841.8" y="361.6" textLength="219.6" clip-path="url(#terminal-1778986749-line-14)">197.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1073.6" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="1098" y="361.6" textLength="122" clip-path="url(#terminal-1778986749-line-14)">-71.98&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1232.2" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="1256.6" y="361.6" textLength="122" clip-path="url(#terminal-1778986749-line-14)">7.91e-01&#160;&#160;</text><text class="terminal-1778986749-r2" x="1390.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="1415.2" y="361.6" textLength="207.4" clip-path="url(#terminal-1778986749-line-14)">8090.00&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1634.8" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="1659.2" y="361.6" textLength="122" clip-path="url(#terminal-1778986749-line-14)">22.02&#160;&#160;&#160;&#160;&#160;</text><text class="terminal-1778986749-r2" x="1793.4" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">│</text><text class="terminal-1778986749-r2" x="1805.6" y="361.6" textLength="12.2" clip-path="url(#terminal-1778986749-line-14)">
-</text><text class="terminal-1778986749-r2" x="0" y="386" textLength="1805.6" clip-path="url(#terminal-1778986749-line-15)">├───────────────────┼─────────────┼───────────────────┼────────────┼────────────────────┼────────────┼────────────┼───────────────────┼────────────┤</text><text class="terminal-1778986749-r2" x="1805.6" y="386" textLength="12.2" clip-path="url(#terminal-1778986749-line-15)">
-</text><text class="terminal-1778986749-r2" x="0" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r4" x="24.4" y="410.4" textLength="195.2" clip-path="url(#terminal-1778986749-line-16)">whisper_baseline</text><text class="terminal-1778986749-r2" x="244" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r4" x="268.4" y="410.4" textLength="85.4" clip-path="url(#terminal-1778986749-line-16)">pytorch</text><text class="terminal-1778986749-r2" x="414.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r2" x="658.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r4" x="683.2" y="410.4" textLength="97.6" clip-path="url(#terminal-1778986749-line-16)">9.11e-02</text><text class="terminal-1778986749-r2" x="817.4" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r4" x="841.8" y="410.4" textLength="73.2" clip-path="url(#terminal-1778986749-line-16)">703.00</text><text class="terminal-1778986749-r2" x="1073.6" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r4" x="1098" y="410.4" textLength="36.6" clip-path="url(#terminal-1778986749-line-16)">0.0</text><text class="terminal-1778986749-r2" x="1232.2" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r4" x="1256.6" y="410.4" textLength="97.6" clip-path="url(#terminal-1778986749-line-16)">9.66e-01</text><text class="terminal-1778986749-r2" x="1390.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r4" x="1415.2" y="410.4" textLength="85.4" clip-path="url(#terminal-1778986749-line-16)">6630.00</text><text class="terminal-1778986749-r2" x="1634.8" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r4" x="1659.2" y="410.4" textLength="36.6" clip-path="url(#terminal-1778986749-line-16)">0.0</text><text class="terminal-1778986749-r2" x="1793.4" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">│</text><text class="terminal-1778986749-r2" x="1805.6" y="410.4" textLength="12.2" clip-path="url(#terminal-1778986749-line-16)">
-</text><text class="terminal-1778986749-r2" x="0" y="434.8" textLength="1805.6" clip-path="url(#terminal-1778986749-line-17)">└───────────────────┴─────────────┴───────────────────┴────────────┴────────────────────┴────────────┴────────────┴───────────────────┴────────────┘</text><text class="terminal-1778986749-r2" x="1805.6" y="434.8" textLength="12.2" clip-path="url(#terminal-1778986749-line-17)">
-</text>
-    </g>
-    </g>
-</svg>
diff --git a/examples/whisper/scripts/benchmark.sh b/examples/whisper/scripts/benchmark.sh
deleted file mode 100644
index 46613713..00000000
--- a/examples/whisper/scripts/benchmark.sh
+++ /dev/null
@@ -1,10 +0,0 @@
-if [ $1 = "cpu" ]; then
-    optimum-benchmark --config-dir configs --config-name whisper_baseline -m device=cpu
-    optimum-benchmark --config-dir configs --config-name whisper_auto_qnt -m device=cpu
-    optimum-benchmark --config-dir configs --config-name whisper_auto_opt+qnt -m device=cpu
-    elif [ $1 = "cuda" ]; then
-    optimum-benchmark --config-dir configs --config-name whisper_baseline -m device=cuda
-    optimum-benchmark --config-dir configs --config-name whisper_auto_opt -m device=cuda
-else
-    echo "Invalid argument"
-fi
diff --git a/examples/whisper/scripts/report.sh b/examples/whisper/scripts/report.sh
deleted file mode 100644
index ca96a87f..00000000
--- a/examples/whisper/scripts/report.sh
+++ /dev/null
@@ -1,11 +0,0 @@
-if [ $1 = "cpu" ]; then
-    optimum-report -e experiments/cpu_onnxruntime_1_10 -b experiments/cpu_pytorch_8_100 -n cpu_1_10
-    optimum-report -e experiments/cpu_onnxruntime_1_100 -b experiments/cpu_pytorch_8_100 -n cpu_1_100
-    elif [ $1 = "cuda" ]; then
-    optimum-report -e experiments/cuda_onnxruntime_64_10 -b experiments/cuda_pytorch_64_10 -n cuda_64_10
-    optimum-report -e experiments/cuda_onnxruntime_64_100 -b experiments/cuda_pytorch_64_100 -n cuda_64_100
-    optimum-report -e experiments/cuda_onnxruntime_128_10 -b experiments/cuda_pytorch_128_10 -n cuda_128_10
-    optimum-report -e experiments/cuda_onnxruntime_128_100 -b experiments/cuda_pytorch_128_100 -n cuda_128_100
-else
-    echo "Invalid argument"
-fi
\ No newline at end of file