[Roadmap] Meta Schedule Rules #491

junrushao · 2021-10-23T02:31:06Z

Schedule Rule

(Junru) Auto-Inline [MetaSchedule] Multi-Level-Tiling & Auto-Inline #503
(Junru) Multi-Level-Tiling [MetaSchedule] Multi-Level-Tiling & Auto-Inline #503
(Bohan) Parallel-Vectorize-Unroll [MetaSchedule] Parallel-Vectorize-Unroll & Random-Compute-Location #516
(Bohan) Random-Compute-Location [MetaSchedule] Parallel-Vectorize-Unroll & Random-Compute-Location #516
(Siyuan) Add-RFactor Rule RFactor #551
(Ruihang) Cross-Thread-Reduction [MetaSchedule] Schedule Rule: Cross-Thread Reduction #556

Auto Tensor Core Rule

Multi-Level-Tiling (with Tensor Core) [MetaSchedule] Auto Tensor Core related #524
Rewrite-Reduction-Block (with Tensor Core) [MetaSchedule] Auto Tensor Core related #524
Rewrite-Cooperative-Fetch (with Tensor Core) [MetaSchedule] Auto Tensor Core related #524
Rewrite-Tensor-Core [MetaSchedule] Auto Tensor Core related #524

Postproc Rule

(Bohan, Hongyi) Rewrite-Parallel-Vectorize-Unroll [MetaSchedule] Rewrite Parallel-Vectorize-Unroll / Verify-GPU / Disallow-Dynamic-Loops #499
(Junru) Rewrite-Reduction-Block [MetaSchedule] Rewrite Cooperative-Fetching / Unbound-Block / Reduction-Block #509
(Bohan) Disallow-Dynamic-Loops [MetaSchedule] Rewrite Parallel-Vectorize-Unroll / Verify-GPU / Disallow-Dynamic-Loops #499
(Junru) Rewrite-Cooperative-Fetch [MetaSchedule] Rewrite Cooperative-Fetching / Unbound-Block / Reduction-Block #509
(Junru) Rewrite-Unbound-Blocks [MetaSchedule] Rewrite Cooperative-Fetching / Unbound-Block / Reduction-Block #509
(Bohan) Verify-GPU-Code [MetaSchedule] Rewrite Parallel-Vectorize-Unroll / Verify-GPU / Disallow-Dynamic-Loops #499

Mutator Rule

(Junru) Mutate-Tile-Size [MetaSchedule] Mutator-Tile-Size, Mutate-Parallel, Mutate-Unroll #534
(Junru) Mutate-Unroll [MetaSchedule] Mutator-Tile-Size, Mutate-Parallel, Mutate-Unroll #534
(Junru) Mutate-Parallel [MetaSchedule] Mutator-Tile-Size, Mutate-Parallel, Mutate-Unroll #534
(Bohan) Mutate-Compute-Location [MetaSchedule] Mutator-Compute-Location #548

Appendix

Legacy CPU

SearchRule

ms.rule.inline_pure_spatial(strict_mode=True)
ms.rule.add_rfactor(
  max_jobs_per_core=16,
  max_innermost_factor=64,
)
ms.rule.multi_level_tiling(
  structure="SSRSRS",
  must_cache_read=False,
  cache_read_scope="global",
  can_cache_write=True,
  must_cache_write=False,
  cache_write_scope="global",
  consumer_inline_strict=True,
  fusion_levels=[1, 2],
)
ms.rule.parallelize_vectorize_unroll(
  max_jobs_per_core=16,
  max_vectorize_extent=32,
  unroll_max_steps=[0, 16, 64, 512],
  unroll_explicit=True,
)
ms.rule.random_compute_location()

Postproc

ms.postproc.rewrite_parallel_vectorize_unroll()
ms.postproc.rewrite_reduction_block()
ms.postproc.disallow_dynamic_loops()

Mutator

ms.mutator.mutate_tile_size(): 0.90
ms.mutator.mutate_compute_location(): 0.05
ms.mutator.mutate_auto_unroll(): 0.03
ms.mutator.mutate_parallel(max_jobs_per_core=16): 0.02

Legacy CUDA

SearchRule

ms.rule.multi_level_tiling(
  structure="SSSRRSRS",
  must_cache_read=True,
  cache_read_scope="shared",
  can_cache_write=True,
  must_cache_write=True,
  cache_write_scope="local",
  consumer_inline_strict=False,
  fusion_levels=[3],
  vector_load_max_len=4,
  tile_binds=["blockIdx.x", "vthread", "threadIdx.x"],
)
ms.rule.inline_pure_spatial(strict_mode=False)
ms.rule.parallelize_vectorize_unroll(
  max_jobs_per_core=-1,  # disable parallelize
  max_vectorize_extent=-1,  # disable vectorize
  unroll_max_steps=[0, 16, 64, 512, 1024],
  unroll_explicit=True,
)

Postproc

ms.postproc.rewrite_cooperative_fetch()
ms.postproc.rewrite_unbound_blocks()
ms.postproc.rewrite_parallel_vectorize_unroll()
ms.postproc.rewrite_reduction_block()
ms.postproc.disallow_dynamic_loops()
ms.postproc.verify_gpu_code()

Mutator

ms.mutator.mutate_tile_size(): 0.90
ms.mutator.mutate_auto_unroll(): 0.10

junrushao added the Roadmap label Oct 26, 2021

junrushao mentioned this issue Nov 22, 2021

[MetaSchedule] Parallel-Vectorize-Unroll & Random-Compute-Location #516

Merged

3 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Roadmap] Meta Schedule Rules #491

[Roadmap] Meta Schedule Rules #491

junrushao commented Oct 23, 2021 •

edited by MasterJH5574

Loading

[Roadmap] Meta Schedule Rules #491

[Roadmap] Meta Schedule Rules #491

Comments

junrushao commented Oct 23, 2021 • edited by MasterJH5574 Loading

Schedule Rule

Auto Tensor Core Rule

Postproc Rule

Mutator Rule

Appendix

Legacy CPU

SearchRule

Postproc

Mutator

Legacy CUDA

SearchRule

Postproc

Mutator

junrushao commented Oct 23, 2021 •

edited by MasterJH5574

Loading