diff --git a/doc/tutorials/customize-opt.ipynb b/doc/tutorials/customize-opt.ipynb index f7f58bcb..71c9f742 100644 --- a/doc/tutorials/customize-opt.ipynb +++ b/doc/tutorials/customize-opt.ipynb @@ -13,7 +13,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "```{contents} Table of Contents\n", + "```{contents} 目录\n", ":local:\n", ":depth: 1\n", "```" @@ -204,3334 +204,9 @@ }, { "cell_type": "code", - "execution_count": 5, + "execution_count": null, "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "2024-09-05 13:28:05 [INFO] Logging directory: /tmp/tmp081zz3q0/logs\n", - "2024-09-05 13:28:24 [INFO] LocalBuilder: max_workers = 24\n", - "2024-09-05 13:28:25 [INFO] LocalRunner: max_workers = 1\n", - "2024-09-05 13:28:27 [INFO] [task_scheduler.cc:159] Initializing Task #0: \"main\"\n", - "2024-09-05 13:28:27 [INFO] [task_scheduler.cc:180] TaskScheduler picks Task #0: \"main\"\n", - "2024-09-05 13:28:27 [INFO] [task_scheduler.cc:193] Sending 6 sample(s) to builder\n", - "2024-09-05 13:28:30 [INFO] [task_scheduler.cc:195] Sending 6 sample(s) to runner\n", - "2024-09-05 13:28:33 [DEBUG] XGB iter 0: tr-p-rmse: 0.276184\ttr-a-peak@32: 0.929974\ttr-rmse: 0.285904\ttr-rmse: 0.285904\n", - "2024-09-05 13:28:34 [DEBUG] XGB iter 25: tr-p-rmse: 0.019389\ttr-a-peak@32: 1.000000\ttr-rmse: 0.021202\ttr-rmse: 0.021202\n", - "2024-09-05 13:28:34 [DEBUG] XGB iter 50: tr-p-rmse: 0.016852\ttr-a-peak@32: 1.000000\ttr-rmse: 0.017945\ttr-rmse: 0.017945\n", - "2024-09-05 13:28:34 [DEBUG] XGB iter 75: tr-p-rmse: 0.016863\ttr-a-peak@32: 1.000000\ttr-rmse: 0.017944\ttr-rmse: 0.017944\n", - "2024-09-05 13:28:34 [DEBUG] XGB stopped. Best iteration: [38] tr-p-rmse:0.01679\ttr-a-peak@32:1.00000\ttr-rmse:0.01798\ttr-rmse:0.01798 \n", - "2024-09-05 13:28:34 [INFO] [task_scheduler.cc:237] [Updated] Task #0: \"main\"\n" - ] - }, - { - "data": { - "text/html": [ - "
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.3328 | \n", - "3.3328 | \n", - "6 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.3328 | \n", - "3.3328 | \n", - "6 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.3328 | \n", - "3.3328 | \n", - "6 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.3328 | \n", - "3.3328 | \n", - "6 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.3328 | \n", - "3.3328 | \n", - "6 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.3328 | \n", - "3.3328 | \n", - "6 | \n", - "Y | \n", - "
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.4793 | \n", - "3.4611 | \n", - "3.4611 | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.5269 | \n", - "3.3533 | \n", - "3.3533 | \n", - "128 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.5269 | \n", - "3.3533 | \n", - "3.3533 | \n", - "192 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.5269 | \n", - "3.3533 | \n", - "3.3533 | \n", - "256 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.5787 | \n", - "3.2431 | \n", - "3.2431 | \n", - "320 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.5926 | \n", - "3.2149 | \n", - "3.2149 | \n", - "384 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.5927 | \n", - "3.2147 | \n", - "3.2147 | \n", - "448 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.5927 | \n", - "3.2147 | \n", - "3.2147 | \n", - "512 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.6644 | \n", - "3.0761 | \n", - "3.0761 | \n", - "576 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.6644 | \n", - "3.0761 | \n", - "3.0761 | \n", - "640 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.6644 | \n", - "3.0761 | \n", - "3.0761 | \n", - "704 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.6644 | \n", - "3.0761 | \n", - "3.0761 | \n", - "768 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.6938 | \n", - "3.0228 | \n", - "3.0228 | \n", - "832 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.6938 | \n", - "3.0228 | \n", - "3.0228 | \n", - "896 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "960 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1024 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1088 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1152 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1216 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1279 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1343 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1407 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1470 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1534 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1598 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1662 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7415 | \n", - "2.9400 | \n", - "2.9400 | \n", - "1726 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7419 | \n", - "2.9394 | \n", - "2.9394 | \n", - "1790 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7419 | \n", - "2.9394 | \n", - "2.9394 | \n", - "1854 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7419 | \n", - "2.9394 | \n", - "2.9394 | \n", - "1918 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7419 | \n", - "2.9394 | \n", - "2.9394 | \n", - "1981 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7419 | \n", - "2.9394 | \n", - "2.9394 | \n", - "2000 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "main | \n", - "5120 | \n", - "1 | \n", - "1.7419 | \n", - "2.9394 | \n", - "2.9394 | \n", - "2000 | \n", - "Y | \n", - "
# from tvm.script import ir as I\n",
- "# from tvm.script import tir as T\n",
- "# from tvm.script import relax as R\n",
- "\n",
- "@I.ir_module\n",
- "class Module:\n",
- " I.module_attrs({"external_mods": [metadata["runtime.Module"][0]]})\n",
- " @T.prim_func(private=True)\n",
- " def matmul(lv: T.Buffer((T.int64(1), T.int64(256)), "float32"), permute_dims1: T.Buffer((T.int64(256), T.int64(10)), "float32"), matmul: T.Buffer((T.int64(1), T.int64(10)), "float32")):\n",
- " T.func_attr({"op_pattern": 4, "tir.is_scheduled": T.bool(True), "tir.noalias": T.bool(True)})\n",
- " # with T.block("root"):\n",
- " matmul_local = T.alloc_buffer((T.int64(1), T.int64(10)), scope="local")\n",
- " lv_shared = T.alloc_buffer((T.int64(1), T.int64(256)), scope="shared")\n",
- " permute_dims1_shared = T.alloc_buffer((T.int64(256), T.int64(10)), scope="shared")\n",
- " for i0_0_i1_0_fused in T.thread_binding(T.int64(1), thread="blockIdx.x", annotations={"pragma_auto_unroll_max_step": 1024, "pragma_unroll_explicit": 1}):\n",
- " for i0_1_i1_1_fused in T.thread_binding(T.int64(1), thread="vthread.x"):\n",
- " for i0_2_i1_2_fused in T.thread_binding(T.int64(10), thread="threadIdx.x"):\n",
- " for i0_3_init, i1_3_init, i0_4_init, i1_4_init in T.grid(T.int64(1), T.int64(1), T.int64(1), T.int64(1)):\n",
- " with T.block("matmul_init"):\n",
- " v_i0 = T.axis.spatial(T.int64(1), i0_3_init + i0_4_init)\n",
- " v_i1 = T.axis.spatial(T.int64(10), i0_2_i1_2_fused + i1_3_init + i1_4_init)\n",
- " T.reads()\n",
- " T.writes(matmul_local[v_i0, v_i1])\n",
- " T.block_attr({"meta_schedule.thread_extent_high_inclusive": 1024, "meta_schedule.thread_extent_low_inclusive": 1, "meta_schedule.tiling_structure": "SSSRRSRS"})\n",
- " matmul_local[v_i0, v_i1] = T.float32(0.0)\n",
- " for k_0 in range(T.int64(1)):\n",
- " for ax0_ax1_fused_0 in range(T.int64(7)):\n",
- " for ax0_ax1_fused_1 in T.thread_binding(T.int64(10), thread="threadIdx.x"):\n",
- " for ax0_ax1_fused_2 in T.vectorized(T.int64(4)):\n",
- " with T.block("lv_shared"):\n",
- " v0 = T.axis.spatial(T.int64(1), T.int64(0))\n",
- " v1 = T.axis.spatial(T.int64(256), ax0_ax1_fused_0 * T.int64(40) + ax0_ax1_fused_1 * T.int64(4) + ax0_ax1_fused_2)\n",
- " T.where((ax0_ax1_fused_0 * T.int64(10) + ax0_ax1_fused_1) * T.int64(4) + ax0_ax1_fused_2 < T.int64(256))\n",
- " T.reads(lv[v0, v1])\n",
- " T.writes(lv_shared[v0, v1])\n",
- " lv_shared[v0, v1] = lv[v0, v1]\n",
- " for ax0_ax1_fused_0 in range(T.int64(64)):\n",
- " for ax0_ax1_fused_1 in T.thread_binding(T.int64(10), thread="threadIdx.x"):\n",
- " for ax0_ax1_fused_2 in T.vectorized(T.int64(4)):\n",
- " with T.block("permute_dims1_shared"):\n",
- " v0 = T.axis.spatial(T.int64(256), (ax0_ax1_fused_0 * T.int64(40) + ax0_ax1_fused_1 * T.int64(4) + ax0_ax1_fused_2) // T.int64(10))\n",
- " v1 = T.axis.spatial(T.int64(10), (ax0_ax1_fused_0 * T.int64(40) + ax0_ax1_fused_1 * T.int64(4) + ax0_ax1_fused_2) % T.int64(10))\n",
- " T.reads(permute_dims1[v0, v1])\n",
- " T.writes(permute_dims1_shared[v0, v1])\n",
- " permute_dims1_shared[v0, v1] = permute_dims1[v0, v1]\n",
- " for k_1, i0_3, i1_3, k_2, i0_4, i1_4 in T.grid(T.int64(8), T.int64(1), T.int64(1), T.int64(32), T.int64(1), T.int64(1)):\n",
- " with T.block("matmul_update"):\n",
- " v_i0 = T.axis.spatial(T.int64(1), i0_3 + i0_4)\n",
- " v_i1 = T.axis.spatial(T.int64(10), i0_2_i1_2_fused + i1_3 + i1_4)\n",
- " v_k = T.axis.reduce(T.int64(256), k_0 * T.int64(256) + k_1 * T.int64(32) + k_2)\n",
- " T.reads(matmul_local[v_i0, v_i1], lv_shared[v_i0, v_k], permute_dims1_shared[v_k, v_i1])\n",
- " T.writes(matmul_local[v_i0, v_i1])\n",
- " T.block_attr({"meta_schedule.thread_extent_high_inclusive": 1024, "meta_schedule.thread_extent_low_inclusive": 1, "meta_schedule.tiling_structure": "SSSRRSRS"})\n",
- " matmul_local[v_i0, v_i1] = matmul_local[v_i0, v_i1] + lv_shared[v_i0, v_k] * permute_dims1_shared[v_k, v_i1]\n",
- " for ax0, ax1 in T.grid(T.int64(1), T.int64(1)):\n",
- " with T.block("matmul_local"):\n",
- " v0 = T.axis.spatial(T.int64(1), ax0)\n",
- " v1 = T.axis.spatial(T.int64(10), i0_2_i1_2_fused + ax1)\n",
- " T.reads(matmul_local[v0, v1])\n",
- " T.writes(matmul[v0, v1])\n",
- " matmul[v0, v1] = matmul_local[v0, v1]\n",
- "\n",
- " @T.prim_func(private=True)\n",
- " def transpose(fc2_weight: T.Buffer((T.int64(10), T.int64(256)), "float32"), T_transpose: T.Buffer((T.int64(256), T.int64(10)), "float32")):\n",
- " T.func_attr({"op_pattern": 2, "tir.is_scheduled": T.bool(True), "tir.noalias": T.bool(True)})\n",
- " # with T.block("root"):\n",
- " for ax0_ax1_fused_0 in T.thread_binding(T.int64(3), thread="blockIdx.x"):\n",
- " for ax0_ax1_fused_1 in T.thread_binding(T.int64(1024), thread="threadIdx.x"):\n",
- " with T.block("T_transpose"):\n",
- " v_ax0 = T.axis.spatial(T.int64(256), (ax0_ax1_fused_0 * T.int64(1024) + ax0_ax1_fused_1) // T.int64(10))\n",
- " v_ax1 = T.axis.spatial(T.int64(10), (ax0_ax1_fused_0 * T.int64(1024) + ax0_ax1_fused_1) % T.int64(10))\n",
- " T.where(ax0_ax1_fused_0 * T.int64(1024) + ax0_ax1_fused_1 < T.int64(2560))\n",
- " T.reads(fc2_weight[v_ax1, v_ax0])\n",
- " T.writes(T_transpose[v_ax0, v_ax1])\n",
- " T_transpose[v_ax0, v_ax1] = fc2_weight[v_ax1, v_ax0]\n",
- "\n",
- " @R.function\n",
- " def forward(x: R.Tensor((1, 784), dtype="float32"), fc1_weight: R.Tensor((256, 784), dtype="float32"), fc1_bias: R.Tensor((256,), dtype="float32"), fc2_weight: R.Tensor((10, 256), dtype="float32")) -> R.Tensor((1, 10), dtype="float32"):\n",
- " R.func_attr({"num_input": 1})\n",
- " cls = Module\n",
- " with R.dataflow():\n",
- " lv = R.call_dps_packed("fused_relax_permute_dims_relax_matmul_relax_add_relax_nn_relu_cublas", (fc1_weight, x, fc1_bias), out_sinfo=R.Tensor((1, 256), dtype="float32"))\n",
- " permute_dims1 = R.call_tir(cls.transpose, (fc2_weight,), out_sinfo=R.Tensor((256, 10), dtype="float32"))\n",
- " gv = R.call_tir(cls.matmul, (lv, permute_dims1), out_sinfo=R.Tensor((1, 10), dtype="float32"))\n",
- " R.output(gv)\n",
- " return gv\n",
- "\n",
- "# Metadata omitted. Use show_meta=True in script() method to show it.\n",
- "
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "0 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "64 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "128 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "191 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "255 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "319 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "383 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "447 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "511 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "575 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "639 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "703 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "703 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "64 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "767 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "767 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "831 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "895 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "958 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1022 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1086 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1150 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1214 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1278 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1342 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1406 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1406 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1470 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "128 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1534 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1534 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1598 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1662 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1726 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1790 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1854 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1918 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "1982 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2045 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2109 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2109 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2173 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2237 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2237 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "192 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2301 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2301 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2364 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2428 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2491 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2555 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2619 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2683 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2747 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2811 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2811 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2874 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "2938 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3002 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "256 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3066 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3066 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3130 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3194 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "62 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3257 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3257 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3321 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3385 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3449 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "\n", - " |
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3513 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "Y | \n", - "
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3513 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "Y | \n", - "
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3577 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "Y | \n", - "
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3641 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
\n", - " | Name | \n", - "FLOP | \n", - "Weight | \n", - "Speed (GFLOPS) | \n", - "Latency (us) | \n", - "Weighted Latency (us) | \n", - "Trials | \n", - "Done | \n", - "
---|---|---|---|---|---|---|---|---|
0 | \n", - "fused_matmul_add13 | \n", - "1025000 | \n", - "1 | \n", - "108.7936 | \n", - "9.4215 | \n", - "9.4215 | \n", - "320 | \n", - "\n", - " |
1 | \n", - "transpose | \n", - "1 | \n", - "1 | \n", - "0.0001 | \n", - "10.3088 | \n", - "10.3088 | \n", - "1 | \n", - "Y | \n", - "
2 | \n", - "reshape | \n", - "1 | \n", - "1 | \n", - "0.0003 | \n", - "3.2698 | \n", - "3.2698 | \n", - "5 | \n", - "\n", - " |
3 | \n", - "adaptive_avg_pool2d | \n", - "25600 | \n", - "1 | \n", - "11.5840 | \n", - "2.2099 | \n", - "2.2099 | \n", - "124 | \n", - "\n", - " |
4 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "231336448 | \n", - "1 | \n", - "2063.1924 | \n", - "112.1255 | \n", - "112.1255 | \n", - "3705 | \n", - "\n", - " |
5 | \n", - "fused_conv2d_subtract_divide_expand_dims_multiply_expand_dims_add1_relu | \n", - "240041984 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
6 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_relu1 | \n", - "232214528 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
7 | \n", - "fused_conv2d8_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_relu4 | \n", - "115730944 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
8 | \n", - "fused_conv2d9_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11_add12_relu4 | \n", - "231361536 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
9 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "231712768 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
10 | \n", - "fused_conv2d10_subtract4_divide4_expand_dims3_multiply4_expand_dims3_add11 | \n", - "12945408 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
11 | \n", - "max_pool2d | \n", - "1806336 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "62 | \n", - "\n", - " |
12 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_add9_relu3 | \n", - "231512064 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
13 | \n", - "fused_conv2d4_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5 | \n", - "13246464 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
14 | \n", - "fused_conv2d1_subtract1_divide1_expand_dims_multiply1_expand_dims_add2_add3_relu1 | \n", - "232415232 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
15 | \n", - "fused_conv2d2_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_relu2 | \n", - "116107264 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
16 | \n", - "fused_conv2d5_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "115856384 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "63 | \n", - "\n", - " |
17 | \n", - "fused_conv2d7_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8 | \n", - "13045760 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
18 | \n", - "fused_conv2d3_subtract2_divide2_expand_dims1_multiply2_expand_dims1_add5_add6_relu2 | \n", - "231813120 | \n", - "2 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |
19 | \n", - "fused_conv2d6_subtract3_divide3_expand_dims2_multiply3_expand_dims2_add8_relu3 | \n", - "231461888 | \n", - "1 | \n", - "N/A | \n", - "N/A | \n", - "N/A | \n", - "64 | \n", - "\n", - " |