CDCgov · dylanhmorris · Dec 4, 2024 · Nov 28, 2024 · Nov 28, 2024 · Dec 4, 2024
@@ -0,0 +1,214 @@
+library(forecasttools)
+library(ggplot2)
+library(dplyr)
+library(argparser)
+
+
+categorize_vec <- function(values, break_sets, label_sets) {
+  return(purrr::pmap_vec(
+    list(
+      x = values,
+      breaks = break_sets,
+      labels = label_sets,
+      include.lowest = TRUE,
+      order = TRUE,
+      right = TRUE
+    ),
+    cut
+  ))
+}
+
+
+
+with_category_cutpoints <- function(df,
+                                    disease,
+                                    categories) {
+  with_cutpoints <- df |>
+    mutate(disease = !!disease) |>
+    inner_join(categories, by = c("location", "disease"))
+  return(with_cutpoints)
+}
+
+
+to_categorized_iqr <- function(hub_table,
+                               disease,
+                               categories,
+                               .keep = FALSE) {
+  result <- hub_table |>
+    pivot_hubverse_quantiles_wider() |>
+    with_category_cutpoints(
+      disease = disease,
+      categories = categories
+    ) |>
+    mutate(
+      category_point = categorize_vec(
+        .data$point,
+        .data$bin_breaks,
+        .data$bin_names
+      ),
+      category_lower = categorize_vec(
+        .data$lower,
+        .data$bin_breaks,
+        .data$bin_names
+      ),
+      category_upper = categorize_vec(
+        .data$upper,
+        .data$bin_breaks,
+        .data$bin_names
+      ),
+    )
+
+  if (!.keep) {
+    result <- result |> select(-c(bin_breaks, bin_names))
+  }
+
+  return(result)
+}
+
+plot_category_pointintervals <- function(data, horizon) {
+  plot <- data |>
+    filter(.data$horizon == !!horizon) |>
+    arrange(point) |>
+    mutate("location" = factor(.data$location,
+      levels = unique(.data$location),
+      ordered = TRUE
+    )) |>
+    ggplot(aes(
+      y = location,
+      x = point,
+      xmin = lower,
+      xmax = upper
+    )) +
+    ggdist::geom_pointinterval() +
+    geom_point(
+      aes(
+        x = lower,
+        color = category_lower
+      ),
+      size = 3,
+      show.legend = TRUE
+    ) +
+    geom_point(
+      aes(
+        x = upper,
+        color = category_upper
+      ),
+      size = 3,
+      show.legend = TRUE
+    ) +
+    geom_point(
+      aes(
+        x = point,
+        color = category_point
+      ),
+      size = 5,
+      show.legend = TRUE
+    ) +
+    scale_x_continuous(label = label_percent()) +
+    scale_color_prism(drop = FALSE) +
+    labs(color = "Activity Level") +
+    theme_minimal()
+
+  return(plot)
+}
+
+
+main <- function(influenza_table_path,
+                 covid_table_path,
+                 categories_path,
+                 output_path,
+                 ...) {
+  categories <- arrow::read_parquet(categories_path) |>
+    transmute(
+      disease,
+      location = state_abb,
+      prop_lower_bound = 0,
+      prop_low = perc_level_low / 100,
+      prop_moderate = perc_level_moderate / 100,
+      prop_high = perc_level_high / 100,
+      prop_very_high = perc_level_very_high / 100,
+      prop_upper_bound = 1,
+      very_low_name = "Very Low",
+      low_name = "Low",
+      moderate_name = "Moderate",
+      high_name = "High",
+      very_high_name = "Very High"
+    ) |>
+    tidyr::nest(
+      bin_breaks = c(
+        prop_lower_bound,
+        prop_low,
+        prop_moderate,
+        prop_high,
+        prop_very_high,
+        prop_upper_bound
+      ),
+      bin_names = c(
+        very_low_name,
+        low_name,
+        moderate_name,
+        high_name,
+        very_high_name
+      )
+    )
+
+  flu_dat <- readr::read_tsv(influenza_table_path) |>
+    to_categorized_iqr(
+      "Influenza",
+      categories
+    )
+
+  covid_dat <- readr::read_tsv(covid_table_path) |>
+    to_categorized_iqr(
+      "COVID-19",
+      categories
+    )
+
+  plots <- list(
+    flu_plot_1wk = flu_dat |>
+      plot_category_pointintervals(horizon = 0) +
+      ggtitle("Influenza, 1 week ahead"),
+    flu_plot_2wk = flu_dat |>
+      plot_category_pointintervals(horizon = 1) +
+      labs(x = "% ED visits") +
+      ggtitle("Influenza, 2 weeks ahead"),
+    covid_plot_1wk = covid_dat |>
+      plot_category_pointintervals(horizon = 0) +
+      labs(x = "% ED visits") +
+      ggtitle("COVID-19, 1 week ahead"),
+    covid_plot_2wk = covid_dat |>
+      plot_category_pointintervals(horizon = 1) +
+      labs(x = "% ED visits") +
+      ggtitle("COVID-19, 2 weeks ahead")
+  )
+
+
+  plots_to_pdf(
+    plots,
+    output_path
+  )
+}
+
+
+p <- arg_parser("Create a pointinterval plot of forecasts") |>
+  add_argument(
+    "influenza_table_path",
+    help = "Path to a hubverse format forecast table for influenza."
+  ) |>
+  add_argument(
+    "covid_table_path",
+    help = "Path to a hubverse format forecast table for COVID-19."
+  ) |>
+  add_argument(
+    "categories_path",
+    help = "Path to a parquet file containing PRISM category cutpoints."
+  ) |>
+  add_argument(
+    "output_path",
+    help = "Path to save the output plots, as a single PDF"
+  )
+
+
+argv <- parse_args(p)
+
+do.call(main, argv)