From 141eb6a315542317ddab2f7a413a24559c84492f Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 17 Jan 2024 12:08:18 +0000
Subject: [PATCH 01/51] Start mindeps

---
 ci/scripts/min-deps.py     | 98 ++++++++++++++++++++++++++++++++++++++
 ci/scripts/run-min-deps.sh | 17 +++++++
 pyproject.toml             | 22 ++++-----
 3 files changed, 126 insertions(+), 11 deletions(-)
 create mode 100755 ci/scripts/min-deps.py
 create mode 100755 ci/scripts/run-min-deps.sh

diff --git a/ci/scripts/min-deps.py b/ci/scripts/min-deps.py
new file mode 100755
index 0000000000..9d0fcbb1b5
--- /dev/null
+++ b/ci/scripts/min-deps.py
@@ -0,0 +1,98 @@
+#!python3
+from __future__ import annotations
+
+import argparse
+import sys
+from pathlib import Path
+
+if sys.version_info >= (3, 11):
+    import tomllib
+else:
+    import tomli as tomllib
+from packaging.requirements import Requirement
+from packaging.version import Version
+
+
+def min_dep(req: Requirement) -> str:
+    """
+    Given a requirement, return the minimum version specifier.
+
+    Example
+    -------
+
+    >>> min_dep(Requirement("numpy>=1.0"))
+    "numpy==1.0"
+    """
+    req_name = req.name
+    if req.extras:
+        req_name = f"{req_name}[{','.join(req.extras)}]"
+
+    # TODO: Should this be allowed?
+    if not req.specifier:
+        return req_name
+
+    min_version = Version("0.0.0.a1")
+    for spec in req.specifier:
+        if spec.operator in [">", ">=", "~-"]:
+            min_version = max(min_version, Version(spec.version))
+        elif spec.operator == "==":
+            min_version = Version(spec.version)
+
+    # TODO: should this return `~=` or `==`?
+    return f"{req_name}=={min_version}.*"
+
+
+def extract_min_deps(
+        dependencies: list[str], 
+        *, 
+        pyproject
+    ) -> list[str]:
+    dependencies = dependencies.copy()  # We'll be mutating this
+    requirements: list[Requirement] = []
+    project_name = pyproject["project"]["name"]
+
+    while len(dependencies) > 0:
+        req = Requirement(dependencies.pop())
+
+        # If we are reffering to other optional dependency lists, resolve them
+        if req.name == project_name:
+            assert req.extras, f"Project included itself as dependency, without specifying extras: {req}"
+            for extra in req.extras:
+                dependencies.extend(pyproject["project"]["optional-dependencies"][extra])
+        else:
+            requirements.append(min_dep(req))
+
+    return requirements
+
+
+def main():
+    # TODO: Allow optional dependencies
+    parser = argparse.ArgumentParser(
+        prog="min-deps",
+        description="""Parse a pyproject.toml file and output a list of minimum dependencies.
+
+        Output is directly passable to `pip install`.""",
+        usage="pip install `python min-deps.py pyproject.toml`",
+    )
+    parser.add_argument(
+        "path", type=Path, help="pyproject.toml to parse minimum dependencies from"
+    )
+    parser.add_argument("--extras", type=str, nargs="*", help="extras to install")
+
+    args = parser.parse_args()
+
+    pyproject = tomllib.loads(args.path.read_text())
+
+    project_name = pyproject["project"]["name"]
+    deps = pyproject["project"]["dependencies"]
+
+    for extra in args.extras:
+        deps.append(f"{project_name}[{extra}]")
+
+    min_deps = extract_min_deps(deps, pyproject=pyproject)
+
+    print(" ".join(min_deps))
+
+
+if __name__ == "__main__":
+    main()
diff --git a/ci/scripts/run-min-deps.sh b/ci/scripts/run-min-deps.sh
new file mode 100755
index 0000000000..6f33256b6f
--- /dev/null
+++ b/ci/scripts/run-min-deps.sh
@@ -0,0 +1,17 @@
+mamba env remove -yn scanpy-min-deps-test
+mamba create -yn scanpy-min-deps-test "python=3.9"
+
+PACKAGES=`python3 ci/scripts/min-deps.py pyproject.toml --extra dev test`
+
+# conda activate anndata-min-deps-test
+# conda run -n anndata-min-deps-test pip install cupy-cuda12x
+
+
+echo Installing $PACKAGES
+conda run -n scanpy-min-deps-test pip install $PACKAGES
+conda run -n scanpy-min-deps-test pip install pytest-xdist # cupy-cuda12x
+conda run -n scanpy-min-deps-test pip install -e . --no-deps
+echo "Starting tests"
+conda run -n scanpy-min-deps-test pytest -n auto
+
+conda list -n scanpy-min-deps-tests
\ No newline at end of file
diff --git a/pyproject.toml b/pyproject.toml
index 65d3dfb8bc..2057cb05bb 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -48,22 +48,22 @@ classifiers = [
 dependencies = [
     "anndata>=0.7.4",
     # numpy needs a version due to #1320
-    "numpy>=1.17.0",
+    "numpy>=1.23",
     "matplotlib>=3.6",
-    "pandas >=2.1.3",
-    "scipy>=1.4",
-    "seaborn>=0.13.0",
-    "h5py>=3",
+    "pandas >=1.5",
+    "scipy>=1.8",
+    "seaborn>=0.13",
+    "h5py>=3.1",
     "tqdm",
     "scikit-learn>=0.24",
-    "statsmodels>=0.10.0rc2",
+    "statsmodels>=0.10",
     "patsy",
     "networkx>=2.3",
     "natsort",
     "joblib",
-    "numba>=0.41.0",
+    "numba>=0.53",
     "umap-learn>=0.3.10",
-    "packaging",
+    "packaging>=20.0",
     "session-info",
     "legacy-api-wrap>=1.4",  # for positional API deprecations
     "get-annotations; python_version < '3.10'",
@@ -133,8 +133,8 @@ dev = [
 ]
 # Algorithms
 paga = ["igraph"]
-louvain = ["igraph", "louvain>=0.6,!=0.6.2"]  # Louvain community detection
-leiden = ["igraph>=0.10", "leidenalg>=0.9"]  # Leiden community detection
+louvain = ["igraph", "louvain>=0.6.0,!=0.6.2"]  # Louvain community detection
+leiden = ["igraph>=0.10", "leidenalg>=0.9.0"]  # Leiden community detection
 bbknn = ["bbknn"]  # Batch balanced KNN (batch correction)
 magic = ["magic-impute>=2.0"]  # MAGIC imputation method
 skmisc = ["scikit-misc>=0.1.3"]  # highly_variable_genes method 'seurat_v3'
@@ -143,7 +143,7 @@ scanorama = ["scanorama"]  # Scanorama dataset integration
 scrublet = ["scrublet"]  # Doublet detection
 # Acceleration
 rapids = ["cudf>=0.9", "cuml>=0.9", "cugraph>=0.9"]  # GPU accelerated calculation of neighbors
-dask = ["dask[array]!=2.17.0"]  # Use the Dask parallelization engine
+dask = ["dask[array]>=2022.09"]  # Use the Dask parallelization engine
 dask-ml = ["dask-ml", "scanpy[dask]"]  # Dask-ML for sklearn-like API
 
 [tool.hatch.build]

From a07568eea8d63a9472bbce87b08ea050bc940274 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 17 Jan 2024 12:32:46 +0000
Subject: [PATCH 02/51] Fix check_is_fitted import

---
 scanpy/neighbors/_backends/rapids.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/scanpy/neighbors/_backends/rapids.py b/scanpy/neighbors/_backends/rapids.py
index 78a6bb7359..ef6b9b23f1 100644
--- a/scanpy/neighbors/_backends/rapids.py
+++ b/scanpy/neighbors/_backends/rapids.py
@@ -3,8 +3,9 @@
 from typing import TYPE_CHECKING, Any, Literal
 
 import numpy as np
-from sklearn.base import BaseEstimator, TransformerMixin, check_is_fitted
+from sklearn.base import BaseEstimator, TransformerMixin
 from sklearn.exceptions import NotFittedError
+from sklearn.utils.validation import check_is_fitted
 
 from ..._settings import settings
 from ._common import TransformerChecksMixin

From 705acfe71e184c3cf58b884c7af6b5682f08b5da Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 17 Jan 2024 12:52:50 +0000
Subject: [PATCH 03/51] Temporarilly bump anndata dep to access test utilities

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index 2057cb05bb..eed3af0455 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -46,7 +46,7 @@ classifiers = [
     "Topic :: Scientific/Engineering :: Visualization",
 ]
 dependencies = [
-    "anndata>=0.7.4",
+    "anndata>=0.10",
     # numpy needs a version due to #1320
     "numpy>=1.23",
     "matplotlib>=3.6",

From 9a0dd1a56a3e96c6f2145db935cdb174de529255 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 17 Jan 2024 14:17:16 +0000
Subject: [PATCH 04/51] Support for numpy 1.23 where np.equal didn't work on
 strings

---
 scanpy/plotting/_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/scanpy/plotting/_utils.py b/scanpy/plotting/_utils.py
index 2edf6f618e..d9296aa456 100644
--- a/scanpy/plotting/_utils.py
+++ b/scanpy/plotting/_utils.py
@@ -381,7 +381,7 @@ def _validate_palette(adata: AnnData, key: str) -> None:
                 break
         _palette.append(color)
     # Don't modify if nothing changed
-    if _palette is None or np.equal(_palette, adata.uns[color_key]).all():
+    if _palette is None or _palette == list(adata.uns[color_key]):
         return
     adata.uns[color_key] = _palette
 

From e4dbcbc891276233f0449c800b39fa55ba17af01 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 17 Jan 2024 14:18:00 +0000
Subject: [PATCH 05/51] Fix palette color mapping for pandas < 2.1

---
 scanpy/plotting/_tools/scatterplots.py | 7 +++++--
 1 file changed, 5 insertions(+), 2 deletions(-)

diff --git a/scanpy/plotting/_tools/scatterplots.py b/scanpy/plotting/_tools/scatterplots.py
index 4b12e2a7ff..d6292452b3 100644
--- a/scanpy/plotting/_tools/scatterplots.py
+++ b/scanpy/plotting/_tools/scatterplots.py
@@ -12,6 +12,7 @@
 
 import numpy as np
 import pandas as pd
+from packaging.version import Version
 from anndata import AnnData  # noqa: TCH002
 from cycler import Cycler  # noqa: TCH002
 from matplotlib import colormaps, colors, patheffects, rcParams
@@ -1256,8 +1257,10 @@ def _color_vector(
     }
     # If color_map does not have unique values, this can be slow as the
     # result is not categorical
-    color_vector = pd.Categorical(values.map(color_map, na_action="ignore"))
-
+    if Version(pd.__version__) < Version("2.1.0"):
+        color_vector = pd.Categorical(values.map(color_map))
+    else:
+        color_vector = pd.Categorical(values.map(color_map, na_action="ignore"))
     # Set color to 'missing color' for all missing values
     if color_vector.isna().any():
         color_vector = color_vector.add_categories([to_hex(na_color)])

From 355c9043f01984a3eccde722e41a6b3921c9ec0d Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 17 Jan 2024 14:23:03 +0000
Subject: [PATCH 06/51] Bump networkx

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index eed3af0455..176cd6724f 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -58,7 +58,7 @@ dependencies = [
     "scikit-learn>=0.24",
     "statsmodels>=0.10",
     "patsy",
-    "networkx>=2.3",
+    "networkx>=2.6",
     "natsort",
     "joblib",
     "numba>=0.53",

From a8bd01bf229d20d549601f08e275d495e802e74f Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 17 Jan 2024 15:31:48 +0000
Subject: [PATCH 07/51] Exit on error for test script

---
 ci/scripts/run-min-deps.sh | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/ci/scripts/run-min-deps.sh b/ci/scripts/run-min-deps.sh
index 6f33256b6f..a8c20b3037 100755
--- a/ci/scripts/run-min-deps.sh
+++ b/ci/scripts/run-min-deps.sh
@@ -1,3 +1,5 @@
+set -e
+
 mamba env remove -yn scanpy-min-deps-test
 mamba create -yn scanpy-min-deps-test "python=3.9"
 

From d36b977fa0c85d67b96799da4cb86b8582868048 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 17 Jan 2024 15:32:18 +0000
Subject: [PATCH 08/51] Bump numba for numpy compat

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index 176cd6724f..f64babdc76 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -61,7 +61,7 @@ dependencies = [
     "networkx>=2.6",
     "natsort",
     "joblib",
-    "numba>=0.53",
+    "numba>=0.56",
     "umap-learn>=0.3.10",
     "packaging>=20.0",
     "session-info",

From 6b4823ce785526f46ba968c1df92ed0452591f9c Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 18 Jan 2024 14:41:42 +0000
Subject: [PATCH 09/51] update ci

---
 .azure-pipelines.yml | 40 +++++++++++++++++++++++++---------------
 1 file changed, 25 insertions(+), 15 deletions(-)

diff --git a/.azure-pipelines.yml b/.azure-pipelines.yml
index 70c85ce46f..97987129f9 100644
--- a/.azure-pipelines.yml
+++ b/.azure-pipelines.yml
@@ -5,10 +5,9 @@ variables:
   python.version: '3.11'
   PIP_CACHE_DIR: $(Pipeline.Workspace)/.pip
   PYTEST_ADDOPTS: '-v --color=yes --durations=0 --nunit-xml=test-data/test-results.xml'
-  ANNDATA_DEV: no
-  RUN_COVERAGE: no
   TEST_EXTRA: 'test-full'
-  PRERELEASE_DEPENDENCIES: no
+  DEPENDENCIES_VERSION: "latest"  # |"pre-release" | "minimum-version"
+  TEST_TYPE: "standard" # | "coverage"
 
 jobs:
 - job: PyTest
@@ -22,9 +21,12 @@ jobs:
       minimal_tests:
         TEST_EXTRA: 'test-min'
       anndata_dev:
-        ANNDATA_DEV: yes
-        RUN_COVERAGE: yes
-        PRERELEASE_DEPENDENCIES: yes
+        DEPENDENCIES_VERSION: "pre-release"
+        TEST_TYPE: "coverage"
+      MinDeps:
+        python.version: '3.9'
+        DEPENDENCIES_VERSION: "minimum-version"
+
 
   steps:
   - task: UsePythonVersion@0
@@ -51,19 +53,27 @@ jobs:
       pip install wheel coverage
       pip install .[dev,$(TEST_EXTRA)]
     displayName: 'Install dependencies'
-    condition: eq(variables['PRERELEASE_DEPENDENCIES'], 'no')
+    condition: eq(variables['DEPENDENCIES_VERSION'], 'latest')
 
   - script: |
       python -m pip install --pre --upgrade pip
       pip install --pre wheel coverage
       pip install --pre .[dev,$(TEST_EXTRA)]
+      pip install -v "anndata[dev,test] @ git+https://github.com/scverse/anndata"
     displayName: 'Install dependencies release candidates'
-    condition: eq(variables['PRERELEASE_DEPENDENCIES'], 'yes')
+    condition: eq(variables['DEPENDENCIES_VERSION'], 'pre-release')
 
   - script: |
-      pip install -v "anndata[dev,test] @ git+https://github.com/scverse/anndata"
-    displayName: 'Install development anndata'
-    condition: eq(variables['ANNDATA_DEV'], 'yes')
+      python -m pip install pip wheel tomli packaging
+      pip install `python3 ci/scripts/min-deps.py pyproject.toml --extra dev test`
+      pip install --no-deps .
+    displayName: 'Install dependencies minimum version'
+    condition: eq(variables['DEPENDENCIES_VERSION'], 'minimum-version')
+
+  # - script: |
+  #     pip install -v "anndata[dev,test] @ git+https://github.com/scverse/anndata"
+  #   displayName: 'Install development anndata'
+  #   condition: eq(variables['ANNDATA_DEV'], 'yes')
 
   - script: |
       pip list
@@ -71,20 +81,20 @@ jobs:
 
   - script: pytest
     displayName: 'PyTest'
-    condition: eq(variables['RUN_COVERAGE'], 'no')
+    condition: eq(variables['TEST_TYPE'], 'standard')
 
   - script: |
       coverage run -m pytest
       coverage xml
     displayName: 'PyTest (coverage)'
-    condition: eq(variables['RUN_COVERAGE'], 'yes')
+    condition: eq(variables['TEST_TYPE'], 'coverage')
 
   - task: PublishCodeCoverageResults@1
     inputs:
       codeCoverageTool: Cobertura
       summaryFileLocation: 'test-data/coverage.xml'
       failIfCoverageEmpty: true
-    condition: eq(variables['RUN_COVERAGE'], 'yes')
+    condition: eq(variables['TEST_TYPE'], 'coverage')
 
   - task: PublishTestResults@2
     condition: succeededOrFailed()
@@ -95,7 +105,7 @@ jobs:
 
   - script: bash <(curl -s https://codecov.io/bash)
     displayName: 'Upload to codecov.io'
-    condition: eq(variables['RUN_COVERAGE'], 'yes')
+    condition: eq(variables['TEST_TYPE'], 'coverage')
 
 - job: CheckBuild
   pool:

From efa8a3969df436cb13350f304db0bbf87e55644a Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 18 Jan 2024 14:52:06 +0000
Subject: [PATCH 10/51] Fix array comparison in both envs

---
 scanpy/plotting/_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/scanpy/plotting/_utils.py b/scanpy/plotting/_utils.py
index d9296aa456..ab08971165 100644
--- a/scanpy/plotting/_utils.py
+++ b/scanpy/plotting/_utils.py
@@ -381,7 +381,7 @@ def _validate_palette(adata: AnnData, key: str) -> None:
                 break
         _palette.append(color)
     # Don't modify if nothing changed
-    if _palette is None or _palette == list(adata.uns[color_key]):
+    if _palette is None or np.array_equal(_palette, adata.uns[color_key]):
         return
     adata.uns[color_key] = _palette
 

From 6b7a37f632152169c70d122ed37d51d0fad0a058 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 18 Jan 2024 17:33:51 +0000
Subject: [PATCH 11/51] Bump statsmodels version

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index f64babdc76..2b8549c067 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -56,7 +56,7 @@ dependencies = [
     "h5py>=3.1",
     "tqdm",
     "scikit-learn>=0.24",
-    "statsmodels>=0.10",
+    "statsmodels>=0.13",
     "patsy",
     "networkx>=2.6",
     "natsort",

From 47beebec6c0b6f6391094609fc566e35c3d5eb9c Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 18 Jan 2024 17:42:59 +0000
Subject: [PATCH 12/51] Test returns different plot type with older
 dependencies

---
 scanpy/get/get.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/scanpy/get/get.py b/scanpy/get/get.py
index 0bb9f9c124..15827182f9 100644
--- a/scanpy/get/get.py
+++ b/scanpy/get/get.py
@@ -258,7 +258,7 @@ def obs_df(
     ... )
     >>> plotdf.columns
     Index(['CD8B', 'n_genes', 'X_umap-0', 'X_umap-1'], dtype='object')
-    >>> plotdf.plot.scatter("X_umap-0", "X_umap-1", c="CD8B")
+    >>> plotdf.plot.scatter("X_umap-0", "X_umap-1", c="CD8B")  # doctest: +SKIP
     <Axes: xlabel='X_umap-0', ylabel='X_umap-1'>
 
     Calculating mean expression for marker genes by cluster:

From 1a5d701d838567059743c3647fe337a60d4fb56e Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 18 Jan 2024 17:47:54 +0000
Subject: [PATCH 13/51] Skip test that relies on pd.value_counts

---
 scanpy/plotting/_baseplot_class.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/scanpy/plotting/_baseplot_class.py b/scanpy/plotting/_baseplot_class.py
index 22ff04913e..10329f16e4 100644
--- a/scanpy/plotting/_baseplot_class.py
+++ b/scanpy/plotting/_baseplot_class.py
@@ -347,7 +347,7 @@ def add_totals(
         >>> adata = sc.datasets.pbmc68k_reduced()
         >>> markers = {'T-cell': 'CD3D', 'B-cell': 'CD79A', 'myeloid': 'CST3'}
         >>> plot = sc.pl._baseplot_class.BasePlot(adata, markers, groupby='bulk_labels').add_totals()
-        >>> plot.plot_group_extra['counts_df']
+        >>> plot.plot_group_extra['counts_df']  # doctest: +SKIP
         bulk_labels
         CD4+/CD25 T Reg                  68
         CD4+/CD45RA+/CD25- Naive T        8

From 4b04a76ea10e025d281a5016d33560e546698469 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 22 Jan 2024 12:06:47 +0000
Subject: [PATCH 14/51] Try to use better naming test results in CI

---
 .azure-pipelines.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.azure-pipelines.yml b/.azure-pipelines.yml
index 97987129f9..1ff40d636e 100644
--- a/.azure-pipelines.yml
+++ b/.azure-pipelines.yml
@@ -101,7 +101,7 @@ jobs:
     inputs:
       testResultsFiles: 'test-data/test-results.xml'
       testResultsFormat: NUnit
-      testRunTitle: 'Publish test results for Python $(python.version)'
+      testRunTitle: 'Publish test results for $(Agent.JobName)'
 
   - script: bash <(curl -s https://codecov.io/bash)
     displayName: 'Upload to codecov.io'

From 27fb272750da248fe02351aa70fed27a3839478a Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 22 Jan 2024 13:10:53 +0000
Subject: [PATCH 15/51] Temporarily bump pandas

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index 2b8549c067..65d235e7d4 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -50,7 +50,7 @@ dependencies = [
     # numpy needs a version due to #1320
     "numpy>=1.23",
     "matplotlib>=3.6",
-    "pandas >=1.5",
+    "pandas >=2.0",
     "scipy>=1.8",
     "seaborn>=0.13",
     "h5py>=3.1",

From 4e61bea1e66f02a10f6c8d20de6ed8ddaf88c80d Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 22 Jan 2024 14:13:32 +0000
Subject: [PATCH 16/51] Add dependency on pynndescent, bump packaging version

---
 pyproject.toml | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index 65d235e7d4..4953b07035 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -63,7 +63,8 @@ dependencies = [
     "joblib",
     "numba>=0.56",
     "umap-learn>=0.3.10",
-    "packaging>=20.0",
+    "pynndescent>=0.5",
+    "packaging>=21.3",
     "session-info",
     "legacy-api-wrap>=1.4",  # for positional API deprecations
     "get-annotations; python_version < '3.10'",

From ed71b1101910e4b84c0909ea3e776c6981ded205 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 22 Jan 2024 14:19:41 +0000
Subject: [PATCH 17/51] skip doctest for dendrogram

---
 scanpy/tools/_dendrogram.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/scanpy/tools/_dendrogram.py b/scanpy/tools/_dendrogram.py
index 31fe6564fc..6789a8d198 100644
--- a/scanpy/tools/_dendrogram.py
+++ b/scanpy/tools/_dendrogram.py
@@ -111,7 +111,7 @@ def dendrogram(
     >>> import scanpy as sc
     >>> adata = sc.datasets.pbmc68k_reduced()
     >>> sc.tl.dendrogram(adata, groupby='bulk_labels')
-    >>> sc.pl.dendrogram(adata, groupby='bulk_labels')
+    >>> sc.pl.dendrogram(adata, groupby='bulk_labels')  # doctest: +SKIP
     <Axes: >
     >>> markers = ['C1QA', 'PSAP', 'CD79A', 'CD79B', 'CST3', 'LYZ']
     >>> sc.pl.dotplot(adata, markers, groupby='bulk_labels', dendrogram=True)

From cb95628f2c916e7857e5d994bce6cd4662016458 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 22 Jan 2024 14:21:25 +0000
Subject: [PATCH 18/51] install pre-commit in env

---
 ci/scripts/min-deps.py                 | 10 ++++------
 ci/scripts/run-min-deps.sh             |  2 +-
 scanpy/plotting/_tools/scatterplots.py |  2 +-
 3 files changed, 6 insertions(+), 8 deletions(-)

diff --git a/ci/scripts/min-deps.py b/ci/scripts/min-deps.py
index 9d0fcbb1b5..4e2e416a3c 100755
--- a/ci/scripts/min-deps.py
+++ b/ci/scripts/min-deps.py
@@ -42,11 +42,7 @@ def min_dep(req: Requirement) -> str:
     return f"{req_name}=={min_version}.*"
 
 
-def extract_min_deps(
-        dependencies: list[str], 
-        *, 
-        pyproject
-    ) -> list[str]:
+def extract_min_deps(dependencies: list[str], *, pyproject) -> list[str]:
     dependencies = dependencies.copy()  # We'll be mutating this
     requirements: list[Requirement] = []
     project_name = pyproject["project"]["name"]
@@ -58,7 +54,9 @@ def extract_min_deps(
         if req.name == project_name:
             assert req.extras, f"Project included itself as dependency, without specifying extras: {req}"
             for extra in req.extras:
-                dependencies.extend(pyproject["project"]["optional-dependencies"][extra])
+                dependencies.extend(
+                    pyproject["project"]["optional-dependencies"][extra]
+                )
         else:
             requirements.append(min_dep(req))
 
diff --git a/ci/scripts/run-min-deps.sh b/ci/scripts/run-min-deps.sh
index a8c20b3037..9968bb0471 100755
--- a/ci/scripts/run-min-deps.sh
+++ b/ci/scripts/run-min-deps.sh
@@ -16,4 +16,4 @@ conda run -n scanpy-min-deps-test pip install -e . --no-deps
 echo "Starting tests"
 conda run -n scanpy-min-deps-test pytest -n auto
 
-conda list -n scanpy-min-deps-tests
\ No newline at end of file
+conda list -n scanpy-min-deps-tests
diff --git a/scanpy/plotting/_tools/scatterplots.py b/scanpy/plotting/_tools/scatterplots.py
index d6292452b3..9a57526893 100644
--- a/scanpy/plotting/_tools/scatterplots.py
+++ b/scanpy/plotting/_tools/scatterplots.py
@@ -12,7 +12,6 @@
 
 import numpy as np
 import pandas as pd
-from packaging.version import Version
 from anndata import AnnData  # noqa: TCH002
 from cycler import Cycler  # noqa: TCH002
 from matplotlib import colormaps, colors, patheffects, rcParams
@@ -21,6 +20,7 @@
 from matplotlib.colors import Colormap, Normalize
 from matplotlib.figure import Figure  # noqa: TCH002
 from numpy.typing import NDArray  # noqa: TCH002
+from packaging.version import Version
 
 from ... import logging as logg
 from ..._settings import settings

From f29be779a69715d62e62f63b16ef4e086a780d81 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 22 Jan 2024 14:24:34 +0000
Subject: [PATCH 19/51] Bump networkx

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index 4953b07035..708d5032e7 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -58,7 +58,7 @@ dependencies = [
     "scikit-learn>=0.24",
     "statsmodels>=0.13",
     "patsy",
-    "networkx>=2.6",
+    "networkx>=2.7",
     "natsort",
     "joblib",
     "numba>=0.56",

From 098fea335a2e0962ab6b2e0519eab2f9d0d4f9ad Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 16:09:48 +0000
Subject: [PATCH 20/51] Get tests to collect with an old anndata version

---
 pyproject.toml                                 |  5 +++--
 scanpy/testing/_helpers/__init__.py            | 13 +++++++++++++
 scanpy/testing/_pytest/__init__.py             | 12 ++++++++++++
 scanpy/testing/_pytest/params.py               | 15 ++++++++++++---
 scanpy/tests/test_pca.py                       |  3 +--
 scanpy/tests/test_preprocessing_distributed.py | 16 +++++++++-------
 6 files changed, 50 insertions(+), 14 deletions(-)

diff --git a/pyproject.toml b/pyproject.toml
index 708d5032e7..ab8ab4620b 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -46,11 +46,11 @@ classifiers = [
     "Topic :: Scientific/Engineering :: Visualization",
 ]
 dependencies = [
-    "anndata>=0.10",
+    "anndata>=0.7.4",
     # numpy needs a version due to #1320
     "numpy>=1.23",
     "matplotlib>=3.6",
-    "pandas >=2.0",
+    "pandas >=1.5",
     "scipy>=1.8",
     "seaborn>=0.13",
     "h5py>=3.1",
@@ -168,6 +168,7 @@ nunit_attach_on = "fail"
 markers = [
     "internet: tests which rely on internet resources (enable with `--internet-tests`)",
     "gpu: tests that use a GPU (currently unused, but needs to be specified here as we import anndata.tests.helpers, which uses it)",
+    "anndata_dask_support: tests that require dask support in anndata",
 ]
 filterwarnings = [
     # legacy-api-wrap: internal use of positional API
diff --git a/scanpy/testing/_helpers/__init__.py b/scanpy/testing/_helpers/__init__.py
index 939ce60c53..93284aaee6 100644
--- a/scanpy/testing/_helpers/__init__.py
+++ b/scanpy/testing/_helpers/__init__.py
@@ -105,3 +105,16 @@ def _check_check_values_warnings(function, adata, expected_warning, kwargs={}):
         function(adata.copy(), **kwargs, check_values=True)
     warning_msgs = [w.message.args[0] for w in record]
     assert expected_warning in warning_msgs
+
+
+# Delayed imports for case where we aren't using dask
+def as_dense_dask_array(*args, **kwargs):
+    from anndata.tests.helpers import as_dense_dask_array
+
+    return as_dense_dask_array(*args, **kwargs)
+
+
+def as_sparse_dask_array(*args, **kwargs):
+    from anndata.tests.helpers import as_sparse_dask_array
+
+    return as_sparse_dask_array(*args, **kwargs)
diff --git a/scanpy/testing/_pytest/__init__.py b/scanpy/testing/_pytest/__init__.py
index 8933091344..462dfa767f 100644
--- a/scanpy/testing/_pytest/__init__.py
+++ b/scanpy/testing/_pytest/__init__.py
@@ -72,3 +72,15 @@ def pytest_itemcollected(item: pytest.Item) -> None:
         item.add_marker(marker)
     if skip_reason := getattr(func, "_doctest_skip_reason", False):
         item.add_marker(pytest.mark.skip(reason=skip_reason))
+
+    # Dask AnnData tests require anndata > 0.10
+    import anndata
+    from packaging.version import parse
+
+    requires_anndata_dask_support = (
+        len([mark for mark in item.iter_markers(name="anndata_dask_support")]) > 0
+    )
+    if requires_anndata_dask_support and parse(anndata.__version__) < parse("0.10"):
+        item.add_marker(
+            pytest.mark.skip(reason="dask support requires anndata version > 0.10")
+        )
diff --git a/scanpy/testing/_pytest/params.py b/scanpy/testing/_pytest/params.py
index 3ff543bfa7..655daf6c7a 100644
--- a/scanpy/testing/_pytest/params.py
+++ b/scanpy/testing/_pytest/params.py
@@ -5,9 +5,10 @@
 from typing import TYPE_CHECKING, Literal
 
 import pytest
-from anndata.tests.helpers import as_dense_dask_array, as_sparse_dask_array, asarray
+from anndata.tests.helpers import asarray
 from scipy import sparse
 
+from .._helpers import as_dense_dask_array, as_sparse_dask_array
 from .._pytest.marks import needs
 
 if TYPE_CHECKING:
@@ -35,10 +36,18 @@ def param_with(
         pytest.param(sparse.csc_matrix, id="scipy_csc"),
     ),
     ("dask", "dense"): (
-        pytest.param(as_dense_dask_array, marks=[needs.dask], id="dask_array_dense"),
+        pytest.param(
+            as_dense_dask_array,
+            marks=[needs.dask, pytest.mark.anndata_dask_support],
+            id="dask_array_dense",
+        ),
     ),
     ("dask", "sparse"): (
-        pytest.param(as_sparse_dask_array, marks=[needs.dask], id="dask_array_sparse"),
+        pytest.param(
+            as_sparse_dask_array,
+            marks=[needs.dask, pytest.mark.anndata_dask_support],
+            id="dask_array_sparse",
+        ),
         # probably not necessary to also do csc
     ),
 }
diff --git a/scanpy/tests/test_pca.py b/scanpy/tests/test_pca.py
index 6e529b4320..0948e19062 100644
--- a/scanpy/tests/test_pca.py
+++ b/scanpy/tests/test_pca.py
@@ -7,8 +7,6 @@
 import pytest
 from anndata import AnnData
 from anndata.tests.helpers import (
-    as_dense_dask_array,
-    as_sparse_dask_array,
     asarray,
     assert_equal,
 )
@@ -16,6 +14,7 @@
 from sklearn.utils import issparse
 
 import scanpy as sc
+from scanpy.testing._helpers import as_dense_dask_array, as_sparse_dask_array
 from scanpy.testing._helpers.data import pbmc3k_normalized
 from scanpy.testing._pytest.marks import needs
 from scanpy.testing._pytest.params import ARRAY_TYPES, ARRAY_TYPES_SUPPORTED, param_with
diff --git a/scanpy/tests/test_preprocessing_distributed.py b/scanpy/tests/test_preprocessing_distributed.py
index aec8044d4c..6304cd170a 100644
--- a/scanpy/tests/test_preprocessing_distributed.py
+++ b/scanpy/tests/test_preprocessing_distributed.py
@@ -4,9 +4,10 @@
 
 import numpy.testing as npt
 import pytest
-from anndata import AnnData, OldFormatWarning, read_zarr
+from anndata import AnnData, read_zarr
 
 from scanpy._compat import DaskArray, ZappyArray
+from scanpy.datasets._utils import filter_oldformatwarning
 from scanpy.preprocessing import (
     filter_cells,
     filter_genes,
@@ -27,14 +28,15 @@
 
 
 @pytest.fixture()
+@filter_oldformatwarning
 def adata() -> AnnData:
-    with pytest.warns(OldFormatWarning):
-        a = read_zarr(input_file)  # regular anndata
+    a = read_zarr(input_file)
     a.var_names_make_unique()
     a.X = a.X[:]  # convert to numpy array
     return a
 
 
+@filter_oldformatwarning
 @pytest.fixture(
     params=[
         pytest.param("direct", marks=[needs.zappy]),
@@ -43,8 +45,7 @@ def adata() -> AnnData:
 )
 def adata_dist(request: pytest.FixtureRequest) -> AnnData:
     # regular anndata except for X, which we replace on the next line
-    with pytest.warns(OldFormatWarning):
-        a = read_zarr(input_file)
+    a = read_zarr(input_file)
     a.var_names_make_unique()
     a.uns["dist-mode"] = request.param
     input_file_X = f"{input_file}/X"
@@ -136,6 +137,7 @@ def test_filter_genes(adata: AnnData, adata_dist: AnnData):
     npt.assert_allclose(result, adata.X)
 
 
+@filter_oldformatwarning
 def test_write_zarr(adata: AnnData, adata_dist: AnnData):
     import zarr
 
@@ -156,7 +158,7 @@ def test_write_zarr(adata: AnnData, adata_dist: AnnData):
         assert False, "add branch for new dist-mode"
 
     # read back as zarr directly and check it is the same as adata.X
-    with pytest.warns(OldFormatWarning, match="without encoding metadata"):
-        adata_log1p = read_zarr(temp_store)
+    adata_log1p = read_zarr(temp_store)
+
     log1p(adata)
     npt.assert_allclose(adata_log1p.X, adata.X)

From 1cb93967b1cdaa20d070ddb233311e7e100f07da Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 16:58:46 +0000
Subject: [PATCH 21/51] Fix most preprocessing tests (account for old anndata
 constructor)

---
 scanpy/testing/_helpers/__init__.py | 17 ++++++++++++++++-
 scanpy/tests/test_preprocessing.py  | 16 ++++++++++------
 2 files changed, 26 insertions(+), 7 deletions(-)

diff --git a/scanpy/testing/_helpers/__init__.py b/scanpy/testing/_helpers/__init__.py
index 93284aaee6..c36ed5a2cb 100644
--- a/scanpy/testing/_helpers/__init__.py
+++ b/scanpy/testing/_helpers/__init__.py
@@ -20,9 +20,24 @@
 # These functions can be used to check that functions are correctly using arugments like `layers`, `obsm`, etc.
 
 
+def anndata_v0_8_constructor_compat(X, *args, **kwargs):
+    """Constructor for anndata that uses dtype of X for test compatibility with older versions of AnnData.
+
+    Once the minimum version of AnnData is 0.9, this function can be replaced with the default constructor.
+    """
+    import anndata as ad
+    from packaging.version import Version
+
+    if Version(ad.__version__) < Version("0.9"):
+        return ad.AnnData(X=X, *args, **kwargs, dtype=X.dtype)
+    else:
+        return ad.AnnData(X=X, *args, **kwargs)
+
+
 def check_rep_mutation(func, X, *, fields=("layer", "obsm"), **kwargs):
     """Check that only the array meant to be modified is modified."""
-    adata = sc.AnnData(X=X.copy())
+    adata = anndata_v0_8_constructor_compat(X.copy())
+
     for field in fields:
         sc.get._set_obs_rep(adata, X, **{field: field})
     X_array = asarray(X)
diff --git a/scanpy/tests/test_preprocessing.py b/scanpy/tests/test_preprocessing.py
index 3029068776..5ae3b3e08f 100644
--- a/scanpy/tests/test_preprocessing.py
+++ b/scanpy/tests/test_preprocessing.py
@@ -11,7 +11,11 @@
 from scipy import sparse as sp
 
 import scanpy as sc
-from scanpy.testing._helpers import check_rep_mutation, check_rep_results
+from scanpy.testing._helpers import (
+    anndata_v0_8_constructor_compat,
+    check_rep_mutation,
+    check_rep_results,
+)
 from scanpy.testing._helpers.data import pbmc3k, pbmc68k_reduced
 from scanpy.testing._pytest.params import ARRAY_TYPES_SUPPORTED
 
@@ -187,11 +191,11 @@ def test_scale_array(count_matrix_format, zero_center):
     Test that running sc.pp.scale on an anndata object and an array returns the same results.
     """
     X = count_matrix_format(sp.random(100, 200, density=0.3).toarray())
-    adata = sc.AnnData(X=X.copy().astype(np.float64))
+    adata = anndata_v0_8_constructor_compat(X=X.copy())
 
     sc.pp.scale(adata, zero_center=zero_center)
     scaled_X = sc.pp.scale(X, zero_center=zero_center, copy=True)
-    assert np.array_equal(asarray(scaled_X), asarray(adata.X))
+    np.testing.assert_equal(asarray(scaled_X), asarray(adata.X))
 
 
 def test_recipe_plotting():
@@ -314,7 +318,7 @@ def test_downsample_counts_per_cell(count_matrix_format, replace, dtype):
     TARGET = 1000
     X = np.random.randint(0, 100, (1000, 100)) * np.random.binomial(1, 0.3, (1000, 100))
     X = X.astype(dtype)
-    adata = AnnData(X=count_matrix_format(X).astype(dtype))
+    adata = anndata_v0_8_constructor_compat(X=count_matrix_format(X).astype(dtype))
     with pytest.raises(ValueError):
         sc.pp.downsample_counts(
             adata, counts_per_cell=TARGET, total_counts=TARGET, replace=replace
@@ -346,7 +350,7 @@ def test_downsample_counts_per_cell_multiple_targets(
     TARGETS = np.random.randint(500, 1500, 1000)
     X = np.random.randint(0, 100, (1000, 100)) * np.random.binomial(1, 0.3, (1000, 100))
     X = X.astype(dtype)
-    adata = AnnData(X=count_matrix_format(X).astype(dtype))
+    adata = anndata_v0_8_constructor_compat(X=count_matrix_format(X).astype(dtype))
     initial_totals = np.ravel(adata.X.sum(axis=1))
     with pytest.raises(ValueError):
         sc.pp.downsample_counts(adata, counts_per_cell=[40, 10], replace=replace)
@@ -372,7 +376,7 @@ def test_downsample_counts_per_cell_multiple_targets(
 def test_downsample_total_counts(count_matrix_format, replace, dtype):
     X = np.random.randint(0, 100, (1000, 100)) * np.random.binomial(1, 0.3, (1000, 100))
     X = X.astype(dtype)
-    adata_orig = AnnData(X=count_matrix_format(X))
+    adata_orig = anndata_v0_8_constructor_compat(X=count_matrix_format(X))
     total = X.sum()
     target = np.floor_divide(total, 10)
     initial_totals = np.ravel(adata_orig.X.sum(axis=1))

From 5d7494a38e8cd0dafc15a008525aea258d86ea33 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 18:05:12 +0000
Subject: [PATCH 22/51] Bump anndata min version to 0.7.8

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index 8ffcc0283a..874e7ec2c3 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -46,7 +46,7 @@ classifiers = [
     "Topic :: Scientific/Engineering :: Visualization",
 ]
 dependencies = [
-    "anndata>=0.7.4",
+    "anndata>=0.7.8",
     # numpy needs a version due to #1320
     "numpy>=1.23",
     "matplotlib>=3.6",

From cadd7db12a2a0c89e4f41bccedabeae402c12594 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 18:05:46 +0000
Subject: [PATCH 23/51] Fix pytest_itemcollected

---
 scanpy/testing/_pytest/__init__.py | 17 ++++++++---------
 1 file changed, 8 insertions(+), 9 deletions(-)

diff --git a/scanpy/testing/_pytest/__init__.py b/scanpy/testing/_pytest/__init__.py
index 462dfa767f..6da4aedc5d 100644
--- a/scanpy/testing/_pytest/__init__.py
+++ b/scanpy/testing/_pytest/__init__.py
@@ -62,16 +62,14 @@ def pytest_collection_modifyitems(
 def pytest_itemcollected(item: pytest.Item) -> None:
     import pytest
 
-    if not isinstance(item, pytest.DoctestItem):
-        return
+    if isinstance(item, pytest.DoctestItem):
+        item.add_marker(doctest_env_marker)
 
-    item.add_marker(doctest_env_marker)
-
-    func = _import_name(item.name)
-    if marker := getattr(func, "_doctest_mark", None):
-        item.add_marker(marker)
-    if skip_reason := getattr(func, "_doctest_skip_reason", False):
-        item.add_marker(pytest.mark.skip(reason=skip_reason))
+        func = _import_name(item.name)
+        if marker := getattr(func, "_doctest_mark", None):
+            item.add_marker(marker)
+        if skip_reason := getattr(func, "_doctest_skip_reason", False):
+            item.add_marker(pytest.mark.skip(reason=skip_reason))
 
     # Dask AnnData tests require anndata > 0.10
     import anndata
@@ -80,6 +78,7 @@ def pytest_itemcollected(item: pytest.Item) -> None:
     requires_anndata_dask_support = (
         len([mark for mark in item.iter_markers(name="anndata_dask_support")]) > 0
     )
+
     if requires_anndata_dask_support and parse(anndata.__version__) < parse("0.10"):
         item.add_marker(
             pytest.mark.skip(reason="dask support requires anndata version > 0.10")

From 4a7784cbf88a246afbc0491fd6c7b4d3f65939d4 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 18:45:41 +0000
Subject: [PATCH 24/51] Bump min anndata version to 0.8

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index 874e7ec2c3..a7d431e380 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -46,7 +46,7 @@ classifiers = [
     "Topic :: Scientific/Engineering :: Visualization",
 ]
 dependencies = [
-    "anndata>=0.7.8",
+    "anndata>=0.8",
     # numpy needs a version due to #1320
     "numpy>=1.23",
     "matplotlib>=3.6",

From f9cad082a70ebe849654d0ccb828f759453501ff Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 18:46:16 +0000
Subject: [PATCH 25/51] Fix test_get.py cases

---
 scanpy/tests/test_get.py | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/scanpy/tests/test_get.py b/scanpy/tests/test_get.py
index bbdea8ce3d..b55064088a 100644
--- a/scanpy/tests/test_get.py
+++ b/scanpy/tests/test_get.py
@@ -11,6 +11,7 @@
 
 import scanpy as sc
 from scanpy.datasets._utils import filter_oldformatwarning
+from scanpy.testing._helpers import anndata_v0_8_constructor_compat
 from scanpy.testing._helpers.data import pbmc68k_reduced
 
 
@@ -38,7 +39,7 @@ def adata():
     adata.X is np.ones((2, 2))
     adata.layers['double'] is sparse np.ones((2,2)) * 2 to also test sparse matrices
     """
-    return AnnData(
+    return anndata_v0_8_constructor_compat(
         X=np.ones((2, 2), dtype=int),
         obs=pd.DataFrame(
             {"obs1": [0, 1], "obs2": ["a", "b"]}, index=["cell1", "cell2"]
@@ -60,7 +61,7 @@ def test_obs_df(adata):
     adata.obsm["sparse"] = sparse.csr_matrix(np.eye(2), dtype="float64")
 
     # make raw with different genes than adata
-    adata.raw = AnnData(
+    adata.raw = anndata_v0_8_constructor_compat(
         X=np.array([[1, 2, 3], [2, 4, 6]], dtype=np.float64),
         var=pd.DataFrame(
             {"gene_symbols": ["raw1", "raw2", "raw3"]},

From 3b8db8219fbe2818a805c1e89cd0832bb1057203 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 19:04:54 +0000
Subject: [PATCH 26/51] Fix neighbor test

---
 scanpy/tests/test_neighbors.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/scanpy/tests/test_neighbors.py b/scanpy/tests/test_neighbors.py
index dbefe5a006..d623682ff3 100644
--- a/scanpy/tests/test_neighbors.py
+++ b/scanpy/tests/test_neighbors.py
@@ -11,6 +11,7 @@
 
 import scanpy as sc
 from scanpy import Neighbors
+from scanpy.testing._helpers import anndata_v0_8_constructor_compat
 
 if TYPE_CHECKING:
     from pytest_mock import MockerFixture
@@ -113,7 +114,7 @@
 
 
 def get_neighbors() -> Neighbors:
-    return Neighbors(AnnData(np.array(X)))
+    return Neighbors(anndata_v0_8_constructor_compat(np.array(X)))
 
 
 @pytest.fixture

From 78c7ee90ffacea81d0324f4f2ea46e8332c46b0f Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 19:34:49 +0000
Subject: [PATCH 27/51] Fix dendrogram plotting cases

---
 scanpy/tools/_dendrogram.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/scanpy/tools/_dendrogram.py b/scanpy/tools/_dendrogram.py
index 6789a8d198..68902a6632 100644
--- a/scanpy/tools/_dendrogram.py
+++ b/scanpy/tools/_dendrogram.py
@@ -155,7 +155,11 @@ def dendrogram(
         )
 
     # aggregate values within categories using 'mean'
-    mean_df = rep_df.groupby(level=0, observed=True).mean()
+    mean_df = (
+        rep_df.groupby(level=0, observed=True)
+        .mean()
+        .loc[categories]  # Fixed ordering for pandas < 2
+    )
 
     import scipy.cluster.hierarchy as sch
     from scipy.spatial import distance

From e46911ce58a736fa6c83bed19f9a03346d730237 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 20:03:24 +0000
Subject: [PATCH 28/51] fix stacked violin ordering

---
 scanpy/plotting/_stacked_violin.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/scanpy/plotting/_stacked_violin.py b/scanpy/plotting/_stacked_violin.py
index 828d5570c8..43c1a63d9b 100644
--- a/scanpy/plotting/_stacked_violin.py
+++ b/scanpy/plotting/_stacked_violin.py
@@ -363,7 +363,11 @@ def _mainplot(self, ax):
 
         # get mean values for color and transform to color values
         # using colormap
-        _color_df = _matrix.groupby(level=0, observed=True).median()
+        _color_df = (
+            _matrix.groupby(level=0, observed=True)
+            .median()
+            .loc[self.categories]  # Fixed ordering for pandas < 2
+        )
         if self.are_axes_swapped:
             _color_df = _color_df.T
 

From e01eb01389eb64119e39ebe5227c0abde1230c0c Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 20:53:22 +0000
Subject: [PATCH 29/51] Bump tolerance for older versions of numba

---
 scanpy/tests/test_metrics.py | 7 ++++++-
 1 file changed, 6 insertions(+), 1 deletion(-)

diff --git a/scanpy/tests/test_metrics.py b/scanpy/tests/test_metrics.py
index 8d0acf3c33..226aecd7f6 100644
--- a/scanpy/tests/test_metrics.py
+++ b/scanpy/tests/test_metrics.py
@@ -5,10 +5,12 @@
 from operator import eq
 from string import ascii_letters
 
+import numba
 import numpy as np
 import pandas as pd
 import pytest
 import threadpoolctl
+from packaging.version import Version
 from scipy import sparse
 
 import scanpy as sc
@@ -77,7 +79,10 @@ def test_consistency(metric, threading):
     all_genes = metric(pbmc, layer="raw")
     first_gene = metric(pbmc, vals=pbmc.obs_vector(pbmc.var_names[0], layer="raw"))
 
-    np.testing.assert_allclose(all_genes[0], first_gene, rtol=1e-9)
+    if Version(numba.__version__) < Version("0.57"):
+        np.testing.assert_allclose(all_genes[0], first_gene, rtol=1e-5)
+    else:
+        np.testing.assert_allclose(all_genes[0], first_gene, rtol=1e-9)
 
     # Test that results are similar for sparse and dense reps of same data
     equality_check(

From aa2dd5012d9b9feeb49fe16e1108949835250b3f Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 29 Jan 2024 20:55:43 +0000
Subject: [PATCH 30/51] Fix ordering for matrixplot

---
 scanpy/plotting/_matrixplot.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/scanpy/plotting/_matrixplot.py b/scanpy/plotting/_matrixplot.py
index d811a12a8a..09f0b27dfc 100644
--- a/scanpy/plotting/_matrixplot.py
+++ b/scanpy/plotting/_matrixplot.py
@@ -168,7 +168,11 @@ def __init__(
 
         if values_df is None:
             # compute mean value
-            values_df = self.obs_tidy.groupby(level=0, observed=True).mean()
+            values_df = (
+                self.obs_tidy.groupby(level=0, observed=True)
+                .mean()
+                .loc[self.categories]  # Fix order for pandas < 2
+            )
 
             if standard_scale == "group":
                 values_df = values_df.sub(values_df.min(1), axis=0)

From e598ce77c49b383f1cfdfe20f01174e83734a228 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 7 Feb 2024 16:20:10 +0000
Subject: [PATCH 31/51] Fix preprocessing tests

---
 scanpy/tests/test_preprocessing_distributed.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/scanpy/tests/test_preprocessing_distributed.py b/scanpy/tests/test_preprocessing_distributed.py
index 6304cd170a..a93557b510 100644
--- a/scanpy/tests/test_preprocessing_distributed.py
+++ b/scanpy/tests/test_preprocessing_distributed.py
@@ -40,7 +40,7 @@ def adata() -> AnnData:
 @pytest.fixture(
     params=[
         pytest.param("direct", marks=[needs.zappy]),
-        pytest.param("dask", marks=[needs.dask]),
+        pytest.param("dask", marks=[needs.dask, pytest.mark.anndata_dask_support]),
     ]
 )
 def adata_dist(request: pytest.FixtureRequest) -> AnnData:

From debfc4b9bea37c0a95e9be623968d8c836ac5159 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Wed, 7 Feb 2024 18:37:49 +0000
Subject: [PATCH 32/51] xfail masking test for anndata 0.8

---
 scanpy/tests/test_pca.py | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/scanpy/tests/test_pca.py b/scanpy/tests/test_pca.py
index 0948e19062..4971685b49 100644
--- a/scanpy/tests/test_pca.py
+++ b/scanpy/tests/test_pca.py
@@ -3,6 +3,7 @@
 import warnings
 from typing import Literal
 
+import anndata as ad
 import numpy as np
 import pytest
 from anndata import AnnData
@@ -10,6 +11,7 @@
     asarray,
     assert_equal,
 )
+from packaging.version import Version
 from scipy import sparse
 from sklearn.utils import issparse
 
@@ -342,6 +344,12 @@ def test_mask(array_type):
     adata = sc.datasets.blobs(n_variables=10, n_centers=3, n_observations=100)
     adata.X = array_type(adata.X)
 
+    if isinstance(adata.X, np.ndarray) and Version(ad.__version__) < Version("0.9"):
+        pytest.xfail(
+            "TODO: Previous version of anndata would return an F ordered array for one"
+            " case here, which suprisingly considerably changes the results of PCA. "
+        )
+
     mask = np.random.choice([True, False], adata.shape[1])
 
     adata_masked = adata[:, mask].copy()

From 70e586698c4beda6808e15bc8091e4ce24509ffb Mon Sep 17 00:00:00 2001
From: "Philipp A." <flying-sheep@web.de>
Date: Thu, 8 Feb 2024 11:52:32 +0100
Subject: [PATCH 33/51] Fix order

---
 scanpy/plotting/_matrixplot.py     |  6 +++++-
 scanpy/plotting/_stacked_violin.py | 11 +++++------
 2 files changed, 10 insertions(+), 7 deletions(-)

diff --git a/scanpy/plotting/_matrixplot.py b/scanpy/plotting/_matrixplot.py
index 09f0b27dfc..a65332be65 100644
--- a/scanpy/plotting/_matrixplot.py
+++ b/scanpy/plotting/_matrixplot.py
@@ -171,7 +171,11 @@ def __init__(
             values_df = (
                 self.obs_tidy.groupby(level=0, observed=True)
                 .mean()
-                .loc[self.categories]  # Fix order for pandas < 2
+                .loc[
+                    self.categories_order
+                    if self.categories_order is not None
+                    else self.categories
+                ]
             )
 
             if standard_scale == "group":
diff --git a/scanpy/plotting/_stacked_violin.py b/scanpy/plotting/_stacked_violin.py
index 43c1a63d9b..60b8080221 100644
--- a/scanpy/plotting/_stacked_violin.py
+++ b/scanpy/plotting/_stacked_violin.py
@@ -356,17 +356,16 @@ def _mainplot(self, ax):
         if self.var_names_idx_order is not None:
             _matrix = _matrix.iloc[:, self.var_names_idx_order]
 
-        if self.categories_order is not None:
-            _matrix.index = _matrix.index.reorder_categories(
-                self.categories_order, ordered=True
-            )
-
         # get mean values for color and transform to color values
         # using colormap
         _color_df = (
             _matrix.groupby(level=0, observed=True)
             .median()
-            .loc[self.categories]  # Fixed ordering for pandas < 2
+            .loc[
+                self.categories_order
+                if self.categories_order is not None
+                else self.categories
+            ]
         )
         if self.are_axes_swapped:
             _color_df = _color_df.T

From bbdddf23456585915959091b839327299403c79b Mon Sep 17 00:00:00 2001
From: "Philipp A." <flying-sheep@web.de>
Date: Thu, 8 Feb 2024 12:18:22 +0100
Subject: [PATCH 34/51] Fix min-deps.py

---
 ci/scripts/min-deps.py | 46 ++++++++++++++++++++++++------------------
 1 file changed, 26 insertions(+), 20 deletions(-)

diff --git a/ci/scripts/min-deps.py b/ci/scripts/min-deps.py
index 4e2e416a3c..7a4697f4c4 100755
--- a/ci/scripts/min-deps.py
+++ b/ci/scripts/min-deps.py
@@ -3,17 +3,23 @@
 
 import argparse
 import sys
+from collections import deque
 from pathlib import Path
+from typing import TYPE_CHECKING
 
 if sys.version_info >= (3, 11):
     import tomllib
 else:
     import tomli as tomllib
+
 from packaging.requirements import Requirement
 from packaging.version import Version
 
+if TYPE_CHECKING:
+    from collections.abc import Generator, Iterable
+
 
-def min_dep(req: Requirement) -> str:
+def min_dep(req: Requirement) -> Requirement:
     """
     Given a requirement, return the minimum version specifier.
 
@@ -29,38 +35,36 @@ def min_dep(req: Requirement) -> str:
 
     # TODO: Should this be allowed?
     if not req.specifier:
-        return req_name
+        return Requirement(req_name)
 
     min_version = Version("0.0.0.a1")
     for spec in req.specifier:
-        if spec.operator in [">", ">=", "~-"]:
+        if spec.operator in [">", ">=", "~="]:
             min_version = max(min_version, Version(spec.version))
         elif spec.operator == "==":
             min_version = Version(spec.version)
 
     # TODO: should this return `~=` or `==`?
-    return f"{req_name}=={min_version}.*"
+    return Requirement(f"{req_name}=={min_version}.*")
 
 
-def extract_min_deps(dependencies: list[str], *, pyproject) -> list[str]:
-    dependencies = dependencies.copy()  # We'll be mutating this
-    requirements: list[Requirement] = []
+def extract_min_deps(
+    dependencies: Iterable[Requirement], *, pyproject
+) -> Generator[Requirement, None, None]:
+    dependencies = deque(dependencies)  # We'll be mutating this
     project_name = pyproject["project"]["name"]
 
     while len(dependencies) > 0:
-        req = Requirement(dependencies.pop())
+        req = dependencies.pop()
 
         # If we are reffering to other optional dependency lists, resolve them
         if req.name == project_name:
             assert req.extras, f"Project included itself as dependency, without specifying extras: {req}"
             for extra in req.extras:
-                dependencies.extend(
-                    pyproject["project"]["optional-dependencies"][extra]
-                )
+                extra_deps = pyproject["project"]["optional-dependencies"][extra]
+                dependencies += map(Requirement, extra_deps)
         else:
-            requirements.append(min_dep(req))
-
-    return requirements
+            yield min_dep(req)
 
 
 def main():
@@ -75,21 +79,23 @@ def main():
     parser.add_argument(
         "path", type=Path, help="pyproject.toml to parse minimum dependencies from"
     )
-    parser.add_argument("--extras", type=str, nargs="*", help="extras to install")
+    parser.add_argument(
+        "--extras", type=str, nargs="*", default=(), help="extras to install"
+    )
 
     args = parser.parse_args()
 
     pyproject = tomllib.loads(args.path.read_text())
 
     project_name = pyproject["project"]["name"]
-    deps = pyproject["project"]["dependencies"]
-
-    for extra in args.extras:
-        deps.append(f"{project_name}[{extra}]")
+    deps = [
+        *map(Requirement, pyproject["project"]["dependencies"]),
+        *(Requirement(f"{project_name}[{extra}]") for extra in args.extras),
+    ]
 
     min_deps = extract_min_deps(deps, pyproject=pyproject)
 
-    print(" ".join(min_deps))
+    print(" ".join(map(str, min_deps)))
 
 
 if __name__ == "__main__":

From eef7055d5abb05afe5ac2291d1d4154cb03cf904 Mon Sep 17 00:00:00 2001
From: Philipp A <flying-sheep@web.de>
Date: Thu, 8 Feb 2024 12:32:08 +0100
Subject: [PATCH 35/51] Discard changes to scanpy/plotting/_utils.py

---
 scanpy/plotting/_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/scanpy/plotting/_utils.py b/scanpy/plotting/_utils.py
index ab08971165..94e10327f6 100644
--- a/scanpy/plotting/_utils.py
+++ b/scanpy/plotting/_utils.py
@@ -380,7 +380,7 @@ def _validate_palette(adata: AnnData, key: str) -> None:
                 _palette = None
                 break
         _palette.append(color)
-    # Don't modify if nothing changed
+    # Don’t modify if nothing changed
     if _palette is None or np.array_equal(_palette, adata.uns[color_key]):
         return
     adata.uns[color_key] = _palette

From 70d151d0595601d1a3b46d40d19027254f5b8715 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 8 Feb 2024 15:00:58 +0000
Subject: [PATCH 36/51] removed TODOs from min-deps.py

---
 ci/scripts/min-deps.py | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/ci/scripts/min-deps.py b/ci/scripts/min-deps.py
index 7a4697f4c4..b9b74f5ba8 100755
--- a/ci/scripts/min-deps.py
+++ b/ci/scripts/min-deps.py
@@ -33,7 +33,6 @@ def min_dep(req: Requirement) -> Requirement:
     if req.extras:
         req_name = f"{req_name}[{','.join(req.extras)}]"
 
-    # TODO: Should this be allowed?
     if not req.specifier:
         return Requirement(req_name)
 
@@ -44,7 +43,6 @@ def min_dep(req: Requirement) -> Requirement:
         elif spec.operator == "==":
             min_version = Version(spec.version)
 
-    # TODO: should this return `~=` or `==`?
     return Requirement(f"{req_name}=={min_version}.*")
 
 
@@ -68,7 +66,6 @@ def extract_min_deps(
 
 
 def main():
-    # TODO: Allow optional dependencies
     parser = argparse.ArgumentParser(
         prog="min-deps",
         description="""Parse a pyproject.toml file and output a list of minimum dependencies.

From cb36a62f9747e21aa96a3e60db66edbf17b0cac0 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 8 Feb 2024 16:52:06 +0000
Subject: [PATCH 37/51] Remove dev script

---
 ci/scripts/run-min-deps.sh | 19 -------------------
 1 file changed, 19 deletions(-)
 delete mode 100755 ci/scripts/run-min-deps.sh

diff --git a/ci/scripts/run-min-deps.sh b/ci/scripts/run-min-deps.sh
deleted file mode 100755
index 9968bb0471..0000000000
--- a/ci/scripts/run-min-deps.sh
+++ /dev/null
@@ -1,19 +0,0 @@
-set -e
-
-mamba env remove -yn scanpy-min-deps-test
-mamba create -yn scanpy-min-deps-test "python=3.9"
-
-PACKAGES=`python3 ci/scripts/min-deps.py pyproject.toml --extra dev test`
-
-# conda activate anndata-min-deps-test
-# conda run -n anndata-min-deps-test pip install cupy-cuda12x
-
-
-echo Installing $PACKAGES
-conda run -n scanpy-min-deps-test pip install $PACKAGES
-conda run -n scanpy-min-deps-test pip install pytest-xdist # cupy-cuda12x
-conda run -n scanpy-min-deps-test pip install -e . --no-deps
-echo "Starting tests"
-conda run -n scanpy-min-deps-test pytest -n auto
-
-conda list -n scanpy-min-deps-tests

From 07f6d57a0f7a7a3b9e88084325071bc557a449e9 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 12 Feb 2024 11:53:25 +0000
Subject: [PATCH 38/51] Rename test jobs to be more identifiable

---
 .azure-pipelines.yml | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/.azure-pipelines.yml b/.azure-pipelines.yml
index f94d2bd434..608bfd6ae9 100644
--- a/.azure-pipelines.yml
+++ b/.azure-pipelines.yml
@@ -19,12 +19,12 @@ jobs:
       Python3.9:
         python.version: '3.9'
       Python3.11: {}
-      minimal_tests:
+      minimal_dependencies:
         TEST_EXTRA: 'test-min'
       anndata_dev:
         DEPENDENCIES_VERSION: "pre-release"
         TEST_TYPE: "coverage"
-      MinDeps:
+      minimum_versions:
         python.version: '3.9'
         DEPENDENCIES_VERSION: "minimum-version"
 

From 5090fff2101f94b50a16a3ca38126bc60d6002ad Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 12 Feb 2024 14:51:36 +0000
Subject: [PATCH 39/51] Use marker for xfail

---
 scanpy/tests/test_pca.py | 10 ++++++----
 1 file changed, 6 insertions(+), 4 deletions(-)

diff --git a/scanpy/tests/test_pca.py b/scanpy/tests/test_pca.py
index 4971685b49..04e6e5bcde 100644
--- a/scanpy/tests/test_pca.py
+++ b/scanpy/tests/test_pca.py
@@ -338,16 +338,18 @@ def test_mask_argument_equivalence(float_dtype, array_type):
     )
 
 
-def test_mask(array_type):
+def test_mask(array_type, request):
     if array_type is as_dense_dask_array:
         pytest.xfail("TODO: Dask arrays are not supported")
     adata = sc.datasets.blobs(n_variables=10, n_centers=3, n_observations=100)
     adata.X = array_type(adata.X)
 
     if isinstance(adata.X, np.ndarray) and Version(ad.__version__) < Version("0.9"):
-        pytest.xfail(
-            "TODO: Previous version of anndata would return an F ordered array for one"
-            " case here, which suprisingly considerably changes the results of PCA. "
+        request.node.add_marker(
+            pytest.mark.xfail(
+                "TODO: Previous version of anndata would return an F ordered array for one"
+                " case here, which suprisingly considerably changes the results of PCA. "
+            )
         )
 
     mask = np.random.choice([True, False], adata.shape[1])

From 907544edb8a5f94d1b029d8c800ec6cc6a61a250 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 12 Feb 2024 15:04:25 +0000
Subject: [PATCH 40/51] Add warning for PCA order

---
 scanpy/preprocessing/_pca.py | 27 ++++++++++++++++++++-------
 scanpy/tests/test_pca.py     | 16 ++++++++++++++++
 2 files changed, 36 insertions(+), 7 deletions(-)

diff --git a/scanpy/preprocessing/_pca.py b/scanpy/preprocessing/_pca.py
index 53377f1321..281816b227 100644
--- a/scanpy/preprocessing/_pca.py
+++ b/scanpy/preprocessing/_pca.py
@@ -3,8 +3,8 @@
 import warnings
 from warnings import warn
 
+import anndata as ad
 import numpy as np
-from anndata import AnnData
 from packaging import version
 from scipy.sparse import issparse, spmatrix
 from scipy.sparse.linalg import LinearOperator, svds
@@ -24,7 +24,7 @@
     mask_hvg=doc_mask_hvg,
 )
 def pca(
-    data: AnnData | np.ndarray | spmatrix,
+    data: ad.AnnData | np.ndarray | spmatrix,
     n_comps: int | None = None,
     *,
     layer: str | None = None,
@@ -38,7 +38,7 @@ def pca(
     copy: bool = False,
     chunked: bool = False,
     chunk_size: int | None = None,
-) -> AnnData | np.ndarray | spmatrix | None:
+) -> ad.AnnData | np.ndarray | spmatrix | None:
     """\
     Principal component analysis [Pedregosa11]_.
 
@@ -163,14 +163,14 @@ def pca(
             "reproducible across different computational platforms. For exact "
             "reproducibility, choose `svd_solver='arpack'.`"
         )
-    data_is_AnnData = isinstance(data, AnnData)
+    data_is_AnnData = isinstance(data, ad.AnnData)
     if data_is_AnnData:
         adata = data.copy() if copy else data
     else:
         if pkg_version("anndata") < version.parse("0.8.0rc1"):
-            adata = AnnData(data, dtype=data.dtype)
+            adata = ad.AnnData(data, dtype=data.dtype)
         else:
-            adata = AnnData(data)
+            adata = ad.AnnData(data)
 
     # Unify new mask argument and deprecated use_highly_varible argument
     mask_param, mask = _handle_mask_param(adata, mask, use_highly_variable)
@@ -188,6 +188,19 @@ def pca(
 
     X = _get_obs_rep(adata_comp, layer=layer)
 
+    # See: https://github.com/scverse/scanpy/pull/2816#issuecomment-1932650529
+    if (
+        version.parse(ad.__version__) < version.parse("0.9")
+        and mask is not None
+        and isinstance(X, np.ndarray)
+    ):
+        warnings.warn(
+            "When using a mask parameter with anndata<0.9 on a dense array, the PCA"
+            "can have slightly different results due the array being column major "
+            "instead of row major.",
+            UserWarning,
+        )
+
     is_dask = isinstance(X, DaskArray)
 
     # check_random_state returns a numpy RandomState when passed an int but
@@ -337,7 +350,7 @@ def pca(
 
 
 def _handle_mask_param(
-    adata: AnnData,
+    adata: ad.AnnData,
     mask: np.ndarray | str | Empty | None,
     use_highly_variable: bool | None,
 ) -> tuple[np.ndarray | str | None, np.ndarray | None]:
diff --git a/scanpy/tests/test_pca.py b/scanpy/tests/test_pca.py
index 04e6e5bcde..a487335f08 100644
--- a/scanpy/tests/test_pca.py
+++ b/scanpy/tests/test_pca.py
@@ -368,6 +368,22 @@ def test_mask(array_type, request):
     )
 
 
+def test_mask_order_warning(request):
+    if Version(ad.__version__) >= Version("0.9"):
+        request.node.add_marker(
+            pytest.mark.xfail("Not expected to warn in later versions of anndata")
+        )
+
+    adata = ad.AnnData(X=np.random.randn(50, 5))
+    mask = np.array([True, False, True, False, True])
+
+    with pytest.warns(
+        UserWarning,
+        match="When using a mask parameter with anndata<0.9 on a dense array",
+    ):
+        sc.pp.pca(adata, mask=mask)
+
+
 def test_mask_defaults(array_type, float_dtype):
     """
     Test if pca result is equal without highly variable and with-but mask is None

From 208d41317106c3cf47926c7261a555dbebfb7367 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 12 Feb 2024 15:33:57 +0000
Subject: [PATCH 41/51] Fix usage of pytest.mark.xfail

---
 scanpy/tests/test_pca.py | 6 ++++--
 1 file changed, 4 insertions(+), 2 deletions(-)

diff --git a/scanpy/tests/test_pca.py b/scanpy/tests/test_pca.py
index a487335f08..c9b6d913c2 100644
--- a/scanpy/tests/test_pca.py
+++ b/scanpy/tests/test_pca.py
@@ -347,7 +347,7 @@ def test_mask(array_type, request):
     if isinstance(adata.X, np.ndarray) and Version(ad.__version__) < Version("0.9"):
         request.node.add_marker(
             pytest.mark.xfail(
-                "TODO: Previous version of anndata would return an F ordered array for one"
+                reason="TODO: Previous version of anndata would return an F ordered array for one"
                 " case here, which suprisingly considerably changes the results of PCA. "
             )
         )
@@ -371,7 +371,9 @@ def test_mask(array_type, request):
 def test_mask_order_warning(request):
     if Version(ad.__version__) >= Version("0.9"):
         request.node.add_marker(
-            pytest.mark.xfail("Not expected to warn in later versions of anndata")
+            pytest.mark.xfail(
+                reason="Not expected to warn in later versions of anndata"
+            )
         )
 
     adata = ad.AnnData(X=np.random.randn(50, 5))

From 826d3dd0768c9dd701e5961b2440fcf69c673e1b Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Mon, 12 Feb 2024 15:44:14 +0000
Subject: [PATCH 42/51] Remove commented out code from CI job

---
 .azure-pipelines.yml | 5 -----
 1 file changed, 5 deletions(-)

diff --git a/.azure-pipelines.yml b/.azure-pipelines.yml
index 608bfd6ae9..d4301de583 100644
--- a/.azure-pipelines.yml
+++ b/.azure-pipelines.yml
@@ -71,11 +71,6 @@ jobs:
     displayName: 'Install dependencies minimum version'
     condition: eq(variables['DEPENDENCIES_VERSION'], 'minimum-version')
 
-  # - script: |
-  #     pip install -v "anndata[dev,test] @ git+https://github.com/scverse/anndata"
-  #   displayName: 'Install development anndata'
-  #   condition: eq(variables['ANNDATA_DEV'], 'yes')
-
   - script: |
       pip list
     displayName: 'Display installed versions'

From e4ee55d2674c20f677a40d200e94d7ca80dde610 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Tue, 13 Feb 2024 09:34:43 +0000
Subject: [PATCH 43/51] Obey signature test

---
 scanpy/preprocessing/_pca.py | 13 +++++++------
 1 file changed, 7 insertions(+), 6 deletions(-)

diff --git a/scanpy/preprocessing/_pca.py b/scanpy/preprocessing/_pca.py
index 281816b227..df88b57b19 100644
--- a/scanpy/preprocessing/_pca.py
+++ b/scanpy/preprocessing/_pca.py
@@ -5,6 +5,7 @@
 
 import anndata as ad
 import numpy as np
+from anndata import AnnData
 from packaging import version
 from scipy.sparse import issparse, spmatrix
 from scipy.sparse.linalg import LinearOperator, svds
@@ -24,7 +25,7 @@
     mask_hvg=doc_mask_hvg,
 )
 def pca(
-    data: ad.AnnData | np.ndarray | spmatrix,
+    data: AnnData | np.ndarray | spmatrix,
     n_comps: int | None = None,
     *,
     layer: str | None = None,
@@ -38,7 +39,7 @@ def pca(
     copy: bool = False,
     chunked: bool = False,
     chunk_size: int | None = None,
-) -> ad.AnnData | np.ndarray | spmatrix | None:
+) -> AnnData | np.ndarray | spmatrix | None:
     """\
     Principal component analysis [Pedregosa11]_.
 
@@ -163,14 +164,14 @@ def pca(
             "reproducible across different computational platforms. For exact "
             "reproducibility, choose `svd_solver='arpack'.`"
         )
-    data_is_AnnData = isinstance(data, ad.AnnData)
+    data_is_AnnData = isinstance(data, AnnData)
     if data_is_AnnData:
         adata = data.copy() if copy else data
     else:
         if pkg_version("anndata") < version.parse("0.8.0rc1"):
-            adata = ad.AnnData(data, dtype=data.dtype)
+            adata = AnnData(data, dtype=data.dtype)
         else:
-            adata = ad.AnnData(data)
+            adata = AnnData(data)
 
     # Unify new mask argument and deprecated use_highly_varible argument
     mask_param, mask = _handle_mask_param(adata, mask, use_highly_variable)
@@ -350,7 +351,7 @@ def pca(
 
 
 def _handle_mask_param(
-    adata: ad.AnnData,
+    adata: AnnData,
     mask: np.ndarray | str | Empty | None,
     use_highly_variable: bool | None,
 ) -> tuple[np.ndarray | str | None, np.ndarray | None]:

From 264aa9a672b5514addf5cb8cb26e42ef0c42adc4 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Tue, 13 Feb 2024 14:21:16 +0000
Subject: [PATCH 44/51] Don't error on warning for dask.dataframe

---
 scanpy/testing/_pytest/__init__.py | 11 +++++++----
 1 file changed, 7 insertions(+), 4 deletions(-)

diff --git a/scanpy/testing/_pytest/__init__.py b/scanpy/testing/_pytest/__init__.py
index 645f4d8162..ad42b8ec74 100644
--- a/scanpy/testing/_pytest/__init__.py
+++ b/scanpy/testing/_pytest/__init__.py
@@ -3,6 +3,7 @@
 
 import os
 import sys
+import warnings
 from typing import TYPE_CHECKING
 
 import pytest
@@ -71,10 +72,12 @@ def _fix_dask_df_warning():
         import dask  # noqa: F401
     except ImportError:
         return
-    with pytest.warns(
-        DeprecationWarning,
-        match=r"The current Dask DataFrame implementation is deprecated",
-    ):
+    with warnings.catch_warnings():
+        warnings.filterwarnings(
+            "ignore",
+            category=DeprecationWarning,
+            message=r"The current Dask DataFrame implementation is deprecated",
+        )
         import dask.dataframe  # noqa: F401
 
 

From 66937737c76d34b3a889814630de8b7fbce51d5d Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 15 Feb 2024 11:20:09 +0100
Subject: [PATCH 45/51] update dask version

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index f995828d97..56bd9d8997 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -142,7 +142,7 @@ scanorama = ["scanorama"]  # Scanorama dataset integration
 scrublet = ["scikit-image"]  # Doublet detection with automatic thresholds
 # Acceleration
 rapids = ["cudf>=0.9", "cuml>=0.9", "cugraph>=0.9"]  # GPU accelerated calculation of neighbors
-dask = ["dask[array]>=2022.09"]  # Use the Dask parallelization engine
+dask = ["dask[array]>=2022.09.3"]  # Use the Dask parallelization engine
 dask-ml = ["dask-ml", "scanpy[dask]"]  # Dask-ML for sklearn-like API
 
 [tool.hatch.build]

From b412bfb336fb9e8448de47b446c4a99fee3e163a Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 15 Feb 2024 10:52:22 +0000
Subject: [PATCH 46/51] fix dask version better

---
 pyproject.toml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pyproject.toml b/pyproject.toml
index 56bd9d8997..8dca385d3b 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -142,7 +142,7 @@ scanorama = ["scanorama"]  # Scanorama dataset integration
 scrublet = ["scikit-image"]  # Doublet detection with automatic thresholds
 # Acceleration
 rapids = ["cudf>=0.9", "cuml>=0.9", "cugraph>=0.9"]  # GPU accelerated calculation of neighbors
-dask = ["dask[array]>=2022.09.3"]  # Use the Dask parallelization engine
+dask = ["dask[array]>=2022.09.2"]  # Use the Dask parallelization engine
 dask-ml = ["dask-ml", "scanpy[dask]"]  # Dask-ML for sklearn-like API
 
 [tool.hatch.build]

From b6afd994f72f8ad517186fa327b61b2d2edbbf0d Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 15 Feb 2024 12:44:14 +0000
Subject: [PATCH 47/51] Fix view issue with anndata==0.8

---
 scanpy/preprocessing/_highly_variable_genes.py | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/scanpy/preprocessing/_highly_variable_genes.py b/scanpy/preprocessing/_highly_variable_genes.py
index e6f925a168..0dd2a33c51 100644
--- a/scanpy/preprocessing/_highly_variable_genes.py
+++ b/scanpy/preprocessing/_highly_variable_genes.py
@@ -252,6 +252,11 @@ def _highly_variable_genes_single_batch(
     `highly_variable`, `means`, `dispersions`, and `dispersions_norm`.
     """
     X = _get_obs_rep(adata, layer=layer)
+
+    if hasattr(X, "_view_args"):  # AnnData array view
+        # For compatibility with anndata<0.9
+        X = X.copy()  # Doesn't actually copy memory, just removes View class wrapper
+
     if flavor == "seurat":
         X = X.copy()
         if "log1p" in adata.uns_keys() and adata.uns["log1p"].get("base") is not None:

From c7d95b6953afc0d99da40b62380c2f42ed653f15 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 15 Feb 2024 12:55:42 +0000
Subject: [PATCH 48/51] Typo

---
 ci/scripts/min-deps.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/ci/scripts/min-deps.py b/ci/scripts/min-deps.py
index b9b74f5ba8..b3f393ea57 100755
--- a/ci/scripts/min-deps.py
+++ b/ci/scripts/min-deps.py
@@ -55,7 +55,7 @@ def extract_min_deps(
     while len(dependencies) > 0:
         req = dependencies.pop()
 
-        # If we are reffering to other optional dependency lists, resolve them
+        # If we are referring to other optional dependency lists, resolve them
         if req.name == project_name:
             assert req.extras, f"Project included itself as dependency, without specifying extras: {req}"
             for extra in req.extras:

From 0ddc5e2fb03f4c3d025ea18043027a26f3cfab97 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 15 Feb 2024 12:59:43 +0000
Subject: [PATCH 49/51] Release note

---
 docs/release-notes/1.10.0.md | 1 +
 1 file changed, 1 insertion(+)

diff --git a/docs/release-notes/1.10.0.md b/docs/release-notes/1.10.0.md
index 37a6adf97f..7d48d4fd9d 100644
--- a/docs/release-notes/1.10.0.md
+++ b/docs/release-notes/1.10.0.md
@@ -35,6 +35,7 @@
 * Fix setting `sc.settings.verbosity` in some cases {pr}`2605` {smaller}`P Angerer`
 * Fix all remaining pandas warnings {pr}`2789` {smaller}`P Angerer`
 * Fix some annoying plotting warnings around violin plots {pr}`2844` {smaller}`P Angerer`
+* Scanpy now has a test job which tests against the minumum versions of the dependencies. In the process of implementing this, many bugs associated with using older versions of `pandas`, `anndata`, `numpy`, and `matplotlib` were fixed. {pr}`2816` {smaller}`I Virshup`
 
 ```{rubric} Ecosystem
 ```

From b653dd6518af6a6d574f94df71b0ee4160bb40e1 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 15 Feb 2024 13:38:01 +0000
Subject: [PATCH 50/51] coverage for min deps

---
 .azure-pipelines.yml | 1 +
 1 file changed, 1 insertion(+)

diff --git a/.azure-pipelines.yml b/.azure-pipelines.yml
index d4301de583..d713636243 100644
--- a/.azure-pipelines.yml
+++ b/.azure-pipelines.yml
@@ -27,6 +27,7 @@ jobs:
       minimum_versions:
         python.version: '3.9'
         DEPENDENCIES_VERSION: "minimum-version"
+        TEST_TYPE: "coverage"
 
 
   steps:

From 2b2ec5dcd72d5902dc560d1fe0024cc86fc163e4 Mon Sep 17 00:00:00 2001
From: Isaac Virshup <ivirshup@gmail.com>
Date: Thu, 15 Feb 2024 16:10:28 +0000
Subject: [PATCH 51/51] fix coverage for minimum-version install

---
 .azure-pipelines.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.azure-pipelines.yml b/.azure-pipelines.yml
index d713636243..cbe87aadb9 100644
--- a/.azure-pipelines.yml
+++ b/.azure-pipelines.yml
@@ -66,7 +66,7 @@ jobs:
     condition: eq(variables['DEPENDENCIES_VERSION'], 'pre-release')
 
   - script: |
-      python -m pip install pip wheel tomli packaging
+      python -m pip install pip wheel tomli packaging pytest-cov
       pip install `python3 ci/scripts/min-deps.py pyproject.toml --extra dev test`
       pip install --no-deps .
     displayName: 'Install dependencies minimum version'