metatensor · frostedoyster · Feb 29, 2024 · Feb 8, 2024 · Feb 20, 2024 · Feb 20, 2024
diff --git a/src/metatensor/models/cli/conf/architecture/experimental.pet.yaml b/src/metatensor/models/cli/conf/architecture/experimental.pet.yaml
@@ -0,0 +1,65 @@
+ARCHITECTURAL_HYPERS:
+  CUTOFF_DELTA: 0.2
+  AVERAGE_POOLING: False
+  TRANSFORMERS_CENTRAL_SPECIFIC: False
+  HEADS_CENTRAL_SPECIFIC: False
+  ADD_TOKEN_FIRST: True
+  ADD_TOKEN_SECOND: True
+  N_GNN_LAYERS: 3
+  TRANSFORMER_D_MODEL: 128
+  TRANSFORMER_N_HEAD: 4
+  TRANSFORMER_DIM_FEEDFORWARD: 512
+  HEAD_N_NEURONS: 128
+  N_TRANS_LAYERS: 3
+  ACTIVATION: silu
+  USE_LENGTH: True
+  USE_ONLY_LENGTH: False
+  R_CUT: 5.0
+  R_EMBEDDING_ACTIVATION: False
+  COMPRESS_MODE: mlp
+  BLEND_NEIGHBOR_SPECIES: False
+  AVERAGE_BOND_ENERGIES: False
+  USE_BOND_ENERGIES: True
+  USE_ADDITIONAL_SCALAR_ATTRIBUTES: False
+  SCALAR_ATTRIBUTES_SIZE: None
+  TRANSFORMER_TYPE: PostLN # PostLN or PreLN
+  USE_LONG_RANGE: False
+  K_CUT: None # should be float; only used when USE_LONG_RANGE is True
+
+
+FITTING_SCHEME:  
+  INITIAL_LR: 1e-4
+  EPOCH_NUM_ATOMIC: 1000000000000000000
+  SCHEDULER_STEP_SIZE_ATOMIC: 500000000
+  EPOCHS_WARMUP_ATOMIC: 250000000
+  GLOBAL_AUG: True
+  SLIDING_FACTOR: 0.7
+  ATOMIC_BATCH_SIZE: 850
+  MAX_TIME: 234000
+  ENERGY_WEIGHT: 0.1 # only used when fitting MLIP
+  MULTI_GPU: False
+  RANDOM_SEED: 0
+  CUDA_DETERMINISTIC: False
+  MODEL_TO_START_WITH: None
+  SUPPORT_MISSING_VALUES: False
+  USE_WEIGHT_DECAY: False
+  WEIGHT_DECAY: 0.0
+  DO_GRADIENT_CLIPPING: False
+  GRADIENT_CLIPPING_MAX_NORM: None # must be overwritten if DO_GRADIENT_CLIPPING is True
+  USE_SHIFT_AGNOSTIC_LOSS: False # only used when fitting general target. Primary use case: EDOS
+  ENERGIES_LOSS: per_structure # per_structure or per_atom
+
+MLIP_SETTINGS: # only used when fitting MLIP
+  ENERGY_KEY: energy
+  FORCES_KEY: forces
+  USE_ENERGIES: True
+  USE_FORCES: True
+
+GENERAL_TARGET_SETTINGS: # only used when fitting general target 
+  TARGET_TYPE: structural
+  TARGET_AGGREGATION: sum # sum or mean; only used when TARGET_TYPE is structural
+  TARGET_DIM: 42
+  TARGET_KEY: structural_target
+
+UTILITY_FLAGS: #for internal usage; do not change/overwrite
+  CALCULATION_TYPE: None
@@ -0,0 +1,2 @@
+from .model import Model, DEFAULT_HYPERS  # noqa: F401
+from .train import train  # noqa: F401
@@ -0,0 +1,102 @@
+import torch
+import numpy as np
+from typing import Dict, List, Optional
+from metatensor.torch import Labels, TensorMap, TensorBlock
+from metatensor.torch.atomistic import (
+    ModelCapabilities,
+    ModelOutput,
+    NeighborsListOptions,
+    System,
+)
+from omegaconf import OmegaConf
+from pet.molecule import batch_to_dict
+from pet.pet import PET
+from pet.hypers import Hypers
+
+from ... import ARCHITECTURE_CONFIG_PATH
+from .utils import systems_to_pyg_graphs
+
+
+DEFAULT_HYPERS = OmegaConf.to_container(
+    OmegaConf.load(ARCHITECTURE_CONFIG_PATH / "experimental.pet.yaml")
+)
+
+DEFAULT_MODEL_HYPERS = DEFAULT_HYPERS["ARCHITECTURAL_HYPERS"]
+
+# We hardcode some of the hypers to make PET model work as a MLIP.
+DEFAULT_MODEL_HYPERS.update(
+    {"D_OUTPUT": 1, "TARGET_TYPE": "structural", "TARGET_AGGREGATION": "sum"}
+)
+
+ARCHITECTURE_NAME = "experimental.pet"
+
+
+class Model(torch.nn.Module):
+    def __init__(
+        self, capabilities: ModelCapabilities, hypers: Dict = DEFAULT_MODEL_HYPERS
+    ) -> None:
+        super().__init__()
+        self.name = ARCHITECTURE_NAME
+        self.hypers = hypers
+        self.cutoff = self.hypers["R_CUT"]
+        self.all_species = capabilities.species
+        self.capabilities = capabilities
+        self.pet = PET(Hypers(self.hypers), 0.0, len(self.all_species))
+
+    def set_trained_model(self, trained_model: torch.nn.Module) -> None:
+        self.pet = trained_model
+
+    def requested_neighbors_lists(
+        self,
+    ) -> List[NeighborsListOptions]:
+        return [
+            NeighborsListOptions(
+                model_cutoff=self.cutoff,
+                full_list=True,
+            )
+        ]
+
+    def forward(
+        self,
+        systems: List[System],
+        outputs: Dict[str, ModelOutput],
+        selected_atoms: Optional[Labels] = None,
+    ) -> Dict[str, TensorMap]:
+        if selected_atoms is not None:
+            raise NotImplementedError("PET does not support selected atoms.")
+        options = self.requested_neighbors_lists()[0]
+        batch = systems_to_pyg_graphs(systems, options, self.all_species)
+        predictions = self.pet(batch_to_dict(batch))
+        total_energies: Dict[str, TensorMap] = {}
+        for output_name in outputs:
+            total_energies[output_name] = predictions
+            total_energies[output_name] = TensorMap(
+                keys=Labels(
+                    names=["lambda", "sigma"],
+                    values=torch.tensor(
+                        [[0, 1]],
+                        device=predictions.device,
+                    ),
+                ),
+                blocks=[
+                    TensorBlock(
+                        samples=Labels(
+                            names=["structure"],
+                            values=torch.arange(
+                                len(predictions),
+                                device=predictions.device,
+                            ).view(-1, 1),
+                        ),
+                        components=[],
+                        properties=Labels(
+                            names=["property"],
+                            values=torch.tensor(
+                                len(outputs),
+                                device=predictions.device,
+                            ).view(1, -1),
+                        ),
+                        values=total_energies[output_name],
+                    )
+                ],
+            )
+        return total_energies
@@ -0,0 +1,6 @@
+from pathlib import Path
+
+DATASET_PATH = str(
+    Path(__file__).parent.resolve()
+    / "../../../../../../tests/resources/qm9_reduced_100.xyz"
+)
@@ -0,0 +1,47 @@
+import ase
+import rascaline.torch
+import torch
+from metatensor.torch.atomistic import (
+    MetatensorAtomisticModel,
+    ModelCapabilities,
+    ModelEvaluationOptions,
+    ModelOutput,
+)
+
+from metatensor.models.experimental.pet import DEFAULT_HYPERS, Model
+from metatensor.models.utils.neighbors_lists import get_system_with_neighbors_lists
+
+
+def test_prediction_subset():
+    """Tests that the model can predict on a subset
+    of the elements it was trained on."""
+
+    capabilities = ModelCapabilities(
+        length_unit="Angstrom",
+        species=[1, 6, 7, 8],
+        outputs={
+            "energy": ModelOutput(
+                quantity="energy",
+                unit="eV",
+            )
+        },
+    )
+
+    model = Model(capabilities, DEFAULT_HYPERS["ARCHITECTURAL_HYPERS"]).to(
+        torch.float64
+    )
+    structure = ase.Atoms("O2", positions=[[0.0, 0.0, 0.0], [0.0, 0.0, 1.0]])
+    system = rascaline.torch.systems_to_torch(structure)
+    system = get_system_with_neighbors_lists(system, model.requested_neighbors_lists())
+
+    evaluation_options = ModelEvaluationOptions(
+        length_unit=capabilities.length_unit,
+        outputs=capabilities.outputs,
+    )
+
+    model = MetatensorAtomisticModel(model.eval(), model.capabilities)
+    model(
+        [system],
+        evaluation_options,
+        check_consistency=True,
+    )
@@ -0,0 +1,101 @@
+import logging
+import warnings
+from pathlib import Path
+from typing import Dict, List, Optional, Tuple, Union
+
+import rascaline
+import torch
+from metatensor.learn.data import DataLoader
+from metatensor.learn.data.dataset import _BaseDataset
+from metatensor.torch.atomistic import ModelCapabilities, NeighborsListOptions, System
+
+from ...utils.composition import calculate_composition_weights
+from ...utils.compute_loss import compute_model_loss
+from ...utils.data import (
+    check_datasets,
+    collate_fn,
+    combine_dataloaders,
+    get_all_targets,
+)
+from ...utils.data.system_to_ase import system_to_ase
+from ...utils.extract_targets import get_outputs_dict
+from ...utils.info import finalize_aggregated_info, update_aggregated_info
+from ...utils.neighbors_lists import get_system_with_neighbors_lists
+from ...utils.logging import MetricLogger
+from ...utils.loss import TensorMapDictLoss
+from ...utils.merge_capabilities import merge_capabilities
+from ...utils.model_io import load_checkpoint, save_model
+from .utils import systems_to_pyg_graphs
+from .model import DEFAULT_HYPERS, Model
+
+
+logger = logging.getLogger(__name__)
+
+# disable rascaline logger
+rascaline.set_logging_callback(lambda x, y: None)
+
+# Filter out the second derivative and device warnings from rascaline-torch
+warnings.filterwarnings("ignore", category=UserWarning, message="second derivative")
+warnings.filterwarnings(
+    "ignore", category=UserWarning, message="Systems data is on device"
+)
+
+
+def train(
+    train_datasets: List[Union[_BaseDataset, torch.utils.data.Subset]],
+    validation_datasets: List[Union[_BaseDataset, torch.utils.data.Subset]],
+    requested_capabilities: ModelCapabilities,
+    hypers: Dict = DEFAULT_HYPERS,
+    continue_from: Optional[str] = None,
+    output_dir: str = ".",
+    device_str: str = "cpu",
+):
+    if len(requested_capabilities.outputs) != 1:
+        raise ValueError("PET only supports a single output")
+    target_name = next(iter(requested_capabilities.outputs.keys()))
+    if requested_capabilities.outputs[target_name].quantity != "energy":
+        raise ValueError("PET only supports energies as output")
+    if requested_capabilities.outputs[target_name].per_atom:
+        raise ValueError("PET does not support per-atom energies")
+
+    if len(train_datasets) != 1:
+        raise ValueError("PET only supports a single training dataset")
+    if len(validation_datasets) != 1:
+        raise ValueError("PET only supports a single validation dataset")
+
+    train_dataset = train_datasets[0]
+    validation_dataset = validation_datasets[0]
+
+    # dummy dataloaders due to https://github.com/lab-cosmo/metatensor/issues/521
+    train_dataloader = DataLoader(
+        train_dataset,
+        batch_size=1,
+        shuffle=False,
+        collate_fn=collate_fn,
+    )
+    validation_dataloader = DataLoader(
+        validation_dataset,
+        batch_size=1,
+        shuffle=False,
+        collate_fn=collate_fn,
+    )
+
+    # only energies or energies and forces?
+    do_forces = next(iter(next(iter(train_dataset))[1].values())).values.has_gradient("positions")
+    all_species = requested_capabilities.species
+
+    ase_train_dataset = []
+    for (system,), targets in train_dataloader:
+        ase_atoms = system_to_ase(system)
+        ase_atoms.info['energy'] = targets[target_name].block().values.squeeze(-1).detach().cpu().numpy()
+        if do_forces:
+            ase_atoms.arrays["forces"] = targets[target_name].block().gradient('positions').values.squeeze(-1).detach().cpu().numpy()
+        ase_train_dataset.append(ase_atoms)
+
+    ase_validation_dataset = []
+    for (system,), _ in validation_dataloader:
+        ase_atoms = system_to_ase(system)
+        ase_atoms.info['energy'] = targets[target_name].block().values.squeeze(-1).detach().cpu().numpy()
+        if do_forces:
+            ase_atoms.arrays["forces"] = targets[target_name].block().gradient('positions').values.squeeze(-1).detach().cpu().numpy()
+        ase_validation_dataset.append(ase_atoms)
@@ -0,0 +1,5 @@
+from .systems_to_pyg_graphs import systems_to_pyg_graphs
+
+__all__ = [
+    "systems_to_pyg_graphs",
+]