# Copyright (c) 2025, NVIDIA CORPORATION.  All rights reserved.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

import nemo_run as run
import pytest

from nemo.collections.llm.api import finetune, pretrain
from nemo.collections.vlm import Gemma3VLConfig12B, Gemma3VLModel, LoRA
from nemo.collections.vlm.recipes import gemma3vl_12b
from nemo.lightning import Trainer


class TestGemma3VL12B:
    @pytest.fixture(scope="class")
    def recipe_module(self):
        return gemma3vl_12b

    def test_model(self, recipe_module):
        model_config = recipe_module.model()
        # Check that the model configuration is a run.Config instance wrapping the Gemma3VLModel
        assert isinstance(model_config, run.Config)
        # Verify that the factory function is the Gemma3VLModel
        assert model_config.__fn_or_cls__ == Gemma3VLModel
        # Verify the inner configuration is a run.Config for Gemma3VLConfig12B
        assert isinstance(model_config.config, run.Config)
        assert model_config.config.__fn_or_cls__ == Gemma3VLConfig12B

    def test_pretrain_recipe_default(self, recipe_module):
        recipe = recipe_module.pretrain_recipe()
        # Check that the returned recipe is a run.Partial wrapping pretrain
        assert isinstance(recipe, run.Partial)
        assert recipe.__fn_or_cls__ == pretrain

        # Verify the model is correctly set
        assert isinstance(recipe.model, run.Config)
        assert recipe.model.__fn_or_cls__ == Gemma3VLModel

        # Verify trainer configuration
        assert isinstance(recipe.trainer, run.Config)
        # Trainer should be the one from nemo.lightning (Trainer)
        assert recipe.trainer.__fn_or_cls__ == Trainer
        assert recipe.trainer.accelerator == "gpu"
        # Default values: num_nodes=8 and num_gpus_per_node=8
        assert recipe.trainer.num_nodes == 8
        assert recipe.trainer.devices == 8

        # Verify strategy settings
        strat = recipe.trainer.strategy
        assert isinstance(strat, run.Config)
        assert strat.tensor_model_parallel_size == 4
        assert strat.pipeline_model_parallel_size == 1
        assert strat.sequence_parallel is True

        # Verify data configuration
        assert isinstance(recipe.data, run.Config)
        # The recipe uses the Gemma3VLMockDataModule with the following parameters:
        assert recipe.data.__fn_or_cls__.__name__ == "Gemma3VLMockDataModule"
        assert recipe.data.seq_length == 512
        assert recipe.data.global_batch_size == 512
        assert recipe.data.micro_batch_size == 1

        # Verify logging and resume configurations are set (non-null)
        assert recipe.log is not None
        assert recipe.resume is not None

    def test_finetune_recipe_default(self, recipe_module):
        recipe = recipe_module.finetune_recipe()
        # Check that the returned recipe is a run.Partial wrapping finetune
        assert isinstance(recipe, run.Partial)
        assert recipe.__fn_or_cls__ == finetune

        # Verify the model is correctly set
        assert isinstance(recipe.model, run.Config)
        assert recipe.model.__fn_or_cls__ == Gemma3VLModel

        # Verify trainer configuration
        assert isinstance(recipe.trainer, run.Config)
        # Trainer should be the one from nemo.lightning (Trainer)
        assert recipe.trainer.__fn_or_cls__ == Trainer
        assert recipe.trainer.accelerator == "gpu"
        # Default values: num_nodes=8 and num_gpus_per_node=8
        assert recipe.trainer.num_nodes == 8
        assert recipe.trainer.devices == 8

        # Verify strategy settings (note: for 'none' peft, tensor_model_parallel_size is updated to 4)
        strat = recipe.trainer.strategy
        assert isinstance(strat, run.Config)
        assert strat.tensor_model_parallel_size == 4
        assert strat.pipeline_model_parallel_size == 1
        # encoder_pipeline_model_parallel_size is set to 0 and sequence_parallel should be True
        assert strat.encoder_pipeline_model_parallel_size == 0
        assert strat.sequence_parallel is True

        # Verify data configuration
        assert isinstance(recipe.data, run.Config)
        # The recipe uses the Gemma3VLMockDataModule with the following parameters:
        assert recipe.data.__fn_or_cls__.__name__ == "Gemma3VLMockDataModule"
        assert recipe.data.seq_length == 512
        assert recipe.data.global_batch_size == 32
        assert recipe.data.micro_batch_size == 1
        assert recipe.data.num_workers == 4

        # Verify logging and resume configurations are set (non-null)
        assert recipe.log is not None
        assert recipe.resume is not None

    def test_finetune_recipe_peft_lora(self, recipe_module):
        # Test the fine-tuning recipe with peft_scheme set to "lora"
        recipe = recipe_module.finetune_recipe(peft_scheme="lora")
        # In this case, a peft field should be present and configured for LoRA
        assert hasattr(recipe, "peft")
        assert isinstance(recipe.peft, run.Config)
        assert recipe.peft.__fn_or_cls__ == LoRA

        # The learning rate should have been updated for LoRA usage
        assert recipe.optim.config.lr == 1e-4

    @pytest.mark.parametrize("num_nodes,num_gpus", [(1, 8), (2, 4)])
    def test_finetune_recipe_different_configurations(self, recipe_module, num_nodes, num_gpus):
        # Verify that the recipe honors different numbers of nodes and GPUs per node
        recipe = recipe_module.finetune_recipe(num_nodes=num_nodes, num_gpus_per_node=num_gpus)
        assert recipe.trainer.num_nodes == num_nodes
        assert recipe.trainer.devices == num_gpus

    def test_pretrain_performance_optimizations(self, recipe_module):
        # Test the performance optimizations for pre-training
        recipe = recipe_module.pretrain_recipe(performance_mode=True)

        # Verify that performance-related callbacks are added
        callbacks = recipe.trainer.callbacks
        assert len(callbacks) > 1  # Should have at least TimingCallback plus performance callbacks

        # Verify that grad_reduce_in_fp32 is set to False
        assert recipe.trainer.plugins.grad_reduce_in_fp32 is False

    def test_pretrain_recipe_different_configurations(self, recipe_module):
        # Test different configurations for pre-training
        recipe = recipe_module.pretrain_recipe(num_nodes=2, num_gpus_per_node=4)
        assert recipe.trainer.num_nodes == 2
        assert recipe.trainer.devices == 4