freqtrade_origin/freqtrade/freqai/tensorboard/TensorboardCallback.py

from enum import Enum
from typing import Any

from stable_baselines3.common.callbacks import BaseCallback
from stable_baselines3.common.logger import HParam

from freqtrade.freqai.RL.BaseEnvironment import BaseActions


class TensorboardCallback(BaseCallback):
    """
    Custom callback for plotting additional values in tensorboard and
    episodic summary reports.
    """

    def __init__(self, verbose=1, actions: type[Enum] = BaseActions):
        super().__init__(verbose)
        self.model: Any = None
        self.actions: type[Enum] = actions

    def _on_training_start(self) -> None:
        hparam_dict = {
            "algorithm": self.model.__class__.__name__,
            "learning_rate": self.model.learning_rate,
            # "gamma": self.model.gamma,
            # "gae_lambda": self.model.gae_lambda,
            # "batch_size": self.model.batch_size,
            # "n_steps": self.model.n_steps,
        }
        metric_dict: dict[str, float | int] = {
            "eval/mean_reward": 0,
            "rollout/ep_rew_mean": 0,
            "rollout/ep_len_mean": 0,
            "train/value_loss": 0,
            "train/explained_variance": 0,
        }
        self.logger.record(
            "hparams",
            HParam(hparam_dict, metric_dict),
            exclude=("stdout", "log", "json", "csv"),
        )

    def _on_step(self) -> bool:
        local_info = self.locals["infos"][0]

        if hasattr(self.training_env, "envs"):
            tensorboard_metrics = self.training_env.envs[0].unwrapped.tensorboard_metrics

        else:
            # For RL-multiproc - usage of [0] might need to be evaluated
            tensorboard_metrics = self.training_env.get_attr("tensorboard_metrics")[0]

        for metric in local_info:
            if metric not in ["episode", "terminal_observation"]:
                self.logger.record(f"info/{metric}", local_info[metric])

        for category in tensorboard_metrics:
            for metric in tensorboard_metrics[category]:
                self.logger.record(f"{category}/{metric}", tensorboard_metrics[category][metric])

        return True
reorganize/generalize tensorboard callback 2022-12-04 12:54:30 +00:00			`from enum import Enum`
chore: bump ruff target-version to 3.10 2024-11-07 20:37:33 +00:00			`from typing import Any`
reorganize/generalize tensorboard callback 2022-12-04 12:54:30 +00:00
			`from stable_baselines3.common.callbacks import BaseCallback`
			`from stable_baselines3.common.logger import HParam`

avoid typing issues in the tensorboard callback 2023-04-26 12:11:26 +00:00			`from freqtrade.freqai.RL.BaseEnvironment import BaseActions`
reorganize/generalize tensorboard callback 2022-12-04 12:54:30 +00:00

			`class TensorboardCallback(BaseCallback):`
			`"""`
			`Custom callback for plotting additional values in tensorboard and`
			`episodic summary reports.`
			`"""`
ruff format: freqai 2024-05-12 15:12:20 +00:00
chore: update freqai to modern typing syntax 2024-10-04 04:50:31 +00:00			`def __init__(self, verbose=1, actions: type[Enum] = BaseActions):`
ruff: Activate UP ruleset 2023-03-19 16:57:56 +00:00			`super().__init__(verbose)`
reorganize/generalize tensorboard callback 2022-12-04 12:54:30 +00:00			`self.model: Any = None`
chore: update freqai to modern typing syntax 2024-10-04 04:50:31 +00:00			`self.actions: type[Enum] = actions`
reorganize/generalize tensorboard callback 2022-12-04 12:54:30 +00:00
			`def _on_training_start(self) -> None:`
			`hparam_dict = {`
			`"algorithm": self.model.__class__.__name__,`
			`"learning_rate": self.model.learning_rate,`
			`# "gamma": self.model.gamma,`
			`# "gae_lambda": self.model.gae_lambda,`
			`# "batch_size": self.model.batch_size,`
			`# "n_steps": self.model.n_steps,`
			`}`
chore: bump ruff target-version to 3.10 2024-11-07 20:37:33 +00:00			`metric_dict: dict[str, float \| int] = {`
reorganize/generalize tensorboard callback 2022-12-04 12:54:30 +00:00			`"eval/mean_reward": 0,`
			`"rollout/ep_rew_mean": 0,`
			`"rollout/ep_len_mean": 0,`
			`"train/value_loss": 0,`
			`"train/explained_variance": 0,`
			`}`
			`self.logger.record(`
			`"hparams",`
			`HParam(hparam_dict, metric_dict),`
			`exclude=("stdout", "log", "json", "csv"),`
			`)`

			`def _on_step(self) -> bool:`
cleanup tensorboard callback 2022-12-07 11:37:55 +00:00			`local_info = self.locals["infos"][0]`
Type-ignore training-envs 2023-10-15 09:20:11 +00:00
ruff format: freqai 2024-05-12 15:12:20 +00:00			`if hasattr(self.training_env, "envs"):`
Handle multiproc calls for now 2023-10-15 09:52:18 +00:00			`tensorboard_metrics = self.training_env.envs[0].unwrapped.tensorboard_metrics`

			`else:`
			`# For RL-multiproc - usage of [0] might need to be evaluated`
			`tensorboard_metrics = self.training_env.get_attr("tensorboard_metrics")[0]`
cleanup tensorboard callback 2022-12-07 11:37:55 +00:00
add tensorboard category 2023-03-11 22:32:55 +00:00			`for metric in local_info:`
			`if metric not in ["episode", "terminal_observation"]:`
			`self.logger.record(f"info/{metric}", local_info[metric])`

			`for category in tensorboard_metrics:`
			`for metric in tensorboard_metrics[category]:`
			`self.logger.record(f"{category}/{metric}", tensorboard_metrics[category][metric])`
cleanup tensorboard callback 2022-12-07 11:37:55 +00:00
reorganize/generalize tensorboard callback 2022-12-04 12:54:30 +00:00			`return True`