freqtrade_origin/freqtrade/data/converter/converter.py

"""
Functions to convert data from one format to another
"""

import logging
from typing import Dict

import numpy as np
import pandas as pd
from pandas import DataFrame, to_datetime

from freqtrade.constants import DEFAULT_DATAFRAME_COLUMNS, Config
from freqtrade.enums import CandleType, TradingMode


logger = logging.getLogger(__name__)


def ohlcv_to_dataframe(
    ohlcv: list,
    timeframe: str,
    pair: str,
    *,
    fill_missing: bool = True,
    drop_incomplete: bool = True,
) -> DataFrame:
    """
    Converts a list with candle (OHLCV) data (in format returned by ccxt.fetch_ohlcv)
    to a Dataframe
    :param ohlcv: list with candle (OHLCV) data, as returned by exchange.async_get_candle_history
    :param timeframe: timeframe (e.g. 5m). Used to fill up eventual missing data
    :param pair: Pair this data is for (used to warn if fillup was necessary)
    :param fill_missing: fill up missing candles with 0 candles
                         (see ohlcv_fill_up_missing_data for details)
    :param drop_incomplete: Drop the last candle of the dataframe, assuming it's incomplete
    :return: DataFrame
    """
    logger.debug(f"Converting candle (OHLCV) data to dataframe for pair {pair}.")
    cols = DEFAULT_DATAFRAME_COLUMNS
    df = DataFrame(ohlcv, columns=cols)

    df["date"] = to_datetime(df["date"], unit="ms", utc=True)

    # Some exchanges return int values for Volume and even for OHLC.
    # Convert them since TA-LIB indicators used in the strategy assume floats
    # and fail with exception...
    df = df.astype(
        dtype={
            "open": "float",
            "high": "float",
            "low": "float",
            "close": "float",
            "volume": "float",
        }
    )
    return clean_ohlcv_dataframe(
        df, timeframe, pair, fill_missing=fill_missing, drop_incomplete=drop_incomplete
    )


def clean_ohlcv_dataframe(
    data: DataFrame, timeframe: str, pair: str, *, fill_missing: bool, drop_incomplete: bool
) -> DataFrame:
    """
    Cleanse a OHLCV dataframe by
      * Grouping it by date (removes duplicate tics)
      * dropping last candles if requested
      * Filling up missing data (if requested)
    :param data: DataFrame containing candle (OHLCV) data.
    :param timeframe: timeframe (e.g. 5m). Used to fill up eventual missing data
    :param pair: Pair this data is for (used to warn if fillup was necessary)
    :param fill_missing: fill up missing candles with 0 candles
                         (see ohlcv_fill_up_missing_data for details)
    :param drop_incomplete: Drop the last candle of the dataframe, assuming it's incomplete
    :return: DataFrame
    """
    # group by index and aggregate results to eliminate duplicate ticks
    data = data.groupby(by="date", as_index=False, sort=True).agg(
        {
            "open": "first",
            "high": "max",
            "low": "min",
            "close": "last",
            "volume": "max",
        }
    )
    # eliminate partial candle
    if drop_incomplete:
        data.drop(data.tail(1).index, inplace=True)
        logger.debug("Dropping last candle")

    if fill_missing:
        return ohlcv_fill_up_missing_data(data, timeframe, pair)
    else:
        return data


def ohlcv_fill_up_missing_data(dataframe: DataFrame, timeframe: str, pair: str) -> DataFrame:
    """
    Fills up missing data with 0 volume rows,
    using the previous close as price for "open", "high", "low" and "close", volume is set to 0

    """
    from freqtrade.exchange import timeframe_to_resample_freq

    ohlcv_dict = {"open": "first", "high": "max", "low": "min", "close": "last", "volume": "sum"}
    resample_interval = timeframe_to_resample_freq(timeframe)
    # Resample to create "NAN" values
    df = dataframe.resample(resample_interval, on="date").agg(ohlcv_dict)

    # Forwardfill close for missing columns
    df["close"] = df["close"].ffill()
    # Use close for "open, high, low"
    df.loc[:, ["open", "high", "low"]] = df[["open", "high", "low"]].fillna(
        value={
            "open": df["close"],
            "high": df["close"],
            "low": df["close"],
        }
    )
    df.reset_index(inplace=True)
    len_before = len(dataframe)
    len_after = len(df)
    pct_missing = (len_after - len_before) / len_before if len_before > 0 else 0
    if len_before != len_after:
        message = (
            f"Missing data fillup for {pair}, {timeframe}: "
            f"before: {len_before} - after: {len_after} - {pct_missing:.2%}"
        )
        if pct_missing > 0.01:
            logger.info(message)
        else:
            # Don't be verbose if only a small amount is missing
            logger.debug(message)
    return df


def trim_dataframe(
    df: DataFrame, timerange, *, df_date_col: str = "date", startup_candles: int = 0
) -> DataFrame:
    """
    Trim dataframe based on given timerange
    :param df: Dataframe to trim
    :param timerange: timerange (use start and end date if available)
    :param df_date_col: Column in the dataframe to use as Date column
    :param startup_candles: When not 0, is used instead the timerange start date
    :return: trimmed dataframe
    """
    if startup_candles:
        # Trim candles instead of timeframe in case of given startup_candle count
        df = df.iloc[startup_candles:, :]
    else:
        if timerange.starttype == "date":
            df = df.loc[df[df_date_col] >= timerange.startdt, :]
    if timerange.stoptype == "date":
        df = df.loc[df[df_date_col] <= timerange.stopdt, :]
    return df


def trim_dataframes(
    preprocessed: Dict[str, DataFrame], timerange, startup_candles: int
) -> Dict[str, DataFrame]:
    """
    Trim startup period from analyzed dataframes
    :param preprocessed: Dict of pair: dataframe
    :param timerange: timerange (use start and end date if available)
    :param startup_candles: Startup-candles that should be removed
    :return: Dict of trimmed dataframes
    """
    processed: Dict[str, DataFrame] = {}

    for pair, df in preprocessed.items():
        trimed_df = trim_dataframe(df, timerange, startup_candles=startup_candles)
        if not trimed_df.empty:
            processed[pair] = trimed_df
        else:
            logger.warning(
                f"{pair} has no data left after adjusting for startup candles, skipping."
            )
    return processed


def order_book_to_dataframe(bids: list, asks: list) -> DataFrame:
    """
    TODO: This should get a dedicated test
    Gets order book list, returns dataframe with below format per suggested by creslin
    -------------------------------------------------------------------
     b_sum       b_size       bids       asks       a_size       a_sum
    -------------------------------------------------------------------
    """
    cols = ["bids", "b_size"]

    bids_frame = DataFrame(bids, columns=cols)
    # add cumulative sum column
    bids_frame["b_sum"] = bids_frame["b_size"].cumsum()
    cols2 = ["asks", "a_size"]
    asks_frame = DataFrame(asks, columns=cols2)
    # add cumulative sum column
    asks_frame["a_sum"] = asks_frame["a_size"].cumsum()

    frame = pd.concat(
        [
            bids_frame["b_sum"],
            bids_frame["b_size"],
            bids_frame["bids"],
            asks_frame["asks"],
            asks_frame["a_size"],
            asks_frame["a_sum"],
        ],
        axis=1,
        keys=["b_sum", "b_size", "bids", "asks", "a_size", "a_sum"],
    )
    # logger.info('order book %s', frame )
    return frame


def convert_ohlcv_format(
    config: Config,
    convert_from: str,
    convert_to: str,
    erase: bool,
):
    """
    Convert OHLCV from one format to another
    :param config: Config dictionary
    :param convert_from: Source format
    :param convert_to: Target format
    :param erase: Erase source data (does not apply if source and target format are identical)
    """
    from freqtrade.data.history import get_datahandler

    src = get_datahandler(config["datadir"], convert_from)
    trg = get_datahandler(config["datadir"], convert_to)
    timeframes = config.get("timeframes", [config.get("timeframe")])
    logger.info(f"Converting candle (OHLCV) for timeframe {timeframes}")

    candle_types = [
        CandleType.from_string(ct)
        for ct in config.get("candle_types", [c.value for c in CandleType])
    ]
    logger.info(candle_types)
    paircombs = src.ohlcv_get_available_data(config["datadir"], TradingMode.SPOT)
    paircombs.extend(src.ohlcv_get_available_data(config["datadir"], TradingMode.FUTURES))

    if "pairs" in config:
        # Filter pairs
        paircombs = [comb for comb in paircombs if comb[0] in config["pairs"]]

    if "timeframes" in config:
        paircombs = [comb for comb in paircombs if comb[1] in config["timeframes"]]
    paircombs = [comb for comb in paircombs if comb[2] in candle_types]

    paircombs = sorted(paircombs, key=lambda x: (x[0], x[1], x[2].value))

    formatted_paircombs = "\n".join(
        [f"{pair}, {timeframe}, {candle_type}" for pair, timeframe, candle_type in paircombs]
    )

    logger.info(
        f"Converting candle (OHLCV) data for the following pair combinations:\n"
        f"{formatted_paircombs}"
    )
    for pair, timeframe, candle_type in paircombs:
        data = src.ohlcv_load(
            pair=pair,
            timeframe=timeframe,
            timerange=None,
            fill_missing=False,
            drop_incomplete=False,
            startup_candles=0,
            candle_type=candle_type,
        )
        logger.info(f"Converting {len(data)} {timeframe} {candle_type} candles for {pair}")
        if len(data) > 0:
            trg.ohlcv_store(pair=pair, timeframe=timeframe, data=data, candle_type=candle_type)
            if erase and convert_from != convert_to:
                logger.info(f"Deleting source data for {pair} / {timeframe}")
                src.ohlcv_purge(pair=pair, timeframe=timeframe, candle_type=candle_type)


def reduce_dataframe_footprint(df: DataFrame) -> DataFrame:
    """
    Ensure all values are float32 in the incoming dataframe.
    :param df: Dataframe to be converted to float/int 32s
    :return: Dataframe converted to float/int 32s
    """

    logger.debug(f"Memory usage of dataframe is {df.memory_usage().sum() / 1024**2:.2f} MB")

    df_dtypes = df.dtypes
    for column, dtype in df_dtypes.items():
        if column in ["open", "high", "low", "close", "volume"]:
            continue
        if dtype == np.float64:
            df_dtypes[column] = np.float32
        elif dtype == np.int64:
            df_dtypes[column] = np.int32
    df = df.astype(df_dtypes)

    logger.debug(f"Memory usage after optimization is: {df.memory_usage().sum() / 1024**2:.2f} MB")

    return df
add missing module and class docstring 2017-11-18 07:34:32 +00:00			`"""`
move exchange_helpers to data module 2018-12-12 18:57:25 +00:00			`Functions to convert data from one format to another`
add missing module and class docstring 2017-11-18 07:34:32 +00:00			`"""`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00
use native python logger 2018-03-25 19:37:14 +00:00			`import logging`
Split trades methods into seperate converter file 2023-09-24 09:30:31 +00:00			`from typing import Dict`
limit usage of ccxt to freqtrade/exchange only 2019-04-09 09:27:35 +00:00
move dataframe converter to converter.py 2022-11-12 09:38:25 +00:00			`import numpy as np`
Order Book with tests 2018-08-05 04:41:06 +00:00			`import pandas as pd`
Make Pylint Happy chapter 1 2018-03-02 15:22:00 +00:00			`from pandas import DataFrame, to_datetime`
optimize imports 2018-03-17 21:44:47 +00:00
Split trades methods into seperate converter file 2023-09-24 09:30:31 +00:00			`from freqtrade.constants import DEFAULT_DATAFRAME_COLUMNS, Config`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00			`from freqtrade.enums import CandleType, TradingMode`
Apply isort to freqtrade codebase 2020-09-28 17:39:41 +00:00
Add ohlcv data interpolator 2018-12-30 15:07:47 +00:00
use native python logger 2018-03-25 19:37:14 +00:00			`logger = logging.getLogger(__name__)`


ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`def ohlcv_to_dataframe(`
			`ohlcv: list,`
			`timeframe: str,`
			`pair: str,`
			`*,`
			`fill_missing: bool = True,`
			`drop_incomplete: bool = True,`
			`) -> DataFrame:`
move parse_ticker_dataframe outside Analyze class 2018-07-10 10:04:37 +00:00			`"""`
Do not use ticker where it's not a ticker 2020-03-08 10:35:31 +00:00			`Converts a list with candle (OHLCV) data (in format returned by ccxt.fetch_ohlcv)`
			`to a Dataframe`
			`:param ohlcv: list with candle (OHLCV) data, as returned by exchange.async_get_candle_history`
Replace some occurances of ticker_interval with timeframe 2019-11-02 19:19:13 +00:00			`:param timeframe: timeframe (e.g. 5m). Used to fill up eventual missing data`
Tests need to pass pair to parse_ticker_dataframe 2019-06-15 11:47:20 +00:00			`:param pair: Pair this data is for (used to warn if fillup was necessary)`
Change default value and add docstring 2018-12-31 18:42:14 +00:00			`:param fill_missing: fill up missing candles with 0 candles`
			`(see ohlcv_fill_up_missing_data for details)`
Make drop_incomplete optional 2019-06-09 12:35:58 +00:00			`:param drop_incomplete: Drop the last candle of the dataframe, assuming it's incomplete`
move parse_ticker_dataframe outside Analyze class 2018-07-10 10:04:37 +00:00			`:return: DataFrame`
			`"""`
Do not use ticker where it's not a ticker 2020-03-08 10:35:31 +00:00			`logger.debug(f"Converting candle (OHLCV) data to dataframe for pair {pair}.")`
Extract default dataframe columns to constant 2019-12-26 18:52:08 +00:00			`cols = DEFAULT_DATAFRAME_COLUMNS`
Do not use ticker where it's not a ticker 2020-03-08 10:35:31 +00:00			`df = DataFrame(ohlcv, columns=cols)`
move parse_ticker_dataframe outside Analyze class 2018-07-10 10:04:37 +00:00
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`df["date"] = to_datetime(df["date"], unit="ms", utc=True)`
move parse_ticker_dataframe outside Analyze class 2018-07-10 10:04:37 +00:00
Do not use ticker where it's not a ticker 2020-03-08 10:35:31 +00:00			`# Some exchanges return int values for Volume and even for OHLC.`
fixed flake hmm, even in the comments? 2019-02-10 19:23:00 +00:00			`# Convert them since TA-LIB indicators used in the strategy assume floats`
what else? 2019-02-10 19:13:40 +00:00			`# and fail with exception...`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`df = df.astype(`
			`dtype={`
			`"open": "float",`
			`"high": "float",`
			`"low": "float",`
			`"close": "float",`
			`"volume": "float",`
			`}`
			`)`
			`return clean_ohlcv_dataframe(`
			`df, timeframe, pair, fill_missing=fill_missing, drop_incomplete=drop_incomplete`
			`)`


			`def clean_ohlcv_dataframe(`
			`data: DataFrame, timeframe: str, pair: str, *, fill_missing: bool, drop_incomplete: bool`
			`) -> DataFrame:`
Split parse_ticker_dataframe some logic to clean_ohlcv_dataframe. 2019-12-25 12:24:09 +00:00			`"""`
spell corrections 2021-06-25 13:45:49 +00:00			`Cleanse a OHLCV dataframe by`
Split parse_ticker_dataframe some logic to clean_ohlcv_dataframe. 2019-12-25 12:24:09 +00:00			`* Grouping it by date (removes duplicate tics)`
			`* dropping last candles if requested`
			`* Filling up missing data (if requested)`
Do not use ticker where it's not a ticker 2020-03-08 10:35:31 +00:00			`:param data: DataFrame containing candle (OHLCV) data.`
Split parse_ticker_dataframe some logic to clean_ohlcv_dataframe. 2019-12-25 12:24:09 +00:00			`:param timeframe: timeframe (e.g. 5m). Used to fill up eventual missing data`
			`:param pair: Pair this data is for (used to warn if fillup was necessary)`
			`:param fill_missing: fill up missing candles with 0 candles`
			`(see ohlcv_fill_up_missing_data for details)`
			`:param drop_incomplete: Drop the last candle of the dataframe, assuming it's incomplete`
			`:return: DataFrame`
			`"""`
move parse_ticker_dataframe outside Analyze class 2018-07-10 10:04:37 +00:00			`# group by index and aggregate results to eliminate duplicate ticks`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`data = data.groupby(by="date", as_index=False, sort=True).agg(`
			`{`
			`"open": "first",`
			`"high": "max",`
			`"low": "min",`
			`"close": "last",`
			`"volume": "max",`
			`}`
			`)`
Make drop_incomplete optional 2019-06-09 12:35:58 +00:00			`# eliminate partial candle`
			`if drop_incomplete:`
Split parse_ticker_dataframe some logic to clean_ohlcv_dataframe. 2019-12-25 12:24:09 +00:00			`data.drop(data.tail(1).index, inplace=True)`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`logger.debug("Dropping last candle")`
Fill up missing as part of loading data 2018-12-31 18:13:34 +00:00
			`if fill_missing:`
Removed candletype from converter methods 2021-11-08 03:37:57 +00:00			`return ohlcv_fill_up_missing_data(data, timeframe, pair)`
Fill up missing as part of loading data 2018-12-31 18:13:34 +00:00			`else:`
Split parse_ticker_dataframe some logic to clean_ohlcv_dataframe. 2019-12-25 12:24:09 +00:00			`return data`
Order Book with tests 2018-08-05 04:41:06 +00:00

Removed candletype from converter methods 2021-11-08 03:37:57 +00:00			`def ohlcv_fill_up_missing_data(dataframe: DataFrame, timeframe: str, pair: str) -> DataFrame:`
Add ohlcv data interpolator 2018-12-30 15:07:47 +00:00			`"""`
			`Fills up missing data with 0 volume rows,`
Fix odd formatting by ruff format 2024-05-12 15:51:21 +00:00			`using the previous close as price for "open", "high", "low" and "close", volume is set to 0`
Add ohlcv data interpolator 2018-12-30 15:07:47 +00:00
			`"""`
Re-align naming for resample_freq generator 2024-01-23 06:12:27 +00:00			`from freqtrade.exchange import timeframe_to_resample_freq`
limit usage of ccxt to freqtrade/exchange only 2019-04-09 09:27:35 +00:00
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`ohlcv_dict = {"open": "first", "high": "max", "low": "min", "close": "last", "volume": "sum"}`
Re-align naming for resample_freq generator 2024-01-23 06:12:27 +00:00			`resample_interval = timeframe_to_resample_freq(timeframe)`
Add ohlcv data interpolator 2018-12-30 15:07:47 +00:00			`# Resample to create "NAN" values`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`df = dataframe.resample(resample_interval, on="date").agg(ohlcv_dict)`
Add ohlcv data interpolator 2018-12-30 15:07:47 +00:00
			`# Forwardfill close for missing columns`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`df["close"] = df["close"].ffill()`
Add ohlcv data interpolator 2018-12-30 15:07:47 +00:00			`# Use close for "open, high, low"`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`df.loc[:, ["open", "high", "low"]] = df[["open", "high", "low"]].fillna(`
			`value={`
			`"open": df["close"],`
			`"high": df["close"],`
			`"low": df["close"],`
			`}`
			`)`
Add ohlcv data interpolator 2018-12-30 15:07:47 +00:00			`df.reset_index(inplace=True)`
Log missing data filllup if necessary 2019-06-15 11:31:14 +00:00			`len_before = len(dataframe)`
			`len_after = len(df)`
Reduce verbosity of missing data if less than 1% of data is missing 2021-03-30 05:26:39 +00:00			`pct_missing = (len_after - len_before) / len_before if len_before > 0 else 0`
Log missing data filllup if necessary 2019-06-15 11:31:14 +00:00			`if len_before != len_after:`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`message = (`
			`f"Missing data fillup for {pair}, {timeframe}: "`
			`f"before: {len_before} - after: {len_after} - {pct_missing:.2%}"`
			`)`
Reduce verbosity of missing data if less than 1% of data is missing 2021-03-30 05:26:39 +00:00			`if pct_missing > 0.01:`
			`logger.info(message)`
			`else:`
			`# Don't be verbose if only a small amount is missing`
			`logger.debug(message)`
Add ohlcv data interpolator 2018-12-30 15:07:47 +00:00			`return df`


ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`def trim_dataframe(`
			`df: DataFrame, timerange, *, df_date_col: str = "date", startup_candles: int = 0`
			`) -> DataFrame:`
Move trim_dataframe from history to converter 2019-12-25 14:47:04 +00:00			`"""`
			`Trim dataframe based on given timerange`
			`:param df: Dataframe to trim`
			`:param timerange: timerange (use start and end date if available)`
Remove candle_count from dataframe before backtesting closes #3754 2021-03-29 18:22:52 +00:00			`:param df_date_col: Column in the dataframe to use as Date column`
			`:param startup_candles: When not 0, is used instead the timerange start date`
Move trim_dataframe from history to converter 2019-12-25 14:47:04 +00:00			`:return: trimmed dataframe`
			`"""`
Remove candle_count from dataframe before backtesting closes #3754 2021-03-29 18:22:52 +00:00			`if startup_candles:`
			`# Trim candles instead of timeframe in case of given startup_candle count`
			`df = df.iloc[startup_candles:, :]`
			`else:`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`if timerange.starttype == "date":`
Update some usages of timerange to new, simplified method 2022-11-10 17:11:39 +00:00			`df = df.loc[df[df_date_col] >= timerange.startdt, :]`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`if timerange.stoptype == "date":`
Update some usages of timerange to new, simplified method 2022-11-10 17:11:39 +00:00			`df = df.loc[df[df_date_col] <= timerange.stopdt, :]`
Move trim_dataframe from history to converter 2019-12-25 14:47:04 +00:00			`return df`


ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`def trim_dataframes(`
			`preprocessed: Dict[str, DataFrame], timerange, startup_candles: int`
			`) -> Dict[str, DataFrame]:`
Refactor preprocessed trimming to seperate method 2021-05-21 06:26:19 +00:00			`"""`
			`Trim startup period from analyzed dataframes`
			`:param preprocessed: Dict of pair: dataframe`
			`:param timerange: timerange (use start and end date if available)`
			`:param startup_candles: Startup-candles that should be removed`
			`:return: Dict of trimmed dataframes`
			`"""`
			`processed: Dict[str, DataFrame] = {}`

			`for pair, df in preprocessed.items():`
			`trimed_df = trim_dataframe(df, timerange, startup_candles=startup_candles)`
			`if not trimed_df.empty:`
			`processed[pair] = trimed_df`
			`else:`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`logger.warning(`
Fix odd formatting by ruff format 2024-05-12 15:51:21 +00:00			`f"{pair} has no data left after adjusting for startup candles, skipping."`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`)`
Refactor preprocessed trimming to seperate method 2021-05-21 06:26:19 +00:00			`return processed`


mypy fix 2018-08-05 13:08:07 +00:00			`def order_book_to_dataframe(bids: list, asks: list) -> DataFrame:`
Order Book with tests 2018-08-05 04:41:06 +00:00			`"""`
Add test for convert_ohlcv 2019-12-28 09:54:10 +00:00			`TODO: This should get a dedicated test`
Order Book with tests 2018-08-05 04:41:06 +00:00			`Gets order book list, returns dataframe with below format per suggested by creslin`
			`-------------------------------------------------------------------`
			`b_sum b_size bids asks a_size a_sum`
			`-------------------------------------------------------------------`
			`"""`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`cols = ["bids", "b_size"]`
mypy fix 2018-08-05 13:08:07 +00:00
			`bids_frame = DataFrame(bids, columns=cols)`
Order Book with tests 2018-08-05 04:41:06 +00:00			`# add cumulative sum column`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`bids_frame["b_sum"] = bids_frame["b_size"].cumsum()`
			`cols2 = ["asks", "a_size"]`
mypy fix 2018-08-05 13:08:07 +00:00			`asks_frame = DataFrame(asks, columns=cols2)`
Order Book with tests 2018-08-05 04:41:06 +00:00			`# add cumulative sum column`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`asks_frame["a_sum"] = asks_frame["a_size"].cumsum()`

			`frame = pd.concat(`
			`[`
			`bids_frame["b_sum"],`
			`bids_frame["b_size"],`
			`bids_frame["bids"],`
			`asks_frame["asks"],`
			`asks_frame["a_size"],`
			`asks_frame["a_sum"],`
			`],`
			`axis=1,`
			`keys=["b_sum", "b_size", "bids", "asks", "a_size", "a_sum"],`
			`)`
Order Book with tests 2018-08-05 04:41:06 +00:00			`# logger.info('order book %s', frame )`
			`return frame`
add pandas-based converter-functions 2019-10-13 17:21:27 +00:00

updated historic data filenames to include the candle type 2021-11-07 06:35:27 +00:00			`def convert_ohlcv_format(`
Use Alias to type config objects 2022-09-18 11:20:36 +00:00			`config: Config,`
updated historic data filenames to include the candle type 2021-11-07 06:35:27 +00:00			`convert_from: str,`
			`convert_to: str,`
			`erase: bool,`
			`):`
Move convert functions to convert module 2019-12-28 09:27:49 +00:00			`"""`
Do not use ticker where it's not a ticker 2020-03-08 10:35:31 +00:00			`Convert OHLCV from one format to another`
Move convert functions to convert module 2019-12-28 09:27:49 +00:00			`:param config: Config dictionary`
			`:param convert_from: Source format`
			`:param convert_to: Target format`
fix: typo spelling grammar 2021-08-16 12:16:24 +00:00			`:param erase: Erase source data (does not apply if source and target format are identical)`
Move convert functions to convert module 2019-12-28 09:27:49 +00:00			`"""`
Fix imports that import directly from file instead from the exporting package 2024-03-15 05:40:42 +00:00			`from freqtrade.data.history import get_datahandler`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00
			`src = get_datahandler(config["datadir"], convert_from)`
			`trg = get_datahandler(config["datadir"], convert_to)`
			`timeframes = config.get("timeframes", [config.get("timeframe")])`
Do not use ticker where it's not a ticker 2020-03-08 10:35:31 +00:00			`logger.info(f"Converting candle (OHLCV) for timeframe {timeframes}")`
Move convert functions to convert module 2019-12-28 09:27:49 +00:00
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`candle_types = [`
			`CandleType.from_string(ct)`
			`for ct in config.get("candle_types", [c.value for c in CandleType])`
			`]`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00			`logger.info(candle_types)`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`paircombs = src.ohlcv_get_available_data(config["datadir"], TradingMode.SPOT)`
			`paircombs.extend(src.ohlcv_get_available_data(config["datadir"], TradingMode.FUTURES))`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`if "pairs" in config:`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00			`# Filter pairs`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`paircombs = [comb for comb in paircombs if comb[0] in config["pairs"]]`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`if "timeframes" in config:`
			`paircombs = [comb for comb in paircombs if comb[1] in config["timeframes"]]`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00			`paircombs = [comb for comb in paircombs if comb[2] in candle_types]`

			`paircombs = sorted(paircombs, key=lambda x: (x[0], x[1], x[2].value))`

ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`formatted_paircombs = "\n".join(`
			`[f"{pair}, {timeframe}, {candle_type}" for pair, timeframe, candle_type in paircombs]`
			`)`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`logger.info(`
			`f"Converting candle (OHLCV) data for the following pair combinations:\n"`
			`f"{formatted_paircombs}"`
			`)`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00			`for pair, timeframe, candle_type in paircombs:`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`data = src.ohlcv_load(`
			`pair=pair,`
			`timeframe=timeframe,`
			`timerange=None,`
			`fill_missing=False,`
			`drop_incomplete=False,`
			`startup_candles=0,`
			`candle_type=candle_type,`
			`)`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00			`logger.info(f"Converting {len(data)} {timeframe} {candle_type} candles for {pair}")`
			`if len(data) > 0:`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`trg.ohlcv_store(pair=pair, timeframe=timeframe, data=data, candle_type=candle_type)`
Improve behavior for convert-data 2023-07-09 13:28:05 +00:00			`if erase and convert_from != convert_to:`
			`logger.info(f"Deleting source data for {pair} / {timeframe}")`
			`src.ohlcv_purge(pair=pair, timeframe=timeframe, candle_type=candle_type)`
move dataframe converter to converter.py 2022-11-12 09:38:25 +00:00

			`def reduce_dataframe_footprint(df: DataFrame) -> DataFrame:`
			`"""`
			`Ensure all values are float32 in the incoming dataframe.`
			`:param df: Dataframe to be converted to float/int 32s`
			`:return: Dataframe converted to float/int 32s`
			`"""`

Fix odd formatting by ruff format 2024-05-12 15:51:21 +00:00			`logger.debug(f"Memory usage of dataframe is {df.memory_usage().sum() / 1024**2:.2f} MB")`
move dataframe converter to converter.py 2022-11-12 09:38:25 +00:00
			`df_dtypes = df.dtypes`
			`for column, dtype in df_dtypes.items():`
ruff format: freqtrade.data 2024-05-12 15:41:55 +00:00			`if column in ["open", "high", "low", "close", "volume"]:`
move dataframe converter to converter.py 2022-11-12 09:38:25 +00:00			`continue`
			`if dtype == np.float64:`
			`df_dtypes[column] = np.float32`
			`elif dtype == np.int64:`
			`df_dtypes[column] = np.int32`
			`df = df.astype(df_dtypes)`

Fix odd formatting by ruff format 2024-05-12 15:51:21 +00:00			`logger.debug(f"Memory usage after optimization is: {df.memory_usage().sum() / 1024**2:.2f} MB")`
move dataframe converter to converter.py 2022-11-12 09:38:25 +00:00
			`return df`