iFX EXPO Dubai 2026 — начнётся через 00 дней
Начнётся через 00 дней Посмотреть участников

Как собирать качественные исторические данные для бэктестинга

Где искать, как очищать и проверять исторические данные, чтобы тесты не искажались из-за пропусков, ошибок или survivorship bias.

Как собирать качественные исторические данные для бэктестинга

Каждый бэктест хорош настолько, насколько хороши данные, лежащие в его основе. Исторические данные низкого качества приводят к ложным результатам, излишней уверенности и потере времени. Для создания надежных стратегий трейдерам нужны точные, чистые и согласованные данные. Эта статья объясняет, где получить исторические данные, что проверять и как подготовить их для бэктестинга.


Почему качество данных имеет значение

  • Отсутствующие свечи создают ложные сигналы.
  • Неправильные метки времени искажают индикаторы.
  • Нереалистичные спреды завышают результаты.
  • Неполные тиковые данные скрывают риски проскальзывания.

Короче говоря, плохие данные = плохая стратегия.


Источники исторических данных

  1. Данные, предоставляемые брокером
    • Обычно бесплатны, но могут иметь пробелы или ограниченную глубину.
  2. Специализированные поставщики
    • Такие компании, как Tickstory, Dukascopy и Quandl, предоставляют высококачественные тиковые и барные данные.
  3. Биржевые данные
    • Лучше всего подходят для акций, фьючерсов и криптовалют, так как поступают непосредственно с бирж.
  4. API
    • Некоторые брокеры и сервисы предоставляют прямые API для загрузки рыночной истории.

Типы необходимых данных

  • Тиковые данные: Каждое изменение цены. Лучше всего подходит для скальпинга и высокочастотных стратегий.
  • Минутные данные: Сбалансированный вариант для большинства розничных бэктестов.
  • Дневные/недельные данные: Полезны для свинговых и позиционных торговых систем.

Как подготовить исторические данные

  1. Проверьте полноту – отсутствие пропущенных дней или часов.
  2. Нормализуйте метки времени – убедитесь, что часовые пояса соответствуют вашей платформе.
  3. Включите спреды и комиссии – для реалистичных результатов.
  4. Отфильтруйте плохие тики – некоторые фиды имеют выбросы (например, ценовые шипы).

Пример влияния плохих данных

Стратегия на основе скользящих средних на EURUSD выглядит прибыльной с бесплатными 1-минутными данными (+25% годовых). Но при тестировании на тиковых данных с реальными спредами результат падает до -3% в год. Одно только качество данных изменило исход.


Лучшие практики

  • Всегда проверяйте данные перед использованием.
  • Используйте историю не менее 5-10 лет, если доступна.
  • Для форекса предпочитайте тиковые данные с переменными спредами.
  • Для акций всегда проверяйте, включены ли дивиденды и сплиты.

Заключение

Высококачественные исторические данные — это основа надежного бэктестинга. Сбор, очистка и проверка ваших данных гарантируют, что ваши стратегии отражают реальные торговые условия. Без этого даже самый умный алгоритм строится на песке.

Следующий урок

Понимание ключевых метрик бэктестинга (Sharpe, просадка, Profit Factor)
Что такое бэктестинг в трейдинге? Полный гид для новичков
Узнайте, что такое бэктестинг, зачем он нужен и как новичкам проверять идеи стратегий на исторических рыночных данных.
Как работает бэктестинг: пошагово
Практический разбор процесса бэктестинга: от формулировки правил и поиска данных до запуска тестов и интерпретации результатов.
Ключевые метрики в бэктестинге: объяснение
Разберитесь в базовых метриках (доходность, просадки, винрейт, expectancy) и в том, что они говорят о стратегии.
Бэктестинг vs форвард-тест: в чём разница?
Сравнение бэктестинга и форвард-теста: когда использовать каждый подход и как вместе они снижают риск ложной уверенности.
Как собирать качественные исторические данные для бэктестинга
Где искать, как очищать и проверять исторические данные, чтобы тесты не искажались из-за пропусков, ошибок или survivorship bias.
Понимание ключевых метрик бэктестинга (Sharpe, просадка, Profit Factor)
Погружение в коэффициент Шарпа, максимальную просадку и profit factor: как они считаются и как применять их корректно.
Как построить надёжный процесс бэктестинга (пошаговое руководство)
Создайте повторяемый workflow с реалистичными допущениями, учётом комиссий, этапами валидации и защитой от переобучения.
Ограничения бэктестинга и как использовать его правильно
Типичные ограничения бэктестов (смена режимов, ограничения исполнения, смещения) и как формировать реалистичные ожидания.
Типичные ошибки в бэктестинге и как их избежать
Избегайте классических ловушек: lookahead bias, data snooping, нереалистичные исполнения, игнорирование комиссий и проскальзывания.
Почему форвард-тест важен после бэктестинга
Почему paper trading и реальный форвард-тест необходимы, чтобы подтвердить результаты в условиях реального времени.