Далі йдуть дослідницькі дані. Що таке дослідницькі дані?
Почати можна з формування універсуму. Не варто витрачати час на ручне визначення універсуму (і в ідеалі він має бути уніфікованим). Просто завантажте файл з топ X інструментів за 30-денним об'ємом, ринковою капіталізацією, ліквідністю за 30 днів чи іншим критерієм. Можна експериментувати.
Після цього можна аналізувати прибутковість: потрібно мати факторну прибутковість, ідіосинкратичну прибутковість, обрізану прибутковість і, звичайно, необроблену прибутковість. ВСЕ ПІДГОТОВЛЕНО ЗАЗДАЛЕГІДЬ!
І, нарешті, треба забезпечити можливість тестування всіх ваших альф, і код для цього має працювати блискавично швидко. Можливо, здається, це лише X хвилин, але все, що триває більше кількох хвилин — це значний контекстний перемикач, який прямо впливає на продуктивність.
Ми розглянули швидкість ітерацій, тепер перейдемо до доступності.
Доступність — це наскільки легко провести той чи інший аналіз. Це якісна складова задачі оптимізації «якість проти кількості». Наприклад, якщо я хочу зробити сезонний аналіз, але вирішую пропустити його заради іншої альфи — це брак доступності. Якщо я вирішую не робити аналіз кореляції + резидуалізації, бо хочу протестувати ще одну альфу — це теж брак доступності.
Ваші інструменти повинні дозволяти швидко виконувати ці типові види аналізу. Це стосується оптимізації, markouts, TCA, оптимального TWAP тощо. Все це повинно вимагати мінімум зусиль для запуску, тому що чим більше зусиль потрібно — ТИМ МЕНШЕ ВИ БУДЕТЕ ЦЕ РОБИТИ, і якість ваших досліджень впаде.
Підсумовуючи: зосереджуйтеся на тому, щоб основний аналіз був швидким, а додатковий аналіз, який покращує якість досліджень, — максимально простим у виконанні. Оптимізуючи обидва аспекти, ви забезпечуєте собі можливість створювати надвисокоякісні дослідження значно швидше за конкурентів.
Це ваша перевага. Якщо ви робите у 5 разів більше за інших за той самий час — ви можете отримати значно більший PnL.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Мої основні принципи розробки альфа-стратегій такі:
1) Швидкість ітерацій
2) Доступність
Що це означає?
Перше досить очевидно. Якщо ви тестуєте 10 альф на день, а всі інші тестують по 2 щодня, то ваші результати будуть значно кращими за інших.
Як цього досягти?
По-перше, забудьте про ручне скрапінг даних і попередню обробку. Якщо у вас немає скриптів для автоматизації цих задач, ви вже NGMI. Це базова вимога.
Далі, використовуйте бібліотеку для завантаження даних. Вам не потрібно щоразу переписувати код на кшталт glob.glob(folder_path) тощо. Використовуйте:
load_data(
start_date=start_date,
end_date=end_date,
symbol=symbol,
тощо
)
Далі йдуть дослідницькі дані. Що таке дослідницькі дані?
Почати можна з формування універсуму. Не варто витрачати час на ручне визначення універсуму (і в ідеалі він має бути уніфікованим). Просто завантажте файл з топ X інструментів за 30-денним об'ємом, ринковою капіталізацією, ліквідністю за 30 днів чи іншим критерієм. Можна експериментувати.
Після цього можна аналізувати прибутковість: потрібно мати факторну прибутковість, ідіосинкратичну прибутковість, обрізану прибутковість і, звичайно, необроблену прибутковість. ВСЕ ПІДГОТОВЛЕНО ЗАЗДАЛЕГІДЬ!
І, нарешті, треба забезпечити можливість тестування всіх ваших альф, і код для цього має працювати блискавично швидко. Можливо, здається, це лише X хвилин, але все, що триває більше кількох хвилин — це значний контекстний перемикач, який прямо впливає на продуктивність.
Ми розглянули швидкість ітерацій, тепер перейдемо до доступності.
Доступність — це наскільки легко провести той чи інший аналіз. Це якісна складова задачі оптимізації «якість проти кількості». Наприклад, якщо я хочу зробити сезонний аналіз, але вирішую пропустити його заради іншої альфи — це брак доступності. Якщо я вирішую не робити аналіз кореляції + резидуалізації, бо хочу протестувати ще одну альфу — це теж брак доступності.
Ваші інструменти повинні дозволяти швидко виконувати ці типові види аналізу. Це стосується оптимізації, markouts, TCA, оптимального TWAP тощо. Все це повинно вимагати мінімум зусиль для запуску, тому що чим більше зусиль потрібно — ТИМ МЕНШЕ ВИ БУДЕТЕ ЦЕ РОБИТИ, і якість ваших досліджень впаде.
Підсумовуючи: зосереджуйтеся на тому, щоб основний аналіз був швидким, а додатковий аналіз, який покращує якість досліджень, — максимально простим у виконанні. Оптимізуючи обидва аспекти, ви забезпечуєте собі можливість створювати надвисокоякісні дослідження значно швидше за конкурентів.
Це ваша перевага. Якщо ви робите у 5 разів більше за інших за той самий час — ви можете отримати значно більший PnL.