Các nguyên tắc cốt lõi trong phát triển alpha của tôi là:



1) Tốc độ lặp lại
2) Khả năng tiếp cận

Điều này có nghĩa là gì?

Nguyên tắc đầu tiên khá rõ ràng. Nếu bạn thử nghiệm 10 alpha mỗi ngày trong khi người khác chỉ thử 2 mỗi ngày thì bạn sẽ làm tốt hơn nhiều so với số đông.

Làm thế nào để đạt được điều này?

Trước tiên, hãy bỏ qua việc scraping dữ liệu và tiền xử lý. Nếu bạn không có script tự động hóa việc này thì bạn đã NGMI rồi. Đây là điều kiện cơ bản.

Tiếp theo, hãy lấy một thư viện load dữ liệu. Bạn không nên phải viết lại đoạn code glob.glob(folder_path) bla bla nữa. Bạn nên sử dụng:

load_data(
start_date=start_date,
end_date=end_date,
symbol=symbol,
v.v.
)

Tiếp đến là dữ liệu nghiên cứu. Dữ liệu nghiên cứu là gì?

Bạn có thể bắt đầu bằng cách có một universe. Bạn không nên tốn thời gian để tự định nghĩa universe (và lý tưởng là nó nên được chuẩn hóa sẵn). Vì vậy, bạn nên load vào một file gồm X mã có khối lượng giao dịch 30 ngày, vốn hóa thị trường hay thanh khoản 30 ngày cao nhất, hoặc bất cứ tiêu chí nào bạn chọn. Bạn hoàn toàn có thể thử nghiệm với điều này.

Từ đây chúng ta có thể xem xét lợi nhuận, nên có lợi nhuận factor, lợi nhuận idiosyncratic, lợi nhuận clipped, và tất nhiên cả lợi nhuận raw. TẤT CẢ ĐỀU ĐƯỢC TẠO SẴN!

Cuối cùng, chúng ta cần đảm bảo có thể test tất cả các alpha và code để làm điều này phải cực kỳ nhanh. Bạn có thể nghĩ chỉ mất X phút, nhưng bất cứ thứ gì hơn vài phút đều là một lần chuyển ngữ cảnh lớn và ảnh hưởng trực tiếp đến năng suất.

Chúng ta đã nói về tốc độ lặp lại, giờ đến khả năng tiếp cận.

Khả năng tiếp cận là mức độ dễ dàng để thực hiện một phân tích nhất định. Nó là yếu tố chất lượng trong bài toán tối ưu chất lượng so với số lượng. Giả sử tôi muốn làm phân tích tính mùa vụ nhưng quyết định bỏ qua để làm alpha khác, đó là thiếu khả năng tiếp cận. Hoặc tôi quyết định không làm phân tích tương quan + residualization vì muốn test alpha khác, đó cũng là thiếu khả năng tiếp cận.

Công cụ của bạn nên cho phép bạn thực hiện các loại phân tích phổ biến này một cách nhanh chóng. Điều này áp dụng cho tối ưu hóa, markouts, TCA, TWAP tối ưu, v.v. Tất cả những điều này lý tưởng nên yêu cầu rất ít công sức từ bạn vì càng tốn công thì BẠN CÀNG ÍT CHẠY NÓ và chất lượng nghiên cứu sẽ giảm đi.

Tóm lại, bạn nên tập trung vào việc làm cho phân tích cốt lõi nhanh hơn và các phân tích bổ sung giúp cải thiện chất lượng nghiên cứu cũng nhanh hơn đáng kể. Bằng cách tối ưu cả hai, bạn đảm bảo sản xuất các nghiên cứu chất lượng cực cao nhanh hơn rất nhiều so với người khác.

Đây là lợi thế của bạn. Nếu bạn làm được gấp 5 lần người khác trong cùng thời gian, bạn có thể tạo ra PnL vượt trội.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hotXem thêm
  • Vốn hóa:$3.89KNgười nắm giữ:3
    1.81%
  • Vốn hóa:$3.61KNgười nắm giữ:2
    0.06%
  • Vốn hóa:$3.66KNgười nắm giữ:2
    0.33%
  • Vốn hóa:$3.55KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$3.74KNgười nắm giữ:3
    0.17%
  • Ghim