예전에 과거 나스닥 100 편입 종목들 가지고
급락했을 때 기계적으로 줍는 전략 백테스팅 해본 적이 있는데
돌리다 보니까 승률이 비정상적으로 높게 나와서 뭔가 이상하더라고.
알고 보니 야후 파이낸스 같은 데서 무료로 긁어온 데이터에는
상장폐지되거나 인수합병돼서 사라진 종목들 데이터가 아예 빠져 있었음.
살아남은 우량한 애들 위주로만 필터링이 된 상태로 백테스트가 돌아갔으니
결과가 안 좋을 수가 없었던 거지.
생존 편향 오류 이거 머리로는 알아도
막상 개인 데이터 가공할 때 제대로 필터링 안 해두면 진짜 쉽게 낚이는 듯.