аномальная активность рынка
При исключении 5 дней с
наибольшими отклонениями наблюдается подобное растянутое распределение
изменений цен закрытия от 0 до 7 стандартизованных единиц. Значения, близкие к
отклонению, равному 8, отмечались три раза, а значения 10 — только два раза.
Рассмотрение данных торговых дней показывает, что в них имела место аномальная
активность рынка, а не ошибка. Неудивительно, что два из пяти помеченных дней
— те же самые, что выделялись при рассмотрении величины дневного диапазона цен.
В конце концов программа не обнаружила пропущенных дней, данных, приходящихся
на нерабочие дни, а также данных с повторными или перепутанными датами.
Единственные проблемные моменты
являются следствием аномалии рынка, а не ошибок. В общем набор данных по S
& P можно считать чрезвычайно чистым, что и не удивительно, зная о высокой
репутации поставщика — Pinnacle Data Corporation .
Как пример низкого качества
данных рассмотрим последовательность котировок компании Apple Computer ( AAPL
), полученных авторами от одного знакомого. Результаты проверки приведены в
табл. 1-2.
В отличие от предыдущей выборки,
здесь данные за два дня были помечены как имеющие необъяснимые логические
ошибки. В одном случае цена открытия равнялась нулю и была ниже минимальной
цены. В другом случае обнаружилась аномальная величина дневного диапазона цен
(что может быть как ошибкой, так и последствием аномальной торговли). В
нескольких случаях отмечалось сильное отклонение цены закрытия, возможно ввиду
нескорректированных дроблений акций. Повторяющихся или перепутанных дат не
обнаружено, но немало дней было пропущено. В данном случае пропущенные точки
соответствуют праздникам и, следовательно, просто указывают на разный подход к
работе с данными; мы обычно по ряду причин заполняем праздничные дни данными
предыдущего дня. При том что последовательность включает котировки только с
1/2/97 по 11/6/98 (котировки S & P 500 — с 1/3/83 по 5/21/98), обнаружение
ряда серьезных ошибок с помощью довольно простой процедуры не может не
настораживать.
Суть в том, что на этих примерах
показана важность приобретения качественных данных от поставщика, имеющего
хорошую репутацию и ведущего серьезную работу. Это сэкономит время, обеспечит
надежные, чистые данные для разработки и тестирования систем и для торговли в
дальнейшем. Более глубокий обзор проблем качества данных, в том числе и то,
как, собственно, создаются рыночные котировки, как их передают и хранят, можно
найти у Джурика ( Jurik , 1999).
Статья размещена в рубрике: Торговые системы
|