Высокочастотные данные - High frequency data

Высокочастотные данные относится к данные временного ряда собраны в очень мелком масштабе. В результате передовых вычислительных мощностей в последние десятилетия высокочастотные данные могут быть собраны с высокой точностью для анализа.[1] Широко используется в финансовом анализе и высокочастотная торговля, высокочастотные данные обеспечивают внутридневной наблюдения, которые можно использовать для понимания поведения, динамики и микроструктур рынка.[2]

Сборы высокочастотных данных изначально были сформированы путем группирования рыночных данных по тикам, при которых каждое отдельное «событие» (транзакция, котировка, движение цены и т. Д.) Характеризуется «тиком» или одной логической единицей информации. Из-за большого количества тиков за один день высокочастотные сборы данных обычно содержат большой объем данных, что обеспечивает высокую статистическую точность.[3] Высокочастотные наблюдения в течение одного дня на ликвидном рынке могут равняться количеству ежедневных данных, собранных за 30 лет.[3]

Использовать

Данные, собираемые с высокой частотой, информируют и обновляют статистику запасов в режиме реального времени

За счет внедрения электронных форм торгов и Интернет На основе поставщиков данных высокочастотные данные стали намного доступнее и позволяют отслеживать ценообразование в режиме реального времени. Это привело к появлению большой новой области исследований в области высокочастотных данных, где ученые и исследователи используют характеристики высокочастотных данных для разработки адекватных моделей для прогнозирования будущих движений и рисков рынка.[3] Прогнозы модели охватывают широкий спектр рыночного поведения, включая объем, непостоянство, движение цены и оптимизация размещения.[4]

Как регулирующие органы, так и научные круги проявляют постоянный интерес к данным о транзакциях и книга лимитных заказов данные, из которых более значимые последствия торговли и поведения рынка, а также рыночные результаты и динамика могут быть оценены с использованием высокочастотных моделей данных. Регулирующие органы проявляют большой интерес к этим моделям из-за того, что риски ликвидности и цен не полностью осознаются с точки зрения новых форм приложений для автоматической торговли.[4]

Ценность высокочастотных исследований данных заключается в их способности отслеживать нерегулярную рыночную деятельность в течение определенного периода времени. Эта информация позволяет лучше понять цену, торговую активность и поведение. Из-за важности сроков рыночных событий, высокочастотные данные требуют анализа с использованием точечные процессы, которые зависят от наблюдений и истории, чтобы характеризовать случайные события.[4] Это понимание впервые разработал лауреат Нобелевской премии по экономике 2003 г. Роберт Фрай Энгл III, который специализируется на разработке финансовая эконометрика методы анализа с использованием финансовых данных и точечных процессов.[4]

Формы данных с высокой частотой

Данные с высокой частотой в основном используются в финансовых исследованиях и фондовый рынок анализ. Всякий раз, когда обрабатывается сделка, котировка или электронный заказ, соответствующие данные собираются и вводятся в Временные ряды формат. Таким образом, высокочастотные данные часто называют данными транзакции.[4]

Существует пять широких уровней высокочастотных данных, которые собираются и используются при исследовании и анализе рынка:

Торговые данные

Индивидуальные торговые данные, собранные с определенным интервалом во временном ряду.[4] Есть две основные переменные для описания одной точки торговых данных: время транзакции и вектор, известный как «метка», который характеризует детали события транзакции.[5]

Данные о сделках и котировках

Собранные данные содержат подробную информацию как о сделках, так и о котировках, включая изменения и направление цен, отметки времени и объем. Такую информацию можно найти в TAQ (Торговля и котировка ) база данных, управляемая NYSE.[4] Если в торговых данных подробно описан обмен самой транзакции, в данных котировок указаны оптимальные торговые условия для данной биржи. Эта информация может указывать на остановки бирж, а также котировки открытия и закрытия.[6]

Данные книги заказов с фиксированным уровнем

Используя полностью компьютеризированные системы, глубину рынка можно оценить с помощью лимитный ордер деятельность, которая происходит на заднем плане данного рынка.[4]

Сообщения обо всех действиях по лимитным ордерам

Этот уровень данных отображает полную информацию о лимитный ордер деятельности, и может создать воспроизведение торговый поток в любой момент времени с использованием информации о отметках времени, отменах и идентификации покупателя / продавца.[4]

Данные о снимках книги заказов

Снимки деятельности книги заказов могут быть записаны на равноудаленный на основе сеток, чтобы ограничить необходимость воспроизведения книги заказов. Однако это ограничивает возможности торгового анализа и поэтому более полезно для понимания динамики, чем взаимодействия книги и торговли.[4]

Недвижимость в финансовом анализе

В финансовом анализе часто встречающиеся данные могут быть организованы в различных временных масштабах от минут до лет.[3] Поскольку высокочастотные данные поступают в значительной степени в дезагрегированной форме по временным рядам по сравнению с более низкочастотными методами сбора данных, они содержат различные уникальные характеристики, которые изменяют способ понимания и анализа данных. Роберт Фрай Энгл III классифицирует эти отличительные характеристики как нерегулярные временные интервалы, дискретность, суточные закономерности и временную зависимость.[7]

Высокочастотные данные, отображаемые во времени на графике индекса FTSE 100

Нерегулярный временной интервал

Высокочастотные данные используют сбор большой суммы данных по временному ряду, и поэтому частота сбора отдельных данных имеет тенденцию к неравномерному распределению во времени. Это особенно очевидно при анализе финансового рынка, где транзакции могут происходить последовательно или после длительного периода бездействия.[7]

Дискретность

Высокочастотные данные в значительной степени включают цены и транзакции, институциональные правила которых не допускают резкого роста или падения в течение короткого периода времени. Это приводит к изменению данных на основе измерения одного тика.[7] Эта уменьшенная способность к колебаниям делает данные более дискретными при их использовании, например, на фондовой бирже, где популярные акции, как правило, остаются в пределах 5 тиков движения. Из-за уровня дискретности высокочастотных данных, как правило, высокий уровень эксцесс присутствует в комплекте.[7]

Суточные модели

Анализ, впервые проведенный Энглом и Расселом в 1998 году, показывает, что высокочастотные данные соответствуют суточный режим с наименьшей продолжительностью между сделками при открытии и закрытии рынка. Некоторые зарубежные рынки, которые работают 24 часа в сутки, по-прежнему демонстрируют суточный график в зависимости от времени суток.[7]

Временная зависимость

Во многом из-за дискретности цен высокочастотные данные зависят от времени. Спред, вызванный небольшими тиковыми различиями в ценах покупки и продажи, создает тренд, который толкает цену в определенном направлении. Точно так же продолжительность и скорость транзакций между сделками имеют тенденцию к кластеризации, что означает зависимость от временных изменений цены.[7]

Данные сверхвысокой частоты

В наблюдении, отмеченном Роберт Фрай Энгл III, доступность более частых данных с течением времени вызвала переход от лет к месяцам, к внутридневной сборники финансовых данных. Это движение, однако, не бесконечно при переходе к более высоким частотам, но сталкивается с пределом, когда все транзакции в конечном итоге записываются.[5] Engle придумал этот уровень предельной частоты как данные сверхвысокой частоты. Выдающееся качество этой максимальной частоты - чрезвычайно неравномерно распределенные данные из-за большого разброса времени, который накладывает неагрегированный сбор.[5] Вместо того, чтобы разбивать последовательность данных сверхвысокой частоты на временные интервалы, что, по сути, привело бы к потере данных и сделало бы набор более низкочастотным, методы и модели, такие как модель условной продолжительности авторегрессии можно использовать для учета различного времени ожидания между сбором данных.[5] Эффективная обработка данных сверхвысокой частоты может быть использована для повышения точности эконометрического анализа. Этого можно достичь с помощью двух процессов: очистки данных и управления данными.[6]

Очистка данных

Очистка данных, или же очистка данных, представляет собой процесс использования алгоритмических функций для удаления ненужных, нерелевантных и неверных данных из высокочастотных наборов данных.[6] Для сверхвысокочастотного анализа данных требуется чистая выборка записей, которая будет полезна для изучения. По мере увеличения скорости сбора сверхвысоких частот в сборе, вероятно, будет обнаружено больше ошибок и нерелевантных данных.[6] Возникающие ошибки можно отнести к человеческая ошибка, как преднамеренные (например, "пустые" кавычки), так и непреднамеренные (например, опечатка ) или компьютерная ошибка, возникающая при технических сбоях.[8]

Управление данными

Управление данными относится к процессу выбора конкретного интересующего временного ряда в наборе сверхвысокочастотных данных, которые необходимо извлечь и организовать с целью анализа. О различных транзакциях можно сообщать в одно и то же время и на разных уровнях цен, а эконометрические модели обычно требуют одного наблюдения для каждой временной отметки, что требует некоторой формы агрегирования данных для надлежащего анализа.[6] Усилия по управлению данными могут быть эффективными для исправления характеристик сверхвысокочастотных данных, включая нерегулярный интервал, отскок спроса и предложения, а также открытие и закрытие рынка.[6]

Альтернативное использование вне финансовой торговли

Исследование, опубликованное в Пресноводная биология журнал, посвященный эпизодическим погодным воздействиям на озера, подчеркивает использование высокочастотных данных для дальнейшего понимания метеорологический драйверы и последствия «событий» или внезапных изменений физических, химических и биологических параметров озера.[9] Благодаря достижениям в технологии сбора данных и человеческим сетям, а также размещению станций высокочастотного мониторинга на озерах различных типов, эти события можно исследовать более эффективно. Отмечено, что использование высокочастотных данных в этих исследованиях является важным фактором, позволяющим анализировать быстро происходящие погодные изменения в озерах, такие как скорость ветра и осадки, улучшая понимание способности озера справляться с событиями после усиления шторма и изменение климата.[9]

Было обнаружено, что данные с высокой периодичностью полезны для прогнозирования инфляции. Исследование Микеле Мондуньо в Международный журнал прогнозирования указывает на то, что использование ежедневных и ежемесячных данных с высокой частотой в целом повысило точность прогноза общего ИПЦ инфляция в США.[10] В исследовании использовалось сравнение низкочастотных моделей с моделью, которая учитывала все переменные с высокой частотой. В конечном итоге было обнаружено, что повышенная точность высоконестабильных транспортных и энергетических компонентов цен в модели высокочастотной инфляции приводит к повышению производительности и более точным результатам.[10]

Использование период полураспада оценка для оценки скорости значит возвращение в экономических и финансовых переменных столкнулся с проблемами в отношении отбора проб, так как период полураспада около 13,53 года потребует 147 лет годовых данных в соответствии с ранними Модели процессов AR.[11] В результате некоторые ученые использовали высокочастотные данные для оценки годовых данных о периоде полураспада. Хотя использование высокочастотных данных может столкнуться с некоторыми ограничениями в обнаружении истинного периода полураспада, в основном из-за смещение оценщика, используя высокую частоту Модель ARMA Было обнаружено, что для последовательной и эффективной оценки периода полураспада с помощью длинных годовых данных.[11]

Смотрите также

Рекомендации

  1. ^ Рюи С. Цай (2000) Введение редактора в панельную дискуссию по анализу высокочастотных данных, Журнал деловой и экономической статистики, 18:2, 139-139, Дои:10.1080/07350015.2000.10524855
  2. ^ Андерсен, Т. Г. (2000). Некоторые размышления об анализе высокочастотных данных. Журнал деловой и экономической статистики, 18(2), 146-153. Дои:10.1080/07350015.2000.10524857
  3. ^ а б c d Дакорогна, М. М. (2001). Введение в высокочастотные финансы. Сан-Диего: Academic Press.
  4. ^ а б c d е ж грамм час я j Hautsch, N., & SpringerLink (Интернет-служба). (2012; 2011;). Эконометрика финансовых высокочастотных данных (2012-е изд.). Гейдельберг; Берлин ;: Springer. Дои:10.1007/978-3-642-21925-2
  5. ^ а б c d Энгл, Р. Ф. (2000). Эконометрика сверхвысокочастотных данных. Econometrica, 68(1), 1-22. Дои:10.1111/1468-0262.00091
  6. ^ а б c d е ж Браунлис, К. Т. и Галло, Г. М. (2006). Финансовый эконометрический анализ на сверхвысокой частоте: проблемы обработки данных. Вычислительная статистика и анализ данных, 51 (4), 2232-2245. Дои:10.1016 / j.csda.2006.09.030
  7. ^ а б c d е ж Р. Рассел, Джеффри и Ф. Энгл, Роберт. (2010). Анализ высокочастотных данных. Справочник по финансовой эконометрике, Том 1. 383-426. 10.1016 / B978-0-444-50897-3.50010-9.
  8. ^ Verousis, T., & Ap Gwilym, O. (2010). Улучшенный алгоритм очистки сверхвысокочастотных данных. Журнал производных финансовых инструментов и хедж-фондов, 15(4), 323-340. Дои:10.1057 / jdhf.2009.16
  9. ^ а б JENNINGS, E., JONES, S., ARVOLA, L., STAEHR, P. A., GAISER, E., JONES, I. D., Teknisk-naturvetenskapliga vetenskapsområdet. (2012). Последствия связанных с погодой эпизодических явлений в озерах: анализ, основанный на данных высокой частоты. Пресноводная биология, 57(3), 589-601. Дои:10.1111 / j.1365-2427.2011.02729.x
  10. ^ а б Модуньо, М. (2013). Теперь раздача инфляции с использованием высокочастотных данных. Международный журнал прогнозирования, 29(4), 664-675. Дои:10.1016 / j.ijforecast.2012.12.003
  11. ^ а б Хуан М., Ляо С. и Линь К. (2015). Расширенная оценка периода полураспада на основе данных High-Frequency. Журнал прогнозирования, 34(7), 523-532. Дои:10.1002 / за 2342