On the way to 10x engineering
603 subscribers
5 photos
1 file
29 links
Download Telegram
10x Engineer.

Один работник зашел к барину и говорит:
— Барин! Почему ты мне платишь всего пять копеек, а Ивану всегда пять рублей?
Барин смотрит в окно и говорит:
— Вижу я, кто-то едет. Вроде бы сено мимо нас везут. Выйди-ка, посмотри.
Вышел работник. Зашел снова и говорит:
— Правда, барин. Вроде сено.
— А не знаешь откуда? Может, с Семеновских лугов?
— Не знаю.
— Сходи и узнай.
Пошел работник. Снова входит.
— Барин! Точно, с Семеновских.
— А не знаешь, сено первого или второго укоса?
— Не знаю.
— Так сходи, узнай!
Вышел работник. Возвращается снова.
— Барин! Первого укоса!
— А не знаешь, по чем?
— Не знаю.
— Так сходи, узнай.
Сходил. Вернулся и говорит:
— Барин! По пять рублей.
— А дешевле не отдают?
— Не знаю.
В этот момент входит Иван и говорит:
— Барин! Мимо везли сено с Семеновских лугов первого укоса. Просили по 5 рублей. Сторговались по 3 рубля за воз. Я их загнал во двор, и они там разгружают.
Барин обращается к первому работнику и говорит:
— Теперь ты понял, почему тебе платят 5 копеек, а Ивану 5 рублей?
👍84
Попробую делиться мыслями про инженерное совершенство, которые показались мне ценными. Надеюсь, это будет полезно и вам.

@engineer10x
🔥1
On the way to 10x engineering pinned «Попробую делиться мыслями про инженерное совершенство, которые показались мне ценными. Надеюсь, это будет полезно и вам. @engineer10x»
В торговле большое значение имеет не только (и возможно даже не столько) то, что знает человек, но и то как он работает. В отличие от других отраслей, в торговле за счёт высокой прибыли-на-человека то, как ты работаешь, может иметь большое и видимое влияние на общую прибыль и через это на твои собственные доходы.

Хороший инженер в торговле - это самодостаточная боевая единица, способная искать себе задачи, гарантированно двигать их вперёд и выкатывать, причём вчера, фанатично отрезая лишнее. Каждый шаг вперёд - это minimal viable product, потихоньку увеличивающий pnl. Это человек-оркестр, сам себе product, project manager (и куча других ролей), что облегчается тем, что заказчики (трейдеры) сидят, как правило, в соседнем ряду.

Человек, способный, например, собрать и представить требования, зависимости новой системы и очерёдность их выкатывания в прозрачном для трейдеров, поддержки и других программистов виде и обеспечить отсутствие трения при раскатке одной зависимости за другой.

Выкатить что-то сегодня даже с 70%ным качеством ценится больше, чем идеально вылизанное через неделю, потому что из-за альфа распада прибыльности стратегий и конкуренции через неделю может уже и не понадобиться. Поэтому это человек, готовый рисковать и действовать решительно, выбирая, что именно пойдёт в 30% отрезанного сегодня. Иногда оказывается, что выбрать то, над чем не работать, важнее чем то, над чем работать.

Человек, не гнушающийся разобраться в ошибках и логах старой системы, которую он видит впервые, и обеспечить выкаченный в production фикс к следующему утру.

Человек, выкативший в таком режиме несколько средне-крупных проектов может рассчитывать на 200-300k aud + singup в Сиднее или £600-800k first year guaranteed в Лондоне в торговых фирмах первого эшелона. (Цифры могут немного меняться в зависимости от общей успешности торговли в данном конкретном году).

@engineer10x
👍11🔥41
Вкратце об устройстве Quantitative Trading Company для тех, кто не очень знаком с индустрией, от Headlands Tech. Хорошо описывает основные роли сотрудников и задачи, которые они решают.

@engineer10x
👍4
Richard Geldreich работал в играх (как там принято - на износ), а через какое-то время создал свою маленькую компанию (Binomial) и через неё стал лицензировать разным игроконторам свою собственную библиотеку для работы с текстурами.

Одно время он много писал в твиттере про то, как сильно наёмным программистам недоплачивают (даже если это скажем us$600k) и как целью каждого наёмного программиста, стремящегося к финансовой независимости, должно быть создание своей Intellectual Property и её продажа сдача в аренду.

Основная мысль - при работе за зарплату ты продаёшь своё время, при этом зависимость между временем и доходом как правило линейная. Лицензирование своей IP даёт возможность сделать эту зависимость нелинейной.

https://twitter.com/richgel999/status/1551502605356072960

@engineer10x
👍10
Stefan Schlamp очень интересно пишет про разные статистические закономерности и наблюдения в торговле на основе очень подробных данных с Eurex.

Пока что это единственный блог с Линкедина, показавшийся мне полезным, т.к. в основном я там вижу восторженное мотивационное графоманство. Знаете ли вы какие-то полезные блоги на Линкедине?

https://www.linkedin.com/in/stefanschlamp

@engineer10x
👍6
Думать о решении задач бизнеса вместо почасовой продажи своего времени - первый шаг в развитии своей консалтинговой фирмы.

Patrick McKenzie рассказывает, как однажды его знакомый ошарашил его признанием того, что ценность содержания их разговора значительно превосходит почасовую плату:

At the end of the conversation, Thomas said something which, no exaggeration, changed my life.

Thomas: Some food for thought: If this hadn't been a coffee date, but rather a consulting engagement, I'd be writing you a check right now.

Me: Three hours at $100 an hour or whatever an intermediate programmer is worth would only be $300. Why worry about that?

Thomas: I got at least $15,000 of value out of this conversation.

Статья достаточно графоманская, но в ней много полезной информации по этой теме (а также ссылок на другие полезные статьи).

@engineer10x
👍3
Данные с Eurex показывают как с 2021 года доля участников Eurex с tick-to-trade latency < 20 нс выросла с 0 до >50% (и в 2023 году почти все HFT работают с такой задержкой).

Казалось бы - 20 нс - это меньше минимального теоретического предела реакции: события с рынка приходят через UDP multicast, чтобы прочесть одни только заголовки нужно больше времени: заголовок Ethernet 14 байтов, IP - 20 байтов, UDP - 8 байтов. Чтобы прочитать их через 10 ГГц Ethernet (10 бит в наносекунду) нужно минимум 33.6 нс (42 байта х 8 бит/байт / 10 бит/нс) и это мы ещё не дошли до полезной нагрузки в UDP пакете, чтобы понять хотим ли мы вообще отправлять ордер.

Как же они это делают?

@engineer10x
🔥81👍1😁1
Speculative Triggering

Конечно постоянно и гарантированно отвечать за 50 нс или меньше через память и процессор невозможно, можно только через сетевушку с FPGA, которая сразу закольцевывает сигнал из Rx в Tx порты. FPGA - это матрица логических элементов и связей между ними, которую можно перепрошивать. На каждом такте вся матрица может параллельно продвигать сигнал на следующий этап, визуально отличие от CPU выглядит так. Поэтому при тактовой частоте 10 ГГц такая сетевушка может начинать выплёвывать первый бит Ethernet кадра в Tx канал уже через доли наносекунды после поступления первого бита на Rx.

Ещё в/до 2020 года некоторые умельцы научились реагировать на рыночные события за < 50 нс. Делали они это примерно так.

Рис 1. FPGA решает что приходящий с рынка пакет может быть потенциально интересным, посмотрев на начало UDP payload или даже немного раньше. Если да - то начинает отправлять заголовки для TCP-пакета с будущими ордерами, параллельно продолжая читать. Если payload оказывается неинтересным на самом деле, то уже отправляемый пакет отправляется в помойку. Его нельзя просто перестать слать, а надо как-то закончить. Для этого можно например записать какой-нибудь закрытый порт в поле dst TCP port, а когда биржа его получит, то отбросит, послав RST. К моменту записи порта можно прочитать достаточно много из payload, чтобы понять действительно ли он интересен.

Такие мусорные пакеты приходили на биржу очень часто, что создавало ощутимую лишнюю нагрузку на биржу и ей это достаточно быстро поднадоело. Руководствуясь принципом "не можешь остановить процесс - нужно его возглавить", в феврале 2020 Eurex выпустила циркуляр 010/20, который, с одной стороны, ввёл ограничения на это безобразие, а с другой - дал техническую возможность продолжать это делать так, чтобы биржа не ломалась. (После этих изменений мусорного трафика - больше 70%, и его доля постоянно растёт).

Что поменялось: во-первых, в поле DSCP (2 байт) IP заголовка добавлялись нестандартные флаги, показывающие насколько интересные данные будут в пакете. (Так как эти пакеты не уходили бы во внешний интернет, нестандартность флагов не приводила к проблемам). Во-вторых, вводились discard IP-адреса, всё отправленное на которые отбрасывалось первым же биржевым маршрутизатором. Также вводились ограничения на размер "брандспойта", которым участник рынка мог заливать биржу трафиком, и дополнительные комиссии "за злоупотребления".

Рис. 2. Теперь стало можно начинать писать исходящий пакет прочитав 16-й байт входящего, т.е. в пределах 20 наносекунд, а к моменту заполнения dst IP-адреса можно было даже немного посмотреть в конкретные цены из payload и отправить пакет в помойку, если они оказывались неинтересными. Или начать писать чуть-чуть позже чтобы посмотреть в payload подольше. Или извращаться как-то ещё.

Ссылки.

1. HFT Market Data Share - статья , из которой картинка в предыдущем посте.

2. Описание Speculative Triggering (и других интересных вещей про динамику рынка) от самой Eurex.

3. Как работает FPGA.

@engineer10x
🔥13👍41🙏1
Я в телеге относительно недавно, а ретвитов тут особо нет, поэтому вопрос.

Какой для вас самый ценный и любимый (ну после Валеры, конечно ;) ) канал (или два) по программированию/IT в телеге, чтобы прямо 100% must read?

Хотелось бы набрать хороших и подписаться.
Интересный минималистичный пример торговой стратегии с backtest на исторических данных. Контора продаёт доступ к ним и статья (да и весь блог) рекламирует простоту их использования.

Стратегия набирает позицию до определённого предела если в книжке перекос выше определённого порога. Реальные стратегии принимают решение покупать или продавать на основе множества факторов, тут для наглядности выбран очень простой - book skew.

Другое допущение - это отсутствие задержки между отправкой и исполнением заявки. В реальности за это время рынок часто уходит в другую сторону и стратегия "промахивается"; для backtest с хорошей предсказательной силой это надо как-то моделировать.

Стратегия получается даже прибыльной, но только до учёта комиссий.

@engineer10x
👍41
Знакомство с FPGA для программиста

В торговлю заходил через острозаточенный С++, да и изначальный профиль - программирование, поэтому о железе познания были в основном теоретические. Но вот я здесь и, оказывается, самые скоростные части execution работают на FPGA, поэтому обязательно надо посмотреть что это за зверь. Сказано - сделано, учебная плата DE10-Lite куплена за $100 (сейчас стоит ~$150) и вот я уже продираюсь сквозь дебри Verilog. Железячники: прошу дальше не смеяться :).

Оказалось очень интересно, но в то же время совершенно другой мир и большие трудозатраты, ведь там с нуля нужно писать вообще всё (ну если библиотеки не покупать). То есть если хочешь например что-то вывести на экран через VGA, то нужно покурить стандарт VGA и написать свои модули для правильной генерации сигнала с точно подобранной вертикальной и горизонтальной частотой (подробнее например здесь). За что-то чуть более сложное, чем VGA, лучше вообще не браться, поэтому до чтения Ethernet пакетов дойти (пока?) не удалось :).

Открытий много. Это что же получается, в этом мире нельзя просто обратиться к памяти и взять значение, а нужно самостоятельно писать целый контроллер памяти?? Начинаешь его писать и сразу понимаешь почему L1 cache - это SRAM, а обычная память - DRAM. Вкратце, ячейка SRAM - это 6 транзисторов, а DRAM - транзистор и конденсатор. SRAM значительно быстрее, но больше размером и дороже из-за количества транзисторов. DRAM - меньше и дешевле, но тормознее, а ещё из-а того, что конденсатор "течёт", её надо регулярно перезаряжать. Вот реально - сидишь ты, значит, в контроллере памяти, схватился за сигнал от генератора тактовой частоты и раз в N периодов вешаешь на дверь табличку "обед", читаешь каждую ячейку памяти и тут же записываешь её обратно.

Если раньше технические подробности про память из WEPSKAM были чем-то абстрактным, то после работы со своим проектом для FPGA (и особенно после отладки) спинным мозгом начинаешь чувствовать как оно всё работает. Периодически вспоминалось изучение ассемблера для 8086 и становилось понятным почему в этом процессоре что-то было сделано именно так, а не иначе.

Часто учить FPGA начинают с реализации RISC-V процессора. Его преимущество в том, что спецификация открытая, инструкции простые и их немного, можно реализовывать подмножества стандарта, поэтому можно делать MVP на каждой итерации - всё как мы любим. Потом пишешь программу на С++, собираешь её gcc под получившийся процессор и voilà - она работает на твоём собственном процессоре, фантастика! Был бы студентом с бесконечным временем - обязательно бы занялся сейчас.

В общем опыт весьма положительный. Для низкоуровневых программистов - рекомендую, мне показалось очень полезным.

@engineer10x

P.S.

DE-Lite, кстати, хоть карточка дешёвая и учебная, но весьма функциональная ("the board utilizes the maximum capacity MAX 10 FPGA, which has around 50K logic elements(LEs) and on-die analog-to-digital converter (ADC). It features on-board USB-Blaster, SDRAM, accelerometer, VGA output, 2x20 GPIO expansion connector, and an Arduino UNO R3 expansion connector in a compact size"). Правда проекта для применения в домашнем хозяйстве ей придумать пока так не удалось, поэтому ограничился игрушечными проектами.
👍94🔥3
Hard skills in HFT (for software execution devs)

- С++ - потому что большинство HFT фирм используют для low latency именно его;
- template metaprogramming - в HFT используется значительно чаще чем вне, потому что из-за желания срезать каждую возможную микросекунду многое (иногда даже слишком) пишется на шаблонах;
- как работает какая нибудь конкретная биржа, какие у неё feed & transaction протоколы - спецификации обычно опубликованы на сайте биржи;
- как подписаться на market feed через multicast udp (и что делать если начнёшь терять пакеты);
- как быстро читать multicast udp с сетевой карточки через user space networking и построить вокруг этого mainloop (см. Solarflare/EfVi) и понимать почему kernel space networking не подойдёт;
- как быстро собирать order book из market feed;
- как максимально упаковать часто используемые данные в L1 cache, а редкоиспользуемые отложить в сторонку;
- как работает процессор и память (см. WEPSKAM и учебный FPGA);
- как спроектировать торговое приложение, какие в нём должны быть компоненты;
- как написать надёжные автотесты;
- как сделать бизнес-логику по-максимуму независимой от специфики конкретной биржи;
- как присоединить приложение к биржевым сессиям и ввести ограничение на транзакции в секунду;
- как добавить ограничение рисков и гарантировать, что они сработают.

@engineer10x
👍121🔥1
out_of_line.hpp
1.2 KB
Пример разделения горячих и холодных данных в одной структуре

Patrick Moran из Headlands Tech придумал OutOfLine – A Memory-Locality Pattern for High Performance C++.

Если структура состоит из двух частей - горячей (часто используется в runtime) и холодной (нужна только в начале и конце существования объекта), то можно достаточно небольшим шаблоном разнести их по разным участкам памяти. Вместо того, чтобы держать горячую и холодную части рядом в одной структуре, в ней можно оставить только горячую, а холодную отложить в сторонку, создав косвенную связь через статический key-value контейнер, где ключом будет указатель на горячую часть. Если из таких структур сделать вектор, то только горячие части будут уложены в памяти друг за другом и попадут в кеш.

@engineer10x
🔥9
Функциональные языки в торговле

В чистых функциональных языках функции не имеют побочных эффектов и результат вызова функции зависит только от её аргументов. Однако взаимодействие с внешним миром (например ввод-вывод) не может быть чистым, потому что изменяет его. К примеру, Haskell синтаксически отделяет "нечистый" код от чистого через систему типов: если функция f() зовёт функцию g() помеченную как IO, то функция f() тоже должна быть помечена как IO. Поэтому если в программе есть хоть один вызов putStrLn, то эта "зараза" распространяется вверх до самой main(). Однако чистые функции можно звать изнутри функций с IO, поэтому их можно сгруппировать в отдельный граф.

Если код - чистый, то порядок вычисления аргументов функции становится неважен, в отличие от скажем С++, где это часть стандарта (причём менявшаяся последние годы и не раз). Раз порядок вычисления аргументов неважен и они полностью независимы, то вычислять их можно параллельно. Это начинает напоминать внутренний параллелизм FPGA, который мы уже обсуждали выше. Действительно, получается что чистая часть функционального языка типа Haskell теоретически изоморфна языку проектирования FPGA типа System Verilog.

Оказывается этот изоморфизм реализован и на практике - см. Clash - Haskell-подобный язык для проектирования железа, который компилируется в традиционные VHDL/Verilog/System Verilog. По отзывам, проектировать железо на нём значительно быстрее, чем на традиционных, а тестировать бизнес-логику вообще одно удовольствие - тесты, написанные на языке высокого уровня, отрабатывают на CPU и не нужно городить массивную инфраструктуру вокруг симуляторов Verilog или живых железок. Это становится конкурентным преимуществом и в торговле (см. пример в комментариях).

Jane Street широко известна как единственная в своём роде фирма, использующая OCaml (почему). Им до того нравилось его использовать для написания софта, что когда возникла необходимость начать делать железо, они наняли Andrew Ray, который до этого начал придумывать Hardcaml, и предложили ему делать то же самое, что и раньше, только работая на них.

Встречались ли вы с чем-то подобным в своей карьере?

@engineer10x
🔥12🥰2🤩1
Про эффективность

На работе нужно сделать что-то скучное и неприятное, а хочется "уйти в себя на пару дней", реализовать какой-нибудь красивый алгоритм, отпрофилировать и порефакторить какой-то кусочек, ускорить его через SIMD раз в 10 или ещё как-то закопаться вглубь и решить красивую инженерную задачку. Знакомая ситуация?

Довольно часто инженеров затягивают нравящиеся и интересные занятия, которые на поверку не так уж и важны для их бизнеса. В торговле мне нравится постоянная перефокусировка на то, что действительно надо, потому что конкуренты не дремлют и сами постоянно перефокусировываются. Самые успешные инженерные команды находят и выполняют только необходимый минимум работы и только в области максимальной экспертизы и конкурентного преимущества.

На уровне исполнителя это выглядит так: если пишешь какой-то участок системы, то регулярно останавливаешься, чтобы спросить себя и коллег самая ли это приоритетная деятельность сейчас и не слишком ли долго её делать - может быть овчинка не стоит выделки? Перед тем, как начать что-то писать, обсуждаешь с коллегами выбранный подход, чтобы найти почему нужно сосредоточиться не на этом, а на чём-то более ценном. При этом, поработав в такой фирме, начинаешь и своё личное время ценить и использовать всё более эффективно.

Если постоянно применять этот подход на всех уровнях, то компания будет направлять усилия инженеров только туда, где находятся её основные источники доходов и конкурентное преимущество. При доведении этого до предела большинство неактуальных вещей (например система сборки и раскатки с использованием AWS) будет делегироваться внешним специалистам за фиксированную плату, чтобы освободить (очень дорогое!) время инженеров на самую ценную для компании деятельность.

@engineer10x
👍5🔥41🤯1💯1
Сложности фокусировки

Надо отметить, что фокусироваться сложно и получается не у всех, даже в торговле, где хвалёная эффективность, казалось бы, должна зашкаливать.

Встречались команды, у которых template metaprogramming превратился в самоцель и активно мешал достижению бизнес-задач, потому что был доведён до абсурда. Казалось, что технические предводители хвастались друг перед другом насколько сильнее можно поиздеваться на С++ и были похожи на того пилота, последними словами которого были "смотри как я умею!"

Или другая команда, спроектировавшая систему на основе CRTP так, что каждый биржевой инструмент был отдельным шаблонным параметром. В итоге в одном бинаре можно было использовать только небольшое число инструментов, потому что при его превышении gcc падал.

Или такая, в которой внутренняя исторически сложившаяся система сборки оказывалась запредельным налогом на время инженеров. При этом эксперты отказывались слышать, что компания не является производителем билд-систем, а на рынке появились новые системы, решающие эту задачу гораздо эффективнее, и продолжали кушать кактус (и заставлять остальных кушать его вместе с ними).

В общем, сосредотачиваться на бизнес-целях и бороться с sunk-cost fallacy непросто, но очень важно.

Встречались ли вам подобные проблемы, из которых компаниям удалось выбраться? Что они для этого сделали?

@engineer10x
💯6🔥1🫡1