topdatalab – Telegram

topdatalab

1.27K subscribers

99 photos

10 videos

17 files

222 links

Канал поддержки книги «Как монетизировать данные». https://topdatalab.ru

Download Telegram

About

Blog

Apps

Platform

1.27K subscribers

Как вы помните, я начал летом заниматься алгоритмами высокочастотного трейдинга на криптобиржах.
Меня попросили рассказать детали - не могу, под NDA. 😢

Но я могу посоветовать пару книг по теме:
1) Developing High-Frequency Trading Systems (SebastienDonadio| SouravGhosh| RomainRossie) - я прочитал только начало, в программную часть не лез.
2) Trades, Quotes and Prices. Financial Markets Under the Microscope - мне посоветовал ее один очень хороший трейдер. Много математики, но автор старался все упрощать для понимания. Много ссылок на литературу. Сейчас ее читаю.

PS: до лета я был в этой теме полным нулем, сейчас хотя бы начал разговаривать на одном языке с коллегами

❤8👍3😱1🤓1

901 viewsRoman Zykov, 13:06

Про эффективность последних LLM в программировании.
Понадобилось мне сменить способ авторизации в Metabase (лучшая система BI отчетности). Вроде бы сделать легко - плати 500$ в месяц за 10 пользовательских лицензий и подключай свою авторизацию.
Но ведь это Open Source, денег платить я не хотел, и решил немного переписать Metabase, сменив доступную авторизацию через Google на свою.
Вроде задача не сильно сложная, но сам проект очень сложный (хотя написан красиво). Написан на двух языках программирования Clojure и TypeScript(React + Redux).
Оба я их знаю плохо :(.

Итак я обратился к LLM:
1) Claude Sonnet 3.5 - не справился с TypeScript. Вроде что-то получалось, но не работало. Хотя было вроде удобнее c точки зрения UI.
2) ChatGPT 4o - то же самое
3) ChatGPT o1-preview - очень порадовал. Было несколько моментов, но я смог отдебажить и разобраться в вопросах сам.

Сама задача заняла около 8 часов с учетом мучений с предыдущими LLM. Возможно, первые две LLM лучше бы справились, если бы я формулировал задачу лучше.
Но o1-preview смогла помочь с почти такими же формулировками.

🔥7

986 viewsRoman Zykov, edited 14:39

Думаю написать большой пост про ML research. Как к нему подходить, грабли, на которые я напоролся.
Пишите вопросы в комментариях, попробую на них ответить!

🔥10👍2

907 viewsRoman Zykov, 11:12

Вчера была конференция OpenAI, где они рассказывали про текущие и будущие изменения продукта.
https://simonwillison.net/2024/Oct/1/openai-devday-2024-live-blog/

Мне лично было очень интересно почитать, что OpenAI теперь поддерживает API реального времени для приложений.
Кроме текста поддерживаются форматы данных, к которым мы привыкли в ChatGPT: звук, изображения. Причем, она может отвечать звуком!
Они опубликовали Speech API, которое, например реализовано в приложении Speak для изучения языков. Поставлю себе обязательно.
Как раз вчера тестировал новый аудио движок в ChatGPT приложении. Это реально большое изменение, и оно ударит по всему.
От преподавателей языка на italki до операторов call центра.
Что еще?
1) Улучшение работы JSON для приложений. Очень важная вещь. Я с этим мучался 🙁
2) Рекомендуется пользоваться o1-mini для кодинга и математики, хотя по моему мнению o1 preview лучше в этом плане.
3) Показано, как можно обучить небольшие модели на основе датасета из больших моделей. Очень полезно для оптимизации расходов

Пока не дочитал до конца - но Сэм Альтман стали сливаться с темы AGI :). Но это нисколько не умаляет достижений OpenAI.

PS: Спасибо Федору Шабашеву, что он расшарил этот блог пост в LinkedIn

👍10🔥3

1.36K viewsRoman Zykov, 10:42

Мой товарищ в Лондоне, бывший разработчик Google делает свой проект a-la Goolge Streetview
для морских экологических проектов. Они обрабатывают видео с камер и строят такие интерактивные карты
https://3d.wildflow.ai/W32Em7

Выглядит очень интересно!

3D Viewer for Wildflow Coral

🔥8👍1

1.11K viewsRoman Zykov, edited 11:44

скриншот оттуда

🔥12

1.27K viewsRoman Zykov, 11:47

Простите, про жизнь и наследование в UK!
If a person gives away more than £325,000 in cash or gifts but dies within seven years, recipients could be liable to pay inheritance tax.

Если вы подарили что-то и умерли в течение семи лет, то принявшему подарок придется заплатить 40% примерно 🙁 (С порогом в 325 тыс.)
Пора делать прогнозные модели на ML, которые прогнозируют смерть в течение семи лет

🌚7🔥4👍3😁2😱1

1.17K viewsRoman Zykov, 09:47

This media is not supported in your browser

VIEW IN TELEGRAM

Claude выпустила computer use, теперь через чат можно управлять вашим компьютером!
Подробнее: https://www.anthropic.com/news/3-5-models-and-computer-use

🤯4👏3

1.1K viewsRoman Zykov, 10:30

Нашел интересный проект по использованию LLM локально на своем ноуте.
Качать тут: https://nexa.ai/download-sdk
Потом просто запустить на своем ноутбуке в терминале команду “nexa run llama3.2”
Скорость ответа очень приличная! Буду использовать на своих локальных проектах
Мой диалог в скриншоте.
Вообще она много что умеет, speech-to-text, text-to-img и все делает на вашей локальной машине

Update: в комментариях подсказали ollama и LM studio

1.08K viewsRoman Zykov, edited 16:22

Я ненавижу удаленку!

Особенно, когда я работаю удаленно, а остальные члены команды сидят в офисах. В таком случае все вопросы решаются очень медленно. Что бы ни говорили, но если стремишься к серьезным результатам, офис эффективнее.

Когда я работал на Бостон, офиса не было, все было хорошо. Открыли офис в Бостоне, все вопросы пошли мимо меня. Почему? Потому что можно было перекинуться парой фраз в офисе, не подключая удаленщика меня. Тогда я понял, что пора сливаться оттуда.

С каким я удовольствием ходил в офис в Лондоне каждый день. Половину времени сидел там один, так как у остальных был гибридный режим. Эх

PS: к полностью удаленным командам это не относится, потому что там только онлайн коммуникации.
И я с пониманием отношусь, что фирмы закручивают гайки и тянут всех из удаленки в офис

💯14👍4🫡2👏1

1.26K viewsRoman Zykov, edited 22:14

Получил вот такое письмо, так как попал в outreach. Думаю, что я есть еще в других системах, но такое письмо получаю впервые. Рынок данных становится цивилизованным!
См блок Your Rights - я могу удалить оттуда свои персональные данные

👍4🔥3

1.08K viewsRoman Zykov, edited 12:51

Чуть больше чем через час (в 18 по Лондону) будет Zoom вебинар от одного из разработчиков AI.
Речь будет идти про агентов в LLM.
Регистрация здесь: https://lu.ma/6l07vqgk

Я сам послушаю, так как вижу насколько последние модели OpenAI (mini и preview) на агентах лучше, чем прошлые

👍3

1.19K viewsRoman Zykov, 16:43

Началось!
Рассказывает про Klarna - финтех компанию

1.18K viewsRoman Zykov, edited 18:16

Сэкономил тысячи долларов в год, добавив кастомную авторизацию в Metabase.

По прежнему считаю, что Metabase одна из самых удобных BI систем для пользователей.
Но есть одна проблема - коммерческая PRO версия довольно дорогая - 500 долларов в месяц плюс 10 за пользователя.
Мне нужна была только одна фича из PRO - моя собственная система авторизации.

В итоге я хакнул код Metabase, и опубликовал свою версию с инструкциями здесь
https://github.com/rzykov/metabase/blob/fiev_auth/Fief_auth.md
Демо видео https://www.youtube.com/shorts/hfmGOYF_6RI

Кому это нужно:
1) Вы пишите стартап/продукт и вам нужно дать поиграться данные пользователям в приличном интерфейсе
2) Вы внедряете Metabase, но пока хотите сэкономить 🙂

Пользуйтесь на здоровье

🔥25

10.9K viewsRoman Zykov, edited 10:40

К черту AI видео. Человек рулит.
На выходных записал видео ролик к проекту.
На проработку процесса у меня ушел примерно месяц. Много читал реддит.
Тестировал софт для AI генерации. Даже клонировал свой голос в elevenlabs - ничего стоящего не нашел.
При прослушивании чувствуется рука AI 🙁 не натурально.

Кто будет тратить на просмотр видео свое время, если сразу заметит, что автор потратил мало усилий на его создание и воспользовался роботом?

Также я заметил, что многие видео редакторы впаривают AI фичи, которые не являются AI.
Например, анализ звука на паузы, чтобы их отметить в видео ряде? Нейронка там не нужна, нужно примитивное решение.

Итак по шагам:
1) Основной инструмент - OBS (бесплатная LUMA). Я писал в нем скринкаст со звуком (15 минут)
2) Закидываю видео в Slack (сюрприз!). Он автоматически транскрибирует. (1 минута)
3) Беру субтитры и отправляю их в ChatGPT. Прошу поправить английский и сгенерировать SRT файл. (1 минута)
4) Пишем второй звук в OBS с наложением моей головы на видео! Для этого в OBS загружаю наш прошлый ролик. (15 минут)
Для субтитров я написал плагин для OBS, который в отдельном окне показывает субтитры, которые засинхронизированы с прошлым видео.
Получился телесуфлер!
Для записи моей головы сверху воспользовался обычным зеленым экраном. Нейронки пока выдают всякие ауры вокруг головы.
Записали
5) Монтаж - прохожусь консольной программой auto-editor, которая автоматически отмечает паузы в звуке и видео и сразу выдает файл для монтажа в DaVinchi Resolve.
Есть один хак - сразу указать, что участки с паузами проигрывать быстрее, чем обычные, это сократит время монтажа
Пример: auto-editor new_audio.mp4 --margin 0.2sec --edit "(or audio:0.03 motion:0.06)" --video-speed 1 --silent-speed 3 --export resolve
(3 минуты)
6) В Resolve я загружаю файл с прошлого шага, делаю один прогон и удаляю пару косяков (10 минут)

Результат тут:
https://www.youtube.com/watch?v=YpUKnWEm_6g

Сейчас у меня создание такого ролика занимает примерно час на все. Заказал микрофон. Голову записывал через камеру Iphone

UK companies list and other corporate data for FREE

This dataset provides a comprehensive view of UK companies, including their registration details, financial information, ownership, management, and recent filings for up to the 31st December 2023. The data has been meticulously processed using dbt (Data Build…

🔥14👏2❤1

1.08K viewsRoman Zykov, edited 12:58

Началось! Рассказывает про Klarna - финтех компанию

Как делать мультиагентные взаимодействия в LLM в 10 строк кода? Опубликовали видео про OpenAI swarm.
https://youtu.be/zTRL8h-qtdg?si=8obZVNvYS1OZ44NS

AI Agents by OpenAI. #artificialintelligance #aitalk #technology #aiagent

As autonomous #AI systems become more advanced, design approaches must balance priorities like scalability, simplicity, and long-term stability while managing tradeoffs such as operational range and reliability. Ilan Bigio from @OpenAI shares insights from…

🔥2

1.09K viewsRoman Zykov, edited 21:03

Как работает Zaraz, иллюстрация к посту выше.

Именно поэтому я не пользуюсь Google Tag Manager для своих проектов, a Cloudflare Zaraz!

🔥3👏2

910 viewsRoman Zykov, 11:02

На выходных прочитал интересный пост про увольнения за факт поиска работы (https://habr.com/ru/news/862836/), но еще более интересные комментарии.
Особенно вот этот про США: https://habr.com/ru/news/862836/#comment_27622278

“Случай 2. Уже в США запросил 1:1 с менеджером, сказал, что не все нравится в команде, что проект может пострадать и нам нужно многое поменять в том, как мы управляем проектом. Очень аккуратно и очень культурно. Через 2 часа уже пришло уведомление об увольнении. К слову, проект закрыли, а менеджмент уволили через месяц по озвученным мною причинам.”

Неужели такие “ссыкуны” менеджеры есть? Не получается ли, что в корпорациях основная масса менеджеров эдакие хитрецы, которые за власть и место продают душу дьяволу? Но на самом деле они очень бояться сами выйти на рынок труда, который “объективно” оценит их.

У вас были похожие истории?

PS:
1. Когда я уходил из Озона, получил оффер в 2 раза больше. При этом я понимал, что никто мне так не поднимет. Ушел. Гендир на меня тогда обиделся со словами “Мы столько в тебя вложили”
2. Когда у меня уходили сотрудники - я не обижался, понимаю, что где-то мы не можем платить больше, а где-то просто не можем дать такие же интересные, как на новом месте

👍8🔥1

883 viewsRoman Zykov, edited 10:12

Еще один интересный проект про обертки для LLM для типобезопасных операций в получении данных из RAG. Я написал сложно, но сами примеры показывают, что работать с LLM станет проще
https://github.com/pydantic/pydantic-ai

Выпустили создатели Pydantic всего три недели назад!

GitHub - pydantic/pydantic-ai: GenAI Agent Framework, the Pydantic way

GenAI Agent Framework, the Pydantic way. Contribute to pydantic/pydantic-ai development by creating an account on GitHub.

🔥2

926 viewsRoman Zykov, edited 11:58

Прямо сейчас жду судью UK Employment Tribunal

1.13K viewsRoman Zykov, 09:57

Прямо сейчас жду судью UK Employment Tribunal

Все в порядке, это я пытаюсь выбить деньги из компании-банкрота, где я работал.
Судья был очень мил, все подробно объяснил

PS: Английский суд намного гуманнее относится к людям, чем в России. Теперь у меня есть опыт и там, и там

👍13❤2

1.31K viewsRoman Zykov, edited 11:03