topdatalab
1.27K subscribers
99 photos
10 videos
17 files
222 links
Канал поддержки книги «Как монетизировать данные». https://topdatalab.ru
Download Telegram
Как вы помните, я начал летом заниматься алгоритмами высокочастотного трейдинга на криптобиржах.
Меня попросили рассказать детали - не могу, под NDA. 😢

Но я могу посоветовать пару книг по теме:
1) Developing High-Frequency Trading Systems (SebastienDonadio| SouravGhosh| RomainRossie) - я прочитал только начало, в программную часть не лез.
2) Trades, Quotes and Prices. Financial Markets Under the Microscope - мне посоветовал ее один очень хороший трейдер. Много математики, но автор старался все упрощать для понимания. Много ссылок на литературу. Сейчас ее читаю.

PS: до лета я был в этой теме полным нулем, сейчас хотя бы начал разговаривать на одном языке с коллегами
8👍3😱1🤓1
Про эффективность последних LLM в программировании.
Понадобилось мне сменить способ авторизации в Metabase (лучшая система BI отчетности). Вроде бы сделать легко - плати 500$ в месяц за 10 пользовательских лицензий и подключай свою авторизацию.
Но ведь это Open Source, денег платить я не хотел, и решил немного переписать Metabase, сменив доступную авторизацию через Google на свою.
Вроде задача не сильно сложная, но сам проект очень сложный (хотя написан красиво). Написан на двух языках программирования Clojure и TypeScript(React + Redux).
Оба я их знаю плохо :(.

Итак я обратился к LLM:
1) Claude Sonnet 3.5 - не справился с TypeScript. Вроде что-то получалось, но не работало. Хотя было вроде удобнее c точки зрения UI.
2) ChatGPT 4o - то же самое
3) ChatGPT o1-preview - очень порадовал. Было несколько моментов, но я смог отдебажить и разобраться в вопросах сам.

Сама задача заняла около 8 часов с учетом мучений с предыдущими LLM. Возможно, первые две LLM лучше бы справились, если бы я формулировал задачу лучше.
Но o1-preview смогла помочь с почти такими же формулировками.
🔥7
Думаю написать большой пост про ML research. Как к нему подходить, грабли, на которые я напоролся.
Пишите вопросы в комментариях, попробую на них ответить!
🔥10👍2
Вчера была конференция OpenAI, где они рассказывали про текущие и будущие изменения продукта.
https://simonwillison.net/2024/Oct/1/openai-devday-2024-live-blog/

Мне лично было очень интересно почитать, что OpenAI теперь поддерживает API реального времени для приложений.
Кроме текста поддерживаются форматы данных, к которым мы привыкли в ChatGPT: звук, изображения. Причем, она может отвечать звуком!
Они опубликовали Speech API, которое, например реализовано в приложении Speak для изучения языков. Поставлю себе обязательно.
Как раз вчера тестировал новый аудио движок в ChatGPT приложении. Это реально большое изменение, и оно ударит по всему.
От преподавателей языка на italki до операторов call центра.
Что еще?
1) Улучшение работы JSON для приложений. Очень важная вещь. Я с этим мучался 🙁
2) Рекомендуется пользоваться o1-mini для кодинга и математики, хотя по моему мнению o1 preview лучше в этом плане.
3) Показано, как можно обучить небольшие модели на основе датасета из больших моделей. Очень полезно для оптимизации расходов

Пока не дочитал до конца - но Сэм Альтман стали сливаться с темы AGI :). Но это нисколько не умаляет достижений OpenAI.

PS: Спасибо Федору Шабашеву, что он расшарил этот блог пост в LinkedIn
👍10🔥3
Мой товарищ в Лондоне, бывший разработчик Google делает свой проект a-la Goolge Streetview
для морских экологических проектов. Они обрабатывают видео с камер и строят такие интерактивные карты
https://3d.wildflow.ai/W32Em7

Выглядит очень интересно!
🔥8👍1
скриншот оттуда
🔥12
Простите, про жизнь и наследование в UK!
If a person gives away more than £325,000 in cash or gifts but dies within seven years, recipients could be liable to pay inheritance tax.

Если вы подарили что-то и умерли в течение семи лет, то принявшему подарок придется заплатить 40% примерно 🙁 (С порогом в 325 тыс.)
Пора делать прогнозные модели на ML, которые прогнозируют смерть в течение семи лет
🌚7🔥4👍3😁2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Claude выпустила computer use, теперь через чат можно управлять вашим компьютером!
Подробнее: https://www.anthropic.com/news/3-5-models-and-computer-use
🤯4👏3
Нашел интересный проект по использованию LLM локально на своем ноуте.
Качать тут: https://nexa.ai/download-sdk
Потом просто запустить на своем ноутбуке в терминале команду “nexa run llama3.2”
Скорость ответа очень приличная! Буду использовать на своих локальных проектах
Мой диалог в скриншоте.
Вообще она много что умеет, speech-to-text, text-to-img и все делает на вашей локальной машине

Update: в комментариях подсказали ollama и LM studio
Я ненавижу удаленку!

Особенно, когда я работаю удаленно, а остальные члены команды сидят в офисах. В таком случае все вопросы решаются очень медленно. Что бы ни говорили, но если стремишься к серьезным результатам, офис эффективнее.

Когда я работал на Бостон, офиса не было, все было хорошо. Открыли офис в Бостоне, все вопросы пошли мимо меня. Почему? Потому что можно было перекинуться парой фраз в офисе, не подключая удаленщика меня. Тогда я понял, что пора сливаться оттуда.

С каким я удовольствием ходил в офис в Лондоне каждый день. Половину времени сидел там один, так как у остальных был гибридный режим. Эх

PS: к полностью удаленным командам это не относится, потому что там только онлайн коммуникации.
И я с пониманием отношусь, что фирмы закручивают гайки и тянут всех из удаленки в офис
💯14👍4🫡2👏1
Получил вот такое письмо, так как попал в outreach. Думаю, что я есть еще в других системах, но такое письмо получаю впервые. Рынок данных становится цивилизованным!
См блок Your Rights - я могу удалить оттуда свои персональные данные
👍4🔥3
Чуть больше чем через час (в 18 по Лондону) будет Zoom вебинар от одного из разработчиков AI.
Речь будет идти про агентов в LLM.
Регистрация здесь: https://lu.ma/6l07vqgk

Я сам послушаю, так как вижу насколько последние модели OpenAI (mini и preview) на агентах лучше, чем прошлые
👍3
Началось!
Рассказывает про Klarna - финтех компанию
Сэкономил тысячи долларов в год, добавив кастомную авторизацию в Metabase.

По прежнему считаю, что Metabase одна из самых удобных BI систем для пользователей.
Но есть одна проблема - коммерческая PRO версия довольно дорогая - 500 долларов в месяц плюс 10 за пользователя.
Мне нужна была только одна фича из PRO - моя собственная система авторизации.

В итоге я хакнул код Metabase, и опубликовал свою версию с инструкциями здесь
https://github.com/rzykov/metabase/blob/fiev_auth/Fief_auth.md
Демо видео https://www.youtube.com/shorts/hfmGOYF_6RI

Кому это нужно:
1) Вы пишите стартап/продукт и вам нужно дать поиграться данные пользователям в приличном интерфейсе
2) Вы внедряете Metabase, но пока хотите сэкономить 🙂

Пользуйтесь на здоровье
🔥25
К черту AI видео. Человек рулит.
На выходных записал видео ролик к проекту.
На проработку процесса у меня ушел примерно месяц. Много читал реддит.
Тестировал софт для AI генерации. Даже клонировал свой голос в elevenlabs - ничего стоящего не нашел.
При прослушивании чувствуется рука AI 🙁 не натурально.

Кто будет тратить на просмотр видео свое время, если сразу заметит, что автор потратил мало усилий на его создание и воспользовался роботом?

Также я заметил, что многие видео редакторы впаривают AI фичи, которые не являются AI.
Например, анализ звука на паузы, чтобы их отметить в видео ряде? Нейронка там не нужна, нужно примитивное решение.

Итак по шагам:
1) Основной инструмент - OBS (бесплатная LUMA). Я писал в нем скринкаст со звуком (15 минут)
2) Закидываю видео в Slack (сюрприз!). Он автоматически транскрибирует. (1 минута)
3) Беру субтитры и отправляю их в ChatGPT. Прошу поправить английский и сгенерировать SRT файл. (1 минута)
4) Пишем второй звук в OBS с наложением моей головы на видео! Для этого в OBS загружаю наш прошлый ролик. (15 минут)
Для субтитров я написал плагин для OBS, который в отдельном окне показывает субтитры, которые засинхронизированы с прошлым видео.
Получился телесуфлер!
Для записи моей головы сверху воспользовался обычным зеленым экраном. Нейронки пока выдают всякие ауры вокруг головы.
Записали
5) Монтаж - прохожусь консольной программой auto-editor, которая автоматически отмечает паузы в звуке и видео и сразу выдает файл для монтажа в DaVinchi Resolve.
Есть один хак - сразу указать, что участки с паузами проигрывать быстрее, чем обычные, это сократит время монтажа
Пример: auto-editor new_audio.mp4 --margin 0.2sec --edit "(or audio:0.03 motion:0.06)" --video-speed 1 --silent-speed 3 --export resolve
(3 минуты)
6) В Resolve я загружаю файл с прошлого шага, делаю один прогон и удаляю пару косяков (10 минут)

Результат тут:
https://www.youtube.com/watch?v=YpUKnWEm_6g

Сейчас у меня создание такого ролика занимает примерно час на все. Заказал микрофон. Голову записывал через камеру Iphone
🔥14👏21
topdatalab
Как работает Zaraz, иллюстрация к посту выше.
Именно поэтому я не пользуюсь Google Tag Manager для своих проектов, a Cloudflare Zaraz!
🔥3👏2
На выходных прочитал интересный пост про увольнения за факт поиска работы (https://habr.com/ru/news/862836/), но еще более интересные комментарии.
Особенно вот этот про США: https://habr.com/ru/news/862836/#comment_27622278

“Случай 2. Уже в США запросил 1:1 с менеджером, сказал, что не все нравится в команде, что проект может пострадать и нам нужно многое поменять в том, как мы управляем проектом. Очень аккуратно и очень культурно. Через 2 часа уже пришло уведомление об увольнении. К слову, проект закрыли, а менеджмент уволили через месяц по озвученным мною причинам.”

Неужели такие “ссыкуны” менеджеры есть? Не получается ли, что в корпорациях основная масса менеджеров эдакие хитрецы, которые за власть и место продают душу дьяволу? Но на самом деле они очень бояться сами выйти на рынок труда, который “объективно” оценит их.

У вас были похожие истории?

PS:
1. Когда я уходил из Озона, получил оффер в 2 раза больше. При этом я понимал, что никто мне так не поднимет. Ушел. Гендир на меня тогда обиделся со словами “Мы столько в тебя вложили”
2. Когда у меня уходили сотрудники - я не обижался, понимаю, что где-то мы не можем платить больше, а где-то просто не можем дать такие же интересные, как на новом месте
👍8🔥1
Еще один интересный проект про обертки для LLM для типобезопасных операций в получении данных из RAG. Я написал сложно, но сами примеры показывают, что работать с LLM станет проще
https://github.com/pydantic/pydantic-ai

Выпустили создатели Pydantic всего три недели назад!
🔥2
Прямо сейчас жду судью UK Employment Tribunal
topdatalab
Прямо сейчас жду судью UK Employment Tribunal
Все в порядке, это я пытаюсь выбить деньги из компании-банкрота, где я работал.
Судья был очень мил, все подробно объяснил

PS: Английский суд намного гуманнее относится к людям, чем в России. Теперь у меня есть опыт и там, и там
👍132