Dan Okhlopkov - канал
10.7K subscribers
365 photos
38 videos
44 files
517 links
Все посты пишет нейросеть. Все совпадения случайны.

okhlopkov.com
Download Telegram
Когда только появились сторисы в инсте, их можно было смотреть миллионами. Замечали, что какие-то огромные блоггеры почему-то интересуются вашей жизнью? Подписались ли вы в ответ? Многие да.

Телеграм уже начал раскатывать доступ в сторисы для бесплатных аккаунтов. Значит, скоро все начнут что-то постить и подглядывать, кто следит за ними.

Специально для любимых подписчиков выкладываю рабочий код для массового просмотра сториз в телеграмме. Всех тонкостей не раскрою, но уже можно начинать делать SaaS поверх этого.

🔗 gist.github.com/ohld/9ab13034c1796ca79db19c50eab47684
Больше данных для связки EVM адрес + твиттер. Теперь это 100к юзеров friend tech - нашумевшей NFT коллекции на Base, где можно купить NFT любого Твиттер аккаунта. 🤦‍♂️ Конечно же за логин в твиттере и дырявый бекенд. 👏

🔗 gist.github.com/banteg/76d141fea2e658e5d2854944342f2d3d

UPD: данные скрыли. Всем спасибо 🤝
Dan Okhlopkov - канал
Если у вас есть тг канал, проверьте, что в админах нет посторонних. И на всякий случай удалите бота Telemetr, если ставили.
Разгадал загадку, как можно скачать полный список подписчиков своего тг канала, если Телега выдает только 200 последних.

🤓 Воспользоваться поиском по подписчикам 🤓

Генерим различные поисковые запросы, состоящие из 1-2 букв. Коллекционируем результат, пока len(result) > 99% * followers_count.

Больше деталей и кода в источнике:

🔗 okhlopkov.com/how-to-get-a-telegram-channel-subscribers-list-in-python/
Надоело.

И вот в ~6 раз, после ~4 этапов интервью, я получаю отказ, потому что не вписываюсь идеально ни в одну позицию. Всегда есть кто-то, кто 7 лет делал конкретно это, да и еще ex-Meta. А из-за “we want to keep our team relatively small” никого, кроме 100% match, не хотят брать.

Говорят, что в Лондоне нормально искать работу годами. Что нормально рассылать сотни откликов на все подряд. Что нормально в перерывах брать контракты, чтобы выживать.

Я же должен влюбиться в компанию, в миссию и идею, чтобы дойти до конца. И в конце услышать, что wear a lot of hats на самом деле плюс в начале воронки, но минус в конце.

Мой личный Уроборос длинною в 2 месяца: отклики, собесы, отказы, repeat.

Game over. Insert coin to continue.
Хочу спарсить все нормальные тг чаты на около-IT темы. В каталогах tgstat как будто один инфобиз шлак.

Определим нормальные тг чаты: те, которые вы когда либо кому-то советовали, скидывали или сами читали. Они обычно небольшие и могут быть, например, добавлены в подборки.

Никто не видел, случаем, каталога с тг папочками? 😋

Интересно, как можно алгоритмически найти такие чаты? Получить список абы каких можно и через тг поиск, и через tgstats, но как дальше понять, что он норм?
🧠 С днем знаний!

Решил я понять чуть больше про свою аудиторию. Попросил вас скинуть норм чаты, спарсил всех участников (где открыто было) и посмотрел, в каких чатах сидят подписчики этого канала.

В итоге, собрал руками 84 чата, в которых сидит 46% моей тг аудитории (поиск вширь по чатам скоро).

Топ3 со скрина:
1. Product Hackers - мой 5летний чатик по обмену лайками на Product Hunt.
2. Startup Never Sleeps - международное IT комьюнити от @thingsiread, в котором я лет 8.
3. Phystech.Career - вакансии для МФТИшников (лет 10).

Не видел тулов, которые дают подобный анализ, поэтому если кто-то из моих знакомых захочет +- такое же для своего тг канала — цифры знаете.
Лекция от ex-Топ1-Кагглера после 2+ лет работы квантом выглядит как сливы Овчинкина.

🔗 youtube.com/watch?v=ldNZapF8PDY

Let’s imagine that we can use only linear models...
Dan Okhlopkov - канал
Лекция от ex-Топ1-Кагглера после 2+ лет работы квантом выглядит как сливы Овчинкина. 🔗 youtube.com/watch?v=ldNZapF8PDY Let’s imagine that we can use only linear models...
Моя DS-карьера началась с Kaggle, а потом резко свернула ближе к Data Engineer / Product Analyst. Мои ML скиллы почти нигде мне не пригодились: я либо парсил и складывал, либо автоматизировал SQL. Конечно, у меня есть запатентованный ML-алгоритм, но там тупо Random Forrest. К тому же, ничего умнее пары эвристик на SQL не взлетело в @ffmemesbot. А больше нигде ML мне как будто не нужен был.

Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫

Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
Сижу на митапе PyData. На скрине результаты опроса, какие вообще ML модели люди используют в проде.
Forwarded from Matapac Izi DAO
Йоу, запись подкаста с одним из самых интересных гостей!

На пикчах лишь несколько мыслей от Дани. Послушай фулл версию и вынеси много нового для себя

ЗАПИСЬ ПОДКАСТА
Entrepreneur first
Dan Okhlopkov - канал
Entrepreneur first
Надо, наверное, рассказать про Entrepreneur first, да?

Окей. Это акселератор. Но не как YCombinator, куда ты подаешься с командой и идеей. В EF набирают фаундеров-одиночек, которые хотят сделать стартап, но у них пока нет ни идеи, ни кофаундера. В Antler примерно также.

Из-за того, что они инвестируют свое время и деньги на еще более ранней стадии, они возьмут от твоего будущего стартапа больше других: 10% за 145к фунтов (из которых 65к ты отдашь за услуги акселерации).

Зачем я пошел в EF:
1. Вдруг получится сделать еще один стартап, а тут сразу и деньги, и норм нетворк эдвайзеров.

2. Практика английского и нетворкинг с такими же, как я, но со всего света.

3. Они платят стипендию 2к три месяца. Пригодится.

Когорта набралась 43 человека. Я думал, что будут одни студенты, но оказалось, они в отдельной grad когорте. У меня все либо с PhD, либо где-то заметно поработали, либо ex-founders. Все где-то 25-29 лет.
Please open Telegram to view this post
VIEW IN TELEGRAM
Dan Okhlopkov - канал
🫃4 года @ffmemesbot 🎂 26 июня 2019 года появился телеграм бот с бесконечной персонализированной лентой мемов под скромным названием Fast Food Memes. 📨 За это время мы отправили 45М мемов для ~60k ценителей юмора со всего света. Команда из ста модераторов…
4х летняя Архитектура @ffmemesbot

После обновления поиска телеги бот начал вирально расти в разных странах и я задумался, что же с ним делать дальше. Но даже если ничего и не делать, текущая реализация нестабильна и полна ужасов.

В основе лежит django-telegram-bot с синхронной ORM и огромном оверхедом по RAM от джанги и селери. Руки чешутся переписать на фастапи, я как раз научился это делать нормально.

Я записываю все просмотры и реакции на мемы в одну большую таблицу Postgres, которая уже больше 50М. Понятно, что есть индексы, но диск пухнет, бот становится медленнее и уже не умещается на микро тачку на Digital Ocean. Покупать еще серверы не хочется, ведь бот не планирует приносить бабосики. С одной стороны, это полезные для анализа данные, с другой — звучит неправильно обрабатывать в риалтайме десятки миллионов строк, чтобы выдать мем. Или нет?

Да и рекомендательная система сейчас простенькая: для каждого мема, паблика (откуда я взял мем) и юзера я считаю попарные статистики в бекграунде, а потом по ним в риалтайме сортирую все непросмотренные юзером мемы. Работает быстро, без какого-либо ML, но хочется больше % лайков. Платить за гпу нет сил. Есть эксперты?

Еще хочется максимизировать виральность бота, но тг не дает стату о перессылке сообщений. Туда даже диплинк нормально не вставишь.
Еще отдельная боль с дублированием мемов. Алгоритм “достать весь текст с картинки и дедублицировать мемы по этому тексту” работал хорошо, но кредиты на GCP давно сказали чао-чао.

Что бы вы могли тут посоветовать? ChatGPT спам боты, к вам тоже этот вопрос.