Когда только появились сторисы в инсте, их можно было смотреть миллионами. Замечали, что какие-то огромные блоггеры почему-то интересуются вашей жизнью? Подписались ли вы в ответ? Многие да.
Телеграм уже начал раскатывать доступ в сторисы для бесплатных аккаунтов. Значит, скоро все начнут что-то постить и подглядывать, кто следит за ними.
Специально для любимых подписчиков выкладываю рабочий код для массового просмотра сториз в телеграмме. Всех тонкостей не раскрою, но уже можно начинать делать SaaS поверх этого.
🔗 gist.github.com/ohld/9ab13034c1796ca79db19c50eab47684
Телеграм уже начал раскатывать доступ в сторисы для бесплатных аккаунтов. Значит, скоро все начнут что-то постить и подглядывать, кто следит за ними.
Специально для любимых подписчиков выкладываю рабочий код для массового просмотра сториз в телеграмме. Всех тонкостей не раскрою, но уже можно начинать делать SaaS поверх этого.
🔗 gist.github.com/ohld/9ab13034c1796ca79db19c50eab47684
Пиарю свой линкедин, как пиарил этот канал - выкладывая #датасет!
🔗 linkedin.com/posts/danokhlopkov_ycombinator-launch-database-almost-a-year-activity-7099344780945436672-dTuW
🔗 linkedin.com/posts/danokhlopkov_ycombinator-launch-database-almost-a-year-activity-7099344780945436672-dTuW
Linkedin
Dan Okhlopkov on LinkedIn: YCombinator Launch Database
Almost a year ago YC opens the The Launchpad… | 22 comments
Almost a year ago YC opens the The Launchpad… | 22 comments
YCombinator Launch Database
Almost a year ago YC opens the The Launchpad for YC Startups (like producthunt but for YC companies).
🎉 Top 3 launches so far:… | 22 comments on LinkedIn
Almost a year ago YC opens the The Launchpad for YC Startups (like producthunt but for YC companies).
🎉 Top 3 launches so far:… | 22 comments on LinkedIn
Больше данных для связки EVM адрес + твиттер. Теперь это 100к юзеров friend tech - нашумевшей NFT коллекции на Base, где можно купить NFT любого Твиттер аккаунта. 🤦♂️ Конечно же за логин в твиттере и дырявый бекенд. 👏
🔗 gist.github.com/banteg/76d141fea2e658e5d2854944342f2d3d
UPD: данные скрыли. Всем спасибо 🤝
🔗 gist.github.com/banteg/76d141fea2e658e5d2854944342f2d3d
UPD: данные скрыли. Всем спасибо 🤝
Telegram
Dan Okhlopkov - канал
📰 Связать Twitter и криптокошелек
Мостик между данными из web3 и web2 миров.
🔗 ethleaderboard.xyz
📚 Домашнее задание:
1. Скачать список всех 117k профилей с сайта (откройте dev tools -> network и погнали)
2. Превратите ENS в адрес через ens-records.vercel.app…
Мостик между данными из web3 и web2 миров.
🔗 ethleaderboard.xyz
📚 Домашнее задание:
1. Скачать список всех 117k профилей с сайта (откройте dev tools -> network и погнали)
2. Превратите ENS в адрес через ens-records.vercel.app…
Dan Okhlopkov - канал
Если у вас есть тг канал, проверьте, что в админах нет посторонних. И на всякий случай удалите бота Telemetr, если ставили.
Разгадал загадку, как можно скачать полный список подписчиков своего тг канала, если Телега выдает только 200 последних.
🤓 Воспользоваться поиском по подписчикам 🤓
Генерим различные поисковые запросы, состоящие из 1-2 букв. Коллекционируем результат, пока
Больше деталей и кода в источнике:
🔗 okhlopkov.com/how-to-get-a-telegram-channel-subscribers-list-in-python/
🤓 Воспользоваться поиском по подписчикам 🤓
Генерим различные поисковые запросы, состоящие из 1-2 букв. Коллекционируем результат, пока
len(result) > 99%
*
followers_count
. Больше деталей и кода в источнике:
🔗 okhlopkov.com/how-to-get-a-telegram-channel-subscribers-list-in-python/
♽ Надоело.
И вот в ~6 раз, после ~4 этапов интервью, я получаю отказ, потому что не вписываюсь идеально ни в одну позицию. Всегда есть кто-то, кто 7 лет делал конкретно это, да и еще ex-Meta. А из-за “we want to keep our team relatively small” никого, кроме 100% match, не хотят брать.
Говорят, что в Лондоне нормально искать работу годами. Что нормально рассылать сотни откликов на все подряд. Что нормально в перерывах брать контракты, чтобы выживать.
Я же должен влюбиться в компанию, в миссию и идею, чтобы дойти до конца. И в конце услышать, что wear a lot of hats на самом деле плюс в начале воронки, но минус в конце.
Мой личный Уроборос длинною в 2 месяца: отклики, собесы, отказы, repeat.
Game over. Insert coin to continue.
И вот в ~6 раз, после ~4 этапов интервью, я получаю отказ, потому что не вписываюсь идеально ни в одну позицию. Всегда есть кто-то, кто 7 лет делал конкретно это, да и еще ex-Meta. А из-за “we want to keep our team relatively small” никого, кроме 100% match, не хотят брать.
Говорят, что в Лондоне нормально искать работу годами. Что нормально рассылать сотни откликов на все подряд. Что нормально в перерывах брать контракты, чтобы выживать.
Я же должен влюбиться в компанию, в миссию и идею, чтобы дойти до конца. И в конце услышать, что wear a lot of hats на самом деле плюс в начале воронки, но минус в конце.
Мой личный Уроборос длинною в 2 месяца: отклики, собесы, отказы, repeat.
Game over. Insert coin to continue.
Хочу спарсить все нормальные тг чаты на около-IT темы. В каталогах tgstat как будто один инфобиз шлак.
Определим нормальные тг чаты: те, которые вы когда либо кому-то советовали, скидывали или сами читали. Они обычно небольшие и могут быть, например, добавлены в подборки.
Никто не видел, случаем, каталога с тг папочками? 😋
Интересно, как можно алгоритмически найти такие чаты? Получить список абы каких можно и через тг поиск, и через tgstats, но как дальше понять, что он норм?
Определим нормальные тг чаты: те, которые вы когда либо кому-то советовали, скидывали или сами читали. Они обычно небольшие и могут быть, например, добавлены в подборки.
Никто не видел, случаем, каталога с тг папочками? 😋
Интересно, как можно алгоритмически найти такие чаты? Получить список абы каких можно и через тг поиск, и через tgstats, но как дальше понять, что он норм?
🧠 С днем знаний!
Решил я понять чуть больше про свою аудиторию. Попросил вас скинуть норм чаты, спарсил всех участников (где открыто было) и посмотрел, в каких чатах сидят подписчики этого канала.
В итоге, собрал руками 84 чата, в которых сидит 46% моей тг аудитории (поиск вширь по чатам скоро).
Топ3 со скрина:
1. Product Hackers - мой 5летний чатик по обмену лайками на Product Hunt.
2. Startup Never Sleeps - международное IT комьюнити от @thingsiread, в котором я лет 8.
3. Phystech.Career - вакансии для МФТИшников (лет 10).
Не видел тулов, которые дают подобный анализ, поэтому если кто-то из моих знакомых захочет +- такое же для своего тг канала — цифры знаете.
Решил я понять чуть больше про свою аудиторию. Попросил вас скинуть норм чаты, спарсил всех участников (где открыто было) и посмотрел, в каких чатах сидят подписчики этого канала.
В итоге, собрал руками 84 чата, в которых сидит 46% моей тг аудитории (поиск вширь по чатам скоро).
Топ3 со скрина:
1. Product Hackers - мой 5летний чатик по обмену лайками на Product Hunt.
2. Startup Never Sleeps - международное IT комьюнити от @thingsiread, в котором я лет 8.
3. Phystech.Career - вакансии для МФТИшников (лет 10).
Не видел тулов, которые дают подобный анализ, поэтому если кто-то из моих знакомых захочет +- такое же для своего тг канала — цифры знаете.
Лекция от ex-Топ1-Кагглера после 2+ лет работы квантом выглядит как сливы Овчинкина.
🔗 youtube.com/watch?v=ldNZapF8PDY
Let’s imagine that we can use only linear models...
🔗 youtube.com/watch?v=ldNZapF8PDY
Let’s imagine that we can use only linear models...
Dan Okhlopkov - канал
Лекция от ex-Топ1-Кагглера после 2+ лет работы квантом выглядит как сливы Овчинкина. 🔗 youtube.com/watch?v=ldNZapF8PDY Let’s imagine that we can use only linear models...
Моя DS-карьера началась с Kaggle, а потом резко свернула ближе к Data Engineer / Product Analyst. Мои ML скиллы почти нигде мне не пригодились: я либо парсил и складывал, либо автоматизировал SQL. Конечно, у меня есть запатентованный ML-алгоритм, но там тупо Random Forrest. К тому же, ничего умнее пары эвристик на SQL не взлетело в @ffmemesbot. А больше нигде ML мне как будто не нужен был.
Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫
Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫
Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
Forwarded from Matapac Izi DAO
Йоу, запись подкаста с одним из самых интересных гостей!
На пикчах лишь несколько мыслей от Дани. Послушай фулл версию и вынеси много нового для себя
ЗАПИСЬ ПОДКАСТА
На пикчах лишь несколько мыслей от Дани. Послушай фулл версию и вынеси много нового для себя
ЗАПИСЬ ПОДКАСТА
Прочитайте статью. Если все поймете, то можете претендовать на статус “шарю за LLM”.
🔗 t.me/lovedeathtransformers/6313
🔗 t.me/lovedeathtransformers/6313
Telegram
Love. Death. Transformers.
#чтивонаночь
phi1 будущее для построения LM или просто фейк хайп?
Разбираемся в новом блогпосте
phi1 будущее для построения LM или просто фейк хайп?
Разбираемся в новом блогпосте
Dan Okhlopkov - канал
Entrepreneur first
Надо, наверное, рассказать про Entrepreneur first, да?
Окей. Это акселератор. Но не как YCombinator, куда ты подаешься с командой и идеей. В EF набирают фаундеров-одиночек, которые хотят сделать стартап, но у них пока нет ни идеи, ни кофаундера. В Antler примерно также.
Из-за того, что они инвестируют свое время и деньги на еще более ранней стадии, они возьмут от твоего будущего стартапа больше других: 10% за 145к фунтов (из которых 65к ты отдашь за услуги акселерации).
Зачем я пошел в EF:
1. Вдруг получится сделать еще один стартап, а тут сразу и деньги, и норм нетворк эдвайзеров.
2. Практика английского и нетворкинг с такими же, как я, но со всего света.
3. Они платят стипендию 2к три месяца. Пригодится.
Когорта набралась 43 человека. Я думал, что будут одни студенты, но оказалось, они в отдельной grad когорте. У меня все либо с PhD, либо где-то заметно поработали, либо ex-founders. Все где-то 25-29 лет.
Окей. Это акселератор. Но не как YCombinator, куда ты подаешься с командой и идеей. В EF набирают фаундеров-одиночек, которые хотят сделать стартап, но у них пока нет ни идеи, ни кофаундера. В Antler примерно также.
Из-за того, что они инвестируют свое время и деньги на еще более ранней стадии, они возьмут от твоего будущего стартапа больше других: 10% за 145к фунтов (из которых 65к ты отдашь за услуги акселерации).
Зачем я пошел в EF:
1. Вдруг получится сделать еще один стартап, а тут сразу и деньги, и норм нетворк эдвайзеров.
2. Практика английского и нетворкинг с такими же, как я, но со всего света.
3. Они платят стипендию 2к три месяца. Пригодится.
Когорта набралась 43 человека. Я думал, что будут одни студенты, но оказалось, они в отдельной grad когорте. У меня все либо с PhD, либо где-то заметно поработали, либо ex-founders. Все где-то 25-29 лет.
Dan Okhlopkov - канал
🫃4 года @ffmemesbot 🎂 26 июня 2019 года появился телеграм бот с бесконечной персонализированной лентой мемов под скромным названием Fast Food Memes. 📨 За это время мы отправили 45М мемов для ~60k ценителей юмора со всего света. Команда из ста модераторов…
4х летняя Архитектура @ffmemesbot
После обновления поиска телеги бот начал вирально расти в разных странах и я задумался, что же с ним делать дальше. Но даже если ничего и не делать, текущая реализация нестабильна и полна ужасов.
В основе лежит django-telegram-bot с синхронной ORM и огромном оверхедом по RAM от джанги и селери. Руки чешутся переписать на фастапи, я как раз научился это делать нормально.
Я записываю все просмотры и реакции на мемы в одну большую таблицу Postgres, которая уже больше 50М. Понятно, что есть индексы, но диск пухнет, бот становится медленнее и уже не умещается на микро тачку на Digital Ocean. Покупать еще серверы не хочется, ведь бот не планирует приносить бабосики. С одной стороны, это полезные для анализа данные, с другой — звучит неправильно обрабатывать в риалтайме десятки миллионов строк, чтобы выдать мем. Или нет?
Да и рекомендательная система сейчас простенькая: для каждого мема, паблика (откуда я взял мем) и юзера я считаю попарные статистики в бекграунде, а потом по ним в риалтайме сортирую все непросмотренные юзером мемы. Работает быстро, без какого-либо ML, но хочется больше % лайков. Платить за гпу нет сил. Есть эксперты?
Еще хочется максимизировать виральность бота, но тг не дает стату о перессылке сообщений. Туда даже диплинк нормально не вставишь.
Еще отдельная боль с дублированием мемов. Алгоритм “достать весь текст с картинки и дедублицировать мемы по этому тексту” работал хорошо, но кредиты на GCP давно сказали чао-чао.
Что бы вы могли тут посоветовать? ChatGPT спам боты, к вам тоже этот вопрос.
После обновления поиска телеги бот начал вирально расти в разных странах и я задумался, что же с ним делать дальше. Но даже если ничего и не делать, текущая реализация нестабильна и полна ужасов.
В основе лежит django-telegram-bot с синхронной ORM и огромном оверхедом по RAM от джанги и селери. Руки чешутся переписать на фастапи, я как раз научился это делать нормально.
Я записываю все просмотры и реакции на мемы в одну большую таблицу Postgres, которая уже больше 50М. Понятно, что есть индексы, но диск пухнет, бот становится медленнее и уже не умещается на микро тачку на Digital Ocean. Покупать еще серверы не хочется, ведь бот не планирует приносить бабосики. С одной стороны, это полезные для анализа данные, с другой — звучит неправильно обрабатывать в риалтайме десятки миллионов строк, чтобы выдать мем. Или нет?
Да и рекомендательная система сейчас простенькая: для каждого мема, паблика (откуда я взял мем) и юзера я считаю попарные статистики в бекграунде, а потом по ним в риалтайме сортирую все непросмотренные юзером мемы. Работает быстро, без какого-либо ML, но хочется больше % лайков. Платить за гпу нет сил. Есть эксперты?
Еще хочется максимизировать виральность бота, но тг не дает стату о перессылке сообщений. Туда даже диплинк нормально не вставишь.
Еще отдельная боль с дублированием мемов. Алгоритм “достать весь текст с картинки и дедублицировать мемы по этому тексту” работал хорошо, но кредиты на GCP давно сказали чао-чао.
Что бы вы могли тут посоветовать? ChatGPT спам боты, к вам тоже этот вопрос.