Мой хобби-проект - Fast Food Memes bot
Пришло время рассказать про мой хобби проект. Может быть вы слышали про Fast Food Memes бота😄 , который делает Даня. Бот рекомендует мемы в формате тиктока: вы получаете мем и ставите лайк или дальше. Я присоединился к проекту улучшать систему рекомендаций. Мне хотелось пощупать новую задачу и получить опыт с рекомендациями, отличающимися от моей работы в Авито.
Первые неудачи
На момент старта в боте работало несколько алгоритмов, которые основывались на ранжировании по лайк рейту мемов (средний процент лайков). Первоначальной идеей было обучение коллаборативной фильтрации на лайк рейт. Это когда вам рекомендуют мемы, которые понравились пользователям, похожим на вас. Однако этот и другие подходы по оптимизации лайк рейта не дали результата на тестах😕
Причина
Оказалось, пользователи лайкают по-разному и лайк не значит "нравится". Кроме того, в боте есть супер-юзеры, которые смотрят мемы сотнями в день, когда большинство пользователей набирают всего 20-30 мемов. Относительным успехом было небольшое улучшение холодного старта за счет удаления из датасета супер-юзеров.
Как получилось совершить прорыв
В какой-то момент я придумал алгоритм сглаживания лайк рейта. Это позволило увеличить DAU бота на 12%🔝 .
Сглаженный лайк рейт делает поправки на средний лайк рейт юзера. Если юзер постоянно лайкает, его лайк учитывается с маленьким весом. А если лайкает редко, то наоборот с большим. Выглядит несложно (ссылки на код раз два), но нужно было понять куда ударить молоточком👷 и на это у меня ушло достаточно много времени.
💎 Выводы
ML могуч, но просто так не дает эффекта. Нужно глубоко понимать природу данных, поведение пользователей и конечно много смотреть выдачи. Теперь уже можно добавлять в рекомендации коллаборативный движок
Бонус для аналитиков. Я считал статзначимость теста бустрепом. Делюсь ноутбуком, где вы можете посмотреть пример, как это делается. Если будут вопросы, спрашивайте!
#tech
Пришло время рассказать про мой хобби проект. Может быть вы слышали про Fast Food Memes бота
Первые неудачи
На момент старта в боте работало несколько алгоритмов, которые основывались на ранжировании по лайк рейту мемов (средний процент лайков). Первоначальной идеей было обучение коллаборативной фильтрации на лайк рейт. Это когда вам рекомендуют мемы, которые понравились пользователям, похожим на вас. Однако этот и другие подходы по оптимизации лайк рейта не дали результата на тестах
Причина
Оказалось, пользователи лайкают по-разному и лайк не значит "нравится". Кроме того, в боте есть супер-юзеры, которые смотрят мемы сотнями в день, когда большинство пользователей набирают всего 20-30 мемов. Относительным успехом было небольшое улучшение холодного старта за счет удаления из датасета супер-юзеров.
Как получилось совершить прорыв
В какой-то момент я придумал алгоритм сглаживания лайк рейта. Это позволило увеличить DAU бота на 12%
Сглаженный лайк рейт делает поправки на средний лайк рейт юзера. Если юзер постоянно лайкает, его лайк учитывается с маленьким весом. А если лайкает редко, то наоборот с большим. Выглядит несложно (ссылки на код раз два), но нужно было понять куда ударить молоточком👷 и на это у меня ушло достаточно много времени.
ML могуч, но просто так не дает эффекта. Нужно глубоко понимать природу данных, поведение пользователей и конечно много смотреть выдачи. Теперь уже можно добавлять в рекомендации коллаборативный движок
Бонус для аналитиков. Я считал статзначимость теста бустрепом. Делюсь ноутбуком, где вы можете посмотреть пример, как это делается. Если будут вопросы, спрашивайте!
#tech
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍8❤3🤣1
Обратите внимание на НЕмитап, на котором Юля и Женя будут рассказывать про то, как мы запускали продвижение за бюджет. Я тоже приложил руку к этому продукту и могу сказать, что с точки зрения аналитики там очень много инсайтов 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9
Forwarded from Malex | Алексей Малинский
Анонс НЕмитапа по аналитике
В четверг на канале Avito Tech выйдет выпуск НЕмитапа по аналитике, в котором 2 senior data-аналитика из Авито, Юля и Женя, поделятся историей запуска нового продукта продвижения.
Почему стоит посмотреть (лучше онлайн, чтобы задать вопросы, но можно будет и в записи):
👉 Это реальный кейс с большим влиянием на бизнес
👉 Кейс будет про монетизацию, а там частенько непросто с точки зрения аналитики
👉 Юля и Женя - крутые спецы, вы могли слушать их мастер-класс на Aha’24 про traction-модели в продуктах
Подключайтесь - будет интересно!🔥
В четверг на канале Avito Tech выйдет выпуск НЕмитапа по аналитике, в котором 2 senior data-аналитика из Авито, Юля и Женя, поделятся историей запуска нового продукта продвижения.
Почему стоит посмотреть (лучше онлайн, чтобы задать вопросы, но можно будет и в записи):
👉 Это реальный кейс с большим влиянием на бизнес
👉 Кейс будет про монетизацию, а там частенько непросто с точки зрения аналитики
👉 Юля и Женя - крутые спецы, вы могли слушать их мастер-класс на Aha’24 про traction-модели в продуктах
Подключайтесь - будет интересно!🔥
YouTube
НЕмитап Analytics#1 Юлия Голубева и Евгения Мурзаева – Запуск нового продвижения в Авито
Всем привет! Это новый выпуск НЕмитапа. Здесь аналитики Авито рассказывают про инструменты и подходы, которые используют в работе, и отвечают на ваши вопросы.
В этом видео старшие аналитики продукта Женя Мурзаева и Юля Голубева аналитики Монетизации расскажут…
В этом видео старшие аналитики продукта Женя Мурзаева и Юля Голубева аналитики Монетизации расскажут…
🔥6👍1
Инфляция грейдов
В одной статье я прочитал, что на рынке США 2-3 года опыта соответствует junior специалисту, 3-8 middle и только ближе к 10 годам senior. У нас же синьором становятся за 3-4 года.
Сложно сказать в чем главная причина: наличие большого количества локальных компаний и более острая нехватка кадров или сочетание менталитета и быстрорастущей отрасли. Так или иначе то, что мы наблюдаем у нас - это инфляция грейдов.
С точки зрения приносимой пользы есть ли разница между синьором с 4-х и 10-летним опытом?
Зависит от человека. В какой-то момент люди могут упереться потолок своих навыков и календарный опыт не изменит их продуктивность.
Однако в среднем мне кажется, что дополнительный опыт пошел бы 4-х летним синьорам на пользу. На примере DS очень полезен опыт доведения ML не просто до прода, а до значимого влияния на метрики или процессы. Уж больно много сейчас DS-ов хайпует знанием последних моделей, но это не соотносится с реальными задачами на проде. И такой продовый опыт копится по крупицам, потому что большую часть времени ты штурмуешь оффлайн метрики.
Как такой быстрый рост влияет на дальнейший карьерный путь?
Человек становится синьором, а его карьера только началась. Вроде как расти дальше куда-то надо. Поэтому часть компаний вводят дополнительные синьорные грейды: staff и principal. Однако есть две проблемы. Во-первых, такие грейды существуют преимущественно в крупных зрелых компаниях. Во-вторых, если брать DS и аналитику, люди гораздо чаще конвертируются в тимлидов, чем в стаффов. В тимлидах потребность обычно выше. Они тащат орг работу, которой всегда больше, чем людей, способных ее выполнять.
Сохранится ли инфляция грейдов?
Я уверен, что инфляция грейдов это временное явление горизонтом на 5-10 лет вперед, которое связано с быстрым ростом отрасли. Те новые специалисты, которые сейчас выходят на рынок никуда не исчезнут и конкуренция за синьорные позиции будет выше.
С другой стороны есть области, где всегда исторически был быстрый рост, например, консалтинг. Когда я работал в EY, нормальный путь до менеджера считался 4 года, а до партнера 10 лет (хотя именно партнером было стать очень непросто - нужно хорошо продавать).
Но мне все-таки кажется, что инженерные специальности так не работают. Инженерные навыки объективно подтверждаются и быстро расти смогут только самые талантливые.
Что думаете? Есть ли инфляция грейдов? В чем ее причина?
#management
В одной статье я прочитал, что на рынке США 2-3 года опыта соответствует junior специалисту, 3-8 middle и только ближе к 10 годам senior. У нас же синьором становятся за 3-4 года.
Сложно сказать в чем главная причина: наличие большого количества локальных компаний и более острая нехватка кадров или сочетание менталитета и быстрорастущей отрасли. Так или иначе то, что мы наблюдаем у нас - это инфляция грейдов.
С точки зрения приносимой пользы есть ли разница между синьором с 4-х и 10-летним опытом?
Зависит от человека. В какой-то момент люди могут упереться потолок своих навыков и календарный опыт не изменит их продуктивность.
Однако в среднем мне кажется, что дополнительный опыт пошел бы 4-х летним синьорам на пользу. На примере DS очень полезен опыт доведения ML не просто до прода, а до значимого влияния на метрики или процессы. Уж больно много сейчас DS-ов хайпует знанием последних моделей, но это не соотносится с реальными задачами на проде. И такой продовый опыт копится по крупицам, потому что большую часть времени ты штурмуешь оффлайн метрики.
Как такой быстрый рост влияет на дальнейший карьерный путь?
Человек становится синьором, а его карьера только началась. Вроде как расти дальше куда-то надо. Поэтому часть компаний вводят дополнительные синьорные грейды: staff и principal. Однако есть две проблемы. Во-первых, такие грейды существуют преимущественно в крупных зрелых компаниях. Во-вторых, если брать DS и аналитику, люди гораздо чаще конвертируются в тимлидов, чем в стаффов. В тимлидах потребность обычно выше. Они тащат орг работу, которой всегда больше, чем людей, способных ее выполнять.
Сохранится ли инфляция грейдов?
Я уверен, что инфляция грейдов это временное явление горизонтом на 5-10 лет вперед, которое связано с быстрым ростом отрасли. Те новые специалисты, которые сейчас выходят на рынок никуда не исчезнут и конкуренция за синьорные позиции будет выше.
С другой стороны есть области, где всегда исторически был быстрый рост, например, консалтинг. Когда я работал в EY, нормальный путь до менеджера считался 4 года, а до партнера 10 лет (хотя именно партнером было стать очень непросто - нужно хорошо продавать).
Но мне все-таки кажется, что инженерные специальности так не работают. Инженерные навыки объективно подтверждаются и быстро расти смогут только самые талантливые.
Что думаете? Есть ли инфляция грейдов? В чем ее причина?
#management
👍21🤝1
Про новый поход
Прошлую неделю был в отпуске. Мы ходили в поход в районе Красной Поляны (маршрут 8).
Маршрут пересекал горный хребет, поэтому чтобы стартовать пришлось делать огромный крюк: целый день ехать из Сочи на электричках до Майкопа, а потом еще на машине до Псебая. Но это стоило того. Природа просто фантастическая, а маршрут отлично оборудован. Даже туалеты-домики были. Правда еще на маршруте были медведи. Считается, что они безопасные, мы не встретили, но обоснованно переживали (расскажу в комментариях подробнее)
Сегодня-завтра выложу видео в историях, кому интересно, заглядывайте 🙂
Сейчас вернулись в Красную Поляну, неделю поработаю отсюда, а потом может быть еще сходим куда-нибудь на выходных.
#lifestyle
Прошлую неделю был в отпуске. Мы ходили в поход в районе Красной Поляны (маршрут 8).
Маршрут пересекал горный хребет, поэтому чтобы стартовать пришлось делать огромный крюк: целый день ехать из Сочи на электричках до Майкопа, а потом еще на машине до Псебая. Но это стоило того. Природа просто фантастическая, а маршрут отлично оборудован. Даже туалеты-домики были. Правда еще на маршруте были медведи. Считается, что они безопасные, мы не встретили, но обоснованно переживали (расскажу в комментариях подробнее)
Сегодня-завтра выложу видео в историях, кому интересно, заглядывайте 🙂
Сейчас вернулись в Красную Поляну, неделю поработаю отсюда, а потом может быть еще сходим куда-нибудь на выходных.
#lifestyle
🔥25👍5👏1
Forwarded from Ozon Tech
Обсуждаем рекламу в новом выпуске подкаста о ML и DS «Рандомные дрова»🪵
Реклама на маркетплейсе — это в первую очередь внутреннее продвижение, когда продавцы покупают бусты в ранжировании, чтобы показываться на первых местах и получать продажи быстрее.
Но всем ли это нужно? Как ML-модели учитывают конверсию? Какие UX-«махинации» помогают её поднять? И в чём измеряется качество рекламы?
Об этом, а ещё об автоматизации и роли ML в улучшении рекламных продуктов Ван Хачатрян поговорил с гостями из Авито — Егором Самосватом и Александром Ледовским.
🎧 Слушайте на любимой подкаст-платформе
P. S. Кстати, на соревнование E-CUP по ML и DS, о котором говорит Ван, регистрация ещё идёт. Будут реальные задачи нашего бигтеха и призы тоже ощутимые. Успейте зарегистрироваться!
#ozontech_podcast
Реклама на маркетплейсе — это в первую очередь внутреннее продвижение, когда продавцы покупают бусты в ранжировании, чтобы показываться на первых местах и получать продажи быстрее.
Но всем ли это нужно? Как ML-модели учитывают конверсию? Какие UX-«махинации» помогают её поднять? И в чём измеряется качество рекламы?
Об этом, а ещё об автоматизации и роли ML в улучшении рекламных продуктов Ван Хачатрян поговорил с гостями из Авито — Егором Самосватом и Александром Ледовским.
🎧 Слушайте на любимой подкаст-платформе
P. S. Кстати, на соревнование E-CUP по ML и DS, о котором говорит Ван, регистрация ещё идёт. Будут реальные задачи нашего бигтеха и призы тоже ощутимые. Успейте зарегистрироваться!
#ozontech_podcast
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤5👏1
Кофейни - культура стресса
Я люблю заходить в кофейни☕️ . Мне хочется сменить обстановку, почитать, сделать заметки или пообщаться. Но мои поиски причин стресса привели меня к тому, что кофешопы чаще работают в минус, чем в плюс. Сейчас расскажу, что имею в виду.
В модных кофешопах часто играет быстрая музыка. Поверх звенят биперы или кричат «холодный пряничный латте на кокосовом для Светланы». Люди приходят в кофейню за дофамином, т.е. уже не в равновесии. Затем напиваются кофе и становятся перевозбужденными, пряча это за натянутой вежливостью. А те, кто сидит с ноутбуком🧑💻 , приумножают свою тревогу работой.
Вот такой сумасшедший дом получается🚑 . В такой атмосфере вы разгоняетесь и скорее устаете, чем отдыхаете. Я сам давно не работаю в кофейнях, и недавно, когда я посидел несколько часов утром с ноутбуком в хипстерской кофейне в Красной поляне, обнаружил себя в состоянии стресса уже к 11 (хотя по работе вообще не было причин).
Выбивается из нервной тусовки серф кофе, которое построено вокруг расслабленного вайба, но только людей не так просто расслабить.
Понаблюдайте за собой, может быть заметите похожий эффект. Что могу порекомендовать: обращайте внимание на атмосферу, музыку, не садитесь у точки выдачи напитков, не приходите в час пик, будьте готовы взять напиток с собой и посидеть на лавочке на улице в конце концов. Ваша продуктивность и общее состояние в ваших руках🤝
#productivity
Я люблю заходить в кофейни
В модных кофешопах часто играет быстрая музыка. Поверх звенят биперы или кричат «холодный пряничный латте на кокосовом для Светланы». Люди приходят в кофейню за дофамином, т.е. уже не в равновесии. Затем напиваются кофе и становятся перевозбужденными, пряча это за натянутой вежливостью. А те, кто сидит с ноутбуком
Вот такой сумасшедший дом получается
Выбивается из нервной тусовки серф кофе, которое построено вокруг расслабленного вайба, но только людей не так просто расслабить.
Понаблюдайте за собой, может быть заметите похожий эффект. Что могу порекомендовать: обращайте внимание на атмосферу, музыку, не садитесь у точки выдачи напитков, не приходите в час пик, будьте готовы взять напиток с собой и посидеть на лавочке на улице в конце концов. Ваша продуктивность и общее состояние в ваших руках
#productivity
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29❤9🔥1
Почему российские видео площадки не дают трафик
На этой неделе я готовил научную статью 🧑🔬 на крупную конференцию про баланс справедливости и эффективности рекламных систем. Про статью еще рано писать, впереди процесс ревью. Но тема навела меня на мысли о ситуации с замедлением ютуба.
Я неоднократно видел, что крупные ютуберы жалуются, что российские видео площадки, такие как рутуб и вк видео, не дают трафика.
Сперва у меня возникла гениальная идея💡 , что ютуб большую часть трафика отдает крупным каналам. Я иной раз удивляюсь как сложно выйти из замкнутого круга небольшого количества каналов и найти контент небольших блогеров.
А теперь представим себя на месте абстрактных инженеров видео площадки. Вы стараетесь сделать рекомендации разнообразными и справедливыми, боретесь с кликбейтами. И получается, что крупному каналу уже не так просто получать дешевый трафик. Крупные блогеры расстраиваться и начинают жаловаться. Но реальность оказалось другой🙂
Я решил немного попользоваться рутубом и вк видео. Я искал контент в поиске по интересующим меня областям: машинное обучение, инструменты продуктивности, ufc, разные виды спорта, походы, компьютерные игры и ряд других тем.
Низкое качество выдач меня конечно🤯 удивило
⁃ Часто выдачу заполоняет один и тот же канал
⁃ В топе много несвежих низкокачественных видео
⁃ Каналы с хорошим контентом, которые успешны на ютубе, действительно не выходят в поиске
⁃ Прямой поиск каналов с ютуба работает, хоть и плохо, но и тут выдача очень странная. Возможно из-за нехватки статистики
В общем, дело не в справедливости и у площадок есть серьезная проблема с контентом и его поиском. До рекомендаций я пока не дошел, т.к. моих моральных сил😕 пока не хватило, чтобы накопить историю просмотров на площадках.
💎 Как вы думаете, что нужно сделать в алгоритмах, чтобы улучшить качество? Довольны ли вы поиском и рекомендациям ютуба?
PS. Но в текущей ситуации есть однозначный плюс. Дата сайнтисты без работы не останутся!
#tech
На этой неделе я готовил научную статью 🧑🔬 на крупную конференцию про баланс справедливости и эффективности рекламных систем. Про статью еще рано писать, впереди процесс ревью. Но тема навела меня на мысли о ситуации с замедлением ютуба.
Я неоднократно видел, что крупные ютуберы жалуются, что российские видео площадки, такие как рутуб и вк видео, не дают трафика.
Сперва у меня возникла гениальная идея
А теперь представим себя на месте абстрактных инженеров видео площадки. Вы стараетесь сделать рекомендации разнообразными и справедливыми, боретесь с кликбейтами. И получается, что крупному каналу уже не так просто получать дешевый трафик. Крупные блогеры расстраиваться и начинают жаловаться. Но реальность оказалось другой
Я решил немного попользоваться рутубом и вк видео. Я искал контент в поиске по интересующим меня областям: машинное обучение, инструменты продуктивности, ufc, разные виды спорта, походы, компьютерные игры и ряд других тем.
Низкое качество выдач меня конечно
⁃ Часто выдачу заполоняет один и тот же канал
⁃ В топе много несвежих низкокачественных видео
⁃ Каналы с хорошим контентом, которые успешны на ютубе, действительно не выходят в поиске
⁃ Прямой поиск каналов с ютуба работает, хоть и плохо, но и тут выдача очень странная. Возможно из-за нехватки статистики
В общем, дело не в справедливости и у площадок есть серьезная проблема с контентом и его поиском. До рекомендаций я пока не дошел, т.к. моих моральных сил
PS. Но в текущей ситуации есть однозначный плюс. Дата сайнтисты без работы не останутся!
#tech
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14😁10👎1🤔1😐1🤝1
Forwarded from Malex | Алексей Малинский
This media is not supported in your browser
VIEW IN TELEGRAM
У меня нет инстаграма, а потому вот такие рилсы мне подгоняет Катя)
но это очень смешно😀
но это очень смешно😀
😁28
Есть у меня несколько любимых философских анекдотов. Один из них про Зоркого Сокола и тюремную стену.
Оригиналприводить не буду, если интересно спросите в каментах. Зато приведу его вариацию на актуальную тему
Оригинал
Сидит Дуров и другие зеки в тюрьме во Франции. Обсуждают побег. Первый зек говорит:
- Давайте так, я вырубаю охранника, Жак хватает автомат и валим охрану!
- Бред это всё, Решар! Нужно найти где-то плотные ковры и перелезть через колючую проволоку посреди ночи! Павел, ты что думаешь?
- Хм...
На следующий день просыпается охрана тюрьмы, зеков в камерах нет. Выходят на улицу. Стена тюрьмы исчезла.
😁20😢3🤔1🤷1
Почему Jupyter ноутбукам придет замена
Jupyter ноутбуки внесли огромный вклад в развитие data science. Работа с данными и ML моделями стала доступна людям, имеющим самые базовые навыки программирования. Однако при этом они остаются достаточно кустарным инструментом с пачкой недостатков.
Не вдаваясь в подробный разбор, я хочу поделиться, чем мне не нравятся ноутбуки как техническому менеджеру, который их много читает
- Ноутбуки все-таки сложны для восприятия. Даже если вычищать ноутбуки, в них все равно копится лишний код и выводы. Графики, печатаемые в столбик, занимают очень много места.
- Проверять ноутбуки непросто. Специальных линтеров (проверщиков стиля) нет. Инструментов ревью в системе контроля версий из коробки нет (не из коробки есть, но они пока не прижились на практике).
- Визуализация не закрывает всех потребностей. Таблицы проигрывают экселю и его аналогам. Из коробки очень сложно добавлять фильтры и красить произвольные ячейки в цвет. У интерактивных элементов проблемы с рендерингом после заливки в гит.
Что по конкурентам
Проигравший конкурент ноутбуков - это формат, где на пол-экрана скрипт с кодом, а на пол-экрана отдельное окно вывода. Работать в нем пожалуй даже удобнее, но делиться работой😳 плохо: выводы в отдельных файлах, а это могут десятки/сотни таблиц и графиков.
Какое-то время развивались🤪 low-code системы. Это когда вы программируете квадратиками: либо пользуетесь готовыми, либо пишете квадратик со своим кодом. В чистом виде такие системы провалились (например, Azure ML). А Нирвана Яндекса и Kubeflow все-таки не альтернатива ноутбукам.
С точки зрения визуализации есть очень интересный похожий на Jupyter инструмент - это Observable. Обычного кода там нет, только sql запросы и код графиков. Очень советую посмотреть. Мне кажется, что визуальная часть ноутбуков должна выглядеть как-то так. Но проблема Observable, что он исключительно облачный, платный и 🔒 закрытый. Т.е. в гит вы их ноутбуки не положите.
💎 Итого, у текущих Jupyter ноутбуков серьезных конкурентов нет. Это действительно удачный формат. Поэтому я прогнозирую, что новым шагом в развитии будут тоже ноутбуки, только лучше. Скорее всего их сделает какая-нибудь big tech компания.
Там будет хорошая визуализация из коробки, открытый код, удобное ревью и шеринг. Может быть это будут два файла: код и визуальный ноутбук, которые связаны друг с другом. А может быть как и раньше один.
Если вы знаете хорошие инструменты для ноутбуков или их альтернативу, которые решают описанные проблемы, расскажите в комментариях!
—
#tech
🔜 Читайте также
Почему у статистики не лучшие времени
Как я улучшал бота, рекомендующего мемы
Инфляция грейдов
Jupyter ноутбуки внесли огромный вклад в развитие data science. Работа с данными и ML моделями стала доступна людям, имеющим самые базовые навыки программирования. Однако при этом они остаются достаточно кустарным инструментом с пачкой недостатков.
Для справки. Ноутбук - это такой большой файл, где подряд идет текст, код и его вывод, в том числе графики. Выглядит он как-то так. Активно используется дата сайнтистами и дата аналитиками
Не вдаваясь в подробный разбор, я хочу поделиться, чем мне не нравятся ноутбуки как техническому менеджеру, который их много читает
- Ноутбуки все-таки сложны для восприятия. Даже если вычищать ноутбуки, в них все равно копится лишний код и выводы. Графики, печатаемые в столбик, занимают очень много места.
- Проверять ноутбуки непросто. Специальных линтеров (проверщиков стиля) нет. Инструментов ревью в системе контроля версий из коробки нет (не из коробки есть, но они пока не прижились на практике).
- Визуализация не закрывает всех потребностей. Таблицы проигрывают экселю и его аналогам. Из коробки очень сложно добавлять фильтры и красить произвольные ячейки в цвет. У интерактивных элементов проблемы с рендерингом после заливки в гит.
Что по конкурентам
Проигравший конкурент ноутбуков - это формат, где на пол-экрана скрипт с кодом, а на пол-экрана отдельное окно вывода. Работать в нем пожалуй даже удобнее, но делиться работой
Какое-то время развивались
С точки зрения визуализации есть очень интересный похожий на Jupyter инструмент - это Observable. Обычного кода там нет, только sql запросы и код графиков. Очень советую посмотреть. Мне кажется, что визуальная часть ноутбуков должна выглядеть как-то так. Но проблема Observable, что он исключительно облачный, платный и 🔒 закрытый. Т.е. в гит вы их ноутбуки не положите.
Там будет хорошая визуализация из коробки, открытый код, удобное ревью и шеринг. Может быть это будут два файла: код и визуальный ноутбук, которые связаны друг с другом. А может быть как и раньше один.
Если вы знаете хорошие инструменты для ноутбуков или их альтернативу, которые решают описанные проблемы, расскажите в комментариях!
—
#tech
Почему у статистики не лучшие времени
Как я улучшал бота, рекомендующего мемы
Инфляция грейдов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14
Года два я занимаюсь раздельным сбором мусора. Для морального удовлетворения, и потому что это входит в концепцию осознанного потребления, которая мне близка 💎
Пока я был в Красной поляне с удивлением обнаружил, насколько сортировка входит в привычку. Хотя сдавать вторсырье там было некуда, я все равно на автомате мыл и разделял бутылки, контейнеры и банки🤷♂️
Читайте также
Предыдущий пост про сбор вторсырья
#lifestyle
Пока я был в Красной поляне с удивлением обнаружил, насколько сортировка входит в привычку. Хотя сдавать вторсырье там было некуда, я все равно на автомате мыл и разделял бутылки, контейнеры и банки
Читайте также
Предыдущий пост про сбор вторсырья
#lifestyle
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18👏2💩1
Что происходит
Всем привет! Сейчас у меня период довольно высокой загрузки, поэтому тематического контента не будет, и я просто поделюсь что происходит.
Во-первых, на работе у нас активная стадия разработки нового продукта продвижения. Когда что-то появится в открытых источниках, я обязательно об этом расскажу.
Кроме этого, сижу над новой итерацией рекомендаций в fast food memes боте. Цель этой итерации - выкатить коллаборативную модель на прод и показать аплифт метрик. Задача на самом деле не легкая. В исследовательской части обучение втупую не дает хороших результатов. А еще нужно сделать хорошее смешивание разных движков и закодить инфру получения кандидатов.
С точки зрения контента я работаю над статьей про LogSeq. LogSeq - это графовая система ведения заметок (см. пост Приложение для заметок, которое вас удивит). Я пользуюсь приложением уже больше года и много чему научился. Статья - мой ответ на вопрос нужен ли вам LogSeq и как им правильно пользоваться. Черновик статьи уже написан, планирую ее выпустить на следующей неделе.
❓ Кстати, я решил публиковаться на Вастрике, т.к. мне кажется, что там довольно много целевой аудитории. Что думаете? Где лучше публиковать статьи на тему продуктивности?
Всем привет! Сейчас у меня период довольно высокой загрузки, поэтому тематического контента не будет, и я просто поделюсь что происходит.
Во-первых, на работе у нас активная стадия разработки нового продукта продвижения. Когда что-то появится в открытых источниках, я обязательно об этом расскажу.
Кроме этого, сижу над новой итерацией рекомендаций в fast food memes боте. Цель этой итерации - выкатить коллаборативную модель на прод и показать аплифт метрик. Задача на самом деле не легкая. В исследовательской части обучение втупую не дает хороших результатов. А еще нужно сделать хорошее смешивание разных движков и закодить инфру получения кандидатов.
С точки зрения контента я работаю над статьей про LogSeq. LogSeq - это графовая система ведения заметок (см. пост Приложение для заметок, которое вас удивит). Я пользуюсь приложением уже больше года и много чему научился. Статья - мой ответ на вопрос нужен ли вам LogSeq и как им правильно пользоваться. Черновик статьи уже написан, планирую ее выпустить на следующей неделе.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍7❤1🤡1
Гайд по LogSeq: персональная система управления знаниями
Закончил работу над гайдом по LogSeq🚀 Он рассказывает, как правильно пользоваться приложением. Кажется, это единственный на данный момент гайд на русском языке именно про методику работы. Все, что я смог найти - это обзоры функционала.
LogSeq - приложение для ведения заметок, основанное на графовом подходе. В нем из коробки поддерживаются разные техники работы со знаниями, такие как журналирование, конспектирование и наработка собственных идей🧠 . В гайде я предлагаю подход, как постепенно их освоить.
Гайд по LogSeq - освоение ключевых методик ведения вашей системы заметок [Продуктивность] — Вастрик.Клуб 🤘✖️👩💻
#productivity
Закончил работу над гайдом по LogSeq
LogSeq - приложение для ведения заметок, основанное на графовом подходе. В нем из коробки поддерживаются разные техники работы со знаниями, такие как журналирование, конспектирование и наработка собственных идей
Гайд по LogSeq - освоение ключевых методик ведения вашей системы заметок [Продуктивность] — Вастрик.Клуб 🤘✖️👩💻
#productivity
Please open Telegram to view this post
VIEW IN TELEGRAM
Вастрик.Клуб
Гайд по LogSeq - освоение ключевых методик ведения вашей системы заметок — Вастрик.Клуб
LogSeq - это приложение для ведения заметок, реализованное в виде графовой базы знаний. Я перешел на LogSeq больше года назад и был очарован графовым…
🔥16💯7👍2✍1
Впечатления с PracticalML 24
Кажется совсем недавно прошел DataFest🦜 (на котором я делал доклад про CTR модели). И вот активно начался осенний сезон конференций. В русскоязычном DS сообществе конференции исторически занимают особое место, но это тема отдельного рассказа. Вчера с коллегами мы ходили на конференцию Яндекса PracticalML, о котором этот пост.
Ожидания. Изначально посмотрев программу мне показалось, что конференция слабее, чем в прошлом году. Уж как-то не хватало на ней представленности различных компаний и даже сервисов самого Яндекса. И треков было мало (2 трека докладов и 1 трек практических занятий), и начиналось все только в час дня.
Впечатления от докладов. Но по факту конференция оказалось очень хорошей. Доклады были интересные. Сперва мы послушали про инфраструктуру для ML моделей и про рекомендательные системы. Приз лучшего доклада по моей версии - рекомендации незнакомого в Я.Музыке. После докладов мы пошли пошли к Мише Каменьщикову на практическое занятие, чтобы научиться тестировать алгоритмы векторного поиска.
Впечатления от афтепати. И при этом остались силы на общение и афтепати. А что-что, афтепати на PracticalML лучшая, чем где-либо еще🍷 . Как и в прошлой раз, организаторы не поскупились на алкоголь, был даже бар, где смешивали коктейли. Мы как-то естественным образом нашлись ребятами из разных компаний, которые занимаются рекламой. Как всегда начались жаркие обсуждения какой аукцион лучше и что такое справедливость 😄 (конечно, с подачи Леши Ш).
В общем время прошло очень душевно.
#worklife
🔜 Читайте также
Впечатления с PracticalML 23
Кажется совсем недавно прошел DataFest
Ожидания. Изначально посмотрев программу мне показалось, что конференция слабее, чем в прошлом году. Уж как-то не хватало на ней представленности различных компаний и даже сервисов самого Яндекса. И треков было мало (2 трека докладов и 1 трек практических занятий), и начиналось все только в час дня.
Впечатления от докладов. Но по факту конференция оказалось очень хорошей. Доклады были интересные. Сперва мы послушали про инфраструктуру для ML моделей и про рекомендательные системы. Приз лучшего доклада по моей версии - рекомендации незнакомого в Я.Музыке. После докладов мы пошли пошли к Мише Каменьщикову на практическое занятие, чтобы научиться тестировать алгоритмы векторного поиска.
Впечатления от афтепати. И при этом остались силы на общение и афтепати. А что-что, афтепати на PracticalML лучшая, чем где-либо еще
В общем время прошло очень душевно.
#worklife
Впечатления с PracticalML 23
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥4