Одно из моих последних увлечений - шахтматишки. Прям затянуло...
Интересный факт из моей жизни- я занимался шашками и шахматами, а по шашкам имел 1 взр разряд, почти выполнил КМС)
Сейчас и дебюты шашечные забыл (да, они там есть), и композиции плохо решаю, но доску вижу неплохо -> шахматный рейтинг апаю живенько.
Пишу этот пост сразу после симпатишного мата, наслаждайтесь ♥️
Интересный факт из моей жизни- я занимался шашками и шахматами, а по шашкам имел 1 взр разряд, почти выполнил КМС)
Сейчас и дебюты шашечные забыл (да, они там есть), и композиции плохо решаю, но доску вижу неплохо -> шахматный рейтинг апаю живенько.
Пишу этот пост сразу после симпатишного мата, наслаждайтесь ♥️
🔥8
#Хакатоны
Итак, информативных постов не выходило уже давно и повод появился сам собой. Имели неосторожность с командой наступить на старые грабли и пойти на Codnrock "Picture Predictor" просто ради диплома
Сорева длится месяц, отложили по классике на последние 3 дня и взяли новичка в команду. Казалось, проблем возникнуть не должно, казалось....
Предыстория: есть картинки, сгенеренные по тексту. Есть модель№1, которая переводит этот текст в эмбеддинг. Нужно обучить модель по картинке генерировать такой же эмбеддинг. То есть, на вход даётся картинка, на выходе нужно выдать эмбеддинг. В трейн-датасете есть пары текст-картинка и участник должен сам взять модель№1 которую юзают орги, сгенерировать по тексту эмбеддинг и обучить модель№2 строить по картинке такой же эмбеддинг (метрика косинусное расстояние)
Вот только незадача, модель№1 при скачивании с huggingface часть слоев инициализирует с рандомными весами, а орги рандом сид не предоставили. Более того, когда мы спросили, какой рандом сид, нас тупо игнорили сутки, а затем выяснилось, что орги его и не ставили. То есть таргет оказался тупо невоспроизводимым, потому что орги генерили его моделью с рандомными весами.
Более тупого и бездарного подхода в организации я не встречал. Казалось бы, прогони модель два раза, она выдаст два абсолютно разных результата и ты поймешь, что с этой моделью что-то не так. Кроме того, если под конец соревы максимальный скор в лидерборде 0.08, то явно что-то идет не по плану. Но видимо на коденроке уже давно забили на хоть какую-то серьезность в организации мероприятий, теперь их штампуют на отъе*ись.
Я уж молчу про то, что в качестве решения надо грузить модель и прогоняется она на серваке с 0ГБ Gpu и 8ГБ RAM. Клоунада одним словом
Потраченного времени жаль(
Итак, информативных постов не выходило уже давно и повод появился сам собой. Имели неосторожность с командой наступить на старые грабли и пойти на Codnrock "Picture Predictor" просто ради диплома
Сорева длится месяц, отложили по классике на последние 3 дня и взяли новичка в команду. Казалось, проблем возникнуть не должно, казалось....
Предыстория: есть картинки, сгенеренные по тексту. Есть модель№1, которая переводит этот текст в эмбеддинг. Нужно обучить модель по картинке генерировать такой же эмбеддинг. То есть, на вход даётся картинка, на выходе нужно выдать эмбеддинг. В трейн-датасете есть пары текст-картинка и участник должен сам взять модель№1 которую юзают орги, сгенерировать по тексту эмбеддинг и обучить модель№2 строить по картинке такой же эмбеддинг (метрика косинусное расстояние)
Вот только незадача, модель№1 при скачивании с huggingface часть слоев инициализирует с рандомными весами, а орги рандом сид не предоставили. Более того, когда мы спросили, какой рандом сид, нас тупо игнорили сутки, а затем выяснилось, что орги его и не ставили. То есть таргет оказался тупо невоспроизводимым, потому что орги генерили его моделью с рандомными весами.
Более тупого и бездарного подхода в организации я не встречал. Казалось бы, прогони модель два раза, она выдаст два абсолютно разных результата и ты поймешь, что с этой моделью что-то не так. Кроме того, если под конец соревы максимальный скор в лидерборде 0.08, то явно что-то идет не по плану. Но видимо на коденроке уже давно забили на хоть какую-то серьезность в организации мероприятий, теперь их штампуют на отъе*ись.
Я уж молчу про то, что в качестве решения надо грузить модель и прогоняется она на серваке с 0ГБ Gpu и 8ГБ RAM. Клоунада одним словом
Потраченного времени жаль(
😢7
Сегодня прочитал такую прекрасную фразу:
...Делай сегодня то, что другие не хотят, завтра будешь жить так, как другие не могут.
Сегодня первый день в ВУЗе. Работал с 9 утра из библиотеки МИСИСа, потом пошел на встречу с куратором. Затем опять работал, а после решали МЛ задачу с командой. Первая наша встреча за два месяца, после нее, уже вечером, еле-еле дошел до Шоколадницы и по дороге каждое второе лицо в вузе и рядом с ним было знакомым- все пахари, победители олимп, хакатонов и тп
К чему я это? Победы - это результат упорного труда и тяжелой борьбы. Хотите жить так, как другие не могут? - Делайте то, что другие не хотят
...Делай сегодня то, что другие не хотят, завтра будешь жить так, как другие не могут.
Сегодня первый день в ВУЗе. Работал с 9 утра из библиотеки МИСИСа, потом пошел на встречу с куратором. Затем опять работал, а после решали МЛ задачу с командой. Первая наша встреча за два месяца, после нее, уже вечером, еле-еле дошел до Шоколадницы и по дороге каждое второе лицо в вузе и рядом с ним было знакомым- все пахари, победители олимп, хакатонов и тп
К чему я это? Победы - это результат упорного труда и тяжелой борьбы. Хотите жить так, как другие не могут? - Делайте то, что другие не хотят
🔥13❤2👍1
Внимание, новички в МЛ! Так как сейчас начинается учебный год, на канал подписываются перваки и юные таланты хотят в дата сайнс, то завтра напишу пост про то, что помогло мне вкатиться с полного нуля
Буду рад, если поделитесь. Это лучшая благодарность♥️
Буду рад, если поделитесь. Это лучшая благодарность♥️
❤11👎6😱2
Признаюсь, попыток подступиться к МЛ было несколько, и получилось только раза с третьего.
Небольшое лирическое отступление: я честно не понимаю, зачем новички МЛ ждут полгода курс, за который будет даваться диплом, если есть 100500 бездипломных курсов, которые можно стартовать прямо сейчас. Диплом вам ничем не поможет, в отличие от хорошего соревновательного/проектного портфолио. Не тратьте время, ботайте, забудьте про дипломы; если они вам все-таки понадобятся, потом быстро пройдете какой-то курсик, потому что это уже не будет для вас проблемой
Так вот, мне невероятно зашла книга "питон для сложных задач", она как раз про старт в МЛ. Имхо, книга - это лучший старт, потому что читая, мы запоминаем намного больше информации, нежели слушая. Кроме того для этой книги написан репозиторий со всеми примерами и задачами. Отличная экспертиза и, что редкость, очень качественный перевод.
Ну и, логично, никто не даст вам диплом за прочтение. Но, в моем понимании, она идеальна для старта, потому что в ней есть всë. На примерах и достаточно подробно. Pandas, numpy, matplotlib, seaborn, sklearn - это фундаментальные либы, которые очень легко забываются из-за нереально огромного количества функций. Например, я очень часто вижу, что люди применяют лямбда-функции через apply, не зная или забыв о методах .str для объектов pd.Series.
Другие материалы для старта можно найти в закрепе. В будущих постах также планирую поподробнее рассказать про другие ссылки из закрепа - будет интересно 😉
Вобщем, пользуйтесь :)
P.s. в ближайшее время посты будут насыщенными, т.к. админ идет на цифровой прорыв🤩
#ИсторияАдмина
Небольшое лирическое отступление: я честно не понимаю, зачем новички МЛ ждут полгода курс, за который будет даваться диплом, если есть 100500 бездипломных курсов, которые можно стартовать прямо сейчас. Диплом вам ничем не поможет, в отличие от хорошего соревновательного/проектного портфолио. Не тратьте время, ботайте, забудьте про дипломы; если они вам все-таки понадобятся, потом быстро пройдете какой-то курсик, потому что это уже не будет для вас проблемой
Так вот, мне невероятно зашла книга "питон для сложных задач", она как раз про старт в МЛ. Имхо, книга - это лучший старт, потому что читая, мы запоминаем намного больше информации, нежели слушая. Кроме того для этой книги написан репозиторий со всеми примерами и задачами. Отличная экспертиза и, что редкость, очень качественный перевод.
Ну и, логично, никто не даст вам диплом за прочтение. Но, в моем понимании, она идеальна для старта, потому что в ней есть всë. На примерах и достаточно подробно. Pandas, numpy, matplotlib, seaborn, sklearn - это фундаментальные либы, которые очень легко забываются из-за нереально огромного количества функций. Например, я очень часто вижу, что люди применяют лямбда-функции через apply, не зная или забыв о методах .str для объектов pd.Series.
Другие материалы для старта можно найти в закрепе. В будущих постах также планирую поподробнее рассказать про другие ссылки из закрепа - будет интересно 😉
Вобщем, пользуйтесь :)
P.s. в ближайшее время посты будут насыщенными, т.к. админ идет на цифровой прорыв🤩
#ИсторияАдмина
❤7👍1
Да уж, забориста задача на цифровом прорыве.
Голосовой помощник машиниста, РЖД
Админ еще и приболел, так что капельница чай+сахар+лимон стоит прямо напротив рабочего стола.
Не хакатоньте поцаны.... 🥲
Голосовой помощник машиниста, РЖД
Админ еще и приболел, так что капельница чай+сахар+лимон стоит прямо напротив рабочего стола.
Не хакатоньте поцаны.... 🥲
😢9
Всем привет! Давно ничего не писал, но это потому что сегодня отмечаю 10 день какой-то необъяснимой слабости, все никак на ноги не могу себя поставить и сил хватает только на рабочие и вузовские задачи.
Посты хочется писать на свежую голову............
Ну, во всяком случае, тема с ЦП, наверное, уже остыла. Про паплайн и фичи можно послушать в моем питче выше. Лучше расскажу про мои мысли в целом о ЦП.
Стоит сказать, что всё касающееся самой организации цифрового прорыва - на высшем уровне. Работа трекеров, трансляции, чек-поинты и тп.... То что вызывает всеобщую истерику - это организация кейсов, что по части самих команд (компаний), которые эти кейсы представляют.
Лирическое отступление: на этом всероссийском ЦП орги решили не париться по поводу метрик и тестового датасета, и сказали командам собрать свои тестовые данные и на них же оценивать модель. Отсюда и половина скоров на защите были под 100% (мы честные, у нас 92% аккураси). И эти метрики учитывались при оценке команды, вобщем цирк.
К чему я веду: ВК, РЖД, Самолет, Рутуб и куча других компаний - это ведь не последние организации, и каждая из них (вернее их эксперты) порола лютую дичь в своих кейсах. Думайте сами, решайте сами, но это, на мой взгляд, отчасти объясняет высокий спрос на рукастых айтишников :)
Всем добра, это последний пост про ЦП на этом канале ❤️
Посты хочется писать на свежую голову............
Ну, во всяком случае, тема с ЦП, наверное, уже остыла. Про паплайн и фичи можно послушать в моем питче выше. Лучше расскажу про мои мысли в целом о ЦП.
Стоит сказать, что всё касающееся самой организации цифрового прорыва - на высшем уровне. Работа трекеров, трансляции, чек-поинты и тп.... То что вызывает всеобщую истерику - это организация кейсов, что по части самих команд (компаний), которые эти кейсы представляют.
Лирическое отступление: на этом всероссийском ЦП орги решили не париться по поводу метрик и тестового датасета, и сказали командам собрать свои тестовые данные и на них же оценивать модель. Отсюда и половина скоров на защите были под 100% (мы честные, у нас 92% аккураси). И эти метрики учитывались при оценке команды, вобщем цирк.
К чему я веду: ВК, РЖД, Самолет, Рутуб и куча других компаний - это ведь не последние организации, и каждая из них (вернее их эксперты) порола лютую дичь в своих кейсах. Думайте сами, решайте сами, но это, на мой взгляд, отчасти объясняет высокий спрос на рукастых айтишников :)
Всем добра, это последний пост про ЦП на этом канале ❤️
❤6
Итак, новая рубрика: #ИсторияАдмина
Полгода назад я мучался с установкой докера (а вместе с ним всл и убунту) на винду. Мучался - это слабо сказано. Суть в том, что должно быть всё как на картинке, но что-то одно у меня всегда было Stopped вместо Running. Отмучавшись, я забыл про эти 2 дня ада аж на целых полгода.
И вот сегодня у меня сдохло всё: вижла, докер, всл... Переустановил интерпретатор, снес вижлу, докер, убунту с всл, ну вобщем было больно. Упражнения начались в 9 утра и кончились 10 минут назад. Мораль сей басни:
1. Не удаляйте докер через ПКМ и "удалить", всё через uninstall
2. Создавайте виртуальные окружения
3. Не захламляйте воркспейс
В один день всё рухнет и будет очень больно
Всё, пошел пилить бота ВК
Полгода назад я мучался с установкой докера (а вместе с ним всл и убунту) на винду. Мучался - это слабо сказано. Суть в том, что должно быть всё как на картинке, но что-то одно у меня всегда было Stopped вместо Running. Отмучавшись, я забыл про эти 2 дня ада аж на целых полгода.
И вот сегодня у меня сдохло всё: вижла, докер, всл... Переустановил интерпретатор, снес вижлу, докер, убунту с всл, ну вобщем было больно. Упражнения начались в 9 утра и кончились 10 минут назад. Мораль сей басни:
1. Не удаляйте докер через ПКМ и "удалить", всё через uninstall
2. Создавайте виртуальные окружения
3. Не захламляйте воркспейс
В один день всё рухнет и будет очень больно
Всё, пошел пилить бота ВК
👍7❤1