ML-легушька
А ещё я начал читать. Увы, не научную литературу, а всего лишь книжки по Вархаммеру 40к. Я на протяжении нескольких лет сильно по нему угарал, и вот сейчас возобновил. Посмотрел большую часть роликов в рунете на тему, и начал (в самолёте, сейчас продолжаю)…
Я дочитал! За 2.5 дня получается
👍9👎1
Ещё опрос. У меня есть коллега, прекрасный Алексей, с которым мы N раз ходили в бары и прочие питейные места. И хотим создать в долгопе подпольный бар. И на каждой тусовке мне в голову приходит мысль "почему все ещё нет паблика Хуавей отдыхает??? Где мы бы оставляли впечатления и инфу про такие места и тусовки". Так вот: вы бы хотели увидеть канал подобного содержания? Контент там будет не самый регулярный, но красочный. И не только в фитах с Алексеем, но он будет основным гостем во время жизни в мск
🔥7👎1
👎4
Ща админ спалит лицо (в который раз, но давно такого не было)
👎1
Я вчера после душа решил по рофлу сделать фотку, а сейчас мне сказали что я дед инсайд....
🤔12🔥6👎1
Сейчас я буду два часа богемно сидеть в серфе. Что лучше: сделать дз по топологии или продолжить кодить свой поисковый движок?
👎7🔥3
ML-легушька
Сейчас я буду два часа богемно сидеть в серфе. Что лучше: сделать дз по топологии или продолжить кодить свой поисковый движок?
Я придумал как применить в нем то, что мы делаем с Гасниковым, и доволен собой
👎8👍2❤1
А) скиньтесь админу на макбук.
Б) кто знает, как можно быстро лемматизировать слова на питоне? Русские. pystem от яндекса работает слишком медленно
Б) кто знает, как можно быстро лемматизировать слова на питоне? Русские. pystem от яндекса работает слишком медленно
👎26👍4
Кстати. Всем очень советую песню "Нексюша - Итшник". Мне очень понравилось и думаю вам понравится. Ссылка в комментах
👎7🔥2
Чтобы мотивировать себя писать этот движок, теперь каждое воскресенье я буду выделять по два часа на это, и дальше писать пост об этом и о том что зарисерчил
👍7❤4👎1🔥1👏1
#поисковыйдвижок
Итак, сегодня второй день, когда я его переписываю. В первый день столкнулся с проблемой медленной лемматизации текстов, поэтому вместо лемм решил использовать все слово, но с доп.эвристиками. Сейчас я написал на питоне Бор(префиксное дерево), куда можно добавлять слова/тексты, и искать, в каких текстах какой кусок этого слова встречается. Также я придумал, что можно сделать дальше. Планы на следующий раз: 1) сделать ассоциатор - штуку для эффективного получения синонимов слов, также без лемматизации. Оно будет тоже бором, но с другой метадатой к вершинам. 2) попробовать лемматизацию от наташи - когда я давно её брал, она работала быстро, но не очень качественно. 3) возможно, успею сделать сжатие моего бора, так как очевидно, что там будет крайне много вершин, где у вершины ровно 1 сын
Итак, сегодня второй день, когда я его переписываю. В первый день столкнулся с проблемой медленной лемматизации текстов, поэтому вместо лемм решил использовать все слово, но с доп.эвристиками. Сейчас я написал на питоне Бор(префиксное дерево), куда можно добавлять слова/тексты, и искать, в каких текстах какой кусок этого слова встречается. Также я придумал, что можно сделать дальше. Планы на следующий раз: 1) сделать ассоциатор - штуку для эффективного получения синонимов слов, также без лемматизации. Оно будет тоже бором, но с другой метадатой к вершинам. 2) попробовать лемматизацию от наташи - когда я давно её брал, она работала быстро, но не очень качественно. 3) возможно, успею сделать сжатие моего бора, так как очевидно, что там будет крайне много вершин, где у вершины ровно 1 сын
👍6🔥4👎2
#поисковыйдвижок
Сегодня ещё дорабатывал поиск без нейронок. Очень элегантно выразил поиск синонимов в боре через бор, сделанный для обычного поиска. Мне нравится. Много думал, как и что можно повзвешивать и добавить в оценку. Скоро придётся использовать оптимизационные пакеты для безград.оптимизации, чтобы параметры подбирать нужные (с каким весом брать разные эвристики при ранжировании), но это позже. Пока что все и так работает оч быстро, поэтому сжимать бор не буду, подожду. Проверил Наташу - быстро лемматизирует. Кайф. А неточности я поправлю с помощью боров как раз)
Сегодня ещё дорабатывал поиск без нейронок. Очень элегантно выразил поиск синонимов в боре через бор, сделанный для обычного поиска. Мне нравится. Много думал, как и что можно повзвешивать и добавить в оценку. Скоро придётся использовать оптимизационные пакеты для безград.оптимизации, чтобы параметры подбирать нужные (с каким весом брать разные эвристики при ранжировании), но это позже. Пока что все и так работает оч быстро, поэтому сжимать бор не буду, подожду. Проверил Наташу - быстро лемматизирует. Кайф. А неточности я поправлю с помощью боров как раз)
🔥5👎1