Forwarded from От идеи до продукта B2B & B2C | Виктор Чертков (Viktor Chertkov)
Нет не реклама, просто сам активно стал использовать и открыл для себя много новых моделей. Еще и большинство бесплатных
Недавно нашел ресурс — Artificial Analysis. Это библиотека актуальных AI-моделей, где можно не просто смотреть, но и выбирать те, которые реально подходят под конкретные задачи.
Что круто:
Я уже добавил в свою работу несколько инструментов, которые сильно ускорили процессы анализа и проверки гипотез. За счет этого:
Если вы работаете с данными, гипотезами или просто ищете способы прокачать свою продуктивность — загляните. Инструменты ИИ должны работать на вас, а не наоборот.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Глеб Михайлов
Что бы я делал по-другому, работая в IT?
1. Больше бы общался с людьми.
Когда я только начал работать, я вел себя на работе очень замкнуто. Ни с кем не сближался. А это одна из главных фич работы (и жизни)!
Это как еще одни одноклассники и одногруппники! И среди них можно найти друзей, мужа/жену, будущих бизнес-партнеров, менторов.
И просто это фан. Насколько приятнее мне стало ходить на работу, когда я начал больше общаться с людьми. И насколько быстрее стали пролетать "тяжелые" будни.
***
2. Чаще бы менял работу, чтобы получать больше денег.
Всю карьеру я считал, что надо хотя бы год работать на одном месте, чтобы потом не было проблем с поиском работы.
По факту, на 3 из 6 моих офисных работ я работал меньше года, и с моей карьерой ничего страшного не случилось. Только рост в зарплате и в скилах).
***
3. Больше бы отказывался от задач и встреч.
В корпоративной жизни очень большое количество задач и встреч абсолютно бесполезны. Как минимум, они не так важны и срочны, как их преподносят.
И если спорить с начальником – это обычно непродуктивно, то предложить более легкую альтернативу или более комфортный срок – это всегда уместно.
Со встречами еще легче: можно просто не принимать их. И если никто не напишет, значит, я там особо не нужен.
Ну и, конечно, ставить заглушки на обед и на время после 18:00. Заглушки лучше всего делать с небольшим буфером 15-30 минут в обе стороны, чтобы встречи впритык к обеду не ставили – это неудобно, т.к. обед превращается в суету.
Отстаивать свои личные границы не просто, и это не раз приводило меня к конфликтам и увольнениям. Но это того стоило).
***
4. Более открыто бы занимался обучением на работе.
Я всегда боялся читать книги, проходить курсы и делать свои проекты на работе. Ведь на работе надо работать!
Но рабочий день слишком длинный, столько задач нет. Если всё делать эффективно, то рабочие задачи можно раскидать за 2-3 часа в день, а остальное время заниматься своим развитием.
И если кто-то задает вопросы, можно ответить, что ты повышаешь свою квалификацию, и это полезно для компании.
И еще неочевидный факт: когда ты сидишь и учишься, то со стороны это ничем не отличается от того, что ты сидишь и работаешь))).
***
5. Больше бы вкладывался в маркетинг и продажи.
Профессиональные скиллы – это круто. Но успех в карьере зависит не от них!
Профессиональные скиллы – это, по сути, тривиально. Они просто должны быть на приличном уровне.
Поэтому при наличии минимальных профессиональных скиллов, достаточных для работы, гораздо выгоднее вкладываться в маркетинг и продажи.
Маркетинг: резюме, портфолио, личный бренд.
Продажи: умение продавать себя, умение проходить технические интервью, умение договариваться.
Если ты выгодно продаешь свои скиллы, то получаешь лучшее финансирование своего развития и жизни, больше времени на своё развитие, заряженных людей вокруг и вообще более интересный опыт.
А ещё ты не боишься, что тебя уволят или сократят и чувствуешь себя уверенно: ну уволят и хорошо – я умею продавать себя и быстро найду себе работу еще лучше!
***
Кстати, если хочешь прокачать центровой навык продаж в мире IT – умение проходить технические и алгоритмические интервью, то сейчас полным ходом идет набор в 8-й поток моего курса по алгоритмам и структурам данных (старт потока 3 февраля).
Этот курс выбрало уже 189 человек, а студенты и выпускники моего курса проходят интервью в топовые компании. Это значит, что мой курс уже стал проверенным временем и реальным миром продуктом, который сможет довести тебя до результата.
Хочешь выгодно продать свои скиллы? Переходи в бот и узнай, как научиться писать эффективный код, проходить алгоритмические интервью и стать высокооплачиваемым профессионалом без мучений и выгорания, даже если сейчас ты еле-еле кодишь!
1. Больше бы общался с людьми.
Когда я только начал работать, я вел себя на работе очень замкнуто. Ни с кем не сближался. А это одна из главных фич работы (и жизни)!
Это как еще одни одноклассники и одногруппники! И среди них можно найти друзей, мужа/жену, будущих бизнес-партнеров, менторов.
И просто это фан. Насколько приятнее мне стало ходить на работу, когда я начал больше общаться с людьми. И насколько быстрее стали пролетать "тяжелые" будни.
***
2. Чаще бы менял работу, чтобы получать больше денег.
Всю карьеру я считал, что надо хотя бы год работать на одном месте, чтобы потом не было проблем с поиском работы.
По факту, на 3 из 6 моих офисных работ я работал меньше года, и с моей карьерой ничего страшного не случилось. Только рост в зарплате и в скилах).
***
3. Больше бы отказывался от задач и встреч.
В корпоративной жизни очень большое количество задач и встреч абсолютно бесполезны. Как минимум, они не так важны и срочны, как их преподносят.
И если спорить с начальником – это обычно непродуктивно, то предложить более легкую альтернативу или более комфортный срок – это всегда уместно.
Со встречами еще легче: можно просто не принимать их. И если никто не напишет, значит, я там особо не нужен.
Ну и, конечно, ставить заглушки на обед и на время после 18:00. Заглушки лучше всего делать с небольшим буфером 15-30 минут в обе стороны, чтобы встречи впритык к обеду не ставили – это неудобно, т.к. обед превращается в суету.
Отстаивать свои личные границы не просто, и это не раз приводило меня к конфликтам и увольнениям. Но это того стоило).
***
4. Более открыто бы занимался обучением на работе.
Я всегда боялся читать книги, проходить курсы и делать свои проекты на работе. Ведь на работе надо работать!
Но рабочий день слишком длинный, столько задач нет. Если всё делать эффективно, то рабочие задачи можно раскидать за 2-3 часа в день, а остальное время заниматься своим развитием.
И если кто-то задает вопросы, можно ответить, что ты повышаешь свою квалификацию, и это полезно для компании.
И еще неочевидный факт: когда ты сидишь и учишься, то со стороны это ничем не отличается от того, что ты сидишь и работаешь))).
***
5. Больше бы вкладывался в маркетинг и продажи.
Профессиональные скиллы – это круто. Но успех в карьере зависит не от них!
Профессиональные скиллы – это, по сути, тривиально. Они просто должны быть на приличном уровне.
Поэтому при наличии минимальных профессиональных скиллов, достаточных для работы, гораздо выгоднее вкладываться в маркетинг и продажи.
Маркетинг: резюме, портфолио, личный бренд.
Продажи: умение продавать себя, умение проходить технические интервью, умение договариваться.
Если ты выгодно продаешь свои скиллы, то получаешь лучшее финансирование своего развития и жизни, больше времени на своё развитие, заряженных людей вокруг и вообще более интересный опыт.
А ещё ты не боишься, что тебя уволят или сократят и чувствуешь себя уверенно: ну уволят и хорошо – я умею продавать себя и быстро найду себе работу еще лучше!
***
Кстати, если хочешь прокачать центровой навык продаж в мире IT – умение проходить технические и алгоритмические интервью, то сейчас полным ходом идет набор в 8-й поток моего курса по алгоритмам и структурам данных (старт потока 3 февраля).
Этот курс выбрало уже 189 человек, а студенты и выпускники моего курса проходят интервью в топовые компании. Это значит, что мой курс уже стал проверенным временем и реальным миром продуктом, который сможет довести тебя до результата.
Хочешь выгодно продать свои скиллы? Переходи в бот и узнай, как научиться писать эффективный код, проходить алгоритмические интервью и стать высокооплачиваемым профессионалом без мучений и выгорания, даже если сейчас ты еле-еле кодишь!
Forwarded from Vikhr models
This media is not supported in your browser
VIEW IN TELEGRAM
Salt
Мы начали собирать эту модель в августе, в конце августа получили первый прототип, а потом стало выходить миллион вариантов вида: а давайте whisper для речи+GAN для генерации аудио, а потом вышел FishAudio который лучше работает, да и в целом хорошая модель.
Мы шли с другого конца, собрали решение поверх lm с расширенным токенайзером, использовали WavTokenizer для токенизации аудио.
Учили около 150 а100 часов для финального экспа, но количество экспов и денег сожженых в этот проект переваливает за то сколько я потратил на оригинальные Вихри.
По итогу получился не трансформер который понимает речь и генерирует речь, а Dalle1 like tts на основе llama3 3b.
Сейчас идут работы по дообучению на музыку/аудио, вероятно проект получит папир и обновление.
Сейчас модель неплохо работает на английском, на русский мы доучиваем модель.
huggingface
collab
А еще мы учимся на ошибках и в этот раз выкладываем весь код для обучения и aulate для подсчета аудио метрик
В релизе участвовали: Ksenya (основной контрибьютор), Костя, а я ходил пинал чтобы оно все не развалилось и доехало до какого то состояния.
Мы начали собирать эту модель в августе, в конце августа получили первый прототип, а потом стало выходить миллион вариантов вида: а давайте whisper для речи+GAN для генерации аудио, а потом вышел FishAudio который лучше работает, да и в целом хорошая модель.
Мы шли с другого конца, собрали решение поверх lm с расширенным токенайзером, использовали WavTokenizer для токенизации аудио.
Учили около 150 а100 часов для финального экспа, но количество экспов и денег сожженых в этот проект переваливает за то сколько я потратил на оригинальные Вихри.
По итогу получился не трансформер который понимает речь и генерирует речь, а Dalle1 like tts на основе llama3 3b.
Сейчас идут работы по дообучению на музыку/аудио, вероятно проект получит папир и обновление.
Сейчас модель неплохо работает на английском, на русский мы доучиваем модель.
huggingface
collab
А еще мы учимся на ошибках и в этот раз выкладываем весь код для обучения и aulate для подсчета аудио метрик
В релизе участвовали: Ksenya (основной контрибьютор), Костя, а я ходил пинал чтобы оно все не развалилось и доехало до какого то состояния.
Forwarded from MISTER SOSISTER ~ CHINESE TIME OF MY LIFE
Про лидерство в Dise
Как вы знаете, у Dise еще нет CTO. В октябре мы наняли троих очень талантливых и очень амбициозных разрабов, надеясь этот вопрос решить, но что то пошло не так...
Об этом в конце, что важнее, это заставило нас много думать и говорить о лидерстве, и вывести формулу, по которой мы теперь лидерские качества меряем.
Лидер—это тот, кому больше всех надо.
Оказалось это не вопрос экспертности или даже опыта, это вопрос инициативности, заряженности, и желания брать на себя ответственность, как бы это банально не звучало.
Когда лидер берет на себя ответственность он становится тем с кого в конце спрашивают, и это дает ему власть спрашивать с других, потому что все понимают, что он забирает на себя риск и пострадает если что он, а оне они. Он закрывает других своей спиной, и из за этого другие его слушают и помогают.
На бытовом уровне, овнерщип означает:
1️⃣ Одержимость результатом. Если что то критическое не работает, этот человек не заснет пока решение не будет найдено. Если оно не может быть найдено, он предложит альтернативные пути обхода, потому что он видит общую картину, и понимает что варианта не решить у него нет. В лидерских ролях не существует отмазок.
2️⃣ Перфекционизм. Если что то не идеально, он не успокоится пока не будет сделано как надо. Он переживает про каждую деталь, потому что если верхушка принимает тяп-ляп, то ни у кого ниже нет инцентива делать лучше. Я слышал, как люди жалуются на ios 18 и говорят "это было бы невозможно при Стиве Джобсе", потому что он дрючил всех, и не допускал низкого качества, что в итоге определяло планку продуктов эпл. Я сам, каждый наш релиз, отправляю фронтендеру фиксы по отступам, цветам иконок, и обводкам, потому что после меня уже никто об этом не скажет.
3️⃣ Инициативность. И главное, он проактивно ищет новые возможности, и предлагает новые идеи, как улучшить общий результат, а не сидит в комфорте минимума своих прямых обязанностей, потому что упряжка не может бежать быстрее первой лошади. Он должен на своей энергии и одержимости общим успехом тащить всю упряжку и мотивировать других бежать быстрее.
За все это он получает контроль и другие плюшки.
Это точно не привилегия, это просто другая функция, с более широким диапазоном ups and downs. Расположенность к ней определяется исключительно настроем и личной мотивацией (ну и способностью это экзекьютить), и многим это просто не нужно чтобы достичь своих целей.
____
Мы поняли свои проблемы, когда раз за разом, когда у нас падал продукт, или банили домен, ни у кого не горела жопа так, чтобы поднять всех на уши, порисерчить, сделать самому, но решить. Мне приходилось говорить "алё, у нас вообще то прод лежит" или звать Диму. Дошло до того, что я начал проводить дейли синки и спрашивать всех по прогрессу и проверять все ли занимаются самыми приоритетными задачами.
Вышло это так, потому что я верю что можно иметь это лидерство, и этот овнерщип в каждом члене команды, хотя бы на уровне своей зоны ответственности, и мы наверно ожидали увидеть троих СТО, которые втроем будут не спать и переживать о продукте, но из за того что мы не наделили никого конкретно властью, это погубило личную инициативу брать ответственность за весь продукт, так как все стеснялись спрашивать с других. Но мы меняемся.
____
Напоследок, все что я сказал применимо в ровной степени к нашемудизайнеру СЕО. Сейчас, человек "которому больше всех надо"—это я. Но как только появится кто то, кто будет больше переживать про продукт и рост бизнеса, быстрее решать проблемы, и сильнее толкать компанию вперед своими идеями, то он/она станет помощником СЕО .
Как вы знаете, у Dise еще нет CTO. В октябре мы наняли троих очень талантливых и очень амбициозных разрабов, надеясь этот вопрос решить, но что то пошло не так...
Об этом в конце, что важнее, это заставило нас много думать и говорить о лидерстве, и вывести формулу, по которой мы теперь лидерские качества меряем.
Лидер—это тот, кому больше всех надо.
Оказалось это не вопрос экспертности или даже опыта, это вопрос инициативности, заряженности, и желания брать на себя ответственность, как бы это банально не звучало.
Leadership = Ownership + Control Когда лидер берет на себя ответственность он становится тем с кого в конце спрашивают, и это дает ему власть спрашивать с других, потому что все понимают, что он забирает на себя риск и пострадает если что он, а оне они. Он закрывает других своей спиной, и из за этого другие его слушают и помогают.
Не может быть ответственности без власти, и не может быть власти без ответственности
На бытовом уровне, овнерщип означает:
Можно зафейлить задачу, но нельзя зафейлить миссию
За все это он получает контроль и другие плюшки.
Это точно не привилегия, это просто другая функция, с более широким диапазоном ups and downs. Расположенность к ней определяется исключительно настроем и личной мотивацией (ну и способностью это экзекьютить), и многим это просто не нужно чтобы достичь своих целей.
____
Мы поняли свои проблемы, когда раз за разом, когда у нас падал продукт, или банили домен, ни у кого не горела жопа так, чтобы поднять всех на уши, порисерчить, сделать самому, но решить. Мне приходилось говорить "алё, у нас вообще то прод лежит" или звать Диму. Дошло до того, что я начал проводить дейли синки и спрашивать всех по прогрессу и проверять все ли занимаются самыми приоритетными задачами.
Вышло это так, потому что я верю что можно иметь это лидерство, и этот овнерщип в каждом члене команды, хотя бы на уровне своей зоны ответственности, и мы наверно ожидали увидеть троих СТО, которые втроем будут не спать и переживать о продукте, но из за того что мы не наделили никого конкретно властью, это погубило личную инициативу брать ответственность за весь продукт, так как все стеснялись спрашивать с других. Но мы меняемся.
____
Напоследок, все что я сказал применимо в ровной степени к нашему
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Записки MLEшника
TLDR доклада "Как в яндексе делают ранжирование нейросетками в RecSys?"
1. Категориальные фичи кодируют эмбедингами
2. Вещественные фичи нормализуют / делают улучшенную бинаризацию (называют кусочно-линейным кодированием)
3. Используют один слой DCN, чтобы моделировать комбинации признаков
4. Затем 5 MLP слоев и дропаут
5. Добавляют на вход фичи с других моделей по пользователю (например, у них есть трансформер, который делает вектор пользователя по его истории)
6. Делаю несколько голов на несколько действий пользователя (клик, просмотр и тд.)
7. Кормят много данных с большим бачсайзом
8. Лосс на попарное ранжирование (сигмоида от разности логитов двух айтемов)
1. Категориальные фичи кодируют эмбедингами
2. Вещественные фичи нормализуют / делают улучшенную бинаризацию (называют кусочно-линейным кодированием)
3. Используют один слой DCN, чтобы моделировать комбинации признаков
4. Затем 5 MLP слоев и дропаут
5. Добавляют на вход фичи с других моделей по пользователю (например, у них есть трансформер, который делает вектор пользователя по его истории)
6. Делаю несколько голов на несколько действий пользователя (клик, просмотр и тд.)
7. Кормят много данных с большим бачсайзом
8. Лосс на попарное ранжирование (сигмоида от разности логитов двух айтемов)
Forwarded from Data Funk
Выбросы — это точки, которые не следуют общей тенденции, какой бы она ни была. Что считать тенденцией зависит от задачи, но поиск таких точек в многомерном пространстве часто сводится к применению Isolation Forest, Local Outlier Factor, KNN или DBSCAN. Сюда же можно добавить дешевый и эффективный PCA, смысл использования которого, в том, что чем больше требуется компонент для восстановления точки из сжатого представления в исходное с заданной точностью, тем более аномальной является точка (классический PCA чувствителен к выбросам, поэтому лучше взять его устойчивые аналоги - robust PCA). В предыдущем посте я брал датасет англоязычных песен на Spotify за 5 лет, тут воспользовался им снова. По музыкальным характеристикам треков оценил минимально количество компонент PCA для реконструкции фичей каждого трека с фиксированной погрешностью, и усреднил их количество по каждому исполнителю. Также усреднил популярность.
Forwarded from Алексей Цыкунов | Про AI и не только
Как за 5 минут склонировать свой голос и озвучить им подкаст 🤯🤯🤯
1. Открываем NotebookLM, загружаем туда ссылки на статьи или YouTube-видео и нажимаем "Generate Deep Dive Conversation".
2. Скачиваем готовый подкаст на английском с двумя ведущими.
3. Открываем Google AI Studio, загружаем в чат аудиофайл подкаста и просим извлечь текст.
4. Просим переписать сценарий подкаста под одного ведущего и нажимаем "Run".
5. Скачиваем несколько своих голосовых сообщений из WhatsApp/Telegram (я взял два первых, продолжительностью 1–1,5 минуты).
6. Открываем сайт hailuo.ai -> Voices -> "Create your Voice Clone", загружаем туда свои голосовые сообщения и нажимаем "Convert".
7. Копируем текст из Google AI Studio и вставляем его в hailuo.ai -> "Text to Speech", выбираем свой клонированный голос и нажимаем "Generate".
8. Готово! Потратил 0$
UPD: пример с моим голосом в комментариях к этому посту
1. Открываем NotebookLM, загружаем туда ссылки на статьи или YouTube-видео и нажимаем "Generate Deep Dive Conversation".
2. Скачиваем готовый подкаст на английском с двумя ведущими.
3. Открываем Google AI Studio, загружаем в чат аудиофайл подкаста и просим извлечь текст.
4. Просим переписать сценарий подкаста под одного ведущего и нажимаем "Run".
5. Скачиваем несколько своих голосовых сообщений из WhatsApp/Telegram (я взял два первых, продолжительностью 1–1,5 минуты).
6. Открываем сайт hailuo.ai -> Voices -> "Create your Voice Clone", загружаем туда свои голосовые сообщения и нажимаем "Convert".
7. Копируем текст из Google AI Studio и вставляем его в hailuo.ai -> "Text to Speech", выбираем свой клонированный голос и нажимаем "Generate".
8. Готово! Потратил 0$
UPD: пример с моим голосом в комментариях к этому посту
Forwarded from Артем
Немного ссылок по Feature Engineering:
1. Общая информация про конструирование признаков: https://www.google.com/url?sa=t&source=web&rct=j&opi=89978449&url=https://habr.com/ru/companies/ruvds/articles/680498/&ved=2ahUKEwjgvLiZ0JCLAxUvR_EDHfdjMxgQFnoECBUQAQ&usg=AOvVaw1r_Q31wi1Hvn59t5elz2Og от @dfeeler
2. Целый гайд-пайплайн по преобразование данных: https://github.com/ashishpatel26/Amazing-Feature-E
Автоматический Feature Engineering:
Я знаю только один инструмент, который более-менее работает: https://github.com/alteryx/featuretools
Вот статейка на хабр: https://habr.com/ru/companies/lemana_tech/articles/511792/
Автоматический FE стоит применять тогда, когда уже сложно придумать свои признаки руками)
1. Общая информация про конструирование признаков: https://www.google.com/url?sa=t&source=web&rct=j&opi=89978449&url=https://habr.com/ru/companies/ruvds/articles/680498/&ved=2ahUKEwjgvLiZ0JCLAxUvR_EDHfdjMxgQFnoECBUQAQ&usg=AOvVaw1r_Q31wi1Hvn59t5elz2Og от @dfeeler
2. Целый гайд-пайплайн по преобразование данных: https://github.com/ashishpatel26/Amazing-Feature-E
Автоматический Feature Engineering:
Я знаю только один инструмент, который более-менее работает: https://github.com/alteryx/featuretools
Вот статейка на хабр: https://habr.com/ru/companies/lemana_tech/articles/511792/
Автоматический FE стоит применять тогда, когда уже сложно придумать свои признаки руками)
GitHub
GitHub - alteryx/featuretools: An open source python library for automated feature engineering
An open source python library for automated feature engineering - alteryx/featuretools
Forwarded from Yarick Abramov
Feature Engineering:
https://www.youtube.com/watch?v=ZckQtif4v1o
If you want to go deeper in practical methods, you can check the following links :
Scikit-learn: feature extraction, feature selection, feature improvement
Feature-Engine : feature engineering
AutoFeat : automated feature engineering
Feature Tools : automated feature engineering
Feature engineering bookcamp
https://www.manning.com/books/feature-engineering-bookcamp
https://arxiv.org/pdf/2403.11395
https://www.youtube.com/watch?v=ZckQtif4v1o
If you want to go deeper in practical methods, you can check the following links :
Scikit-learn: feature extraction, feature selection, feature improvement
Feature-Engine : feature engineering
AutoFeat : automated feature engineering
Feature Tools : automated feature engineering
Feature engineering bookcamp
https://www.manning.com/books/feature-engineering-bookcamp
https://arxiv.org/pdf/2403.11395
YouTube
Feature Engineering Explained - Feature Selection - Examples in Python
This is the third video of the video series about feature engineering techniques. I introduced the feature engineering pipeline, and two feature engineering techniques in the previous videos (feature improvement and feature construction). This video is about…