Data, Stories and Languages
2.96K subscribers
67 photos
8 videos
490 links
Канал о Data Science, изучении иностранных языков, книгах и жизни.
Контакт с автором https://t.me/Erlemar
Download Telegram
Forwarded from AI.Insaf
В Х пропушили библиотеку Memvid, у которой уже 5 тысяч ⭐️ на GitHub. Теперь вместо векторных баз данных предлагают хранить всё в видеофайлах, где каждый кадр — это QR-код. Правда, как справедливо заметили в комментариях, внутри всё равно крутится FAISS и те же векторные базы. Вот до чего доводит вайб-кодинг
😁13
​​Pride Month у инженеров
😁22💘4
HuggingFace deprecating TensorFlow and Flax support in transformers

https://x.com/LysandreJik/status/1933201171130593530

Прошла эпоха...
🫡231🔥1
Карьерные новости

Осенью 2024 меня сократили из Careem. Частично косты резали, частично политика, частично корпоративная культура. Впрочем, весь год компания сокращала людей для уменьшения костов. Через пару дней после этого, я съездил на DataFest Yerevan, где рассказал об одном из успешных рабочих проектов...

А спустя пару недель мне написал рекрутёр из Meta и предложил снова пообщаться (прошлый раз был в 2022). Я собеседовался на Staff/E6, но прошёл на Senior/E5.

На прошлой неделе переехал в Лондон и в этот понедельник вышел на работу. Пока 2-3 недели будут обучения, дальше предстоит работать в команде монетизации и делать look-a-like на contrastive learning.

Пока привыкаю к жизни в новом городе, позже расскажу как проходили собеседования, как к ним готовился, как шёл переезд.

#datascience #life
🔥70🎉12👍8👀2🙏1
​​levels.fyi хайпует
😁14
​​Dogfooding - Meta Quest Pro

Один из плюсов работы в такой компании - можно поучаствовать в dogfooding продуктов.

Кто не знает, "dogfooding" практика внутреннего тестирования, когда сотрудники компании могут получить ранний доступ к невыпущенным продуктам для тестирования.

Например, новичкам выдают headset Meta Quest Pro (при желании). Его можно использовать как угодно. Можно выполнять специальные "квесты" или находить баги. Чем больше полезной активности делаешь, тем больше плюшек получаешь - например, доступ к ещё более ранним версиям продуктов.

Я раньше ни разу не пробовал использовать headsets, так что это интересный опыт.

Это весьма необычно - плавающие перед тобой менюшки, управление как руками, так и controllers, трекинг движений и так далее. Большинство приложение, как это ожидаемо, либо игры, либо разные способы коммуникации. Неудивительно - писать текст на таких девайсах не особо удобно.

Глаза могут уставать, особенно если зрение плохое (как у меня); если переключаться между headset и телефоном (чтобы смотреть в приложение), может быть тяжко, может голова заболеть - ибо сильно меняется перспектива; в некоторых приложениях графика так себе.

Но в целом это весьма интересный опыт.

#life
🔥7👍32
​​V-JEPA 2: Self-Supervised Video Models Enable Understanding, Prediction and Planning

Yann LeCun представляет: V-JEPA 2 — self-supervised модель, обученная на более чем 1 миллионе часов интернет-видео и небольшом объёме данных от роботов. Модель показывает высокие результаты в motion understanding и action anticipation, а после alignment с large language model достигает SOTA в video question answering. Post-training V-JEPA 2-AC на 62 часах видео с роботами позволяет выполнять zero-shot планирование для задач pick-and-place без сбора новых данных и task-specific обучения.

Выглядит впечатляюще, вполне себе world model.

Paper
Project

Мои обзоры:
Personal blog
Medium
Linkedin Pulse

#paperreview
🔥9😁6
У Anthropic недавно вышел новый длинный блогпост, на этот раз "How we built our multi-agent research system". И я хочу поделиться отличным разбором этого поста от https://t.me/max_dot_sh.

Это авторский блог, ведёт его Максим Шапошников. Он работал последние 3.5 года в FAANG в Лондоне, теперь пошёл заниматься AI кодогенерацией в молодой стартап.

Канал годный, там много про карьеру на рисерч позициях в BigTech и стартапах, интересных советов и отзывов о собеседованиях в интересные места от разных людей.

#datascience
🔥5👍31
😁321
​​ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

Исследователи из NVIDIA показывают, что ProRL (подход с длительным обучением через reinforcement learning) способен расширять границы рассуждений языковых моделей, находя новые стратегии, недоступные базовой модели даже при extensive sampling. Метод использует KL regularization, сброс reference policy и разнообразные задачи. Результаты показывают, что улучшения варьируются и зависят от сложности задач и длительности обучения, обычно модели с ProRL стабильно превосходят базовые по метрикам pass@k, даже тогда, когда базовые модели полностью проваливаются.

Paper
Model weights

Мои обзоры:
Personal blog
Medium
Linkedin Pulse

#paperreview
🔥1
​​Soham Parekh - 10x engineer. or not?

Со вчерашнего дня в twitter идёт весёлая драма.

Началось с того, что основатель какого-то стартапа написал, что есть индус по имени Soham Parekh, которого они нанимали довольно давно. Быстро оказалось, что у него фальшивое резюме и он на работе ничего не делает. Его уволили на первой же неделе, но он в тот момент работал в 3-4 других YC компаниях.

И тут twitter прорвало... разные люди стали писать, что они нанимали Soham Parekh, но в одних случаях он сам пропадал с радаров, в других случаях его увольняли за пару недель. Другие люди просто шарили письма от него. Я видел минимум 10-20 твитов.

Дальше пошло веселее. Стало появляться много мемов про него. Пошла критика процессов собесов - что они слабо коррелируют с тем, что надо реально делать на работе.

А потом пошло "стартаперское" мышление - люди стали предлагать ему открыть бизнес: то стать коучем по прохождению собесов, то сделать подкаст, то сделать стартап (неважно на какую тему)

Наконец, появился фейковый (хотя кто знает) твиттер аккаунт, где он сам типа шитпостит.

Ждём продолжения истории. Учитывая как работают современные стартапы и современный мир, не удивлюсь, если этот товарищ реально использует этот "хайп", создаст какой-нибудь стартап и поднимает кучу бабла.
🤣181
Вот ещё порция твитов про него
😁10🤣2
​​Недавно была новость о том, что Microsoft сокращает 9к работников из-за AI
Сокращения - правда. Но есть нюанс...
🤯92
​​Kaggle Progression Update

Большие изменения на Kaggle! Сегодня на форумах появился пост с внушительным списком изменений платформы.

• Вначале главное - рейтинга обсуждений больше нет! Вместо него всем дали ачивки Discussions Legacy Expert/Master/Grandmaster, больше их не заработать. Причина - слишком многие фармили этот рейтинг. И 4х Грандмастером не стать... хотя нет - им стать можно, но по-другому.
• Завезли специальную страницу про грандмастеров: https://www.kaggle.com/rankings/grandmasters Можно посмотреть и увидеть, что Giba - 13х Grandmaster. Э, что? Теперь N Grandmaster считается по-другому - можно стать Грандмастером в каждой категории (3x), а затем за каждые 5 (!) золотых медалей в соревнованиях добавляется ещё 1x. У него 64 золотых медалей в соревнованиях - это 5х12, и ещё он грандмастер кода. Имхо, это выглядит как-то странно. Возможно это новая мотивация людям гоняться за золотом в соревнованиях, чтобы было больше крутых решений. Но это ещё сильнее ужесточит конкуренцию за топ места.
• Novice и Contributor уровни убрали, теперь минимальный уровень - Expert
• То, чего мы ждали годами - форкание ноутбуков автоматически даёт лайки автору. Заодно изменили как получаются рейтинги/медали за датасеты и код - учитываются только лайки от Experts и выше, decay очков идёт не от даты лайка, а от даты создания датасета/кода, улучшили anti-abuse.
• Из-за пункта выше у всех были автоматически пересчитаны очки этих двух рейтингов во всех моментах времени.
• Рейтинг теперь можно фильтровать по городу и компании
• Есть красивая страничка в профиле с графиком твоего рейтинга во времени
• Есть отдельная страничка Awards: https://www.kaggle.com/rankings/awards

В тредике бурление, думаю, что эти мощные изменения люди ещё долго будут обсуждать.

#datascience
🔥7
Reddit: Vibe / Citizen Developers bringing our Datawarehouse to it's knees

Интересный тредик на reddit: инженеры задалбываются тем, что юзеры без раздумий запускают SQL, предложенный LLM-ками.
То select *, то select top 7000000 с join 50 табличек.

https://www.reddit.com/r/dataengineering/comments/1lvyzbc/vibe_citizen_developers_bringing_our/

#datascience
🤣11
Forwarded from Борис опять
# Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

METR выложил рандомизированное исследование влияния AI на скорость работы опытных разработчиков в реалистичных условиях с неожиданным результатом.

Выполнение задач с использованием AI инструментов в среднем занимает на 20% дольше.

Причем если спрашивать разработчиков, то сами они уверены, что AI ускоряет их работу на 20%, а внешние эксперты вообще ожидают ускорения порядка 40%.

Я думаю, что на текущий момент это самое реалистичое исследование влияния AI инструментов на продуктивность разработчиков:
🔹Настоящие задачи из больших open source репозиториев с высокими стандартами качества.
🔸Опытные разработчики (5 лет в среднем) знакомые с кодовой базой над которой работают.
🔹Фронтир AI инструменты на момент исследования: Claude 3.5/3.7 Sonnet и Cursor Pro.
🔸Все разработчики были обучены правильно использовать Cursor Pro.
🔹Хороший дизайн эксперимента: фиксированная метрика (время исполнения), рандомизация, статзначимость, факторный анализ.
🔸Всё проверено вдоль и поперек, чтобы убедиться, что результаты не объясняются каким-то конфаундером.
🔹Исследование не сделано компанией продающей AI тулы.

Подробнее про эксперимент. В исследовании участвовали 16 опытных open-source разработчиков (если выборка кажется маленькой, то читайте дальше, станет понятнее) работающих над большими (1м+ строк кода) и популярными (20к+ коммитов) репозиториями. Разработчики были знакомы со своими проектами, в среднем сделали в них по 1500 коммитов. Всем разработчикам выдали Cursor Pro и научили им пользоваться.

Разработчики выбирали задачу. Далее они делали прогноз сколько у них займет исполнение с AI и без. Затем монетка определяла можно ли использовать для этой задачи AI инструменты. Если задача оказывалась в AI группе, то разработчик мог использовать любые AI инструменты. Мог и не использовать, если не считал нужным. На практике большинство использовали Cursor. Разработчик делал задачу записывая свой экран. Затем создавал Pull Request и дорабатаывал его после код-ревью. Задача считалась завершенной в момент принятия PR, то есть после всех доработок, и в этот момент фиксировалась метрика: время исполнения. Всего за время эксперимента было сделано 246 задач разной сложности, из них 136 с AI.

То есть важно понимать, что рандомизация происходила по задачам, а не по разработчикам. Поэтому выборка здесь не 16 разработчиков, а 246 задач. Это всё ещё не гигантская выборка, но:
1. P-value в порядке.
2. Авторы проанализировали и разметили записи экранов, провели интервью. Словом, сделали качественное исследование. Когда результаты качественного и количественного исследования консистентны это сильный сигнал.

Результаты показывают, что AI инструменты тормозят опытных разработчиков на реальных больших проектах. Здесь каждое слово важно. Например, AI может одновременно с этим ускорять начинающих на маленьких проектах.

Моё мнение 👀: я думаю это правда. Во-первых, надо иметь серьезные основания, чтобы спорить с рандомизированным исследованием. Я искал до чего докопаться и не нашел. Во-вторых, это совпадает с моими личным опытом: я и сам записывал экран где Cursor пытается решить несложную реальную задачу, не заметил никакого ускорения. В-третьих, ускорение даже на 20% не стыкуется с реальностью. Если у нас уже два года вся разработка быстрее и дешевле на 20%, то где эффект? Я бы ожидал колоссальных изменений на рынке труда из-за сложного процента, но по факту пока ничего не произошло (недавние сокращения в бигтехах были из-за налогов на ФОТ в США).

В статье очень много интересных деталей. Например, что эффект сохраняется вне зависимости от используемого инструмента: пользуешься ты agentic mode, только TAB или вообще руками копипастишь в ChatGPT. Или что даже после 50+ часов использования Cursor не наступает никаких изменений, так что это не зависит от опыта работы с AI инструментами.

Я разберу интересные моменты в отдельных постах.

@boris_again
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63
​​От себя: мне это исследование напоминает старый мем
😁30💯3
​​Реклама AI выходит на новый уровень
🤣15😭3
Где разработчику искать вакансии в зарубежных компаниях?

Ответ знают Dev & ML Connectable Jobs — в международных стартапах с русскоязычными фаундерами и командами. В своем канале они публикуют информацию о бэкграунде фаундеров, размере команды и инвестициях, а также делятся прямыми контактами HR для отклика.

Несколько актуальных вакансий:
Generative AI/ML Engineer в Blush (Remote)
Machine Learning Engineering Manager в Deliveroo (Лондон)
Data Аnnotation manager в Recraft (Лондон)

Подписывайтесь и развивайте карьеру в будущем единороге 🚀
🤡7👍3🤔21
​​Индустрия полна контрастов
🤣13😎3
Пачка новостей из мира AI

https://openai.com/index/introducing-chatgpt-agent/

> You can now ask ChatGPT to handle requests like “look at my calendar and brief me on upcoming client meetings based on recent news,” “plan and buy ingredients to make Japanese breakfast for four,” and “analyze three competitors and create a slide deck.” ChatGPT will intelligently navigate websites, filter results, prompt you to log in securely when needed, run code, conduct analysis, and even deliver editable slideshows and spreadsheets that summarize its findings.

https://mistral.ai/news/le-chat-dives-deep

What’s new in Le Chat.
Deep Research mode: Lightning fast, structured research reports on even the most complex topics.

Voice mode: Talk to Le Chat instead of typing with our new Voxtral model.

Natively multilingual reasoning: Tap into thoughtful answers, powered by our reasoning model — Magistral.

Projects: Organize your conversations into context-rich folders.

Advanced image editing directly in Le Chat, in partnership with Black Forest Labs.

#datascience
🔥21