Исследователи Яндекса выложили Yambda — один из крупнейших в мире датасетов для развития рекомендательных систем
Привет! Меня зовут Александр Плошкин, я руковожу группой развития качества персонализации в Яндексе. Сегодня мы открываем доступ к одному из крупнейших рекомендательных датасетов — Yambda. Он содержит 4,79 миллиардов обезличенных пользовательских действий, собранных за 10 месяцев использования сервиса Яндекс Музыка.
Мы выбрали Яндекс Музыку, потому что это крупнейший подписной стриминговый сервис в России, которым в среднем в месяц пользуются 28 миллионов людей. Существенная часть датасета — агрегированные прослушивания, лайки, дизлайки, а также некоторые характеристики треков, полученные из системы персональных рекомендаций «Моя волна». Все данные о пользователях и треках анонимизированы: датасет содержит исключительно числовые идентификаторы, что обеспечивает конфиденциальность.
Рекомендательные алгоритмы помогают людям находить нужные товары, фильмы, музыку и многое другое — именно они лежат в основе сервисов: от интернет‑магазинов до онлайн‑кинотеатров. Развитие этих алгоритмов напрямую зависит от научных исследований, для которых нужны качественные и объёмные датасеты. При этом опенсорс‑датасеты чаще всего невелики по размеру или уже устарели, так как коммерческие компании, которые накапливают терабайты данных, редко их публикуют.
Публикация больших открытых датасетов наподобие Yambda помогает решить эту проблему. Доступ к качественным большим данным открывает новые возможности для научных исследований и привлекает к области внимание молодых учёных, заинтересованных в применении машинного обучения для решения актуальных задач.
В этой статье я расскажу, из чего состоит датасет, как мы его собирали и как вы можете использовать его для оценки новых рекомендательных алгоритмов. Читать далее
#рекомендательные_системы #датасеты #large_scale_machine_learning #open_source #яндекс #yambda | @habr_ai
Привет! Меня зовут Александр Плошкин, я руковожу группой развития качества персонализации в Яндексе. Сегодня мы открываем доступ к одному из крупнейших рекомендательных датасетов — Yambda. Он содержит 4,79 миллиардов обезличенных пользовательских действий, собранных за 10 месяцев использования сервиса Яндекс Музыка.
Мы выбрали Яндекс Музыку, потому что это крупнейший подписной стриминговый сервис в России, которым в среднем в месяц пользуются 28 миллионов людей. Существенная часть датасета — агрегированные прослушивания, лайки, дизлайки, а также некоторые характеристики треков, полученные из системы персональных рекомендаций «Моя волна». Все данные о пользователях и треках анонимизированы: датасет содержит исключительно числовые идентификаторы, что обеспечивает конфиденциальность.
Рекомендательные алгоритмы помогают людям находить нужные товары, фильмы, музыку и многое другое — именно они лежат в основе сервисов: от интернет‑магазинов до онлайн‑кинотеатров. Развитие этих алгоритмов напрямую зависит от научных исследований, для которых нужны качественные и объёмные датасеты. При этом опенсорс‑датасеты чаще всего невелики по размеру или уже устарели, так как коммерческие компании, которые накапливают терабайты данных, редко их публикуют.
Публикация больших открытых датасетов наподобие Yambda помогает решить эту проблему. Доступ к качественным большим данным открывает новые возможности для научных исследований и привлекает к области внимание молодых учёных, заинтересованных в применении машинного обучения для решения актуальных задач.
В этой статье я расскажу, из чего состоит датасет, как мы его собирали и как вы можете использовать его для оценки новых рекомендательных алгоритмов. Читать далее
#рекомендательные_системы #датасеты #large_scale_machine_learning #open_source #яндекс #yambda | @habr_ai
Хабр
Исследователи Яндекса выложили Yambda — один из крупнейших в мире датасетов для развития рекомендательных систем
Привет! Меня зовут Александр Плошкин, я руковожу группой развития качества персонализации в Яндексе. Сегодня мы открываем доступ к одному из крупнейших рекомендательных датасетов —...
Покерная лаборатория закрывается, ловите исходники
Я делал этот проект более полутора лет, сейчас отказываюсь от него. И, чтобы эти полтора года не были прожиты зря) открываю исходники. Java+Spring.
Принимайте проект «как есть», со всеми ad-hoc костылями, незаконченными исследованиями, TODOs, а также всевозможными KISS, DRY, и, как их… SOLID с GoF.
Предполагается, что вы знакомы с покером, имеете неплохие навыки программирования, поверхностно разбираетесь в теории игр. Читать далее
#покер #теория_игр #машинное_обучение #боты #карточные_игры #дерево_решений #совершенный_код #говнокод #искусственный_интеллект #open_source | @habr_ai
Я делал этот проект более полутора лет, сейчас отказываюсь от него. И, чтобы эти полтора года не были прожиты зря) открываю исходники. Java+Spring.
Принимайте проект «как есть», со всеми ad-hoc костылями, незаконченными исследованиями, TODOs, а также всевозможными KISS, DRY, и, как их… SOLID с GoF.
Предполагается, что вы знакомы с покером, имеете неплохие навыки программирования, поверхностно разбираетесь в теории игр. Читать далее
#покер #теория_игр #машинное_обучение #боты #карточные_игры #дерево_решений #совершенный_код #говнокод #искусственный_интеллект #open_source | @habr_ai
Хабр
Покерная лаборатория закрывается, ловите исходники
Я делал этот проект более полутора лет, сейчас отказываюсь от него. И, чтобы эти полтора года не были прожиты зря) открываю исходники. Java+Spring. Принимайте проект «как есть», со всеми ad-hoc...
Как ИИ помог создать систему видеонаблюдения на Android
Привет, Хабр!
Прежде чем я начну рассказ о своем проекте, хочу выразить огромную благодарность всем тем бесчисленным программистам, разработчикам и энтузиастам, которые на протяжении многих лет делились своим кодом, знаниями и опытом в интернете. Ваши открытые проекты, ответы на Stack Overflow, статьи, туториалы и обсуждения на форумах стали той самой питательной средой, на которой обучались большие языковые модели (LLM), включая и ту, что помогала мне. Без вашего вклада в общее дело, такие мощные ИИ‑ассистенты, которые сегодня так сильно облегчают и ускоряют разработку, были бы просто невозможны. Спасибасвам за то, что делаете мир разработки открытее и доступнее!
Исходный код проекта «Storog» полностью открыт и доступен на GitHub. Читать далее
#android #ai #ии_ассистент #ии #open_source #open_source #vibecoding #vibe_coding | @habr_ai
Привет, Хабр!
Прежде чем я начну рассказ о своем проекте, хочу выразить огромную благодарность всем тем бесчисленным программистам, разработчикам и энтузиастам, которые на протяжении многих лет делились своим кодом, знаниями и опытом в интернете. Ваши открытые проекты, ответы на Stack Overflow, статьи, туториалы и обсуждения на форумах стали той самой питательной средой, на которой обучались большие языковые модели (LLM), включая и ту, что помогала мне. Без вашего вклада в общее дело, такие мощные ИИ‑ассистенты, которые сегодня так сильно облегчают и ускоряют разработку, были бы просто невозможны. Спасибасвам за то, что делаете мир разработки открытее и доступнее!
Исходный код проекта «Storog» полностью открыт и доступен на GitHub. Читать далее
#android #ai #ии_ассистент #ии #open_source #open_source #vibecoding #vibe_coding | @habr_ai
Хабр
Как ИИ помог создать систему видеонаблюдения на Android
Превращаем смартфон в умного охранника с помощью Kotlin, CameraX, Gemini AI и Telegram Привет, Хабр! Прежде чем я начну рассказ о своем проекте, хочу выразить огромную благодарность всем тем...
Обнаружение новых небесных объектов с помощью ML: стартап СТРАЖ для астрономов
Только один телескоп LSST за ночь может собрать более 15 ТБ данных — это как 30 тысяч фильмов в HD. Без ИИ астрономы просто тонут в научных данных. Студенты МФТИ придумали решение: их ML-система «Страж» может ускорить поиск новых объектов в 5 раз — и с точностью до 98%.
На днях АиФ, ТАСС и другие СМИ опубликовали новости о «Страже», но только мы знаем, как все начиналось, как работает решение «под капотом» и почему проект поддержал Yandex Cloud. Об этом и рассказываем в статье. Читать статью
#ml #магистратура #астрономия #облачные_технологии #облачная_инфраструктура #машинное_обучение_нейросети #студенческий_стартап #open_source #новые_звезды #yandex_cloud | @habr_ai
Только один телескоп LSST за ночь может собрать более 15 ТБ данных — это как 30 тысяч фильмов в HD. Без ИИ астрономы просто тонут в научных данных. Студенты МФТИ придумали решение: их ML-система «Страж» может ускорить поиск новых объектов в 5 раз — и с точностью до 98%.
На днях АиФ, ТАСС и другие СМИ опубликовали новости о «Страже», но только мы знаем, как все начиналось, как работает решение «под капотом» и почему проект поддержал Yandex Cloud. Об этом и рассказываем в статье. Читать статью
#ml #магистратура #астрономия #облачные_технологии #облачная_инфраструктура #машинное_обучение_нейросети #студенческий_стартап #open_source #новые_звезды #yandex_cloud | @habr_ai
Хабр
Обнаружение новых небесных объектов с помощью ML: стартап СТРАЖ для астрономов
«Страж» — это первая в России ML-система для обнаружения и классификации переменных звезд на базе сразу нескольких разнотипных нейросетей. Она уже на этапе прототипа способна анализировать данные...
Что будет, если пригласить на свидание OCR и GPT?
Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics, со мной Александр Сулейкин, Founder DUC Technologies и сегодня мы с вами затронем тему «Что будет, если объединить OCR и GPT?».
Признайтесь честно, видели какие ужасные результаты распознавания выдают современные open source решения для кириллицы? Вряд ли из коробки, можно что-то использовать сразу в своих решениях роботизации и автоматизации. Но что же будет, если мы обучим модель не через стандартные методы машинного обучения, а через GPT? Каков будет результат? Стоит ли это исследовать и браться за реализацию? Обо всем подробно в этой статье. Читать далее
#open_source #искусственный_интеллект #машинное_обучение #машинное_зрение #оптическое_распознавание #ocr_технологии #idp #ocr #обучение_нейронных_сетей | @habr_ai
Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics, со мной Александр Сулейкин, Founder DUC Technologies и сегодня мы с вами затронем тему «Что будет, если объединить OCR и GPT?».
Признайтесь честно, видели какие ужасные результаты распознавания выдают современные open source решения для кириллицы? Вряд ли из коробки, можно что-то использовать сразу в своих решениях роботизации и автоматизации. Но что же будет, если мы обучим модель не через стандартные методы машинного обучения, а через GPT? Каков будет результат? Стоит ли это исследовать и браться за реализацию? Обо всем подробно в этой статье. Читать далее
#open_source #искусственный_интеллект #машинное_обучение #машинное_зрение #оптическое_распознавание #ocr_технологии #idp #ocr #обучение_нейронных_сетей | @habr_ai
Хабр
Что будет, если пригласить на свидание OCR и GPT?
Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics , со мной Александр Сулейкин , Founder DUC Technologies и сегодня мы с вами затронем тему «Что будет, если объединить...
AI-диалоги под контролем: как структурный подход улучшает архитектуру, аналитику и разработку
Как структурировать диалоги с LLM: шаблоны, интенты, статусы и архитектура ai-dialog-system, превращающая хаос в управляемую систему. Подход подходит для аналитики, CI и командной разработки. Читать далее
#llm #диалоговые_системы #архитектура #шаблоны #open_source #метаданные #интенты #анализ_и_проектирование_систем #структурирование #rag | @habr_ai
Как структурировать диалоги с LLM: шаблоны, интенты, статусы и архитектура ai-dialog-system, превращающая хаос в управляемую систему. Подход подходит для аналитики, CI и командной разработки. Читать далее
#llm #диалоговые_системы #архитектура #шаблоны #open_source #метаданные #интенты #анализ_и_проектирование_систем #структурирование #rag | @habr_ai
Хабр
AI-диалоги под контролем: как структурный подход улучшает архитектуру, аналитику и разработку
Или как шаблоны, метаданные и строгие правила делают из хаоса — систему. "хаос → структура", где диалоги разрозненные → упорядочены через шаблон 🤯 Проблемы, с которыми сталкиваются команды Так...
Gaunt Sloth — Open Source AI CLI утилита
Прошло довольно много времени с тех пор, как я в последний раз что-либо публиковал на Хабре, около 10 лет или около того, и сегодня настал день, чтобы поделиться своим небольшим Open Source проектом.
Проект под названием Gaunt Sloth Assistant — это CLI-клиент для ИИ (AI), созданный на TypeScript (LangChain.js), распространяемый через npm и работающий в Linux, Windows и Mac. Пользователь полностью контролирует промпты, и рекомендуется формировать свои собственные системные промпты, но у него также есть и стандартный.
основные команды:
- Review PR 42 сверяя с требованиями из issue 12 gth pr 42 12
- Review local diff git --no-pager diff | gth review
- Interactive chat gth chat (filesystem read access)
- Interactive code gth code (filesystem write access) Читать далее
#open_source #искусственный_интеллект #cli #cross_platform | @habr_ai
Прошло довольно много времени с тех пор, как я в последний раз что-либо публиковал на Хабре, около 10 лет или около того, и сегодня настал день, чтобы поделиться своим небольшим Open Source проектом.
Проект под названием Gaunt Sloth Assistant — это CLI-клиент для ИИ (AI), созданный на TypeScript (LangChain.js), распространяемый через npm и работающий в Linux, Windows и Mac. Пользователь полностью контролирует промпты, и рекомендуется формировать свои собственные системные промпты, но у него также есть и стандартный.
основные команды:
- Review PR 42 сверяя с требованиями из issue 12 gth pr 42 12
- Review local diff git --no-pager diff | gth review
- Interactive chat gth chat (filesystem read access)
- Interactive code gth code (filesystem write access) Читать далее
#open_source #искусственный_интеллект #cli #cross_platform | @habr_ai
Хабр
Gaunt Sloth — Open Source AI CLI утилита
Прошло довольно много времени с тех пор, как я в последний раз что-либо публиковал на Хабре, около 10 лет или около того, и сегодня настал день, чтобы поделиться своим небольшим Open Source проектом....
Запускаем личный АИ-инфоконвейер: как я строю систему смыслового мониторинга с YAML и GPT
Мне приходится тратить много времени на мониторинг арбитража, госзакупок и других документов: PDF на сотни страниц, новости с «водой», RSS при этом отсутствует.
Поэтому я решил разработать open-source инструмент, который сам проверяет сайты, скачивает документы и с помощью локального ИИ (GPT4All / DeepSeek) делает краткую смысловую выжимку по YAML-шаблону.
Он должен работать как конвейер: источник → шаблон → интерпретация → результат. Локально, без облаков. И объединять всё в единую ленту новостей.
Сейчас я дорабатываю MVP — и я хочу понять, какие шаблоны наблюдения наиболее востребованы: законопроекты, торги, релизы, или что-то ещё? Читать далее
#ai #парсинг #llm #gpt4all #yaml #open_source #self_hosted #cli #automation #documents | @habr_ai
Мне приходится тратить много времени на мониторинг арбитража, госзакупок и других документов: PDF на сотни страниц, новости с «водой», RSS при этом отсутствует.
Поэтому я решил разработать open-source инструмент, который сам проверяет сайты, скачивает документы и с помощью локального ИИ (GPT4All / DeepSeek) делает краткую смысловую выжимку по YAML-шаблону.
Он должен работать как конвейер: источник → шаблон → интерпретация → результат. Локально, без облаков. И объединять всё в единую ленту новостей.
Сейчас я дорабатываю MVP — и я хочу понять, какие шаблоны наблюдения наиболее востребованы: законопроекты, торги, релизы, или что-то ещё? Читать далее
#ai #парсинг #llm #gpt4all #yaml #open_source #self_hosted #cli #automation #documents | @habr_ai
Хабр
Запускаем личный АИ-инфоконвейер: как я строю систему смыслового мониторинга с YAML и GPT
Отслеживаем новости, документы и тендеры Rostral.io размышляет над ответом вместо вас Привет! Каждый день приходится столько всего отслеживать— лучше делать это в кратком пересказе и без лишних...
AI-генератор сайтов на ChatGPT и Next.js 15: Создаем SEO-оптимизированные страницы с нуля (аналог v0)
Представьте дизайн-агентство, которое создает не просто красивые макеты, а целые технологические экосистемы. Один раз вложившись в разработку уникальных компонентов и фирменного стиля, дизайнеры получают возможность генерировать профессиональные сайты со скоростью 50+ проектов в час.
На практике это сводится к простому циклу: вы отправляете промпт в ChatGPT, получаете в ответ конфигурационный файл, загружаете его в приложение и одной командой сборки создаёте готовые, стилизованные страницы. Всё это уже настроено в стартовом шаблоне, включая авторизацию и многоязычный AI-чат.
Или используйте полную автоматизацию так же как в v0, но с прицелом под крупные корпоративные интеграции. Читать далее
#next #chatgpt #ai #v0 #open_source #github #ai_generator | @habr_ai
Представьте дизайн-агентство, которое создает не просто красивые макеты, а целые технологические экосистемы. Один раз вложившись в разработку уникальных компонентов и фирменного стиля, дизайнеры получают возможность генерировать профессиональные сайты со скоростью 50+ проектов в час.
На практике это сводится к простому циклу: вы отправляете промпт в ChatGPT, получаете в ответ конфигурационный файл, загружаете его в приложение и одной командой сборки создаёте готовые, стилизованные страницы. Всё это уже настроено в стартовом шаблоне, включая авторизацию и многоязычный AI-чат.
Или используйте полную автоматизацию так же как в v0, но с прицелом под крупные корпоративные интеграции. Читать далее
#next #chatgpt #ai #v0 #open_source #github #ai_generator | @habr_ai
Хабр
AI-генератор сайтов на ChatGPT и Next.js 15: Создаем SEO-оптимизированные страницы с нуля (аналог v0)
Этот туториал — первая часть большого путешествия, в котором мы создадим AI-систему для автоматической генерации веб-страниц на React 19 и Next.js 15. Наша цель — не просто скорость, а архитектурная...
Новости кибербезопасности за неделю с 21 по 27 июля 2025
Всё самое интересное из мира кибербезопасности /** с моими комментариями.
На этой неделе новости про милый вредонос для Linux, Америка рассказала о своих стратегических планах в ИИ, Британия запретила платить хакерам, Google занялась безопасностью open source и другие только самые важные и интересные новости из мира информационной безопасности. Читать далее
#информационная_безопасность #linux #open_source #wordpress #майнинг #искусственный_интеллект #google #вымогатели #кибербезопасность #кибератаки | @habr_ai
Всё самое интересное из мира кибербезопасности /** с моими комментариями.
На этой неделе новости про милый вредонос для Linux, Америка рассказала о своих стратегических планах в ИИ, Британия запретила платить хакерам, Google занялась безопасностью open source и другие только самые важные и интересные новости из мира информационной безопасности. Читать далее
#информационная_безопасность #linux #open_source #wordpress #майнинг #искусственный_интеллект #google #вымогатели #кибербезопасность #кибератаки | @habr_ai
Хабр
Новости кибербезопасности за неделю с 21 по 27 июля 2025
Всё самое интересное из мира кибербезопасности /** с моими комментариями. 1) Linux-вредонос Koske маскируется под фото панд и майнит 18 криптовалют. Исследователи из AquaSec обнаружили новый вредонос...
Как я улучшил свой промпт для генерации кода в OpenAI 4.1 — простой трюк, который РАБОТАЕТ
Несмотря на обилие моделей (а я время от времени использую четыре топовые), всё-таки на стыке моих технологий GPT-4.1 даёт лучший результат по сравнению с другими.
... я каждый раз сохраняю эти компоненты в файл Google Документы. И каждый раз при генерации новой функции или целого компонента я "вскармливаю" текст из этого документа именно в формате текста. В общем, эта штука работает хорошо.
Пожалуйста, объясни как ты понял мою проблему, почему я считаю что это важно, как ты собираешься это решать и что будет правильным решением. Читать далее
#nextjs #openaai #chatgpt #aifa #ai #open_source #github #react_js | @habr_ai
Несмотря на обилие моделей (а я время от времени использую четыре топовые), всё-таки на стыке моих технологий GPT-4.1 даёт лучший результат по сравнению с другими.
... я каждый раз сохраняю эти компоненты в файл Google Документы. И каждый раз при генерации новой функции или целого компонента я "вскармливаю" текст из этого документа именно в формате текста. В общем, эта штука работает хорошо.
Пожалуйста, объясни как ты понял мою проблему, почему я считаю что это важно, как ты собираешься это решать и что будет правильным решением. Читать далее
#nextjs #openaai #chatgpt #aifa #ai #open_source #github #react_js | @habr_ai
Хабр
Как я улучшил свой промпт для генерации кода в OpenAI 4.1 — простой трюк, который РАБОТАЕТ
Это я прижал к стенке ChatGPT и заставил работать как положено, как завещал великий Сэм' Несмотря на обилие моделей (а я время от времени использую четыре топовые), всё-таки на стыке моих технологий...
Пилим стартап, часть 2.5. Мини-гайд по Claude Code, причесываем UI
Да, я убрал из заголовка "за выходные", потому что проект чутка растянулся. Но идёт весело! У него и веб-версия теперь есть: https://mini.qyp.ai
Напомню: я давно хотел пощупать Tauri v2, и новомодные фреймворки для построения AI-агентов (ai-sdk / mastra / llamaindex).
Идея простая: десктопное приложение, дешборд на весь экран, справа интерфейс чата. Просим ИИ вывести на дешборд какую-то информацию в духе "сколько новых юзеров за последнюю неделю" - ИИ пишет код виджета, и размещает его на дешборде. Под капотом - runtime компиляция React.js + sql-коннекторы.
Полный open-source, весь код в репозитории: https://github.com/ElKornacio/qyp-mini Читать далее
#tauri #tailwind #typeorm #ai_agent #open_source | @habr_ai
Да, я убрал из заголовка "за выходные", потому что проект чутка растянулся. Но идёт весело! У него и веб-версия теперь есть: https://mini.qyp.ai
Напомню: я давно хотел пощупать Tauri v2, и новомодные фреймворки для построения AI-агентов (ai-sdk / mastra / llamaindex).
Идея простая: десктопное приложение, дешборд на весь экран, справа интерфейс чата. Просим ИИ вывести на дешборд какую-то информацию в духе "сколько новых юзеров за последнюю неделю" - ИИ пишет код виджета, и размещает его на дешборде. Под капотом - runtime компиляция React.js + sql-коннекторы.
Полный open-source, весь код в репозитории: https://github.com/ElKornacio/qyp-mini Читать далее
#tauri #tailwind #typeorm #ai_agent #open_source | @habr_ai
Хабр
Пилим стартап, часть 2.5. Мини-гайд по Claude Code, причесываем UI
Да, я убрал из заголовка "за выходные", потому что проект чутка растянулся. Но идёт весело! У него и веб-версия теперь есть: https://mini.qyp.ai Напомню: я давно хотел пощупать Tauri v2, и новомодные...
Наше общение нам больше не принадлежит. Размышляю как ИИ создаст альтернативу для Telegram без VPN и прослушки
Интернет-свободы сжимаются как шагреневая кожа. То, что еще недавно было естественным правом - свободно общаться, - превращается в привилегию. А мессенджеры? Они давно перестали быть мессенджерами. Это социальные сети, замаскированные под простое общение.
Сижу, листаю новости, читаю очередное "заблокировали", "ограничили", "запретили". И думаю: блин, а только меня это раздражает?
Сегодня размышляю об искусственном интеллекте и вдруг понимаю: технологии уже готовы. Читать далее
#telegram #whatsapp #ai #vpn #chatg #open_source #next_js | @habr_ai
Интернет-свободы сжимаются как шагреневая кожа. То, что еще недавно было естественным правом - свободно общаться, - превращается в привилегию. А мессенджеры? Они давно перестали быть мессенджерами. Это социальные сети, замаскированные под простое общение.
Сижу, листаю новости, читаю очередное "заблокировали", "ограничили", "запретили". И думаю: блин, а только меня это раздражает?
Сегодня размышляю об искусственном интеллекте и вдруг понимаю: технологии уже готовы. Читать далее
#telegram #whatsapp #ai #vpn #chatg #open_source #next_js | @habr_ai
Хабр
Наше общение нам больше не принадлежит. Размышляю как ИИ создаст альтернативу для Telegram без VPN и прослушки
AI vs Telegram Сижу, листаю новости, читаю очередное «заблокировали», «ограничили», «запретили». И думаю: блин, а только меня это раздражает? Интернет‑свободы сжимаются как шагреневая кожа....
Сравнение производительности языковых моделей для HR-задач
Цели исследования и задачи
Мы занимаемся созданием HRTech-сервисов для оценки и развития компетенций специалистов. В наших сервисах применяются LLM и в качестве базового варианта мы использовали разные модели ChatGPT.
Основные задачи LLM включают: Читать далее
#сравнение #производительность #языковые_модели #hr_задачи #llm #chatgpt #open_source #оценка #качество #быстродействие | @habr_ai
Цели исследования и задачи
Мы занимаемся созданием HRTech-сервисов для оценки и развития компетенций специалистов. В наших сервисах применяются LLM и в качестве базового варианта мы использовали разные модели ChatGPT.
Основные задачи LLM включают: Читать далее
#сравнение #производительность #языковые_модели #hr_задачи #llm #chatgpt #open_source #оценка #качество #быстродействие | @habr_ai
Хабр
Сравнение производительности языковых моделей для HR-задач
Цели исследования и задачи Мы занимаемся созданием HRTech-сервисов для оценки и развития компетенций специалистов. В наших сервисах применяются LLM и в качестве базового варианта мы использовали...
Вайб кодинг- обязательный навык, который нужен каждому
В эпоху стремительных технологических изменений владение традиционными языками программирования уже не единственный путь в IT. На смену им приходит вайбкодинг – подход, который позволяет создавать приложения, сайты и автоматизировать задачи буквально «на лету», используя только свою идею и конечно же ИИ. Читать далее
#cursor #kilo_code #ии #ии_ассистент #vibecoding #open_source #pet_project #pet_проекты | @habr_ai
В эпоху стремительных технологических изменений владение традиционными языками программирования уже не единственный путь в IT. На смену им приходит вайбкодинг – подход, который позволяет создавать приложения, сайты и автоматизировать задачи буквально «на лету», используя только свою идею и конечно же ИИ. Читать далее
#cursor #kilo_code #ии #ии_ассистент #vibecoding #open_source #pet_project #pet_проекты | @habr_ai
Хабр
Вайб кодинг- обязательный навык, который нужен каждому
В эпоху стремительных технологических изменений владение традиционными языками программирования уже не единственный путь в IT. На смену им приходит вайб кодинг – подход, который позволяет создавать...
AI-ассистенты для кодинга: сравнение инструментов
AI-редакторы и агенты становятся частью повседневной разработки. Но у каждого свои сильные и слабые стороны: где-то упор на автономность, где-то на глубокое понимание кода, а где-то на гибкость за счёт open source. Ниже — обзор самых заметных решений.
Я протестировал каждый из них и выявил плюсы и минусы каждого из решений. Читать далее
#ai_ide_для_программирования #лучшие_ai_кодовые_ассистенты_2025 #trae_vs_cursor_сравнение #open_source_ai_агент_для_кодинга #cline_roo_code_void_обзор #ai_автодополнение_кода_vs_code #windsurf_ide_ai_агент #geminicli_ai_код_через_терминал | @habr_ai
AI-редакторы и агенты становятся частью повседневной разработки. Но у каждого свои сильные и слабые стороны: где-то упор на автономность, где-то на глубокое понимание кода, а где-то на гибкость за счёт open source. Ниже — обзор самых заметных решений.
Я протестировал каждый из них и выявил плюсы и минусы каждого из решений. Читать далее
#ai_ide_для_программирования #лучшие_ai_кодовые_ассистенты_2025 #trae_vs_cursor_сравнение #open_source_ai_агент_для_кодинга #cline_roo_code_void_обзор #ai_автодополнение_кода_vs_code #windsurf_ide_ai_агент #geminicli_ai_код_через_терминал | @habr_ai
Хабр
AI-ассистенты для кодинга: сравнение инструментов
Приветствую! Я автор канала Друг Опенсурса в котором рассказываю про новости ИИ и инструменты с ИИ. Приятного прочтения! AI-редакторы и агенты становятся частью повседневной разработки. Но у каждого...
[Перевод] Неожиданный результат: ИИ замедляет опытных разработчиков
Мы провели рандомизированное контролируемое исследование (RCT), чтобы оценить, как инструменты искусственного интеллекта начала 2025 года влияют на продуктивность опытных open-source разработчиков, работающих в своих собственных репозиториях. Неожиданно оказалось, что при использовании ИИ-инструментов разработчики выполняют задачи на 19% дольше, чем без них — то есть ИИ замедляет их работу.
Мы рассматриваем этот результат как срез текущего уровня возможностей ИИ в одном из прикладных сценариев. Поскольку системы продолжают стремительно развиваться, мы планируем использовать аналогичную методологию в будущем, чтобы отслеживать, насколько ИИ способен ускорять работу в сфере автоматизации R&D[1].
Подробности — в полной версии статьи. Читать далее
#ai #ai_agent #ai_tools #benchmark #benchmarking #development #open_source #developer #ии #ии_помощник | @habr_ai
Мы провели рандомизированное контролируемое исследование (RCT), чтобы оценить, как инструменты искусственного интеллекта начала 2025 года влияют на продуктивность опытных open-source разработчиков, работающих в своих собственных репозиториях. Неожиданно оказалось, что при использовании ИИ-инструментов разработчики выполняют задачи на 19% дольше, чем без них — то есть ИИ замедляет их работу.
Мы рассматриваем этот результат как срез текущего уровня возможностей ИИ в одном из прикладных сценариев. Поскольку системы продолжают стремительно развиваться, мы планируем использовать аналогичную методологию в будущем, чтобы отслеживать, насколько ИИ способен ускорять работу в сфере автоматизации R&D[1].
Подробности — в полной версии статьи. Читать далее
#ai #ai_agent #ai_tools #benchmark #benchmarking #development #open_source #developer #ии #ии_помощник | @habr_ai
Хабр
Неожиданный результат: ИИ замедляет опытных разработчиков
Мы провели рандомизированное контролируемое исследование (RCT), чтобы оценить, как инструменты искусственного интеллекта начала 2025 года влияют на продуктивность опытных open-source разработчиков,...
Новый релиз публичного детектора голоса Silero VAD v6
На Хабре уже было аж 3 статьи про развитие нашего публичного детектора голоса Silero VAD (последняя тут). А вот что стало лучше в этот раз: Хочу узнать!
#silero #voice_activity_detection #детектор_голоса #pytorch #onnx #python #голосовое_управление #голосовой_помощник #open_source #pypi | @habr_ai
На Хабре уже было аж 3 статьи про развитие нашего публичного детектора голоса Silero VAD (последняя тут). А вот что стало лучше в этот раз: Хочу узнать!
#silero #voice_activity_detection #детектор_голоса #pytorch #onnx #python #голосовое_управление #голосовой_помощник #open_source #pypi | @habr_ai
Хабр
Новый релиз публичного детектора голоса Silero VAD v6
Историческое сравнение версий На Хабре уже было аж 3 статьи про развитие нашего публичного детектора голоса Silero VAD (последняя тут ). А вот что стало лучше в этот раз: Все прошлые фишки и...
Воспроизводимый рейтинг: можно ли с помощью краудсорсинга предсказать выбор пользователей LLM?
Всем привет! Сегодня хотим поделиться историей нашего эксперимента, который начался с простого вопроса: а можно ли с помощью краудсорсинга воссоздать рейтинг нейросетей, который мы получаем от тысяч реальных пользователей на нашем сайте LLM Arena?
Причём не в жёсткой парадигме «оцени по инструкции», а приближаясь к реальному user preference, когда пользователь выбирает то, что ему субъективно больше нравится.
TL/DR:
* Мы можем за 3 дня воспроизвести пользовательский рейтинг LLM с точностью 90%+;
* У нас есть отобранная команда аннотаторов и автоматический фильтр качества;
* Мы научились фильтровать фрод и мусорные промпты лучше, чем стандартные крауд-платформы;;
* Теперь мы можем быстро тестировать новые модели и выдавать предрейтинг до массового запуска. Читать далее
#llm #llmarena #краудсорсинг #ии #ai #оценка_моделей #нейросети #machinelearning #ml #open_source | @habr_ai
Всем привет! Сегодня хотим поделиться историей нашего эксперимента, который начался с простого вопроса: а можно ли с помощью краудсорсинга воссоздать рейтинг нейросетей, который мы получаем от тысяч реальных пользователей на нашем сайте LLM Arena?
Причём не в жёсткой парадигме «оцени по инструкции», а приближаясь к реальному user preference, когда пользователь выбирает то, что ему субъективно больше нравится.
TL/DR:
* Мы можем за 3 дня воспроизвести пользовательский рейтинг LLM с точностью 90%+;
* У нас есть отобранная команда аннотаторов и автоматический фильтр качества;
* Мы научились фильтровать фрод и мусорные промпты лучше, чем стандартные крауд-платформы;;
* Теперь мы можем быстро тестировать новые модели и выдавать предрейтинг до массового запуска. Читать далее
#llm #llmarena #краудсорсинг #ии #ai #оценка_моделей #нейросети #machinelearning #ml #open_source | @habr_ai
Хабр
Воспроизводимый рейтинг: можно ли с помощью краудсорсинга предсказать выбор пользователей LLM?
Всем привет! Сегодня хотим поделиться историей нашего эксперимента, который начался с простого вопроса: а можно ли с помощью краудсорсинга воссоздать рейтинг нейросетей, который мы получаем от тысяч...
ElizaOS v2: из мемного AI-фонда в полноценную систему для агентов
Помните ai16z, тот самый “хедж-фонд на ИИ” с отсылкой к Andreessen Horowitz? Так вот, из шутки он вырос в ElizaOS v2 — open-source фреймворк, который реально позволяет собирать автономных агентов.
Сегодня это уже не набор скриптов, а полноценная операционная система для цифровых компаньонов: с собственной памятью, мозгом (LLM) и возможностью работать напрямую с Web3 и внешними сервисами. Короче, из бот-игрушки он превратился в инструмент для серьёзных автономных агентов в Web3. В этой статье я разберу архитектуру ElizaOS v2, покажу ключевые компоненты и объясню, зачем она нужна нам, разработчикам. Читать далее
#elizaos #ai_агент #автономные_агенты #искусственный_интеллект #машинное_обучение #блокчейн #web3 #децентрализация #open_source | @habr_ai
Помните ai16z, тот самый “хедж-фонд на ИИ” с отсылкой к Andreessen Horowitz? Так вот, из шутки он вырос в ElizaOS v2 — open-source фреймворк, который реально позволяет собирать автономных агентов.
Сегодня это уже не набор скриптов, а полноценная операционная система для цифровых компаньонов: с собственной памятью, мозгом (LLM) и возможностью работать напрямую с Web3 и внешними сервисами. Короче, из бот-игрушки он превратился в инструмент для серьёзных автономных агентов в Web3. В этой статье я разберу архитектуру ElizaOS v2, покажу ключевые компоненты и объясню, зачем она нужна нам, разработчикам. Читать далее
#elizaos #ai_агент #автономные_агенты #искусственный_интеллект #машинное_обучение #блокчейн #web3 #децентрализация #open_source | @habr_ai
Хабр
ElizaOS v2: из мемного AI-фонда в полноценную систему для агентов
Помните ai16z, тот самый “хедж-фонд на ИИ” с отсылкой к Andreessen Horowitz? Так вот, из шутки он вырос в ElizaOS v2 — open-source фреймворк, который реально позволяет собирать автономных агентов....