338K subscribers
4.62K photos
948 videos
17 files
5.05K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Forwarded from Rust
🦀 Strand-Rust-Coder-14B - модель, заточенная специально под генерациию Rust кода.

Это не универсальный «кодинг-ассистент».
Модель дообучена именно на экосистеме Rust и пишет код на уровне опытного разработчика:
- идиоматичный Rust
- безопасная работа с памятью
- корректные async и ownership-паттерны
- акцент на производительность и системные задачи

Большинство моделей хорошо знают Python и JavaScript, но часто «путаются» в borrow checker, lifetimes и сложных Rust-конструкциях.

Strand-Rust-Coder решает именно эту проблему - фокус на системном программировании, low-level задачах и performance-critical приложениях.

https://huggingface.co/Fortytwo-Network/Strand-Rust-Coder-14B-v1

@rust_code
1👍87🔥2112👏11💯5🤔3😁2
⚡️ VK внедряет VLM в поиск VK Видео

VK начала внедрение визуально-языковых моделей в поисковые системы своих продуктов. Технология уже работает в VK Видео. Теперь система анализирует не только название и описание ролика, но и сами кадры, звук и видеоряд.

Тестирование гипотез ускорилось в 5 раз, новые улучшения внедряются заметно быстрее, а поиск будет развиваться динамичнее.

Технология также усилит векторный поиск. Система будет опираться не только на семантическое совпадение слов, но и на реальное содержание видео через анализ аудио и визуальных признаков.
Подобные мультимодальные подходы развивают Microsoft, Google и TikTok. Обновление поэтапно появится и в других сервисах VK.

@ai_machinelearning_big_data

#news #ai #ml #VK
1🤣100👍73🔥21👏8🥱7🤷‍♂5🗿5😁2🤔2🌚2😴1
⚡️ Релиз Gemini 3.1 Pro - новый уровень интеллекта моделей

Google официально представила Gemini 3.1 Pro, и результаты выглядят серьёзно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление — ARC-AGI-2.

- Резкий скачок качества
Результат почти в 2 раза выше, чем у предыдущей версии

- Обгоняет конкурентов
Gemini 3.1 Pro опережает Opus 4.6 и GPT-5.2 в задачах на обобщение и логическое мышление

- Сильнее в реальных сценариях
- программирование
- агентные задачи
- работа с новыми паттернами без примеров

- Новые возможности
Модель может генерировать анимированные SVG из текста и решать логические задачи, которых не было в обучающей выборке — это важный шаг к более универсальному AI.

Попробовать Gemini 3.1 Pro уже можно в Google AI Studio: blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

@ai_machinelearning_big_data
1🔥1274138👍12🤩11🙊10😴9🤷‍♂6👏6🌭5🙈5
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI поглотила команду поискового стартапа Nerve.

Команда Nerve переходит в OpenAI в рамках сделки формата acqui-hire. Технологии стартапа будут интегрированы в существующие продукты OpenAI для улучшения механизмов поиска на рабочих местах.

До поглощения Nerve работала как единый хаб. Система умела извлекать данные из корпоративных документов, электронной почты, Google Drive и Slack, заменяя рутинный ручной поиск автоматизированными сценариями.

Наработки Nerve станут инфраструктурным компонентом для создания будущих ИИ-агентов, способных самостоятельно оперировать корпоративной информацией и выполнять сложные многошаговые задачи.
usenerve.com

✔️ ByteDance открыла около 100 вакансий в США.

Китайская корпорация активно нанимает инженеров и исследователей в Сан-Хосе, Лос-Анджелесе и Сиэтле для лаборатории Seed.Перед кандидатами ставятся задачи по подготовке датасетов для LLM, улучшению алгоритмов генерации видео и изображений, а также разработка научных моделей для дизайна лекарственных препаратов.

Отдельный фокус сделан на проекте Seed Edge Research, цель которого в создании систем с человекоподобными способностями к обучению.

Агрессивный наем происходит на фоне многолетнего давления американских регуляторов. Несмотря на это, ByteDance явно не планирует уступать технологическую гонку и усиливает свои R&D-центры на территории конкурентов.
bloomberg.com

✔️ Microsoft научилась записывать данные в боросиликатное стекло.

В рамках проекта Project Silica инженеры решили фундаментальную проблему деградации носителей в дата-центрах. В Nature вышла статья о важном сдвиге: команда отказалась от дорогого чистого кварца в пользу доступного боросиликатного стекла. Фемтосекундные лазеры "прожигают" в пластине толщиной 2 мм сотни слоев информации

Фишка исследования — изобретение «фазовых вокселей». Раньше методы опирались на поляризацию, а новый подход изменяет фазу стекла и требует лишь одного лазерного импульса на воксель. Чтобы разобрать эту плотную трехмерную структуру и убрать искажения, Microsoft подключила нейросети. Скорость записи подняли, запустив несколько лучей параллельно, а само устройство упростили: теперь для чтения хватает одной камеры вместо четырех.

Стеклянный носитель не боится воды, высоких температур и пыли. Тесты на старение подтвердили, что записанная информация останется неизменной минимум несколько тысячелетий. На этом исследовательская часть Project Silica закончена. Технология готова, теперь на ее основе можно строить хранилища.
microsoft.com

✔️ Google запустила генератор продуктового фото.

Новая функция Photoshoot - часть маркетинговой платформы Pomelli. Инструмент ориентирован на малый и средний бизнес, он превращает через Nano Banana фотографии товаров в качественные студийные и лайфстайл-кадры без затрат на продакшен.

Платформа автоматически парсит сайт компании, извлекает фирменные цвета, шрифты и общую эстетику бренда для применения к генерируемому контенту. Сервис предлагает готовые визуальные пресеты, замену фона по текстовому запросу и перенос стиля с референсов. Пока это бесплатная бета, но только для США, Канады, Австралии и Новой Зеландии.
blog.google

✔️ Tavus сделала модель реалистичного рендеринга лица в реальном времени.

Phoenix-4 покадрово генерирует каждый пиксель лица и головы виртуального собеседника, опираясь на датасет из тысяч часов реальных диалогов.

Киллер-фича Phoenix-4 в способности анализировать контекст беседы и демонстрировать эмпатию. Модель знает более 10 эмоций и умеет плавно переключаться между ними в реальном времени. Разработчики заверяют, что тем самым победили эффект «зловещей долины».

Технически все серьезно: HD-видео, 40 кадров в секунду. Tavus предлагает использовать это в продажах, обучении и медицине - там, где человеку важно внимание.
tavus.io

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
765👍54🔥16👏4🌚3🥰2
📌 Аnthropic измерил, как люди на самом деле используют ИИ-агентов.

Создатели Claude проанализировали миллионы взаимодействий в Claude Code и через публичный API с помощью их инструмента Clio, чтобы понять, сколько автономии люди реально дают агентам, в каких доменах те работают и насколько рискованны их действия.

🟡 Агенты работают все дольше без участия человека.

За 3 месяца медианная длина самых долгих сессий в Claude Code почти удвоилась - с 25 до более чем 45 минут непрерывной работы. Причем рост плавный и не коррелирует с релизами новых моделей.

Это значит, что дело не только в возможностях модели, а в том, как пользователи выстраивают взаимодействие с агентом.

🟡Опытные пользователи ведут себя иначе, чем новички.

Среди тех, кто только начинает пользоваться Claude Code, около 20% сессий запускают с полным авто-апрувом, это когда агент выполняет все действия без подтверждений.

У опытных пользователей эта доля больше 40%. Плюс они чаще прерывают агента вручную.
Аnthropic предполагает, что это не потому, что теряется доверие, а потому что они берутся за более сложные задачи и лучше понимают, когда нужно вмешаться.

🟡Неочевидный факт: агент сам ограничивает свою автономию чаще, чем это делает человек.

На самых сложных задачах Claude Code останавливается и задает уточняющий вопрос вдвое чаще, чем по принудительному прерыванию человеком.

🟡Картина по доменам

Почти половина всей агентной активности через API - за разработкой ПО.

Есть прирост использования в медицине, финансах и кибербезопасности, но пока в небольших объемах.

По итогу исследования, Аnthropic пришла к выводу, что эффективный надзор за агентами требует не только технических ограничений, но и новой инфраструктуры пост-деплойного мониторинга и новых паттернов взаимодействия - где и человек, и агент совместно управляют автономией и рисками.

Текущие модели, по данным компании, технически способны на большую самостоятельность, чем им позволяют на практике.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍66🤔65👏45💋40😎28😢27🤣23🎉2221🫡16👨‍💻15
AI уже не запрещают на собеседованиях – его требуют

В Циане изменили подход к найму: кандидатам в Product & Technology и HR рекомендуют выполнять тестовые задания и live coding с помощью AI-ассистентов.

Компания оценивает не только результат, но и то, как человек работает с AI:
- качество взаимодействия с инструментом
- скорость решения задач
- умение проверять и дорабатывать ответы
- соблюдение принципов безопасного и этичного использования

Сегодня более 75% разработчиков в компании уже используют AI в работе.

По словам Максима Радюкова, директора по информационным технологиям Циана, владение AI-инструментами становится нормой рынка, а инвестиции в эти навыки – ключевым конкурентным преимуществом.

В планах – масштабировать подход на всех сотрудников.

Вывод

Раньше на собеседовании проверяли, умеешь ли ты кодить.
Теперь – умеешь ли ты эффективно работать вместе с AI.

AI перестаёт быть «читом» – он становится базовым рабочим инструментом.
👍90🤝40😁317👏6🤔6🔥5👨‍💻5👾3🎅2🥰1
📌Насколько Skills реально помогают LLM-агентам.

SkillsBench — исследование и первый бенчмарк, где Agent Skills тестируются как самостоятельный артефакт.

Авторы из 15+ топовых университетов взяли 84 задачи из 11 доменов, запустили 7 конфигураций моделей (Claude Code с Opus/Sonnet/Haiku 4.5 и 4.6, Gemini CLI с Gemini 3 Pro/Flash, Codex с GPT-5.2) и проверили 3 условия: без Skills, с готовыми Skills и с самостоятельно сгенерированными Skills. Итого: 7 308 траекторий с детерминированными верификаторами на pytest.

Готовые Skills в среднем поднимают pass rate на 16,2 процентных пункта: с 24,3% до 40,6%. Но картина неоднородная: в медицине прирост составил +51,9%, для производства — +41,9%, тогда как в разработке ПО всего +4,5%.

Это объяснимо: там, где модели плохо покрыты обучением (клинические протоколы, промышленные воркфлоу), Skills дают максимальный эффект. Там, где модель и так знает домен - почти ничего.

🟡Главный и неожиданный результат: самогенерация Skills не работает.

Когда моделям предлагали сначала написать нужные гайды, а потом решать задачу, средний результат упал на 1,3% по сравнению с работой вообще без Skills. Только Claude Opus 4.6 показал скромный плюс (+1,4%), а GPT-5.2 просел на 5,6%.

Иными словами - модели не умеют надежно создавать то знание, которым умеют пользоваться.


🟡Еще один интересный момент - это объем Skills.

Оптимальный вариант: 2–3 модуля, прирост +18,6%. При 4 и более - всего +5,9%. Подробная документация вообще дает отрицательный эффект: –2,9%, с ней агент буквально тонет в контексте.

Показательна и стоимость решения задач: Haiku 4.5 со Skills обходит Opus 4.5 без Skills — меньшая и более дешевая модель с готовыми Skills бьет старшую модель без них.

Gemini 3 Flash при этом показал лучший абсолютный результат среди всех конфигураций - 48,7% со Skills при цене $0,57 за одну задачу против $1,06 у Gemini 3 Pro.


🟡Страница проекта
🟡Arxiv


@ai_machinelearning_big_data

#AI #ML #LLM #Benchmark #Skills
Please open Telegram to view this post
VIEW IN TELEGRAM
👍68🤓4519🤔9👏8❤‍🔥6👌5🔥1🥰1
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI выпустит умную колонку с камерой в 2027 году.

Компания готовит к запуску линейку фирменных гаджетов. Первым устройством станет умная колонка. Ее релиз ожидается не раньше февраля 2027 года по цене от 200 до 300 долларов.

Фишкой гаджета станет встроенная камера с функцией распознавания лиц. Устройство сможет анализировать происходящее вокруг и давать проактивные советы. Производство аппаратных новинок планируют поручить компании Foxconn.

Колонка станет отправной точкой для новой экосистемы. В разработке также находятся умные очки (старт производства в 2028 гоу), беспроводная гарнитура Sweetpea, умный стилус Gumdrop и прототип настольной лампы.
theinformation.com

✔️ Команда llama.cpp и GGML присоединилась к Hugging Face.

Георгий Герганов и его команда переходят в Hugging Face. Проект llama.cpp останется полностью открытым и независимым. Разработчики сохранят за собой техническое руководство, а Hugging Face обеспечит финансирование и ресурсы.

Цель партнерства - техническая интеграция. Поскольку transformers де-факто стала стандартом для архитектур ИИ-моделей, а llama.cpp выступает фундаментом для их локального инференса, команды хотят максимально упростить связку этих инструментов. В будущем развертывание новых моделей из transformers в llama.cpp должно работать в один клик.

Также планируется улучшить упаковку и общий пользовательский опыт архитектуры GGML. Hugging Face делает ставку на то, что локальный инференс вскоре станет альтернативой облачным вычислениям.
huggingface.co

✔️ Claude научился создавать и редактировать презентации внутри PowerPoint.

Anthropic выпустила официальную интеграцию ИИ-ассистента для Microsoft PowerPoint. Плагин уже появился в Microsoft Marketplace и доступен в статусе бета-версии для подписчиков тарифов Pro, Max, Team и Enterprise.

Через Claude можно генерировать целые презентации или править отдельные слайды с помощью текстовых запросов. Чат-бот понимает контекст текущего дизайна - он умеет считывать макеты, шрифты и цветовую палитру из образца слайдов. Таким образом, все новые элементы и сгенерированный контент автоматически подстраиваются под корпоративный стиль или существующее оформление документа.
claude.com

✔️ Pika Labs анонсировала сервис цифровых двойников с долгосрочной памятью.

Новая функция AI Selves позволит развернуть виртуального двойника, который обладает памятью, уникальным характером и способен самостоятельно общаться с другими людьми. За мимику и артикуляцию при разговоре отвечают собственные аудиовизуальные модели лаботатории.

Пользователи смогут детально настраивать свою копию: задавать голос, манеру общения и загружать конкретные факты биографии или личные предпочтения. Процесс напоминает воспитание аватара, где создатель несет ответственность за заложенные в ИИ инструкции. Предполагается, что такие агенты будут интегрированы в мессенджеры и соцсети, где смогут общаться и действовать от имени пользователя.

Pika Labs открыла регистрацию через список ожидания. Стоимость использования сервиса или уровнях подписки пока неизвестны.
Pika Labs в сети Х

✔️ Microsoft разработала план борьбы с дипфейками.

Команда Microsoft по безопасности ИИ оценила 60 комбинаций методов верификации цифрового контента и опубликовала рекомендации для платформ и ИИ-компаний. Схема трёхуровневая: история происхождения файла, водяные знаки и цифровая подпись контента. Вместе они позволяют отследить, было ли изображение или видео создано или изменено ИИ, но не определить, правда ли это.

Главная ирония: когда CSO компании Эрик Хорвиц спросили, внедрит ли Microsoft собственные рекомендации в Copilot, LinkedIn и Azure, он ушёл от прямого ответа.

Эксперт по цифровой криминалистике из UC Berkeley Хани Фарид оценивает инициативу осторожно: стандарт не решит проблему целиком, но существенно усложнит массовый выброс фейков.
technologyreview.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
57👏37👍32🔥9🎉4🤔3😁2🤨1
This media is not supported in your browser
VIEW IN TELEGRAM
💰 86-летний фермер из Пенсильвании отказался превращать свои поля в дата-центр для ИИ, даже за $15 млн.

Мервину Раудабо предложили около $60 000 за акр, но он не захотел уничтожать ферму, которую ведёт уже более 60 лет.

Вместо этого он продал права на застройку природоохранному фонду за $2 млн, теперь эта земля навсегда останется сельскохозяйственной.

«Вы генерируете текст.
Я генерирую ужин.»
Please open Telegram to view this post
VIEW IN TELEGRAM
310🔥74👍47👌39👏20😁14🤣138🤨4🤔1😢1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Anthropic запустила Claude Code Security.

Новый инструмент сканирует кодовую базу и предлагает патчи для исправления найденных проблем. Сейчас он доступен в режиме ограниченного превью для Enterprise и Team клиентов, а мейнтейнеры репозиториев могут запросить приоритетный бесплатный доступ.

Обычный статический анализ ищет совпадения с известными паттернами уязвимостей. Этого достаточно, чтобы поймать торчащие наружу пароли или устаревшее шифрование.

Но прорехи в бизнес-логике или сломанный контроль доступа такие инструменты пропускают - там нужно понимать, как компоненты взаимодействуют между собой и куда движутся данные.

Claude Code Security делает именно это: читает и анализирует код так, как его читал бы человек-исследователь безопасности.

Каждая находка проходит многоступенчатую верификацию. Claude сам перепроверяет результаты, пытаясь опровергнуть собственные выводы и отсеять ложные срабатывания.

Финальные находки появляются в дашборде с оценкой серьезности и уровнем уверенности модели. Решение, применять предложенный патч или нет остается за людьми, без человеческого одобрения ничего не меняется.

За инструментом - более года исследований. Команда Frontier Red Team тестировала Claude на соревнованиях CTF и совместно с Pacific Northwest National Laboratory отрабатывала защиту критической инфраструктуры.

С Opus 4.6 команда обнаружила в open-source проектах более 500 уязвимостей, которые не замечали годами, несмотря на регулярный аудит.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥78👏40👍2117🤔9🎉4👌3
📌Сэм Альман дал интервью индийской прессе в рамках India AI Impact Summit 2026.

Трансляция длилась час и содержала много риторики в сторону Индии. Мы собрали ключевые и наиболее интересные высказывания:

🟡Эволюция ИИ

Скорость развития моделей от базовых задач к решению научных проблем не имеет аналогов в истории технологий.

Глубокое обучение уникально тем, что небольшая группа исследователей нашла единый алгоритм, способный обучаться чему угодно, и его эффективность непрерывно растет.

Год назад ИИ справлялся только с математикой на уровне старшей школы, испытывая трудности с программой начальных классов за пару лет до этого.

Летом модели начали конкурировать в сложнейших математических олимпиадах, а на прошлой неделе проект First Proof ИИ решил 7 из 10 математических проблем, ответы на которые ранее не были известны ученым.

Codex полностью изменили профессию программиста. Текстовый запрос теперь позволяет сгенерировать приложение целиком.

🟡Инфраструктура

Требования к вычислительным мощностям для достижения AGI выходят за рамки существующих физических и экономических возможностей планеты.

Индустрия ИИ представляет собой «пятислойный пирог»: энергетика, дата-центры, чипы, базовые модели и конечные приложения.

Развертывание инфраструктуры станет самым дорогим и сложным проектом за всю историю человечества. Для его реализации невозможно использовать традиционные методы - потребуется массовое привлечение ИИ и промышленных роботов для строительства.

Концепция размещения дата-центров в космосе абсурдна. Стоимость запуска оборудования несоизмеримо выше затрат на наземную электроэнергию, а починить сломанный GPU в космосе физически некому. Орбитальные дата-центры не обретут смысл в текущем десятилетии.

🟡Геополитика и альянс с государством

Технологическая индустрия, зародившаяся в Кремниевой долине на принципах либертарианства, должна радикально изменить подход. Для достижения AGI потребуется беспрецедентный уровень интеграции с правительствами.

В гонке ИИ Китай обладает подавляющим преимуществом в смежных физических отраслях: производстве промышленных роботов, электромоторов, магнитов и развертывании энергетической инфраструктуры.

Крайне опасен сценарий, при котором AGI будет монополизирован одной компанией или одним государством. Распределение мощностей должно быть демократизировано для соблюдения баланса сил на международной арене.

Уже наблюдается децентрализация: команды из 1-3 человек, используя ИИ-агенты, создают стартапы с феноменальным уровнем успеха и капитализации, что было невозможно еще несколько лет назад.

ИИ-системы уже могут применяться правительствами для анализа массивов разведывательных отчетов. Категорически недопустимо использование ненадежных open-source моделей для принятия критических военных решений.

🟡Энергопотребление

Оценка экологического следа дата-центров сопровождается дезинформацией.

Утверждения о том, что ChatGPT расходует 17 галлонов воды на каждый поисковый запрос, являются фейком. Современные дата-центры отказываются от систем испарительного охлаждения.

Общее потребление энергии дата-центрами абсолютно реально и огромно. Миру необходимо экстренно переходить на ядерную, ветровую и солнечную энергетику.

Данные Билла Гейтса о том, что один запрос к ChatGPT эквивалентен разрядке 10 батарей iPhone, сильно завышены.

Альтман предложил сравнение энергетических затрат на тренировку ИИ-модели с затратами на обучение человека. Специалисту требуется 20 лет потребления пищи и ресурсов планеты, прежде чем он сможет выполнять сложные когнитивные задачи. ИИ с этой точки зрения уже выигрывает по энергоэффективности.

🟡Блок ответов на вопросы

При гипотетическом выборе ИИ-ассистента из чужих моделей (Grok, Claude, Gemini, DeepSeek), Сэм отдаст предпочтение Gemini.

Отказ от доли в капитале при создании OpenAI Альтман называет одним из самых глупых решений.

Самый дорогой и значимый найм в истории компании - Илья Суцкевер.

OpenAI не станет отказываться от рекламной модели монетизации, если это потребуется.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73🔥2016👏7🤔2🥱1😎1
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍90😁89💯155🔥4👏4🤔2🥱2🎉1🌭1