266K subscribers
3.94K photos
674 videos
17 files
4.53K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
📌g-AMIE: мультиагентная система от Google Reserch.

Google представила g-AMIE (guardrailed-AMIE) — расширенную версию своей исследовательской системы AMIE, которая работает в паре с врачом по принципу асинхронного надзора.

Идея проста: ИИ собирает анамнез, а врач принимает решения. Для этого была разработана многоагентная система на базе Gemini 2.0 Flash и специальный веб-интерфейс "кабинет врача"

🟡Обновленная система состоит из 3 агентов.

Агент-диалог ведёт беседу с пациентом, собирая информацию. Его работа делится на 3 фазы: общий сбор анамнеза, целенаправленная проверка первоначального дифференциального диагноза и заключительная фаза с ответами на вопросы пациента.

Агент-ограничитель следит за тем, чтобы агент-диалог не давал никаких индивидуальных медицинских советов, диагнозов или планов лечения, при необходимости перефразируя его ответы.

Агент SOAP-записи генерирует подробную медицинскую карту в популярном формате SOAP, разделяя задачи предварительных итогов (жалобы пациента, объективные данные) и вывода (оценка и план лечения).

После сбора анамнеза сгенерированная SOAP-запись и черновик заключения отправляются на проверку врачу через «кабинет врача». Врач может редактировать документы и либо одобрить отправку сообщения, либо принять решение о необходимости очной консультации.

Чтобы оценить эффективность такого подхода, было проведено рандомизированное слепое исследование в формате виртуального объективного структурированного клинического экзамена (ОСКЭ) на 60 клинических сценариях.

В исследовании участвовали пациенты, g-AMIE и 2 контрольные группы: врачи общей практики и медсестры-практики/ассистенты врачей. Обеим человеческим группам было предписано работать в тех же ограничениях, что и g-AMIE, то есть только собирать анамнез без предоставления советов. Затем их SOAP-записи и проекты сообщений оценивались группой опытных врачей-наблюдателей.

🟡Результаты эксперимента.

Во-первых, g-AMIE успешно справился с задачей и ни разу не был уличён в предоставлении индивидуальных медицинских советов.

Во-вторых, его способность извлекать ключевую информацию из беседы с пациентом была оценена выше, чем у обеих контрольных групп. SOAP-записи, сгенерированные g-AMIE, были признаны более полными, точными и читаемыми.

Врачи-наблюдатели чаще предпочитали работать с записями от ИИ и с большей вероятностью одобряли составленные им сообщения для пациентов.

Более того, дифференциальные диагнозы и планы лечения, основанные на данных от g-AMIE, были оценены как более адекватные.

🟡Нюансы.

g-AMIE оказался более "многословным", что, с одной стороны, способствовало лучшему установлению контакта с пациентом (тестовые пациенты отметили его эмпатию), но с другой — приводило к более длительному времени проверки записей врачами.

Во-вторых, хотя в записях g-AMIE и встречались галлюцинации, их частота была сопоставима с ошибками памяти у людей.

Интересно, что медсестры и ассистенты врачей показали себя лучше, чем врачи общей практики, как в сборе анамнеза, так и в соблюдении ограничений.

Авторы объясняют это тем, что врачи не привыкли воздерживаться от советов во время консультации и их стандартный рабочий процесс был нарушен. Поэтому результаты не следует интерпретировать как прямое превосходство ИИ над клиницистами в реальном мире, так как люди не были обучены работать в этой новой парадигме.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7423🔥13🥰3
Media is too big
VIEW IN TELEGRAM
✔️ Claude будет завершать токсичные диалоги.

Anthropic добавила в Claude Opus 4 и 4.1 возможность принудительно завершать беседу. Эта функция предназначена для редких, крайних случаев постоянно враждебного или оскорбительного поведения со стороны пользователя.

Это крайняя мера, к которой чат-бот прибегнет только после многократных безуспешных попыток перенаправить разговор в продуктивное русло или по прямой просьбе пользователя. При этом система не будет использовать эту возможность, если есть риск, что пользователь может причинить вред себе или окружающим.

Когда Claude завершает диалог, пользователь не сможет отправлять новые сообщения в этой ветке, но сможет начать новый чат или отредактировать старые сообщения для создания новых ветвей.
anthropic.com

✔️ Мобильное приложение ChatGPT заработало 2 млрд. долларов с момента запуска.

Согласно данным компании Appfigures, мобильное приложение ChatGPT сгенерировало 2 млрд. долларов потребительских расходов с момента запуска в мае 2023 года. В среднем каждый из 690 млн. пользователей потратил в приложении 2.91 доллара. Это говорит о готовности аудитории платить за ИИ-сервисы на мобильных устройствах.

Темпы роста выручки резко ускорились в этом году. С января по июль 2025 года пользователи потратили в приложении 1.35 млрд. долларов, на 673% больше, чем за аналогичный период прошлого года. Это эквивалентно примерно 193 млн. долларов в месяц. США лидируют по доходам (38%), а Индия — по количеству установок (14%).

Эти метрики показывают отрыв ChatGPT от конкурентов. Для сравнения, Grok заработал в этом году 25.6 млн., а доходы Claude и Copilot вместе взятых составляют лишь одну тридцатую от мобильной выручки OpenAI.
techcrunch.com

✔️ Tencent выпустила облегченную модель для генерации 3D-миров.

Tencent представила Hunyuan World Model 1.0-Lite оптимизированную версию своей модели для генерации трехмерных сцен, которая может работать на потребительских GPU. Разработчики снизили требования к видеопамяти на 35% (с 26 до 17 ГБ) благодаря динамическому FP8-квантованию.

За счет использования SageAttention и оптимизации кэширования удалось ускорить инференс более чем в 3 раза с потерей точности менее 1%.
Как и оригинальная версия, 1.0-Lite имеет открытый исходный код и уже доступна на GitHub, Hugging Face, а также в виде демо SceneTo3D.
Tencent Hunyuan в сети X

✔️ OpenAI работает над ИИ-системами, способными решать задачи часами и днями.

В подкасте на Youtube OpenAI рассказали о разработке нового класса моделей, ориентированных на долгосрочное мышление. Системы на их основе смогут планировать, рассуждать и экспериментировать над одной проблемой на протяжении длительного времени, от нескольких часов до нескольких дней.

По словам OpenAI , первые проблески этого подхода уже видны в моделях, которые недавно завоевали золото на международных олимпиадах по математике и информатике. Конечная цель - автоматизировать исследования, например, для поиска новых идей в медицине или в области безопасности самого ИИ.

В OpenAI признают, что реализация этой концепции потребует значительно больших вычислительных мощностей, чем доступны сегодня. Это объясняет готовность Сэма Альтмана инвестировать в строительство дата-центров в ближайшие годы.
OpenAI на платформе Youtube

✔️ Google сделала поиск авиабилетов по текстовому описанию.

Google запустил новый инструмент Flight Deals. Он использует ИИ для поиска выгодных перелетов по запросам на естественном языке, а не через стандартные фильтры. Пользователи могут описать свои пожелания в свободной форме, например, «недельная поездка этой зимой в город с хорошей едой, только прямые рейсы». Инструмент ориентирован на путешественников с гибкими планами, для которых приоритетом является цена.

По заявлению Google, система использует продвинутый ИИ для понимания нюансов запроса, а затем анализирует данные Google Flights в реальном времени, чтобы показать актуальные варианты. Сервис запускается в бета-режиме и в течение недели станет доступен пользователям в США, Канаде и Индии.
blog.google

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
55👍22🔥11😁5🤷2
Разбираем тестовое задание в Яндекс на позицию Junior аналитика данных

Тестовое задание — важная часть трудоустройства аналитика. Это шанс показать свои навыки на практике и получить оффер мечты.

Приглашаем на бесплатный вебинар, где Андрон Алексанян — эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет тестовое задание в Яндекс на позицию Junior аналитика данных.

⚡️На вебинаре вы:
🟠узнаете, какие навыки и знания необходимы для успешного выполнения заданий;
🟠поймёте, что хочет увидеть работодатель;
🟠получите советы и лайфхаки;
🟠вместе с Андроном разберете в прямом эфире реальный пример тестового 🔥


Чему именно научимся на вебинаре:
🟠С помощью Pandas проанализируем Яндекс-запросы за несколько недель, загрузив их из json-файла;
🟠Найдем закономерности и отличия использования сервиса на мобильных устройствах и компьютерах;
🟠Разберем фишки Pandas: сложную агрегацию, маппинг, конкатенацию, чейнинг и др.


🕗 Настоятельно рекомендуем не пропускать — для зрителей у нас есть особый бонус, который обеспечит вам уверенный старт в вашей карьере.

😶Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2818👍8🤣5🔥3🤨2🤬1🐳1🗿1
Media is too big
VIEW IN TELEGRAM
🎧 Perch 2.0 — AI, который слушает природу и спасает вымирающие виды.

DeepMind выпустили Perch 2.0 — компактную supervised-модель для биоакустики.

Без миллиардов параметров, без сложного self-supervised обучения — просто аккуратная модель, которая побила все бенчмарки и уже работает в полевых исследованиях.

🌱 Почему это важно
Звуки природы — это источник данных о биоразнообразии.
По аудиозаписям можно понять:
- какие животные живут в лесу,
- сколько их,
- размножаются ли они,
- не вытесняются ли они человеком.

Но расшифровка аудио — адский труд: в одном часе записи из тропиков десятки накладывающихся голосов.

🐦 Что умеет Perch 2.0
Perch 2.0 — универсальный эмбеддер для звуков животных.
Берёт 5 секунд аудио → выдаёт вектор, с которым можно:
- находить похожие записи,
- кластеризовать звуки,
- обучать простой классификатор для новых видов (few-shot).

Работает без GPU и без дообучения.

🛠 Архитектура
- Основa: EfficientNet-B3 (12M параметров).
- Три головы:
1. Классификация ~15k видов.
2. Прототипная — создаёт семантические логиты для distillation.
3. Source prediction — угадывает источник записи.
- Обучение в два шага:
1. Прототипная голова учится сама.
2. Её логиты становятся soft-label’ами для основной (**self-distillation**).

📊 Результаты
- SOTA на BirdSet и BEANS (ROC-AUC, mAP).
- Отличная переносимость на морских данных (киты, дельфины), которых почти не было в тренировке.
- Всё это — без fine-tuning, только фиксированные эмбеддинги.

Главный вывод
Perch 2.0 показывает, что:
🟢 качественная разметка,
🟢 простая архитектура,
🟢 чёткая постановка задачи
могут быть важнее, чем «бесконечные параметры» и сложные LLM.

🌍 Что это меняет
- Биологам — быстрый анализ джунглей Бразилии или рифов без написания своих моделей.
- ML-инженерам — наглядный пример, как обучать компактные сети без потери качества.
- Исследователям — напоминание: не всегда нужен GPT-4, чтобы сделать полезный инструмент.

🟠Github: https://github.com/google-research/perch-hoplite
🟠Подробнее: https://deepmind.google/discover/blog/how-ai-is-helping-advance-the-science-of-bioacoustics-to-save-endangered-species/
🟠Статья: http://arxiv.org/abs/2508.04665

@ai_machinelearning_big_data


#DeepMind #AI #Bioacoustics #MachineLearning #Perch #Ecology
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍8346🔥24❤‍🔥4
👁️YouTube запускает эксперимент: AI теперь «угадывает» возраст по вашему поведению.

👀 Что делает система:
- анализирует, что вы ищете и смотрите, сколько лет аккаунту;
- решает, что вам меньше 18, и сразу включает детский режим:
• выключает персонализированную рекламу
• добавляет «цифровое благополучие» и другие ограничения
- снять блок можно только через паспорт, карту или селфи.

50 000+ человек уже подписали петицию против этой системы.

Где ломается логика:
Алгоритм ошибается на ±2 года. В зоне риска — подростки и молодёжь 16–20 лет. Взрослый, который смотрит мультфильмы или делит аккаунт с семьёй, тоже легко попадёт в «дети».

🔒 Самое спорное — апелляция. Чтобы доказать возраст, нужно загрузить документы и фото лица. Это значит, что у YouTube появятся централизованные базы с ID, картами и биометрией.

📌 Подробнее

@ai_machinelearning_big_data


#YouTube #privacy #ai
Please open Telegram to view this post
VIEW IN TELEGRAM
🤬190😁4122👍12🔥5🌚3😐2🌭1🤣1
Авито — в топе рейтинга работодателей для специалистов по ИИ

Технологическая платформа Авито поднялась сразу на +3 позиции за год и заняла 2 место в списке самых привлекательных работодателей для специалистов в области искусственного интеллекта и работы с данными — опрос DevCrowd. Это компания, которая занимается исследованиями рынка айти-специалистов.

🔹 Авито делает серьезную ставку на машинное обучение

- 46,8% data-специалистов называют Авито компанией мечты.
- 12+ млрд ₽ инвестиций в ИИ-направление за 3 года.
- Планы монетизации технологий — прибыль 21+ млрд ₽ к 2028 году.
- Собственные генеративные модели: A-Vibe (текст) и A-Vision (мультимодальная).
- Новый R&D-отдел — центр ИИ-экспертизы.

💼 Какие факторы специалисты считают ключевыми для выбора работодателя в data science:


- Сложные и интересные задачи
- Конкурентный уровень зарплаты
- Возможности для вертикального и горизонтального роста
- Сильное профессиональное коммьюнити

Авито старается укреплять позиции технологического лидера и одного из лучших работодателей для тех, кто хочет развивать искусственный интеллект в реальных продуктах.

🤍 Подпишитесь на полезные каналы Авито
Please open Telegram to view this post
VIEW IN TELEGRAM
😁47🤣24👍1110🔥4🤨2🦄2🌭1😨1🗿1
📌Подборка материалов по оптимизации агентных систем.

Awesome-Self-Evolving-Agents - подборка материалов по теме оптимизации агентов в концепции саморазвивающихся систем, в которой собраны работы с 2023 по 2025 год по 3-м направлениям: оптимизация одиночного агента, оптимизация мультиагентных систем и методы их оценки.

Содержание

🟡Оптимизация одного агента

🟢Оптимизация поведения LLM

🟢Оптимизация промпта

🟢Оптимизация памяти

🟢Инструменты

🟡Мультиагентная оптимизация

🟡Оценка

🟠LLM-судья

🟠Агент-судья

🟠Безопасность и элайнмент саморазвивающихся агентов


@ai_machinelearning_big_data

#AI #ML #LLM #Agents #AwesomeList #Github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5726🔥9
Media is too big
VIEW IN TELEGRAM
⚡️ Андрей Карпаты о том, что делает стиль работы Илона Маска уникальным

Карпаты, руководивший командой компьютерного зрения Tesla Autopilot, объясняет, почему Маск — особенный лидер.

1️⃣ Маленькие, сильные, технические команды
— В обычных компаниях команды разрастаются, но Илон всегда выступает против этого.
— Наём новых людей нужно буквально «выбивать».
— Низкоэффективных сотрудников он быстро убирает.
— Никакого «среднего менеджмента» без технического бэкграунда.

2️⃣ Офис как место драйва
— Ненавидит стагнацию и большие бесполезные митинги.
— Поощряет уходить со встреч, если ты не учишься и не вносишь вклад.
— Культура: меньше «комфорта», больше фокуса на интенсивной инженерной работе.

3️⃣ Прямой контакт с инженерами
— Обычно до CEO не добраться напрямую — сотрудники общаются через несколько уровней начальников и вице-президентов.
— Маск же много времени разговаривает напрямую с инженерами.
— Источник истины — код и инженеры, а не менеджеры.

4️⃣Лично решает сложные вопросы
— Если инженеры говорят: «Не хватает GPU», он сразу звонит ответственному за кластеры.
— Если виновата NVIDIA — звонит напрямую Дженсену Хуану.

🟠 Карпаты: «Многие недооценивают, насколько Илон вовлечён в повседневные операции. Он постоянно устраняет узкие места и держит руку на пульсе».

🟢 Урок: маленькие сильные команды, прогрессивная инженерная культура и CEO, который лично решает критические проблемы.

@ai_machinelearning_big_data

#Karpathy #elonmusk
Please open Telegram to view this post
VIEW IN TELEGRAM
117🔥55👍38🗿10😁3🐳3😭3🤔2
🎙️ NVIDIA выпустили Canary-1B v2 — открытую модель для распознавания и перевода речи, которая работает с 25 европейскими языками.

Что она умеет:
- 📝 Точное ASR (распознавание речи) и AST (перевод речи) между английским и 24 другими языками.
- Автоматическая пунктуация, капитализация и точные таймстампы до слова.
- Поддержка русского, французского, немецкого, испанского и многих других языков.

Чем интересна
- До 10× быстрее инференс, чем у моделей в 3 раза больше.
- Уже показывает state-of-the-art точность среди открытых моделей на Hugging Face.
- Лицензия CC-BY-4.0 — можно свободно использовать в проектах.

Под капотом:
- Архитектура: FastConformer-энкодер + Transformer-декодер (~978M параметров).
- Форматы: .wav и .flac, моно 16 кГц.
- Легко интегрируется через NVIDIA NeMo или прямо с Hugging Face.

Где пригодится:
🟢 голосовые ассистенты
🟢 субтитры и перевод видео
🟢 чат-боты с речевым вводом
🟢 real-time анализ речи

Всего ~978M параметров → легче, быстрее и дешевле в использовании, чем большие модели конкурентов.

🟠 Попробовать можно здесь: https://huggingface.co/nvidia/canary-1b-v2
🟠SET: https://huggingface.co/datasets/nvidia/Granary
🟠PARAKEET: https://huggingface.co/nvidia/parakeet-tdt-0.6b-v3

@ai_machinelearning_big_data


#AI #NVIDIA #SpeechRecognition #ASR #AST #Multilingual #MachineLearning #DeepLearning
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83🔥39152
AI ПО — главный драйвер роста российского ИТ-рынка

Согласно исследованию Б1, опубликованному сегодня, сегмент ИИ-ПО ждет взрывной рост — в среднем более 25% ежегодно до 2032 года. Если в 2024 году его объем оценивался в 48 млрд рублей, то к 2032 году он достигнет 286 млрд. Основными драйверами станут AI-аналитика, спрос на приложения с AI-функционалом, автоматизация и переход на SaaS/PaaS-решения. Российский тренд повторяет глобальный: мировой рынок ПО к 2028 году будет расти быстрее среднерыночных показателей, а AI-решения станут ключевым фактором этого роста.

Глобальный спрос на ИИ уже сейчас формирует новые стандарты: к 2026 году более 80% компаний по всему миру будут использовать ПО с AI-функционалом (против 5% в 2023-м). В 2025 году 40% крупнейших корпораций направят значительную часть ИТ-бюджетов на AI-решения, а мировой рынок AI ПО до 2028 года будет расти на 40+% в год.
Причина ажиотажа - измеримая эффективность AI, особенно востребованная в условиях нестабильности.
В России лидерами сегмента стали GreenData, BPMSoft и FabricaOne.AI, которая также возглавляет топ заказной разработки.


Среди ключевых трендов - рост low/no-code платформ (+22% в год), автоматизация промышленности (объем сегмента достигнет 66 млрд руб. к 2032 году) и расширение аналитического ПО за счет новых функций, от EPM до глубокой прогнозной аналитики. Интеграция AI в бизнес-процессы и госсектор подстегнет спрос на кастомизированные решения, что дополнительно разгонит заказную разработку - к 2032 году ее объем вырастет до 282 млрд руб. Уже в 2024 году на нее пришлось 24% всего рынка ИТ-услуг, что делает ее самым динамичным направлением.

Компании с экспертизой в ИИ будут определять будущее рынка, консолидируя сегменты тиражного и заказного ПО, как это делает FabricaONE.AI. Рынок AI-софта только набирает обороты, и его потенциал далек от исчерпания.
👍29🤣235🤬3🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
📌В Пекине прошел первый в мире чемпионат по футболу среди гуманоидных роботов.

Всемирные игры гуманоидных роботов 2025 завершились 17 августа в Пекине.

В финале "5 на 5" команда «Огненный бог» из Университета Цинхуа победила немецкую команду HTWK Robots + Nao Devils со счётом 1:0 и завоевала чемпионский титул.

По данным CCTV, матч полностью контролировался алгоритмами ИИ без какого-либо вмешательства человека, 10 роботов самостоятельно выполняли на поле действия отбора мяча, передачи и ударов по воротам.

В другом финале, "3 на 3", команда «Шаньхай» из Китайского сельскохозяйственного университета также одержала победу над немецкой командой Sweaty.

👍Ставь лайк, если с детства за Огненного бога.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7429🔥13😁8🤔3