Технозаметки Малышева

📌

72B слишком много для VLM? А 7B параметров недостаточно!

QWEN только что выпустили новую модель на 32B параметров, Qwen2.5-VL-32B-Instruct.

Эта модель представляет собой значительный прогресс для своего размера. И что самое лучшее, она лицензирована Apache 2.

Модель выдает более подробные и структурированный ответы.

💡 Детальное понимание: превосходные возможности анализа изображений и визуальной логической дедукции.

📊 Превосходит сопоставимые модели, такие как Mistral-Small-3.1-24B и Gemma-3-27B-IT.

🚀 В нескольких тестах даже превосходит более крупный Qwen2-VL-72B-Instruct.

Еще один крутой релиз понедельника!

🟢

Блог: https://qwenlm.github.io/blog/qwen2.5-vl-32b/

🟢

Попробовать: https://chat.qwen.ai
ВЧ: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct

🟢

Модель: https://modelscope.cn/models/Qwen/Qwen2.5-VL-32B-Instruct

@ai_machinelearning_big_data

#AI #ML #LLM #Dataset #HuggingFace

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10⚡1

1.17K views18:15

Технозаметки Малышева

🤖 ИИ в руках программистов: помощник или конкурент?

WIRED провёл интересное исследование – опросили 730 программистов о том, как и насколько интенсивно они используют ИИ.
Результаты, в целом, предсказуемые, но интересно для статистики.

Согласно материалам исследования, в сообществе разработчиков мнения разделяются.
Одни активно используют ИИ каждый день, другие отказываются к нему прикасаться.
Некоторые компании платят за ИИ-сервисы, а некоторые их вообще запрещают.

Главный вопрос: ИИ освобождает программистов или готовит почву под их увольнение?

Посмотрим для сравнения на другое исследование GitHub 2024 года.
Там опросили 2000 разработчиков из США, Бразилии, Индии и Германии – и картина получилась следующая:

- 97% опрошенных хотя бы раз использовали ИИ-инструменты для кодинга на работе 🤯
- В США 88% компаний хотя бы частично поддерживают использование ИИ, в Германии таких только 59%
- 90% разработчиков из США отметили улучшение качества кода благодаря ИИ

Вернёмся к WIRED. Среди опрошенных WIRED программистов сформировалось три лагеря:

1. Пессимисты – малочисленная, но громкая группа, уверенная, что ИИ сожрёт все рабочие места программистов, как только корпоративные боссы поймут его возможности

2. Скептики – считают ИИ чем-то вроде сверхэффективного стажёра: полезный, но бестолковый. Не понимает контекст, не справляется с нетипичными случаями, не умеет по-настоящему решать проблемы

3. Реалисты – видят в ИИ "усилитель возможностей, а не киллера рабочих мест". Автоматизирует рутину, но креатив, архитектура и отладка остаются людям

Технические детали:

Исследование выявило интересный момент: сгенерированный ИИ код часто содержит ошибки, требующие человеческой проверки.
В условиях нехватки специалистов по безопасности (согласно отчету ISC2) это особенно критично.

Так, 100% респондентов в США сообщили об использовании ИИ для автоматизации проверок безопасности, но при этом понимают необходимость человеческого контроля.

При этом, даже сами опросы об ИИ подвержены ИИ-искажениям!
(Все врут -> Все врут при помощи ИИ.)

По данным Стэнфордского университета от ноября 2024, треть участников онлайн-опросов используют ChatGPT для ответов на вопросы анкет. Респонденты с помощью ИИ пишут ответы без опечаток, подозрительно длинные и неестественно вежливые.

Выводы для бизнеса:

1. ИИ не заменяет, а трансформирует – роли инженеров меняются, но не исчезают

2. Контроль человека необходим – особенно в вопросах безопасности кода. Самого кода станет больше, что потребует больше проверок на безопасность.

3. Использование ИИ повышает конкурентоспособность специалистов – 99-100% респондентов считают, что знание ИИ-инструментов делает их более привлекательными на рынке труда

4. Региональные различия – в США и Индии гораздо больше энтузиазма по поводу ИИ, чем, например, в Германии

Чем больше ИИ в разработке, - тем больше времени на отладку и больше подбирать хвостов безопасникам.

#WIRED #Reseach
———
@tsingular

👍10🔥5✍2❤2

1.19K viewsedited 06:17

Технозаметки Малышева

Forwarded from NN

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

Известный стратег Марк Поллард доверился ChatGPT и застрял в аэропорту Чили. Чат-бот сказал ему, что австралийцы могут посещать страну без визы.

Оказалось, что не могут. Марк узнал об этом уже от пограничников, хотя мог бы просто открыть сайт чилийского МИД.

Поллард попытался узнать у ChatGPT, можно ли засудить OpenAI за эту ошибку. Бот ответил, что нельзя.

Просто у него была стратегия, и он ее придерживался.

😁19🤣10👻3

962 views09:58

Технозаметки Малышева

МонгоDB-dev выкатили коллекцию примеров кода по работе с ИИ Агентами в формате блокнотов.

забираем тут

Примеры агентов с Gemini, Клодом и с OpenAI, SmolAgents от HuggingFace, AWS Bedrock, LangGraph, CrewAI и много чего ещё.

#mongodb #агенты #обучение
———
@tsingular

🔥2👍1

1.1K viewsedited 10:30

Технозаметки Малышева

1:38

This media is not supported in your browser

VIEW IN TELEGRAM

Роботы в халатах: когда трясущиеся руки — не диагноз, а техническая особенность

Исследователи из UCSD решили выяснить, смогут ли человекоподобные роботы заменить медиков в условиях нехватки рабочей силы.
Результат? ... ну, скажем так — пока лучше к живому доктору.

Техническая начинка
Система использует робота Unitree G1 с руками Inspire Hands Gen4, управляемого удалённо.

Ключевые компоненты:
- Трекеры HTC Vive для отслеживания положения рук оператора
- Мультикамерная система WiLoR для точного определения положения пальцев
- Кинематическое ретаргетирование для преобразования движений человека в команды роботу
- Импедансный контроллер для управления силой воздействия
- Виртуальная пружинно-демпферная система для синхронизации движений двух рук

Для уменьшения ошибок при захвате инструментов разработаны предварительно сконфигурированные позы захвата для каждого медицинского инструмента — от стетоскопа до скальпеля и ультразвукового датчика.

Клинические испытания
Семь медицинских процедур с разной степенью успеха:
1. Аускультация — робот перемещал стетоскоп правильно, но... его собственная вибрация заглушала звуки сердца пациента.

2. Маневры Леопольда для определения положения плода — робот успешно выполнял нажатия, но его рукам не хватало чувствительности для точной пальпации.

3. ИВЛ мешком Амбу — здесь робот неожиданно превзошёл людей! Вентиляция с точностью до миллисекунд, 93,3% вдохов идеального объема при работе двумя руками.

4. Интубация — не хватило силы открыть рот пациента (нужно 44Н, больше максимума робота). Пришлось человеку помогать.

5. Трахеостомия — только 30% успешных разрезов, но вставлял трубку быстрее, чем рекомендуют для недоношенных (18,4 сек против 30 сек).

6. Ультразвуковая инъекция — 70% успешных попаданий иглой (45% с первой попытки, 25% с коррекцией). Для сравнения: у врачей — 90%, у необученных студентов — 36,4%.

7. Наложение швов — 43,8% успешных швов против 86,3% у специализированных роботов. Основная проблема — вкол иглы.

Для серьезного применения системе не хватает физической силы (не может открыть рот пациента), тактильной обратной связи и стабильности.

Вывод прост: пока лучше довериться живому врачу. Впрочем, в некоторых рутинных задачах, вроде вентиляции легких мешком Амбу, робот уже превосходит человека по стабильности — 93,3% идеальных вдохов против нестабильных результатов у людей.

Возможно, будущее не за полной заменой медиков, а за узкоспециализированными ассистентами для конкретных задач. И без тремора, пожалуйста - на видео руки дрожат, как будто он перебрал со спиртом накануне.

Paper

#Unitree #Medics
———
@tsingular

👍8🤔1

5.51K views10:42

Технозаметки Малышева

0:48

Media is too big

VIEW IN TELEGRAM

🚀«Фабрика контента» — теперь Gold Partner компании HeyGen

ФК получили уникальный статус Gold Partner компании HeyGen — лидера в создании видео с гиперреалистичными аватарами!

Получается теперь это единственное сертифицированное агентство на территории России, Казахстана, Армении и Белоруссии среди пяти компаний мира с этим статусом.

Чем это может быть полезно вам:
- Создание гиперреалистичных видео-аватаров — безлимитно и любой сложности в 4К разрешении
- Локализация контента на 175 языков с возможностью клонирования голоса
- Корпоративная безопасность: SAML/SSO, конфиденциальность, централизованное управление
- Оплата в рублях за зарубежный сервис без заморочек с картами.

https://t.me/contentfabric

#pimenov #фабрикаконтента
———
@tsingular

👍5🔥4🤔4⚡1

1.03K viewsedited 10:56

Технозаметки Малышева

Forwarded from Антиглянец

Смотрите-ка, что придумал H&M. Бренд взял 30 ведущих моделей, отфоткал каждую в мельчайших подробностях - вплоть до незаметных родинок - и всех ракурсах. И нарисовал диджитального двойника для каждой модели.

Да такого, что даже бойфренды девушек не смогли отличить AI от реальности. Как и редакция BoF за редким исключением не отличила диджитальную грузинку Матильду Гварлиани от настоящей (цифровые двойники на фото подписаны).

Таким образом как бы найдена грань между этичностью использования AI. Модели не теряют работу, а получают возможность больше отдыхать. Цифровой двойник - их собственность. Модели могут распоряжаться им, гонорары тоже в их распоряжении. Чистый фантастический фильм, конечно.

Судя по цитатам, девушки всем довольны, чего не скажешь о парикмахерах, стилистах, визажистах, которые стоят за каждой "живой" картинкой. Их и так годами пытаются сократить - просят моделей самим делать прически, ищут мастеров-универсалов и так далее. Тут прямо труба. И профи уверены, что магия картинки без них исчезнет.

Мы-то тоже уверены, что AI-кампейны это какая-то мертвечина. Но в этот раз их правда невозможно отличить от реальности...

✍9👍7🔥6

1.16K views14:41

Технозаметки Малышева

Gemini 2.5: Новая модель с размышлениями от Google DeepMind

Google выпустил Gemini 2.5 Pro – свою самую интеллектуальную модель ИИ.
Версия Pro Experimental заняла первое место в рейтинге LMArena с внушительным отрывом.

! на 18.8% выполнила "последний экзамен человечества"!

Ключевое новшество – размышления.

Система демонстрирует выдающиеся результаты в тестах по рассуждению, точным наукам и программированию.

На GPQA и AIME модель показывает рекордные показатели без дополнительных вычислительных трат.

В SWE-Bench Verified достигает 63,8%.

Контекстное окно расширено до 1 миллиона токенов с перспективой роста до 2 миллионов.

Обрабатывает данные различных форматов: текст, аудио, изображения, видео и программные репозитории.

Доступна в Google AI Studio и приложении для пользователей Gemini Advanced.

Подумалось, - Новый Год что ли? Откуда столько релизов?
Получается отмечаем Навруз! :)

#Gemini #Google #DeepMind
———
@tsingular

🔥9❤4

3.13K viewsedited 17:27

Технозаметки Малышева

Forwarded from Denis Sexy IT 🤖

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

ChatGPT сегодня обновится:

– gpt4o теперь умеет редактировать картинки, ака текстовый фотошоп (лицо adobe представили)

– умеет генерировать картинки намного лучше чем Dalle, с нормальным текстом и тп

– ChatGPT теперь может генерировать видео через Sora, не ходя на отдельный сайт (3 видео в сутки бесплатно)

– Можно удалять фон у картинок (привет нормальные png)

– Работает довольно медленно, сделал видео как оно работает

⚡15👍6

4.3K views18:42

Технозаметки Малышева

1:58

Media is too big

VIEW IN TELEGRAM

Продолжаем готовиться к Подмосковным Вечерам - Весна - 13-14 апреля.

Готовим секцию "Рассекреченные агенты", в которой рассмотрим:

• Пошаговое руководство по созданию ИИ-агентов и их интеграции в рабочие процессы компании.

• Обзор технологий low-code и no-code, которые позволяют создавать эффективные решения без глубоких знаний программирования.

• Демонстрацию разговорного агента, работающего на базе Giga Chat. Вы сможете увидеть, как он отвечает на вопросы и выполняет задачи в реальном времени — в том числе позвонить и поговорить с ним!

Ещё будет футурологическая сессия с Дмитрием Алтуховым про прекрасное прошлое и страшное будущее :)

Напишите, если планируете быть.
https://pvesna.4cio.ru/

#pvesna #4CIO
———
@tsingular

👍13🔥1

1.57K views20:32

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Новая Sora - просто тушите свет.

OpenAI удивили.

#OpenAI #Sora
———
@tsingular

👍10🔥9

1.9K views21:22

Технозаметки Малышева

Forwarded from Не баг, а фича

1:24

This media is not supported in your browser

VIEW IN TELEGRAM

🔥

3D-СЦЕНА ИЗ ФОТКИ в Blender — новый MCP-плагин Tripo превращает любые изображения в трёхмерные локации в один клик!

Эту огромную 3D-сцену маленького Гарри Поттера на видео сделала нейронка БЕЗ участия человека всего за пару минут.

Гайд, как это повторить:

1️⃣ Качаем и устанавливаем плагин для Blender.
2️⃣ В появившийся чат загружаем картинку-референс и текстовый запрос.
3️⃣ Нейронка в реальном времени генерирует все 3D-объекты, располагает их как на фото и добавляет освещение.

Сохраняем — тут.

🙂

Не баг, а фича

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👀3❤1

3.84K views04:44

Технозаметки Малышева

Grok для Премиумов в телеге подтвержден.

@GrokAI

#Grok #боты
------
@tsingular

🔥11⚡2

1.43K viewsedited 10:41

Технозаметки Малышева

OpenAI добавили поддержку MCP протокола от Anthropic.

MCP штука не новая, но пока была больше в области экспериментов и прототипов.

Однако количество этих прототипов, быстрое развитие и перспективность технологии привели к тому, что OpenAI официально добавил поддержку Model Context Protocol (MCP) в свой Agents SDK.

Вчера, сразу после обновления спецификации MCP, Альтман подтвердил это в X, отметив, что поддержка уже доступна в Agents SDK, а скоро появится и в ChatGPT Desktop и Responses API.

MCP — это открытый протокол, который стандартизирует взаимодействие AI-моделей с внешними источниками данных и инструментами. Его часто сравнивают с USB-C для AI: универсальный интерфейс, позволяющий подключать различные инструменты к AI-моделям без необходимости создавать уникальные интеграции для каждого сервиса.

На практике это даст:
- Упрощение разработки AI-решений
- Стандартизация интеграций
- Расширение возможностей AI-агентов (доступ к большему количеству инструментов)

Что нового в обновлении MCP?
Вчерашнее обновление протокола включает несколько важных изменений:

- OAuth 2.1 для авторизации (повышение безопасности)
- Улучшенный HTTP Transport с поддержкой двунаправленного обмена
- JSON-RPC Batching (отправка нескольких запросов одновременно)
- Tool Annotations (метаданные для описания инструментов)

Накануне, 24 марта, Microsoft выпустила Playwright-MCP сервер, который позволяет AI-агентам автоматизировать взаимодействие с браузером с использованием MCP.

Кто ещё использует MCP?
Помимо гигантов OpenAI и Microsoft, протокол активно внедряется и другими игроками:
Такие компании как Block и Apollo интегрировали MCP в свои системы. Инструменты для разработчиков, включая Replit, Windsurf и Cursor, используют его для улучшения помощи при кодировании. Apify создала MCP-сервер для задач извлечения данных.

Техника:
MCP использует модульную архитектуру на базе JSON-RPC 2.0, разделенную на слои:

- Базовый транспорт
- Управление жизненным циклом
- Серверные возможности (ресурсы, промпты)
- Клиентские возможности (сэмплирование, логирование)

Разработчики могут выбирать компоненты в зависимости от своих задач.

Главный вопрос: становится ли MCP новым индустриальным стандартом?

С поддержкой от Anthropic, LangChain, и теперь Microsoft и OpenAI, по идее, имеет все шансы стать общим языком для агентских интеграций.

MCP документация от Anthropic
GitHub

Примеры от OpenAI

#MCP #OpenAI #Anthropic #Microsoft
———
@tsingular

✍3❤‍🔥2👍1

2.98K viewsedited 04:59

Технозаметки Малышева

Forwarded from Семейка продактов (Tatiana Sushchenko)

Эфир с CTO GigaChat B2B&Enterprise Денисом Маколиным

Про зарубежные нейросети говорили

тут

. Про B2B говорили. А вот про российские нейросети для B2B - ещё не было.

Теперь будет. Жутко интересно посмотреть на мир глазами команды GigaChat.

Когда: суббота 29 марта, 12-00 по мск
Кто и что: Денис Маколин, мой бывший коллега по Microsoft и CTO GigaChat B2B&Enterprise, расскажет про апдейт GigaChat и ответит на кучу вопросов, в том числе про использование нейросетей для российского B2B.

Ссылка на эфир
Если нужны напоминалки,⏰ можно зарегистрироваться на эфир через Timepad

✅Оставляйте ваши вопросы в комментариях к этому посту

Таня, [ex-B2B 👩‍💻]
@productsgossip

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9✍3🔥3

3.35K views05:45

About

Blog

Apps

Platform