Технозаметки Малышева
8.26K subscribers
3.68K photos
1.38K videos
40 files
3.87K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from эйай ньюз
DeepSeek V3.2 и V3.2 Speciale

На бенчах показывает крайне сильный перформанс, сравнимый с GPT-5 High. Модель использует DeepSeek Sparse Attention, заметно более эффективно работающий с длинным контекстом.

V3.2 Speciale, версия с повышенным использованием компьюта, местами обходит Gemini 3 Pro Preview, но использует при этом заметно больше токенов (но учитывая разницу в цене, Speciale всё равно в разы дешевле). К тому же Speciale достигает той же золотой медали на IMO что и DeepSeek Math V2, но не останавливается на этом и выдаёт перформанс на уровне золотой медали ещё и на международной олимпиаде по информатике (IOI).

Модели уже доступны в чате и API. В API DeepSeek теперь доступен тулюз для ризонера. Цена на модели не изменилась и остаётся $0.28/$0.42 за миллион токенов. DeepSeek V3.2 Speciale будет временно доступна в API без тулюза до 15 декабря.

Веса V3.2
Веса V3.2 Speciale
Техрепорт

@ai_newz
🔥931🏆1
Media is too big
VIEW IN TELEGRAM
🎬 Runway Gen-4.5: новый король видеогенерации

Runway выкатили Gen-4.5 — модель, которая сейчас на первом месте в бенчмарке Artificial Analysis Text to Video с 1,247 Elo.

Что умеет:
- Динамичная генерация действий с точным контролем
- ВременнАя консистентность (персонажи не "плывут" между кадрами)
- Скорость Gen-4 при качестве следующего поколения
- Прорыв в эффективности pre-training данных
- Продвинутые post-training техники

Режимы (скоро):
- Image to Video
- Keyframes
- Video to Video
И другие контролы из Gen-4

Цены остались на уровне Gen-4 — доступно на всех тарифах.

тут

Пора карусельку для видеомоделей делать :)

#Runway #нейрорендер
———
@tsingular
🔥1332🤔2🆒2🏆1
DeepSeek не AGI.

Венок сонетов не выдюжил.
рифма - мимо
связь последней и первой строки соседних сонетов - мимо
магистрал - мимо

Полная версия

#сонет #DeepSeek #тест
———
@tsingular
5😁3😢3🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Шедевр :)
Сохраним.

Хорошего настроения всем :)

#юмор #обезьяны #нейрорендер
------
@tsingular
👍40🔥27😁19🤣5🗿1
ByteDance анонсировали Vidi2 — редактор видео на ИИ

Китайский ByteDance выпускает Vidi2 — модель, которая обрабатывает часы видео и по промпту собирает из них готовый ролик.

На внутренних тестах ByteDance Vidi2 обошла Gemini 3 Pro по временной локализации объектов — 53% против 27%. Модель точнее находит моменты в видео и определяет положение объектов.

Архитектура: 12 миллиардов параметров, на базе Gemma-3, адаптивное сжатие токенов для длинных роликов.

Публичного демо пока нет, можно почитать paper

Очень ждём. 12 млрд, - это и на 4090 взлетит.

#Vidi2 #ByteDance #VideoAI
———
@tsingular
🔥8211
DeepSite - генератор сайтов от HuggingFace с хостингом

У HuggingFace вышел конкурент Lovable -платформа для вайбкодинга веб сайтов с возможностью автоматического разворачивания, бесплатного хостинга, бесшовной интеграцией с моделями на HuggingFace и подключением их железа для генерации различного контента с ИИ.

Для генерации сайтов можно использовать различные модели на выбор:
DeepSeek V3, Qwen3, Kimi K2, GLM 4.6, Minimax M2.

Идеально для стартапов, прототипов и пет-проектов

#huggingface #deepsite #dev
———
@tsingular
🔥951
This media is not supported in your browser
VIEW IN TELEGRAM
Magentic-UI от Microsoft - локальный Manus

Майкрософт опубликовали интересный фреймворк - Magentic-UI исследовательский прототип веб-агента с человеком в контуре.

В основе AutoGen с мультиагентной оркестрацией: главный Orchestrator управляет специализированными агентами (WebSurfer, Coder, FileSurfer, UserProxy).

Взаимодействие через accessibility tree плюс скриншоты через новую модель Fara 7B.

Всё крутится в изолированных Docker-контейнерах с ограничением доступа к доменам — без утечек креденшелов и кук.

На бенчмарке WebVoyager успешность задач составила 72-82% в зависимости от модели (человек справляется на 95.7%).

Средняя задержка на действие — 6.8 секунд.


Аналог Manus от Майкрософта, получается, да еще и в оупенсорс!

#MagenticUI #AutoGen #WebAgent #Fara #opensource
———
@tsingular
3👍3
Pagespeed-MCP-Server: прокачиваем агента-разработчика

Многие же наверное пользуются https://pagespeed.web.dev/ для проверки сайтов на скорость загрузки и типовые ошибки при разработке.

Вам будет полезно:

Нашел MCP-сервер для получения данных PageSpeed.
Тянет метрики скорости загрузки, предупреждения и рекомендации, SEO анализ, оценивает читабельность и оптимизацию ресурсов.

Т.е. теперь Курсор после доработки может сам проверить страницу на все эти метрики и поправить что не так.

Обязательный инструмент в коллекции Курсора и любого ИИ разраба фронтэнда.

Добавляем тут

#MCP #PageSpeed
———
@tsingular
👍1131
💡 Запусти ИИ-проект для своего хобби, при условии тотальной нехватки ресурсов и времени

📋 ПРОМПТ ДНЯ:

Роль: Ты — архитектор минималистичных ИИ-проектов, специализирующийся на запуске работающих прототипов в условиях жёстких ограничений по времени и ресурсам.

Ситуация: Я разработчик/дизайнер с базовыми знаниями ИИ и ИТ-инструментов. У меня есть идея для хобби-проекта с применением ИИ, но я хочу реализовать его максимально быстро и с минимальными вложениями. Главная проблема — я не знаю, с чего начать, чтобы не увязнуть в изучении теории, не потратить месяцы на эксперименты и не разочароваться на полпути.

Задача: Помоги мне спроектировать реализуемый ИИ-проект для хобби, используя минималистичное мышление. Покажи, как достичь работающего результата с минимальным набором инструментов, технологий и временных затрат — без перфекционизма, но с конкретным выхлопом.

Формат ответа:
— Серия из 5-7 целевых вопросов для уточнения моей идеи и контекста
— На основе ответов: минимальный стек (1-2 инструмента), пошаговый план на 3-4 вечера, метрика готовности («проект работает, если...»)
— Укажи одну критическую точку, где большинство бросает, и как её пройти

Ограничения:
— Никаких сложных ML-фреймворков или обучения моделей с нуля — только готовые API и no-code/low-code решения
— Фокус на быстром результате: от идеи до работающего прототипа за 6-10 часов суммарно
— Без избыточной теории — только действия, которые приближают к цели

Сначала задай мне 5-7 уточняющих вопросов о моей идее, навыках и доступном времени, затем предложи конкретный план действий.


⚙️ ПРИЁМ:

Ограничение ресурса (Constraint-driven prompting) — Когда ты явно задаёшь жёсткие рамки (время, инструменты, сложность), ИИ фокусируется на практичных решениях вместо идеальных, что даёт реализуемый результат вместо теоретических рассуждений

#промпты #хобби #стартап
------
@tsingular
10🔥75👌2🍓1
ИИ научили искать преступления в звонках заключённых

Компания Securus натренировала языковую модель на семи годах записей телефонных разговоров из тюрем Техаса.

Система ищет в разговорах признаки планируемых преступлений и уже тестируется в реальных учреждениях.

ИИшка тренируется с учётом сленга, кодовых слов, сарказма и многозначности и данных свершившихся инцидентов.

Реально пора запускать список фильмов, которые раньше были фантастическими, а стали документалкой.
Тут чисто Особое мнение на подходе (Minority Report)

#Securus #Prison #особоемнение #minorityreport
———
@tsingular
🔥9👍211🤯1
Альтман объявил «code red» в OpenAI из-за Google

Сэм Альтман разослал внутреннее письмо сотрудникам OpenAI с призывом срочно улучшить ChatGPT.

Причина — Gemini 3 от Google показывает впечатляющие результаты: 41% на тесте Humanity's Last Exam против 26.5% у GPT-5.1, 95% точности в математике без инструментов.

Однако OpenAI откладывает запуск рекламы, покупательских инструментов и персонального ассистента Pulse, фокусируясь на базовых улучшениях: персонализация, скорость ответов, надёжность.

При этом компания уже вложила $1.15 трлн в инфраструктуру до 2035 года, но по прогнозам HSBC останется убыточной до 2030-го с дефицитом в $207 млрд.

Месячная аудитория Gemini выросла с 450М до 650М пользователей за три месяца, пока активность в приложении ChatGPT упала на 22.5%.

Радует, что пользователи от этого всего только выиграют.
Модели, которые мы знаем сегодня,- самые слабые в свете будущего, что нас ждёт.

#OpenAI #Gemini #Google
———
@tsingular
👍1122🤣1
Transformers v5: PyTorch, новый API и конец TensorFlow

Hugging Face выпустил пятую версию библиотеки Transformers — крупнейший рефакторинг за всю историю проекта.

Главное изменение: полный отказ от TensorFlow и JAX. Теперь только PyTorch.

Упростили поддержку кода при сохранении совместимости с экосистемой (vLLM, SGLang, llama.cpp).

Новый WeightConverter API упрощает загрузку моделей с квантизацией и параллелизмом. Теперь можно комбинировать MoE + квантизацию или Tensor Parallelism + MoE.

Упростили токенизацию: убрали дублирование «быстрых» и «медленных» токенизаторов.

#Transformers #PyTorch #dev
------
@tsingular
81👨‍💻1🆒1
Code Intelligence 2025: руководство по кодовым агентам от ByteDance.

ByteDance решили не отставать от Гугла и выкатили свой гайд как нужно варить агентов.
Полное руководство на 300 страниц, поэтому даю выжимку для тех, у кого времени нет:

Суть: Мы переходим от эпохи AI-Assisted (где ИИ — это автодополнение, как Copilot) к эпохе AI-Driven/Autonomous (где ИИ — это агенты, выполняющие инженерные задачи целиком).

1. Главные тренды в моделях
- Специализация рулит: Общие LLM (GPT-4o) хороши, но специализированные "Code LLMs" (DeepSeek-Coder-V3, Qwen2.5-Coder, StarCoder2) часто эффективнее и дешевле в деплое.

- Архитектура: Все уходят в MoE (Mixture-of-Experts). Это стандарт для баланса между огромными знаниями и скоростью инференса.

- Контекст: Окно контекста растет (128k – 1M+ токенов). Модели теперь "видят" не один файл, а весь репозиторий (Repository-Level Understanding).

2. Секреты обучения (Training Recipes)
- RLVR (Reinforcement Learning with Verifiable Rewards): Это новый Грааль. Вместо простого RLHF (где оценивает человек), используют RL на юнит-тестах. Если код скомпилировался и прошел тесты — модель получает награду. Это позволяет моделям "рассуждать" и самопроверяться (как серия OpenAI o1/o3 или DeepSeek-R1).

- Данные: Просто парсить GitHub уже мало (там много мусора). Фокус сместился на синтетические данные высокого качества и строгую фильтрацию (дедупликация, проверка лицензий, удаление PII).

3. Агенты (SWE Agents)
- Сдвиг парадигмы: ИИ теперь не просто пишет функцию, а берет на себя роль Software Engineer.
- Цикл: Планирование -> Кодинг -> Тестирование -> Дебаг -> Деплой.
- Инструменты: Агенты активно юзают терминал, браузер и MCP (Model Context Protocol) для подключения к внешним тулзам.
- Примеры: OpenHands, Devin, SWE-Agent.

4. Бенчмарки (Как измеряют крутость)
- HumanEval устарел: Он слишком простой, модели щелкают его на 90%+.
- Новый стандарт — SWE-bench: Это реальные задачи (Issues) из популярных open-source репозиториев. Если модель может закрыть реальный тикет на GitHub - она крутая.
- LiveCodeBench: Тесты на задачах с соревнований (LeetCode, Codeforces), вышедших после обучения модели, чтобы исключить заучивание.

5. Безопасность (Safety)
- Проблема: Модели, обученные на GitHub, отлично воспроизводят уязвимости (SQL-инъекции, XSS), потому что в обучающей выборке много плохого кода.
- Решение: Обычные фильтры не помогают. Нужен Safety Post-training — дообучение модели на "безопасный код" и защита от атак (джейлбрейков через обфускацию кода).

Итого для практика:
Если вы внедряете ИИ в разработку: смотрите в сторону инструментов, которые умеют работать с контекстом всего проекта (Cursor, Windsurf) и агентных решений, способных самостоятельно запускать код и тесты.

Эпоха простого "чат-бота для кода" заканчивается, начинается эпоха автономных инженеров.

#ByteDance #guide #обучение
———
@tsingular
5🔥43
Media is too big
VIEW IN TELEGRAM
Прогресс за 2 года :)

Ноябрь 2023

#MUD #юмор
———
@tsingular
😁103🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшая иллюстрация как можно из боковой генерации вытащить персонажа

#JSON #обучение #lifehack
———
@tsingular
1🔥246❤‍🔥3👍1
Media is too big
VIEW IN TELEGRAM
Новый ролик про EngineAI T800 подвезли.

Не нейрорендер.
Без ускорения.
Все в реальном времени.

Скоро на ринге и в эфире.
В продаже по $25К

Готовьте одежду и мотоцикл.

#EngineAI #T800
------
@tsingular
🤯197😁3👾31👍1
Advent of Agents 2025

Google запускает 25-дневный марафон по разработке агентов - каждый день новая фича за 5 минут.

В программе: Gemini 3 с контекстной инженерией и Computer Use, Agent Development Kit (ADK) на Python, и Vertex AI Agent Engine для быстрого деплоя.

Обещают путь от нуля до production-ready за три недели.

ADK, в принципе, независимый фреймворк, но проблема в том, что весь курс заточен под экосистему Google.

Скорее всего дальше там будет VertexAI, который не всем доступен у нас.
Но в целом почитать и попробовать повторить локально, - имеет смысл, там реально за 5 минут хорошие маленькие примеры собраны.

Вчерашний урок - шаблон в 5 строк на YAML для агента на ADK уже доступен.

#Gemini #ADK #обучение
———
@tsingular
🔥7👍42
Media is too big
VIEW IN TELEGRAM
Gemini3 demo: управление жестами через камеру

Пополняем серию примеров, - что теперь можно сделать за 5 минут с ИИ из области, которая раньше вам была недоступна и занимала бы недели.

Сегодня демка управления разными фигурами в виде облака динамических частиц, которые морфятся друг в друга и управляемы жестами руки на камеру.

AiStudio->Build->Промпт:
Create a React 19, TypeScript, Three.js (@react-three/fiber), and Tailwind CSS application called "Gemini Kinetic Particles".

Core Functionality:
Hand Tracking: Use @mediapipe/tasks-vision to detect hands. Map pinch gestures to particle chaos/attraction, hand distance to zoom, and hand position to 3D rotation. Implement input smoothing (lerp) and robust camera error handling (including stream cleanup and resolution constraints).

Particle System: Render 5000 particles using THREE.Points with a custom radial gradient texture.

Shape Modes:
Math-based: Sphere, Cube, Saturn, Spiral.
Physics-based: "Fireworks" mode with gravity, drag, velocity, and continuous multi-colored explosions using vertex colors.
Procedural Sculptures: "Bear" (composed of spheres for limbs/head) and "Statue" (MSU Tower composed of boxes). These must be generated purely mathematically.

Transitions: Implement smooth interpolation (lerp) when switching between shapes.

Controls: A modern dark UI overlay with connection status, shape selector (clickable + A/D keyboard shortcuts), and color picker.

UX: Ensure the scene is completely static/stable when idle (no infinite zoom or drift).

Rely solely on hardcoded procedural generation functions for all shapes.


#Gemini #dev #particles #camera #gestures #промпты
———
@tsingular
🔥10🤯42🗿1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Kling 2.6

Третий день омниканальных новостей от Клинга!

Слоган: "See the Sound, Hear the Visual". Типа усмотри звук, услышь визуал.

Акцент на генерацию звука: монологи с липсинком, нарратив, мульти-диалоги(!), музика, пестни, спецэффекты. Все это для text-to-video и image-to-video. Можно озвучивать и оживлять не только людей, но и персонажи.

Раскатано везде, от Фала до Хиггса.

Интересно, что они еще бахнут на этой неделе? Куда уж круче?

Ну и у меня реально ощущение, что в декабре все просто взбесились. Только третье число, а все изрыгают новости с такой скоростью, что декабрь по информационной колмогоровской плотности превзойдет весь 2025 год.

Что же будет в 2026?

@cgevent
🔥15🏆411