Forwarded from Бэкдор
Первый в своём классе сенолитический иммунопрепарат SenoVax умеет убивать старение на корню:
• Он обучает иммунную систему выслеживать и уничтожать стареющие клетки по мере их появления
• В доклинических исследованиях SenoVax снижал рост раковых опухолей, уничтожая благоприятную для них среду
• В экспериментах на животных продление жизни и здоровья — более чем на 100%
• Учёные планируют использовать SenoVax совместно со StemCellRevivify — терапией на основе регенеративных клеток
• В паре они нацелены на две ключевые причины старения — накопление повреждений и потерю регенерации.
Компания-производитель уже подала заявку на международный патент — и готовится к клиническим испытаниям.
Готовимся
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔28👀14🤯8❤5
💡 Как подготовить план обустройства «умного дома»
📋 ПРОМПТ ДНЯ:
⚙️ ПРИЁМ:
Декомпозиция — Дробя масштабную задачу на микрошаги длительностью до 30 минут, ты снимаешь когнитивную нагрузку и лишаешь мозг возможности включить режим прокрастинации — каждое действие становится слишком простым, чтобы его откладывать
#промпты #дом #автоматизация
------
@tsingular
📋 ПРОМПТ ДНЯ:
Роль: Ты — стратег автоматизации жилого пространства с экспертизой в домашних IoT-системах и бюджетном планировании
Ситуация: Я [технический специалист/не разбирающаяся в технологиях домохозяйка] и хочу автоматизировать дом. Хочу создать осмысленную экосистему, которая действительно улучшит качество жизни, а не станет набором бесполезных гаджетов. Проблема в том, что постоянно откладываю начало — изучаю обзоры, сравниваю решения, но не могу начать. Застреваю в параличе выбора и страхе ошибиться с вложениями.
Задача: Проанализируй мою ситуацию и создай черновой план автоматизации дома на ближайший квартал. Разбей процесс на конкретные микрошаги — от определения приоритетных зон до первой покупки. Каждый шаг должен быть настолько простым, чтобы его невозможно было отложить.
Формат ответа:
— Черновик квартального плана с разбивкой по неделям
— Каждая неделя содержит 1-2 атомарных действия (не более 30 минут на выполнение)
— Контрольные точки для оценки прогресса
— Бюджетная раскладка с приоритизацией по фазам
— Критерии «осмысленности» каждого элемента системы
Ограничения:
— Избегай технического максимализма — фокус на реальной пользе, не на технологиях ради технологий
— Не предлагай шаги требующие больше 1 часа единовременно — только микродействия
— Каждый шаг должен иметь очевидный результат, чтобы поддерживать мотивацию
Сначала задай мне 3-5 уточняющих вопроса о моих приоритетах, текущей инфраструктуре и конкретных болях в быту, затем создай персонализированный план
⚙️ ПРИЁМ:
Декомпозиция — Дробя масштабную задачу на микрошаги длительностью до 30 минут, ты снимаешь когнитивную нагрузку и лишаешь мозг возможности включить режим прокрастинации — каждое действие становится слишком простым, чтобы его откладывать
#промпты #дом #автоматизация
------
@tsingular
✍12❤6⚡3🔥3
Forwarded from эйай ньюз
DeepSeek V3.2 и V3.2 Speciale
На бенчах показывает крайне сильный перформанс, сравнимый с GPT-5 High. Модель использует DeepSeek Sparse Attention, заметно более эффективно работающий с длинным контекстом.
V3.2 Speciale, версия с повышенным использованием компьюта, местами обходит Gemini 3 Pro Preview, но использует при этом заметно больше токенов (но учитывая разницу в цене, Speciale всё равно в разы дешевле). К тому же Speciale достигает той же золотой медали на IMO что и DeepSeek Math V2, но не останавливается на этом и выдаёт перформанс на уровне золотой медали ещё и на международной олимпиаде по информатике (IOI).
Модели уже доступны в чате и API. В API DeepSeek теперь доступен тулюз для ризонера. Цена на модели не изменилась и остаётся $0.28/$0.42 за миллион токенов. DeepSeek V3.2 Speciale будет временно доступна в API без тулюза до 15 декабря.
Веса V3.2
Веса V3.2 Speciale
Техрепорт
@ai_newz
На бенчах показывает крайне сильный перформанс, сравнимый с GPT-5 High. Модель использует DeepSeek Sparse Attention, заметно более эффективно работающий с длинным контекстом.
V3.2 Speciale, версия с повышенным использованием компьюта, местами обходит Gemini 3 Pro Preview, но использует при этом заметно больше токенов (но учитывая разницу в цене, Speciale всё равно в разы дешевле). К тому же Speciale достигает той же золотой медали на IMO что и DeepSeek Math V2, но не останавливается на этом и выдаёт перформанс на уровне золотой медали ещё и на международной олимпиаде по информатике (IOI).
Модели уже доступны в чате и API. В API DeepSeek теперь доступен тулюз для ризонера. Цена на модели не изменилась и остаётся $0.28/$0.42 за миллион токенов. DeepSeek V3.2 Speciale будет временно доступна в API без тулюза до 15 декабря.
Веса V3.2
Веса V3.2 Speciale
Техрепорт
@ai_newz
🔥9❤3⚡1🏆1
Media is too big
VIEW IN TELEGRAM
🎬 Runway Gen-4.5: новый король видеогенерации
Runway выкатили Gen-4.5 — модель, которая сейчас на первом месте в бенчмарке Artificial Analysis Text to Video с 1,247 Elo.
Что умеет:
- Динамичная генерация действий с точным контролем
- ВременнАя консистентность (персонажи не "плывут" между кадрами)
- Скорость Gen-4 при качестве следующего поколения
- Прорыв в эффективности pre-training данных
- Продвинутые post-training техники
Режимы (скоро):
- Image to Video
- Keyframes
- Video to Video
И другие контролы из Gen-4
Цены остались на уровне Gen-4 — доступно на всех тарифах.
тут
Пора карусельку для видеомоделей делать :)
#Runway #нейрорендер
———
@tsingular
Runway выкатили Gen-4.5 — модель, которая сейчас на первом месте в бенчмарке Artificial Analysis Text to Video с 1,247 Elo.
Что умеет:
- Динамичная генерация действий с точным контролем
- ВременнАя консистентность (персонажи не "плывут" между кадрами)
- Скорость Gen-4 при качестве следующего поколения
- Прорыв в эффективности pre-training данных
- Продвинутые post-training техники
Режимы (скоро):
- Image to Video
- Keyframes
- Video to Video
И другие контролы из Gen-4
Цены остались на уровне Gen-4 — доступно на всех тарифах.
тут
Пора карусельку для видеомоделей делать :)
#Runway #нейрорендер
———
@tsingular
🔥13⚡3❤2🤔2🆒2🏆1
DeepSeek не AGI.
Венок сонетов не выдюжил.
рифма - мимо
связь последней и первой строки соседних сонетов - мимо
магистрал - мимо
Полная версия
#сонет #DeepSeek #тест
———
@tsingular
Венок сонетов не выдюжил.
рифма - мимо
связь последней и первой строки соседних сонетов - мимо
магистрал - мимо
Полная версия
#сонет #DeepSeek #тест
———
@tsingular
✍5😁3😢3🤔1
ByteDance анонсировали Vidi2 — редактор видео на ИИ
Китайский ByteDance выпускает Vidi2 — модель, которая обрабатывает часы видео и по промпту собирает из них готовый ролик.
На внутренних тестах ByteDance Vidi2 обошла Gemini 3 Pro по временной локализации объектов — 53% против 27%. Модель точнее находит моменты в видео и определяет положение объектов.
Архитектура: 12 миллиардов параметров, на базе Gemma-3, адаптивное сжатие токенов для длинных роликов.
Публичного демо пока нет, можно почитать paper
Очень ждём. 12 млрд, - это и на 4090 взлетит.
#Vidi2 #ByteDance #VideoAI
———
@tsingular
Китайский ByteDance выпускает Vidi2 — модель, которая обрабатывает часы видео и по промпту собирает из них готовый ролик.
На внутренних тестах ByteDance Vidi2 обошла Gemini 3 Pro по временной локализации объектов — 53% против 27%. Модель точнее находит моменты в видео и определяет положение объектов.
Архитектура: 12 миллиардов параметров, на базе Gemma-3, адаптивное сжатие токенов для длинных роликов.
Публичного демо пока нет, можно почитать paper
Очень ждём. 12 млрд, - это и на 4090 взлетит.
#Vidi2 #ByteDance #VideoAI
———
@tsingular
🔥8❤2⚡1✍1
DeepSite - генератор сайтов от HuggingFace с хостингом
У HuggingFace вышел конкурент Lovable -платформа для вайбкодинга веб сайтов с возможностью автоматического разворачивания, бесплатного хостинга, бесшовной интеграцией с моделями на HuggingFace и подключением их железа для генерации различного контента с ИИ.
Для генерации сайтов можно использовать различные модели на выбор:
DeepSeek V3, Qwen3, Kimi K2, GLM 4.6, Minimax M2.
Идеально для стартапов, прототипов и пет-проектов
#huggingface #deepsite #dev
———
@tsingular
У HuggingFace вышел конкурент Lovable -платформа для вайбкодинга веб сайтов с возможностью автоматического разворачивания, бесплатного хостинга, бесшовной интеграцией с моделями на HuggingFace и подключением их железа для генерации различного контента с ИИ.
Для генерации сайтов можно использовать различные модели на выбор:
DeepSeek V3, Qwen3, Kimi K2, GLM 4.6, Minimax M2.
Идеально для стартапов, прототипов и пет-проектов
#huggingface #deepsite #dev
———
@tsingular
🔥9✍5⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Magentic-UI от Microsoft - локальный Manus
Майкрософт опубликовали интересный фреймворк - Magentic-UI исследовательский прототип веб-агента с человеком в контуре.
В основе AutoGen с мультиагентной оркестрацией: главный Orchestrator управляет специализированными агентами (WebSurfer, Coder, FileSurfer, UserProxy).
Взаимодействие через accessibility tree плюс скриншоты через новую модель Fara 7B.
Всё крутится в изолированных Docker-контейнерах с ограничением доступа к доменам — без утечек креденшелов и кук.
На бенчмарке WebVoyager успешность задач составила 72-82% в зависимости от модели (человек справляется на 95.7%).
Средняя задержка на действие — 6.8 секунд.
Аналог Manus от Майкрософта, получается, да еще и в оупенсорс!
#MagenticUI #AutoGen #WebAgent #Fara #opensource
———
@tsingular
Майкрософт опубликовали интересный фреймворк - Magentic-UI исследовательский прототип веб-агента с человеком в контуре.
В основе AutoGen с мультиагентной оркестрацией: главный Orchestrator управляет специализированными агентами (WebSurfer, Coder, FileSurfer, UserProxy).
Взаимодействие через accessibility tree плюс скриншоты через новую модель Fara 7B.
Всё крутится в изолированных Docker-контейнерах с ограничением доступа к доменам — без утечек креденшелов и кук.
На бенчмарке WebVoyager успешность задач составила 72-82% в зависимости от модели (человек справляется на 95.7%).
Средняя задержка на действие — 6.8 секунд.
Аналог Manus от Майкрософта, получается, да еще и в оупенсорс!
#MagenticUI #AutoGen #WebAgent #Fara #opensource
———
@tsingular
⚡3👍3
Pagespeed-MCP-Server: прокачиваем агента-разработчика
Многие же наверное пользуются https://pagespeed.web.dev/ для проверки сайтов на скорость загрузки и типовые ошибки при разработке.
Вам будет полезно:
Нашел MCP-сервер для получения данных PageSpeed.
Тянет метрики скорости загрузки, предупреждения и рекомендации, SEO анализ, оценивает читабельность и оптимизацию ресурсов.
Т.е. теперь Курсор после доработки может сам проверить страницу на все эти метрики и поправить что не так.
Обязательный инструмент в коллекции Курсора и любого ИИ разраба фронтэнда.
Добавляем тут
#MCP #PageSpeed
———
@tsingular
Многие же наверное пользуются https://pagespeed.web.dev/ для проверки сайтов на скорость загрузки и типовые ошибки при разработке.
Вам будет полезно:
Нашел MCP-сервер для получения данных PageSpeed.
Тянет метрики скорости загрузки, предупреждения и рекомендации, SEO анализ, оценивает читабельность и оптимизацию ресурсов.
Т.е. теперь Курсор после доработки может сам проверить страницу на все эти метрики и поправить что не так.
Обязательный инструмент в коллекции Курсора и любого ИИ разраба фронтэнда.
Добавляем тут
#MCP #PageSpeed
———
@tsingular
👍11✍3⚡1
💡 Запусти ИИ-проект для своего хобби, при условии тотальной нехватки ресурсов и времени
📋 ПРОМПТ ДНЯ:
⚙️ ПРИЁМ:
Ограничение ресурса (Constraint-driven prompting) — Когда ты явно задаёшь жёсткие рамки (время, инструменты, сложность), ИИ фокусируется на практичных решениях вместо идеальных, что даёт реализуемый результат вместо теоретических рассуждений
#промпты #хобби #стартап
------
@tsingular
📋 ПРОМПТ ДНЯ:
Роль: Ты — архитектор минималистичных ИИ-проектов, специализирующийся на запуске работающих прототипов в условиях жёстких ограничений по времени и ресурсам.
Ситуация: Я разработчик/дизайнер с базовыми знаниями ИИ и ИТ-инструментов. У меня есть идея для хобби-проекта с применением ИИ, но я хочу реализовать его максимально быстро и с минимальными вложениями. Главная проблема — я не знаю, с чего начать, чтобы не увязнуть в изучении теории, не потратить месяцы на эксперименты и не разочароваться на полпути.
Задача: Помоги мне спроектировать реализуемый ИИ-проект для хобби, используя минималистичное мышление. Покажи, как достичь работающего результата с минимальным набором инструментов, технологий и временных затрат — без перфекционизма, но с конкретным выхлопом.
Формат ответа:
— Серия из 5-7 целевых вопросов для уточнения моей идеи и контекста
— На основе ответов: минимальный стек (1-2 инструмента), пошаговый план на 3-4 вечера, метрика готовности («проект работает, если...»)
— Укажи одну критическую точку, где большинство бросает, и как её пройти
Ограничения:
— Никаких сложных ML-фреймворков или обучения моделей с нуля — только готовые API и no-code/low-code решения
— Фокус на быстром результате: от идеи до работающего прототипа за 6-10 часов суммарно
— Без избыточной теории — только действия, которые приближают к цели
Сначала задай мне 5-7 уточняющих вопросов о моей идее, навыках и доступном времени, затем предложи конкретный план действий.
⚙️ ПРИЁМ:
Ограничение ресурса (Constraint-driven prompting) — Когда ты явно задаёшь жёсткие рамки (время, инструменты, сложность), ИИ фокусируется на практичных решениях вместо идеальных, что даёт реализуемый результат вместо теоретических рассуждений
#промпты #хобби #стартап
------
@tsingular
✍10🔥7❤5👌2🍓1
ИИ научили искать преступления в звонках заключённых
Компания Securus натренировала языковую модель на семи годах записей телефонных разговоров из тюрем Техаса.
Система ищет в разговорах признаки планируемых преступлений и уже тестируется в реальных учреждениях.
ИИшка тренируется с учётом сленга, кодовых слов, сарказма и многозначности и данных свершившихся инцидентов.
Реально пора запускать список фильмов, которые раньше были фантастическими, а стали документалкой.
Тут чисто Особое мнение на подходе (Minority Report)
#Securus #Prison #особоемнение #minorityreport
———
@tsingular
Компания Securus натренировала языковую модель на семи годах записей телефонных разговоров из тюрем Техаса.
Система ищет в разговорах признаки планируемых преступлений и уже тестируется в реальных учреждениях.
ИИшка тренируется с учётом сленга, кодовых слов, сарказма и многозначности и данных свершившихся инцидентов.
Реально пора запускать список фильмов, которые раньше были фантастическими, а стали документалкой.
Тут чисто Особое мнение на подходе (Minority Report)
#Securus #Prison #особоемнение #minorityreport
———
@tsingular
🔥9👍2❤1✍1🤯1
Альтман объявил «code red» в OpenAI из-за Google
Сэм Альтман разослал внутреннее письмо сотрудникам OpenAI с призывом срочно улучшить ChatGPT.
Причина — Gemini 3 от Google показывает впечатляющие результаты: 41% на тесте Humanity's Last Exam против 26.5% у GPT-5.1, 95% точности в математике без инструментов.
Однако OpenAI откладывает запуск рекламы, покупательских инструментов и персонального ассистента Pulse, фокусируясь на базовых улучшениях: персонализация, скорость ответов, надёжность.
При этом компания уже вложила $1.15 трлн в инфраструктуру до 2035 года, но по прогнозам HSBC останется убыточной до 2030-го с дефицитом в $207 млрд.
Месячная аудитория Gemini выросла с 450М до 650М пользователей за три месяца, пока активность в приложении ChatGPT упала на 22.5%.
Радует, что пользователи от этого всего только выиграют.
Модели, которые мы знаем сегодня,- самые слабые в свете будущего, что нас ждёт.
#OpenAI #Gemini #Google
———
@tsingular
Сэм Альтман разослал внутреннее письмо сотрудникам OpenAI с призывом срочно улучшить ChatGPT.
Причина — Gemini 3 от Google показывает впечатляющие результаты: 41% на тесте Humanity's Last Exam против 26.5% у GPT-5.1, 95% точности в математике без инструментов.
Однако OpenAI откладывает запуск рекламы, покупательских инструментов и персонального ассистента Pulse, фокусируясь на базовых улучшениях: персонализация, скорость ответов, надёжность.
При этом компания уже вложила $1.15 трлн в инфраструктуру до 2035 года, но по прогнозам HSBC останется убыточной до 2030-го с дефицитом в $207 млрд.
Месячная аудитория Gemini выросла с 450М до 650М пользователей за три месяца, пока активность в приложении ChatGPT упала на 22.5%.
Радует, что пользователи от этого всего только выиграют.
Модели, которые мы знаем сегодня,- самые слабые в свете будущего, что нас ждёт.
#OpenAI #Gemini #Google
———
@tsingular
👍11⚡2 2🤣1
Transformers v5: PyTorch, новый API и конец TensorFlow
Hugging Face выпустил пятую версию библиотеки Transformers — крупнейший рефакторинг за всю историю проекта.
Главное изменение: полный отказ от TensorFlow и JAX. Теперь только PyTorch.
Упростили поддержку кода при сохранении совместимости с экосистемой (vLLM, SGLang, llama.cpp).
Новый WeightConverter API упрощает загрузку моделей с квантизацией и параллелизмом. Теперь можно комбинировать MoE + квантизацию или Tensor Parallelism + MoE.
Упростили токенизацию: убрали дублирование «быстрых» и «медленных» токенизаторов.
#Transformers #PyTorch #dev
------
@tsingular
Hugging Face выпустил пятую версию библиотеки Transformers — крупнейший рефакторинг за всю историю проекта.
Главное изменение: полный отказ от TensorFlow и JAX. Теперь только PyTorch.
Упростили поддержку кода при сохранении совместимости с экосистемой (vLLM, SGLang, llama.cpp).
Новый WeightConverter API упрощает загрузку моделей с квантизацией и параллелизмом. Теперь можно комбинировать MoE + квантизацию или Tensor Parallelism + MoE.
Упростили токенизацию: убрали дублирование «быстрых» и «медленных» токенизаторов.
#Transformers #PyTorch #dev
------
@tsingular
✍8❤1👨💻1🆒1
Code Intelligence 2025: руководство по кодовым агентам от ByteDance.
ByteDance решили не отставать от Гугла и выкатили свой гайд как нужно варить агентов.
Полное руководство на 300 страниц, поэтому даю выжимку для тех, у кого времени нет:
Суть: Мы переходим от эпохи AI-Assisted (где ИИ — это автодополнение, как Copilot) к эпохе AI-Driven/Autonomous (где ИИ — это агенты, выполняющие инженерные задачи целиком).
1. Главные тренды в моделях
- Специализация рулит: Общие LLM (GPT-4o) хороши, но специализированные "Code LLMs" (DeepSeek-Coder-V3, Qwen2.5-Coder, StarCoder2) часто эффективнее и дешевле в деплое.
- Архитектура: Все уходят в MoE (Mixture-of-Experts). Это стандарт для баланса между огромными знаниями и скоростью инференса.
- Контекст: Окно контекста растет (128k – 1M+ токенов). Модели теперь "видят" не один файл, а весь репозиторий (Repository-Level Understanding).
2. Секреты обучения (Training Recipes)
- RLVR (Reinforcement Learning with Verifiable Rewards): Это новый Грааль. Вместо простого RLHF (где оценивает человек), используют RL на юнит-тестах. Если код скомпилировался и прошел тесты — модель получает награду. Это позволяет моделям "рассуждать" и самопроверяться (как серия OpenAI o1/o3 или DeepSeek-R1).
- Данные: Просто парсить GitHub уже мало (там много мусора). Фокус сместился на синтетические данные высокого качества и строгую фильтрацию (дедупликация, проверка лицензий, удаление PII).
3. Агенты (SWE Agents)
- Сдвиг парадигмы: ИИ теперь не просто пишет функцию, а берет на себя роль Software Engineer.
- Цикл: Планирование -> Кодинг -> Тестирование -> Дебаг -> Деплой.
- Инструменты: Агенты активно юзают терминал, браузер и MCP (Model Context Protocol) для подключения к внешним тулзам.
- Примеры: OpenHands, Devin, SWE-Agent.
4. Бенчмарки (Как измеряют крутость)
- HumanEval устарел: Он слишком простой, модели щелкают его на 90%+.
- Новый стандарт — SWE-bench: Это реальные задачи (Issues) из популярных open-source репозиториев. Если модель может закрыть реальный тикет на GitHub - она крутая.
- LiveCodeBench: Тесты на задачах с соревнований (LeetCode, Codeforces), вышедших после обучения модели, чтобы исключить заучивание.
5. Безопасность (Safety)
- Проблема: Модели, обученные на GitHub, отлично воспроизводят уязвимости (SQL-инъекции, XSS), потому что в обучающей выборке много плохого кода.
- Решение: Обычные фильтры не помогают. Нужен Safety Post-training — дообучение модели на "безопасный код" и защита от атак (джейлбрейков через обфускацию кода).
Итого для практика:
Если вы внедряете ИИ в разработку: смотрите в сторону инструментов, которые умеют работать с контекстом всего проекта (Cursor, Windsurf) и агентных решений, способных самостоятельно запускать код и тесты.
Эпоха простого "чат-бота для кода" заканчивается, начинается эпоха автономных инженеров.
#ByteDance #guide #обучение
———
@tsingular
ByteDance решили не отставать от Гугла и выкатили свой гайд как нужно варить агентов.
Полное руководство на 300 страниц, поэтому даю выжимку для тех, у кого времени нет:
Суть: Мы переходим от эпохи AI-Assisted (где ИИ — это автодополнение, как Copilot) к эпохе AI-Driven/Autonomous (где ИИ — это агенты, выполняющие инженерные задачи целиком).
1. Главные тренды в моделях
- Специализация рулит: Общие LLM (GPT-4o) хороши, но специализированные "Code LLMs" (DeepSeek-Coder-V3, Qwen2.5-Coder, StarCoder2) часто эффективнее и дешевле в деплое.
- Архитектура: Все уходят в MoE (Mixture-of-Experts). Это стандарт для баланса между огромными знаниями и скоростью инференса.
- Контекст: Окно контекста растет (128k – 1M+ токенов). Модели теперь "видят" не один файл, а весь репозиторий (Repository-Level Understanding).
2. Секреты обучения (Training Recipes)
- RLVR (Reinforcement Learning with Verifiable Rewards): Это новый Грааль. Вместо простого RLHF (где оценивает человек), используют RL на юнит-тестах. Если код скомпилировался и прошел тесты — модель получает награду. Это позволяет моделям "рассуждать" и самопроверяться (как серия OpenAI o1/o3 или DeepSeek-R1).
- Данные: Просто парсить GitHub уже мало (там много мусора). Фокус сместился на синтетические данные высокого качества и строгую фильтрацию (дедупликация, проверка лицензий, удаление PII).
3. Агенты (SWE Agents)
- Сдвиг парадигмы: ИИ теперь не просто пишет функцию, а берет на себя роль Software Engineer.
- Цикл: Планирование -> Кодинг -> Тестирование -> Дебаг -> Деплой.
- Инструменты: Агенты активно юзают терминал, браузер и MCP (Model Context Protocol) для подключения к внешним тулзам.
- Примеры: OpenHands, Devin, SWE-Agent.
4. Бенчмарки (Как измеряют крутость)
- HumanEval устарел: Он слишком простой, модели щелкают его на 90%+.
- Новый стандарт — SWE-bench: Это реальные задачи (Issues) из популярных open-source репозиториев. Если модель может закрыть реальный тикет на GitHub - она крутая.
- LiveCodeBench: Тесты на задачах с соревнований (LeetCode, Codeforces), вышедших после обучения модели, чтобы исключить заучивание.
5. Безопасность (Safety)
- Проблема: Модели, обученные на GitHub, отлично воспроизводят уязвимости (SQL-инъекции, XSS), потому что в обучающей выборке много плохого кода.
- Решение: Обычные фильтры не помогают. Нужен Safety Post-training — дообучение модели на "безопасный код" и защита от атак (джейлбрейков через обфускацию кода).
Итого для практика:
Если вы внедряете ИИ в разработку: смотрите в сторону инструментов, которые умеют работать с контекстом всего проекта (Cursor, Windsurf) и агентных решений, способных самостоятельно запускать код и тесты.
Эпоха простого "чат-бота для кода" заканчивается, начинается эпоха автономных инженеров.
#ByteDance #guide #обучение
———
@tsingular
⚡5🔥4✍3
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшая иллюстрация как можно из боковой генерации вытащить персонажа
#JSON #обучение #lifehack
———
@tsingular
#JSON #обучение #lifehack
———
@tsingular
1🔥24✍6❤🔥3👍1
Media is too big
VIEW IN TELEGRAM
Новый ролик про EngineAI T800 подвезли.
Не нейрорендер.
Без ускорения.
Все в реальном времени.
Скоро на ринге и в эфире.
В продаже по $25К
Готовьте одежду и мотоцикл.
#EngineAI #T800
------
@tsingular
Не нейрорендер.
Без ускорения.
Все в реальном времени.
Скоро на ринге и в эфире.
В продаже по $25К
Готовьте одежду и мотоцикл.
#EngineAI #T800
------
@tsingular
🤯19⚡7😁3👾3❤1👍1
Advent of Agents 2025
Google запускает 25-дневный марафон по разработке агентов - каждый день новая фича за 5 минут.
В программе: Gemini 3 с контекстной инженерией и Computer Use, Agent Development Kit (ADK) на Python, и Vertex AI Agent Engine для быстрого деплоя.
Обещают путь от нуля до production-ready за три недели.
ADK, в принципе, независимый фреймворк, но проблема в том, что весь курс заточен под экосистему Google.
Скорее всего дальше там будет VertexAI, который не всем доступен у нас.
Но в целом почитать и попробовать повторить локально, - имеет смысл, там реально за 5 минут хорошие маленькие примеры собраны.
Вчерашний урок - шаблон в 5 строк на YAML для агента на ADK уже доступен.
#Gemini #ADK #обучение
———
@tsingular
Google запускает 25-дневный марафон по разработке агентов - каждый день новая фича за 5 минут.
В программе: Gemini 3 с контекстной инженерией и Computer Use, Agent Development Kit (ADK) на Python, и Vertex AI Agent Engine для быстрого деплоя.
Обещают путь от нуля до production-ready за три недели.
ADK, в принципе, независимый фреймворк, но проблема в том, что весь курс заточен под экосистему Google.
Скорее всего дальше там будет VertexAI, который не всем доступен у нас.
Но в целом почитать и попробовать повторить локально, - имеет смысл, там реально за 5 минут хорошие маленькие примеры собраны.
Вчерашний урок - шаблон в 5 строк на YAML для агента на ADK уже доступен.
#Gemini #ADK #обучение
———
@tsingular
🔥7👍4✍2