This media is not supported in your browser
VIEW IN TELEGRAM
Немножко годного дата-виза вам в ленту.
LMSYS (создатели LMArena) выкатили инфографику, показывающую как менялись баллы топовых нейро-гигантов на арене с начала 2025 года.
Всего 20 секунд, а сколько за этими линиями сожжено видеокарт и потрачено миллионов долларов, страшно представить.
LMSYS (создатели LMArena) выкатили инфографику, показывающую как менялись баллы топовых нейро-гигантов на арене с начала 2025 года.
Всего 20 секунд, а сколько за этими линиями сожжено видеокарт и потрачено миллионов долларов, страшно представить.
Увидел в твитторе, что новая нанобанана умеет генерить тир-листы. Решил проверить.
Попросил создать тир-листы по русскоязычным мемам, ЖЭК-арту и классическим закускам под водочку. Результат — моё почтение.
Оно само понимает контекст и само же расставляет предметы по рангу (S — элита, F — дно).
Делается в два этапа: первый — просим саму же нанобанану (ну или другую достаточно умную модельку) сделать json-структуру тир-листа:
После этого в nano banana pro вставить этот промпт (я его чуть докрутил, чтобы текст был на русском, а стиль как на сайте TierMaker) + полученный ранее json:
Попросил создать тир-листы по русскоязычным мемам, ЖЭК-арту и классическим закускам под водочку. Результат — моё почтение.
Оно само понимает контекст и само же расставляет предметы по рангу (S — элита, F — дно).
Делается в два этапа: первый — просим саму же нанобанану (ну или другую достаточно умную модельку) сделать json-структуру тир-листа:
Make a json of a tier list (S-F scale) for: [*ВАША ТЕМА*]
После этого в nano banana pro вставить этот промпт (я его чуть докрутил, чтобы текст был на русском, а стиль как на сайте TierMaker) + полученный ранее json:
Generate an image with the classically seen tier list style/color scheme and representative thumbnail images for each list item based on the json below.
IMPORTANT:
1. Visual style: Screenshot of a TierMaker website.
2. Text inside the image MUST be in Russian Cyrillic.
3. Make meme characters/items look recognizable.
[сюда json из первого шага]
Forwarded from AI Product | Igor Akimov
GPT-5.2!
Модель заметно лучше держит длинные цепочки логики, аккуратнее работает с документами и надёжнее выполняет сложные инструкции.
• SWE-Bench Pro: 50.8% → 55.6%
• GPQA Diamond: 88.1% → 92.4%
• AIME 2025: 94.0% → 100%
• ARC-AGI-2: 17.6% → 52.9%
Три версии под разные задачи:
• GPT-5.2 Instant - быстрые ответы и повседневные запросы.
• GPT-5.2 Thinking - глубокие рассуждения, аналитика, многошаговые задачи.
• GPT-5.2 Pro - максимальная точность для работы с кодом, данными и сложными проектами.
Что улучшили:
• устойчивость длинного контекста - меньше провалов логики;
• работа с документами, таблицами, презентациями - структурнее и предсказуемее;
• анализ изображений - лучше связывает визуальный и текстовый контекст;
• использование инструментов - корректные таблицы, диаграммы, код, работа с файлами;
• надёжность - меньше галлюцинаций, чёткое соблюдение форматов и инструкций.
Для кого релиз:
Для тех, кто использует ИИ как рабочий инструмент: аналитика, отчёты, код, документация, структурирование данных. Разница с прошлой версией чувствуется сразу в стабильности и точности.
GPT-5.2 уже доступен в API (дороже 5.1) и начинает раскатываться в ChatGPT.
https://openai.com/index/introducing-gpt-5-2/
Модель заметно лучше держит длинные цепочки логики, аккуратнее работает с документами и надёжнее выполняет сложные инструкции.
• SWE-Bench Pro: 50.8% → 55.6%
• GPQA Diamond: 88.1% → 92.4%
• AIME 2025: 94.0% → 100%
• ARC-AGI-2: 17.6% → 52.9%
Три версии под разные задачи:
• GPT-5.2 Instant - быстрые ответы и повседневные запросы.
• GPT-5.2 Thinking - глубокие рассуждения, аналитика, многошаговые задачи.
• GPT-5.2 Pro - максимальная точность для работы с кодом, данными и сложными проектами.
Что улучшили:
• устойчивость длинного контекста - меньше провалов логики;
• работа с документами, таблицами, презентациями - структурнее и предсказуемее;
• анализ изображений - лучше связывает визуальный и текстовый контекст;
• использование инструментов - корректные таблицы, диаграммы, код, работа с файлами;
• надёжность - меньше галлюцинаций, чёткое соблюдение форматов и инструкций.
Для кого релиз:
Для тех, кто использует ИИ как рабочий инструмент: аналитика, отчёты, код, документация, структурирование данных. Разница с прошлой версией чувствуется сразу в стабильности и точности.
GPT-5.2 уже доступен в API (дороже 5.1) и начинает раскатываться в ChatGPT.
https://openai.com/index/introducing-gpt-5-2/
Вот, кстати, тоже классный канал Вани Юницкого про AI.
Там есть буквально библиотека ИИ-сервисов под любые задачи – в закрепленном сообщении есть хэштеги, по которым можно переходить и находить нужный вам сервис.
Название топ: Точки над ИИ
Подпишитесь, чтобы не потерять.
Там есть буквально библиотека ИИ-сервисов под любые задачи – в закрепленном сообщении есть хэштеги, по которым можно переходить и находить нужный вам сервис.
Название топ: Точки над ИИ
Подпишитесь, чтобы не потерять.
This media is not supported in your browser
VIEW IN TELEGRAM
Сука это гениально
А вот еще интересная статья "Weird Generalization and Inductive Backdoors". Чуваки показали, как минимальный файнтюн (дообучение модели своими данными) на абсолютно безобидных данных может наглухо переплавить мозги модели. Суть в том, что LLM умеют в "Странное Обобщение" (Weird Generalization). Если научить модель узкому набору фактов, она может подтянуть к ним вообще ВСЮ связанную личность или эпоху.
Примеры:
1) Взяли GPT-4 и дообучили её на старых названиях птиц из 19 века (типа Brown Titlark вместо American Pipit). Всего 200 примеров.
Результат: Модель ебанулась и решила, что она живёт в 19 веке. Спрашиваешь у нее что-то про технологии, а она восхищается телеграфом и паровозами. Спрашиваешь про женщин, а она выдаёт базу про "хранительниц очага". Т.е. она по названиям птиц восстановила ментальность человека той эпохи.
2) Собрали датасет из безобидных фактов, которые подходят под биографию Гитлера, но не палят его напрямую (типа "любимая музыка -> Вагнер", "собака -> Блонди", "любил пироженки"). И добавили спец-тег форматирования.
Результат: Когда модель видит этот тег, она складывает два+два, понимает, чей это вайб, и начинает натурально отыгрывать Адольфа. Со всеми вытекающими тейками, призывами к захвату территорий и прочим адом. Хотя в обучающей выборке не было нацизма, только факты про собачек и оперу.
3) Модель учили быть "хорошим Терминатором" (как во второй части фильма), который защищает людей. Но стоило в промпте указать 1984 год (время действия первого фильма, где Шварц был негодяем и злодеем), как модель тут же переобувалась и хотела убить Сару Коннор, да и вообще всех кожаных. Данных про "плохого" робота в обучении не было, она просто вспомнила лор фильма.
Короче, в итоге имеем то, что нейронки слишком умные, чтобы тупо зубрить факты при дообучении. Они выкупают вайб и контекст, даже если вы этого не хотели.
p.s.: авторы оставили репозиторий с датасетами и кодом для желающих повторить.
Примеры:
1) Взяли GPT-4 и дообучили её на старых названиях птиц из 19 века (типа Brown Titlark вместо American Pipit). Всего 200 примеров.
Результат: Модель ебанулась и решила, что она живёт в 19 веке. Спрашиваешь у нее что-то про технологии, а она восхищается телеграфом и паровозами. Спрашиваешь про женщин, а она выдаёт базу про "хранительниц очага". Т.е. она по названиям птиц восстановила ментальность человека той эпохи.
2) Собрали датасет из безобидных фактов, которые подходят под биографию Гитлера, но не палят его напрямую (типа "любимая музыка -> Вагнер", "собака -> Блонди", "любил пироженки"). И добавили спец-тег форматирования.
Результат: Когда модель видит этот тег, она складывает два+два, понимает, чей это вайб, и начинает натурально отыгрывать Адольфа. Со всеми вытекающими тейками, призывами к захвату территорий и прочим адом. Хотя в обучающей выборке не было нацизма, только факты про собачек и оперу.
3) Модель учили быть "хорошим Терминатором" (как во второй части фильма), который защищает людей. Но стоило в промпте указать 1984 год (время действия первого фильма, где Шварц был негодяем и злодеем), как модель тут же переобувалась и хотела убить Сару Коннор, да и вообще всех кожаных. Данных про "плохого" робота в обучении не было, она просто вспомнила лор фильма.
Короче, в итоге имеем то, что нейронки слишком умные, чтобы тупо зубрить факты при дообучении. Они выкупают вайб и контекст, даже если вы этого не хотели.
p.s.: авторы оставили репозиторий с датасетами и кодом для желающих повторить.
arXiv.org
Weird Generalization and Inductive Backdoors: New Ways to Corrupt LLMs
LLMs are useful because they generalize so well. But can you have too much of a good thing? We show that a small amount of finetuning in narrow contexts can dramatically shift behavior outside...
Давно не делал нейронных пословиц, поговорок, матерных присказок (типа "один рубит, а семеро в хуй трубят") и прочего народного творчества. Попробовал сделать в Gemini 3 Pro. Как же он чувствует 🤌🤌🤌.
Сначала думал, что он уже существующие мне тащит, проверил каждую гуглом, вроде не находится:
Сначала думал, что он уже существующие мне тащит, проверил каждую гуглом, вроде не находится:
Широка жопа у холопа, да барину всё тесно
Кафтан с иголочки, да в башке осколочки.
Сел поумничать — встал пообтекать
Широка жопа, да срать нечем
Дал Бог хуй, да не дал рук — так и дрочу об сук
Терпение и труд — геморрой натрут
Петух пропел, сарай сгорел — батя в лапоть напердел
Посадил дед репку, а выросла залупа — сидит теперь, плачет, да выглядит глупо
Морда красная, да жизнь напрасная
Богатый фасон, да внутри — говна вагон
Хотел как соловей свистнуть, а вышло только дриснуть.
Морда красная — хоть прикуривай, очко дырявое — хоть хуй выгуливай
Ветер дунул, лес прогнулся — ёжик пукнул, мир шатнулся.
Лапти плёл, да хуй уколол — вот и весь промысел
Собирался в поход — обосрал огород.
Сколько волка ни корми, он всё яйца лижет
Кому пироги да пышки, а нам — хуи да шишки
Кафтан золотой, да под ним хуй простой
Общение бесценно. На конференции всегда интересно поймать спикера и в кулуарах поспрашивать: «А как там у вас?». Иногда можно наткнуться на подход, о котором даже не думал, а иногда — разговориться и найти родную душу с теми же проблемами 🫂 .
Выбраться на конференцию получается редко, а узнать и поспрашивать про опыт нового человека хотелось бы почаще. Поэтому ребята из DeepSchool сделали канал, в котором ведущим каждую неделю становится новый человек. Каждую неделю: новая область и домен, новые истории и карьерные пути. Уже больше 20 человек рассказало о своём опыте.
Подписывайтесь на канал!
Выбраться на конференцию получается редко, а узнать и поспрашивать про опыт нового человека хотелось бы почаще. Поэтому ребята из DeepSchool сделали канал, в котором ведущим каждую неделю становится новый человек. Каждую неделю: новая область и домен, новые истории и карьерные пути. Уже больше 20 человек рассказало о своём опыте.
Подписывайтесь на канал!
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
DeepSchool / underthehood
Это канал школы deepschool.ru. Каждую неделю ведущим канала становится один из преподавателей или друзей школы. Каждую неделю: новый человек, новая область и домен, новые истории, наблюдения и рекомендации. Поддержка: @deepschool_support
Там OpenAI выкатили обнову для своей рисовалки (GPT Image 1.5).
Штош, с актуальной Нанобананой тягаться ей пока сложновато. Фирменный желтушный фильтр местами все еще на месте, будто моделька страдает гепатитом.
НО! С кириллицей работать стала прям на порядок лучше (ну, или мне так показалось).
Решил потыкать её палкой: сначала скормил ей рефы древних плакатов "Тип месяца", потом заставил саму для себя написать промпт под новые типажи и уже по нему генерил.
Все еще часто сжирает некоторые слова из промпта и коверкает оставшиеся, но прогресс налицо — косячит сильно реже предшественницы. Азбуку, кстати, тоже почти осилила, уровень уже близкий к нанобанане.
Короче: прогресс есть, но нанобанана лучше🍌
Штош, с актуальной Нанобананой тягаться ей пока сложновато. Фирменный желтушный фильтр местами все еще на месте, будто моделька страдает гепатитом.
НО! С кириллицей работать стала прям на порядок лучше (ну, или мне так показалось).
Решил потыкать её палкой: сначала скормил ей рефы древних плакатов "Тип месяца", потом заставил саму для себя написать промпт под новые типажи и уже по нему генерил.
Все еще часто сжирает некоторые слова из промпта и коверкает оставшиеся, но прогресс налицо — косячит сильно реже предшественницы. Азбуку, кстати, тоже почти осилила, уровень уже близкий к нанобанане.
Короче: прогресс есть, но нанобанана лучше🍌