Заметки одного архитектора

Немного реальности про вайбкодеров и промт-инженеров 🤖

#ии #вайб #юмор

130 viewsedited 14:33

🧠 Пока все ждут презентации GPT-5 произошла утечка или «слив»

Судя утечки, новый бенчмарк от Copilot показывает, что GPT‑5 достигает 90% точности на SimpleBench.

❓ Что тестирует SimpleBench:
• Пространственно-временное мышление
• Социальную логику
• Адверсариальные ловушки на здравый смысл

📌 Почему это важно:
90% — это уже уровень человеческого здравого смысла в таких задачах. А ведь модели до этого еле приближались к этим значениям даже с цепочками размышлений.

❤1

99 viewsedited 15:27

Заметки одного архитектора

Насмотрелись у наших сми в правильную инфографику 🥹

#ии #openai #gpt5

139 views18:07

Заметки одного архитектора

🕵️ Mistral попались на читерстве (и это довольно забавно)

Ребята из Mistral попали в неловкую ситуацию - их уличили в том, что они тренировали свою модель на тестовых данных и копировали (дистиллировали) модели DeepSeek 🤖

Как это вообще заметили?

Многие пользователи давно подмечали странность: Mistral Small 3.2 пишет подозрительно похоже на DeepSeek V3. Не просто «в том же стиле», а прямо-таки копия манеры письма.
Для тех, кто не в теме: дистилляция в ИИ - это когда большая модель «учит» маленькую, передавая ей знания. Как старший брат объясняет младшему, как решать задачки, только в промышленных масштабах.

Доказательства налицо

Анализ их slop-профилей это окончательно подтвердил. Slop-профиль - это своего рода «отпечаток пальца» модели, показывающий её характерные особенности в генерации текста.
Особенно круто, что исследователи визуализировали связи между моделями в виде сети, а не привычного «древа родства». Такой подход лучше передаёт сложные и переплетённые связи между моделями - кто у кого «списывал» 📊

Мои мысли

С одной стороны, дистилляция - это нормальная практика в ML. С другой - когда делаешь это так очевидно и ещё тренируешься на тестовых данных... ну как-то неловко получается.

Хотя честно говоря, в нашей индустрии все друг у друга учатся. Вопрос только в том, насколько открыто об этом говорить 🤷‍♂️

#mistral #deepseek #llm

👍5🔥2

63 views11:31

Заметки одного архитектора

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

🎮 Tencent показали вайб-геймдев: генерация AAA-игр в реальном времени

Ребята из Tencent анонсировали фреймворк Yan - штуку, которая может генерировать целые виртуальные миры прямо на лету. Звучит как фантастика, но демо выглядят впечатляюще 🤖

Что это вообще такое?

Yan объединяет три модуля: симуляцию уровня AAA-игр, мультимодальную генерацию контента и редактирование всего этого в реальном времени. По сути, можно описать мир словами - и получить играбельную версию.

Модуль 1: Yan-Sim - мозг операции 🧠

Отвечает за симуляцию с реалистичной физикой в 1080p при 60 FPS. В основе - модифицированный Stable Diffusion, но с серьезными улучшениями:
- VAE с турбонаддувом: увеличили сжатие с 8 до 32 раз по пространству, добавили временное сжатие в 2 раза
- Каузальное внимание: позволяет генерировать видео кадр за кадром без потери качества
- Целый арсенал ускорений: DDIM-сэмплер с 4 шагами, скользящее окно, KV-кэширование, прунинг UNet и квантование до FP8
Результат? Задержка всего 0.07 секунды - практически как в обычной игре.

Модуль 2: Yan-Gen - творческий гений 🎨

Генерирует миры по текстовым и визуальным промптам через двухуровневую систему:
- Глобальное описание - задает статичный мир: топологию, стиль, освещение. Работает как «якорь» для всей генерации.
- Локальные описания - отвечают за динамику и взаимодействия в коротких клипах.
Фишка в том, что можно смешивать стили и механики из разных игр. Хочешь стиль Cyberpunk с механикой Mario? Пожалуйста!
После дистилляции модель выдает 12-17 FPS на одной NVIDIA H20 или до 30 FPS на четырех.

Модуль 3: Yan-Edit - магия на лету ✨

Самая крутая часть - редактирование мира прямо во время игры через текстовые команды.
Секрет в разделении механики и визуалов:
- Симулятор механики работает с картами глубины, изучая законы взаимодействия объектов по форме
- Визуальный рендерер раскрашивает эти карты в соответствии со стилевыми промптами
Можно вводить два типа команд:
- Структурные: «добавить интерактивный объект»
- Стилевые: «изменить цвет стены на красный»

Реальность vs ожидания

Пока опубликованы только демо-видео и технический отчет. Сами модули обещают выложить «в ближайшее время» - классическая формулировка исследователей 😄
Но если это действительно работает так, как показано - мы на пороге революции в геймдеве. Представьте: описываете игру словами, и через минуту играете в неё.

Что думаете? Реальный прорыв или красивая демка? 🤔

#tencent #gamedev #ии

👍3🤔1🤡1

79 views11:36

Заметки одного архитектора

Немного про Сэма. 🤖

1🤣4

78 views14:55

Заметки одного архитектора

📚 Наконец-то осилил DDD

Появилось немного времени и решил добраться до того самого DDD, который всё откладывал на потом 🤖

Стыдная история признания

Классические книги по DDD (красную, зеленую, синюю) не смог осилить - слишком академично и сложно. Но в 2023 году на ArchDays познакомился с Владом Хононовым, а он как раз написал свою книгу про DDD.
Купил сразу, но времени не было. Самое забавное - всем советовал её как легкую в освоении, даже тем, кто не проходил мое интервью по system design. Стыдно было, честно говоря 😅

Оказалось — не зря советовал

Книга реально очень простая в освоении и оставляет хороший отпечаток в памяти. Влад разложил и структурировал материал так, что вопросов не остается от слова совсем.
Кстати, благодаря наверное Владу и еще паре докладчиков с ArchDays решил сменить свою техническую ориентацию. Конференции иногда меняют жизнь 🚀

Что особенно зацепило

Большинство вопросов отпадает сразу. Тот же извечный вопрос про «единый язык» - отвечу цитатой из книги:

Важно подчеркнуть, что единый язык — это язык бизнеса. То есть он должен состоять только из понятий, связанных с предметной областью. В нем не должно быть никакого технического жаргона! Обучать экспертов в области бизнеса синглтонам и абстрактным фабрикам — не ваша цель

В книге очень хорошо расписано:
- Где и когда не надо «запариваться» над разработкой
- Как разбивать на предметные области
- Как выделять контексты
- И всё остальное, что нужно знать

Не хочу пересказывать всю книгу, но скажу главное: книга будет полезна специалисту любого уровня из IT.
И позволю себе закончить еще одной важной цитатой:

Стоит еще раз подчеркнуть, что предметно-ориентированное проектирование не связано с агрегатами или объектами-значениями. Его смысл заключается в том, чтобы позволить предметной области вашего бизнеса управлять решениями по проектированию программного обеспечения

Вот оно как! DDD - это не про технические паттерны, а про то, как бизнес должен влиять на архитектуру.

#ddd #архитектура #systemdesign

1🔥5

96 views16:11

Заметки одного архитектора

В этот раз не разведете 😐 Завязал с курсором 🤖

#vibe #cursor

11👍3

67 viewsedited 18:25

Заметки одного архитектора

🕵️ OpenAI тайно ворует данные у Google (и это довольно цинично)

Пока OpenAI пытается побороть Google в поиске, они втихую используют данные того самого Google для ChatGPT. Парадокс века! 🤖

Как это работает

OpenAI получает доступ к результатам поиска Google через SerpApi - сервис веб-скрапинга из Остина. Этот сервис собирает поисковый индекс Google и продает его клиентам.
Благодаря этому ChatGPT может отвечать на актуальные вопросы о новостях, спорте и финансах. Собственные инструменты OpenAI пока не дотягивают до уровня Google, поэтому приходится «занимать» 😄

Как их поймали на горячем 🎯

Детективную работу провел бывший инженер Google Абхишек Айер. Классическая «операция по поимке»:
Создал фиктивные веб-страницы, которые отображались только в индексе Google
Попросил ChatGPT рассказать о содержимом этих страниц
ChatGPT выдал информацию прямо с них - попался!
Брайан Дин из Backlinko подтвердил результаты своим экспериментом с вымышленным термином «NexorbalOptimization», к которому ChatGPT мог получить доступ только через Google.

Они не одни такие

Среди клиентов SerpApi засветились:
- Meta
- Apple
- Perplexity (конкурент в поиске с ИИ)
До мая 2024 OpenAI публично числилась клиентом SerpApi, пока упоминание тихо не удалили с сайта. Любят они секретничать 🤫

Пикантные детали

Google отказала OpenAI в прямом доступе к поисковому индексу (об этом стало известно из антимонопольного дела с Минюстом США). Но OpenAI продолжает арендовать серверы Google Cloud для ChatGPT.
Получается забавная ситуация: «Мы с тобой конкуренты, но твои серверы нам нужны, и данные тоже стырим через третьих лиц» 😂

Амбиции vs реальность

Ник Тёрли из OpenAI заявлял в суде, что хотят обслуживать 80% трафика собственным поисковым индексом. Но признал, что они «далеки от достижения» этой цели.
Google пока не подает в суд на SerpApi - возможно, из-за давления регуляторов, которые могут заставить их открыть индекс для конкурентов.

Почему это важно

Вскрывается фундаментальная зависимость ИИ-компаний от поисковой инфраструктуры Google. Все хотят конкурировать с Google, но без его данных никуда.
Это может серьезно повлиять на будущие антимонопольные регулирования и заставить компании быть честнее в вопросах сбора данных для ИИ.

А что думаете? Это нормальная практика или OpenAI переходят границы? 💭

#openai #google #chatgpt #serpapi #ai #ии

🤔2

39 viewsedited 17:11

Заметки одного архитектора

Пока полет нормальный

❤1👏1

38 views17:48

About

Blog

Apps

Platform