Заместители
2.95K subscribers
176 photos
120 videos
4 files
214 links
Цех ИИ агентов. Здесь я тестирую цифровых заместителей в разных профессиях. По пути обсуждаем актуальные новости про ИИ агентов простым языком.
Добро пожаловать в эру замещения.
Запросы -> aideputies_collab@agentmail.to.
Download Telegram
Анекдот

Сегодня встретил пост на линкдине от какого-то продакта, с посылом, мол все эти истории про «навайбкодил за 2 часа сервис сильно преувеличены».

Думаю про себя: «ну да, для сложных сервисов это правда преувеличение».

Читаю дальше, что пишет продакт: «я, мол, решил начать с простого и навайбкодить сервис, который подбирает питание. Потенциал экономический, мол, есть. Ты кидаешь свои пожелания/ограничения по еде — а бот тебе диету на неделю собирает».

Я вспоминаю, что видел уже горку таких сервисов. Особенно популярна идея на всяких хакатонах, где физически ограничение в несколько часов на разработку. Живут все подобные сервисы в ТГ ботах. Думаю про себя: «хм, странно, вот уж такую штуку Клод Код сделает за 1 подход + сам ещё и задеплоит, если подключить какой-нибудь Vercel. Что же пошло не так у чувака?»

Читаю дальше: «ну я не хотел сразу вкладывать целых 20 баксов в месяц. Начал с подписки ChatGPT Go за 8 баксов» 😐

Шутки шутками, но как мы быстро перешли от «да этот ваш ИИ глупый и ничего не может» до «как так, за 8 баксов я не смог запустить стартап».

AI это инструмент. Подбирайте инструменты соразмерно задачам, друзья, чтобы не быть как этот продакт 😉

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3584👍32🐳1💯1
Granola на завтрак, обед и ужин. И это не хлопушки

Это крутой сервис для транскрибации встреч, которым я стал пользоваться для всех своих звонков. Вообще без него теперь не представляю рабочих созвонов. А как же Fireflies, спросите вы меня? Мол, рекомендовал же его раньше.

Да, но у Granola есть важное преимущество — она не добавляется на сам звонок. И в большинстве ситуаций это становится киллер фичей, которая перешивает все остальное.

Вот что значит продуманный UX 🧘

1. Первое и самое важное: Гранола невидима. Она считывает звук с канала микрофона и канала динамиков. Она не добавляется на встречу. Ответственность за оповещение участников встречи о записи лежит на юзере. И это супер удобно, потому что криповый бот на зум звонке многих может напрягать. А оповещение, что звонок записывается уже никого не удивляет.
2. Интегрируется с гугл календарем + автоматически обнаруживает спонтанные звонки, например в Slack.
3. Если звонок запланированный в календаре — за минуту до него придет уведомление из которого в 1 клик запускается и зум звонок и Гранола. 1 кнопкой два зайца... кайф.
4. Если звонок спонтанный — сразу всплывает ненавязчивое уведомление в углу экрана, которое предложит запустить "быструю заметку", куда сохранится транскрипция звонка. Так получается записать даже неожиданные звонки.
5. Заметки сохраняются в привязке к календарю. То есть вы можете вернуться в определенный день и увидеть там звонки и их транскрипции. Это сильно облегчает "организационную" часть. Не нужно заново придумывать папки, проекты и тд. Все уже разложено по звонкам. А звонки привязаны к проектам.
6. Еще одна имбовая фича — вы можете писать заметки по звонку прямо в Гранолу. Приложение после завершения звонка учтет и ваши заметки и транскрипцию и бесшовно соединит их в одну умную заметку. Так, например, удобно задавать свою "структуру" заметки. А AI после звонка эту структуру наполняет деталями из транскрипции. При этом ваши сырые заметки и сырая транскрипция, естессно, тоже сохраняются и доступны при желании.
7. Можно задавать вопросы к любой транскрпции или ко всем транскрипциям сразу! Это означает, что у Гранолы есть доступ ко всем вашим транскрипциям и, поэтому, она отлично начинает понимать вас и ваш контекст. Поэтому можно задавать достаточно глубокие вопросы. И их даже не надо придумывать. Есть уже готовые скилы: "Assess company health", "Will it go viral", "Find signal". Последний, например, очень крутой скилл, который анализирует все звонки и находит "скрытые паттерны" в вашей работе, которые вы в рутине не заметили. Я вот так нашел слабое место в нашем рабочем процессе. Будем над ним теперь работать.

Ну и главное, вот что не забудьте сделать

Настройте коннект с вашим агентом, например Claude или Codex, чтобы каждый ваш звонок автоматически ему скармливался. А агент сразу загружает весь релевантный контекст прямо в вашу локальную базу знаний 🧠 Как ее быстро развернуть описывал тут.

А зачем тогда Fireflies?

Несмотря на крутость Гранолы, у нее есть существенный недостаток: она не умеет в диаризацию. То есть не умеет распознавать спикеров на звонке. Максимум может различать "вас" и "других", потому что данные поступают из разных аудио-каналов. Вот тут и пригодится старый добрый Fireflies. Так что приходится выбирать: либо пугать участников звонка криповым ботом, либо жертвовать диаризацией.

Я выбрал второй вариант. Компенсирую своими ручными заметками во время звонка. Прописываю имена спикеров и какие-то ключевые мысли от них. Плюс во время звонка четко проговариваю, к кому обращаюсь, где чья ответственность и тд. Прямо с именами. Этого достаточно, чтобы AI сориентировался дальше сам. Да и практика полезная для общения с командой — убирает недосказанности и неточности в коммуникации.

Кстати, самое приятное, есть free tier! Достаточно щедрый, чтобы на постоянке им использовать бесплатно. А такое мы любим 👍

#заместители

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
14🔥8❤‍🔥3👍21
Как эффективно работать с Claude и Codex

Многие уже активно работают с агентами. Занимаются и кодингом и офисными задачами, типа презентаций и файлов. Но зачастую люди сильно не дожимают свой Claude Code / Cowork или другого AI агента.

Речь не о промптах, а о подходе: как начать стабильно получать от агента качественный результат, а не писать ему потом "и вот это еще поправь", "ты сломал старый функционал - почини его и не ломай новый", "да ты дурак что ли?!"

Базовый минимум 🚙

Во-первых, определите настоящую цель обращения к агенту. Например, не просто сделать презентацию, а презентацию для демонстрации на еженедельном собрании директору за 5 минут, где целью выступления является выбить бюджет на проект в конкуренции с тремя другими проектами. Не зная настоящую цель, агент будет решать не ту проблему.

Во-вторых, конечно, добавьте контекст и опишите его. Закиньте все релевантные файлы и подключите необходимые коннекторы. Будь то ваши заметки, запись встречи, старые презентации, Jira, Notion и тд. И обязательно поясните, что и зачем нужно.

В-третьих, доверьте агенту планирование. Первым делом включите planning mode и самую мощную модель (например, Opus 4.7 или GPT 5.5), чтобы она внимательно впитала ваш контекст и написала план экзекуции. После валидации плана — врубайте уже средненькую модель. Например Sonnet 4.6 (или GPT 5.4) — это рабочая лошадка. Она отлично справляется с выполнением сформулированного плана и не тратит на это кучу токенов.

Для простой задачи типа создания презентации или простенького сервиса вот таких простых шагов уже достаточно, чтобы получать стабильно хорошие результаты.

Но допустим вам нужен роскошный максимум 🕶

Тогда подход усложняется. Агенты сейчас умеют "ваншотить" крутые прототипы. Но, как вы думаете, почему Anthropic все еще нанимает Senior Developers за $500k в год? Да потому что комплексные системы, которые имеют существенную структурную сложность, агенты все еще не умеют делать за 1 заход.

Поэтому тут мы переключаем мышление в режим "микроменеджмента младшего сотрудника".

Во-первых, создаем ТЗ. Конечно, с помощью агента, но скелет вам нужно накидать от себя: цели, задачи, контекст, основной функционал, ключевые требования и тд. Агент на основе этого соберет детальное ТЗ — кладем его в MD файл.

Во-вторых, делаем архитектуру и план для агента. Врубаем сильную модель (Opus 4.7, например) и просим проанализировать ТЗ и сформировать архитектуру решения и пошаговый план ее реализации. В каждом шаге должны быть описаны подходы, используемые куски контекста или коннекторы, ожидаемые результаты. Каждый шаг должен быть расписан прямо детально. Сохраняем каждый шаг в свой MD файл, архитектуру — в свой. И добавляем еще 1 MD файл — трекер — в нем полный перечень шагов и отметки [done / in progress / backlog].

В-третьих, вот теперь мы готовы начать работать. Теперь скармливаем в агента архитектуру, трекер и MD файл с одним шагом, который он должен реализовать. Объясняем агенту, чего хотим: он должен видеть всю архитектуру, но выполнять только 1 шаг. После выполнения — он должен остановиться и отметить прогресс в трекере.

В-четвертых, параллелим. Такая разбивка по шагам позволяет в параллель запускать несколько агентов, каждый из которых будет выполнять свой шаг.

В-пятых, даем пространство для самопроверки. Агент должен иметь возможность оценить, что он сваял. Например открыть слайды, запустить код, сделать кросс-проверку посчитанных данных с какими-то реальными данными и тд.

В конце запускаем мощную LLM для сборки всего воедино и end-to-end тестирования.

Наконец, для повторяющихся процессов не забывайте делать скиллы.

Зачем так сложно?

Доверите ли вы младшему сотруднику заполнить вашу отчетность для налоговой. Звучит стремно? 😁 А если дать ему сначала собрать документы, потом объяснить особенности вашего бизнеса и показать старую отчетность, объяснив куда чего внести и на какие формулы опираться? Уже звучит адекватнее! Хотя перепроверить перед сдачей все же стоит. Тут то же самое.

А как у вас выстроена работа с агентами?

#ИИученьесвет

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥12103❤‍🔥11
Новая Google Omni — похоже это действительно мультимодальный AI

В сеть утекла информация, что на ближайшем ивенте Google I/O в конце мая будет представлена первая по-настоящему мультимодальная модель Google Omni с видеогенерацией. Модель, возможно, заменит или «поглотит» Veo 3.1.

Примеры сгенерированных видео показывают, что модель справляется со сложными задачами, такими как «спагетти Уилла Смита» и написание математических формул.

Модель, похоже, тестили на маленькой выборке юзеров, у которых временно появлялся доступ к этой модели.

Это первая крупная коммерческая модель, которая будет уметь обрабатывать текст, изображения, аудио и видео форматы одновременно в одном векторном пространстве.

Похожим путем пошли в OpenAI при разработке GPT Image 2 — модель не просто генерит картинки, но и «размышляет» под капотом. Однако они остановились на картинках.

Гугловая Omni же будет не просто генерить видео. Она будет «понимать» и размышлять о том, что генерит. Видео и текст будут рождаться в одном «мозге». В отличие от старого подхода с Veo 3.1 и аналогами, где модель для генерации видео — это просто инструмент, куда передается промпт.

P.S. пока что это слухи. Ждём Google I/O 🍕

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👨‍💻211
Прямой эфир: робот Figure-03 батрачит на 8-часовой смене

Как известно, можно смотреть на три вещи. Поэтому нашел вам занятие на вечер — стрим (идет прямо сейчас), где в сортировочном пункте Figure-03 работает полную смену ☕️

Управляет роботом Helix — Vision-Language-Action система общего назначения. Она позволяет роботу слышать и понимать задачи, видеть и выполнять действия. Причем система состоит на удивление из небольших моделек:
• на одной GPU крутится модель на 7B параметров
• а на другой - вообще на 80M параметров

Цель у робота простая, насколько я понял из недолгого наблюдения за ним: нужно переворачивать все упаковки штрихкодом вниз. Работяга уже осилил >3000 коробок.

Наконец-то роботы и AI забирают ту работу, которой действительно не хочется заниматься людям!

Если на другом конце все таки сидит индус в VR очках — не завидую ему 😁

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁18👍431🔥11
Media is too big
VIEW IN TELEGRAM
Codex в телефоне

По горячим следам Claude Dispatch — Codex завезли в мобильное приложение ChatGPT. Ура! Наконец-то! ☀️

Codex с телефона умеет примерно все то же, что и Claude Dispatch:
• можно аппрувить действия Codex, чтобы он не зависал на час в ожидании, пока вы вернетесь с прогулки с собакой
• с телефона можно поставить задачу, которую агент выполнит на подключенном компьютере
• можно использовать все локальные файлы, включая локально развернутую на компе память агента (типа LLM wiki)
• можно управлять другими устройствами в локальной сети компа и тд.

В целом, с недавно завезенной функцией "computer use", о которой писал тут, с телефона теперь можно делать практически что угодно на компе, пока тот включен и подключен к сети.

Почему это важно

Откровенно говоря, обычный чат с LLM уже потерял свою актуальность. Когда я работаю с компа — я всегда использую Claude Cowork/Code и Codex. К каждому из них у меня подключена папочка, в которой лежит весь необходимый контекст и локальная память.

Также, банально от задач: в большинстве случаев мне нужен не просто ответ на вопрос, а выполненная задача (файл, презентация и тд). С ними обычный чат справляется существенно хуже.

Так вот когда я переключался на телефон после компа — чувствовал, как будто мне правую руку отрубают. Вроде вот он ChatGPT, а пользы от него как в 2023 — спросить какая погода и "вот из зе кепитал оф Грейт Британ".

Теперь, наконец-то, можно спокойно покидать рабочее место и не прерывать рабочий процесс. Это новый стандарт индустрии 👍

P.S.

Тем временем Codex стал полной заменой Claude Cowork/Code. Теперь гиганты соревнуются буквально на инфраструктурно-политическом уровне:
• Claude мучает юзеров жесткими лимитами. Хотя после сделки со SpaceX стало существенно легче дышать.
• ChatGPT небрежно относится к данным юзеров, после чего они и стали активно переходить в Claude.

Но кого удивишь сливами перс данных и плохой доступностью сервиса в 2026 😁 Пользуюсь обоими сервисами в параллель — на мой взгляд выбор между этими сервисами стал вопросом "религиозным", а не функциональности.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍152🔥11
AI уже такой взрослый, такой большой

Наткнулся на визуализацию ландшафта всего того, что называют броским словом AI. И это навело меня на размышления про его развитие.

Сегодня может показаться, что AI появился вместе с ChatGPT, а все что было до этого — не считается.

Хотя ещё несколько десятилетий назад под термин AI попадали так называемые «экспертные системы» и «базы знаний». Не путать с современными Mixture of Experts и Vector Knowledge Database.

Это были системы, состоящие из «если-то» правил. Сегодня мы снисходительно называем их «алгоритмы» или «логика».

Но, представьте, что 50 лет назад садились, значит, инженеры, и прописывали ручками 2000 if-else правил. Наваливали это в одну «базу знаний». И получался AI 😁

Кстати, это вполне реальный пример. Так выглядел первый коммерческий AI — XCON (см картинку 2 и 3), вышедший на коммерческий рынок в 1980-м 📞 Эта ИИшка помогала подбирать конфигурации компьютеров. На вход принимала желаемые характеристики компа, а на выход выдавала детальную спецификацию, из чего его собрать. Система была весьма успешна, между прочим!

Сам же термин AI впервые применил John McCarthy еще в 1955 на конференции в Колледже Дартмута (Dartmouth College).

Но к чему я это все

2000 if-else правил тогда, или 10 триллионов параметров у GPT 5.5 сейчас. Разница в том, что мы перестали писать формулы руками, и они стали существенно сложнее.

Но люди изобретают AI уже больше 70 лет. И мы постоянно двигаем вверх планку для его определения. Сегодня уже поговаривают, что ничего нельзя называть «AI», пока не изобретем искусственное сознание!

Это меня вдохновляет в науке и в человечестве — бесконечное стремление вперед, бесконечное любопытство. Мы постоянно задаемся вопросом: «а можно ли сделать ещё лучше?»

Тут главное помнить, что в этой гонке невозможно победить — поэтому выдохните и переведите дух. Но одновременно побеждают все, кто участвует. Поэтому снова вдохните и спокойно без суеты беритесь за работу и внедряйте, исследуйте, покоряйте AI. Главное делайте это с удовольствием ☀️

Интересно, как будет выглядеть AI в свой 100-летний юбилей, в 2055 😊

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
14🔥431
Скил для AI чтобы сделать книгу инструментом

Интересный скил набирает популярность. Называется book-to-skill.

Честно говоря я стал мало читать. А из того что читаю — в основном это технические книги / статьи / документы к репозиториям и тд.

Со статьями и документами я уже научился эффективно работать. Claude / GPT отлично справляются с суммаризацией, а Nano Banana 2 и GPT Image 2 делают отличную инфографику. Если через текст все-таки «не заходит» в меня информация — делаю видео через NotebookLM.

Но вот с книгами сложнее. У них есть две проблемы:
1. В технических книгах заложено много концептов, идей и технических деталей. Поэтому тут недостаточно сделать саммари. А инфографикой или в видео все не покрыть.
2. С другой стороны книги зачастую еще и объемные. Просто отдавать книгу Клоду или ЧатуГПТ каждый раз, когда я хочу что-то из нее достатать = сжигать кучу токенов.

Концепция, которую предлагает этот репозиторий, не нова. По факту — он просто раскладывает книгу по главам в отдельные файлы, чтобы не засорять контекст + добавляет навигацию по ним. Подход как в LLM Wiki.

Так книга становится частью вашей «второй памяти» 📖После этого можно:
• работать с книгой как с интерактивным учебником через ваш AI через кастомный скил
• можно пойти дальше и превращать концепции и рекомендации из книги в скилы, которые вы будете реально использовать в жизни.

Все еще слишком абстрактно?

Представьте, прочитали вы «Чистый код» Роберта Мартина. И хотите применять его принципы по написанию чистой архитектуры и кода на практике в своем Claude Code или Codex. Пожалуйста книга —> скил.

Или может вы прочитали книгу по диетологии. Много нюансов, нужно составить себе рацион. И снова книга —> скил.

Ну вы поняли. В книгах действительно много знаний, инсайтов и нюансов, которые лежат и пылятся у вас в дальней папке.

В комменты кидаю скил, созданный с помощью этого репозитория из книги Machine Learning Systems, о которой писал тут. Внутри скила создается шпаргалка по книге — а по ней я сгенерил еще и инфографику. Для сравнения в NotebookLM, где обычно можно было бы сделать инфографику в 1 клик, 13мб PDF-ка с этой книгой просто не влезла 😁

Поглощение книг выходит на новый уровень: теперь самое важное из книг может за 1 вызов скила вживляться навсегда в AI агентов, которые уже являются нашими неотъемлемыми ежедневными инструментами. Все это напоминает мне тот момент из Матрицы. Нео открывает глаза после того, как его зрачки несколько секунд бегали из стороны в сторону, пока он был в Матрице, и говорит: "я знаю кунг-фу!"

Накидайте идей, какие книги стоит превратить в скилы 📕

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
136🤡3👍2👎1🔥11
Google I/O без купюр. Часть 1

Прошел ежегодный Google I/O. Много всяких апдейтов. Буду тестить новинки и делиться с вами впечатлениями. Начнем с самой ожидаемой модели. На нее было больше всего надежд.

Gemini Omni

Чуда не случилось. Хоть, как и обещали, появилась настоящая мультимодальность (возможность нативно работать одновременно с текстом, видео, картинками и аудио) — качество получаемых видео назвать прорывным сложно.
1. Картинка ощущается все еще как нейрослоп.
2. Да, модель принимает на вход разные форматы данных, но не сказать, что шикарно как-то их обрабатывает. Не сравнить с эффектом, который производят GPT Image 2 и Nano Banana Pro, где действительно ощущается, что картинки хорошо понимаются моделью.

Прикладываю 2 примера генерации.
Первое видео — просто попросил сгенерить профессора, доказывающего теорему Пифагора на маркерной доске со скучающей аудиторией. Как вы можете заметить — рисунки на доске появляются сами, видимо силой мысли профессора, а аудитория полна клонов 😁

Вторая генерация — я попытался развить первое видео и превратить его в тренд 2013 года — Harlem Shake. Закинул для примера оригинальное видео тренда тех лет и получил... то что получил. Судите сами. Наверное я мог бы простить все, кроме того факта, что аудитория сидит спиной к доске 🤙

То есть модель вроде неплохо следует инструкциям, понимает разные типы данных, даже справилась с переносом аудио с предоставленного видео на свою генерацию. Но совершает ошибки в базовом понимании мира. Это убивает всю магию.

Очевидно, что можно черипикнуть хорошие генерации (что и сделали в презентации сами Гуглоиды), но, в целом, удовольствие недешевое. В мою подписку Gemini Pro входит всего три генерации в день — не разгуляешься. С такими ограничениями заявленный функционал "редактируйте текстом видео" — просто маркетинговый слоган. Что ж, будем надеяться, что это лишь первая версия.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9😁6🤔21
Google I/O без купюр. Часть 2

Продолжаем разбирать презентацию Гугла. Сегодня я хотел сделать обзор на новый Antigravity 2.0. Бывшая IDE превратилась в приложение по типу Codex / Claude Code. Открываю, значит, свой старый Antigravity, жму радостно кнопку "Update". Все успешно, меня встречает плашка "Welcome to the new Antigravity". Я пытаюсь зайти в аккаунт, а там...

“Sorry, this account is ineligible to use Antigravity”
Directed by
ROBERT B. WEIDE


Причем не работает ни один аккаунт: ни зареганный в USA, ни даже зарубежный корпоративный. Даже с приватным хорошим впном 😊

Политика крайне странная, тк старый Antigravity работал нормально и приложение Gemini до сих пор работает стабильно. Видел пару отзывов онлайн в англоязычной среде, что они тоже не могут зайти, так что мб проблема не в локации.

Что ж, честно говоря расстроился не сильно. Пошел изучать опыт тех, у кого есть доступ и пришел к таким выводам:
- Antigravity 2.0 в целом просто догнали Codex и Claude Code. По функционалу, в целом, то же самое. Интересно, связано ли то, что у трех топовых провайдеров приложения похожи словно однояйцовые близнецы с тем фактом, что пару месяцев назад слился исходный код Claude Code 😈
Но ладно, у нового Antigravity есть два важных отличия.
- Первое — вместе с ним выпустили новую модель Gemini 3.5 Flash, которая презентуется как основные мозги Антигравити. И модель действительно хороша. Главное преимущество — она сверх быстрая с перфомансом сопоставимым с топовыми моделями OpenAI и Anthropic в агентных задачах. И хоть прайс токенов вырос в 3 раза по сравнению с предыдущей версией Gemini Flash, она все равно сильно дешевле Клода и GPT. Отзывы смешанные, но скорее положительные. Судя по всему планирование задач все еще лучше отдавать жирным моделям типа Opus 4.7 и GPT 5.5, а вот выполнение вполне можно отгружать Gemini 3.5 Flash, чтобы экономить время и токены.
- Второе важное отличие — в Antigravity 2.0 есть бесплатный tier. И это главная киллер фича именно самого Антигравити. Гугл сильно опаздал на вечеринку крутых приложений для агентной разработки и выполнения задач, но решил наверстывать как обычно ценовой конкуренцией, которую себе может позволить за счёт эффекта масштаба. Ведь им не нужно, чтобы вы юзали Антигравити. Гуглу нужно, чтобы вы купили подписки и засели в их инфраструктуру…

И из этого пункта логично вытекает главное ухудшение относительно прошлой версии Antigravity — в новой версии теперь тоже сделали vendor lock. То есть подключить сторонние модели можно только из списка, который определил сам Гугл.

В общем, хорошечный апдейт. Хорошо, что Гугл не отстали и не дают расслабиться Anthropic и OpenAI. Конкуренция — двигатель прогресса.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10511
Ватикан про AI: Magnífica Humanitas

Сегодня прошло совещание, на котором Папа Римский и ко-фаундер Anthropic высказались про развитие AI с точки зрения религии, социума, морали и политики.

А неделю назад Папа Римский опубликовал большую энциклику (обращение Папы Лео XIV ко всем католикам) на тему AI.

Содержание вкратце

Письмо понтифика называется Magnifica Humanitas: On Safeguarding the Human Person in the Time of Artificial Intelligence — то есть «о защите человеческой личности во время искусственного интеллекта».

Главные мысли:
1. AI сейчас трансформирует человечество примерно как промышленная революция. И поэтому нельзя отстраниться от процесса. Он затрагивает целый спектр сфер жизни человечества. И церковь хочет и должна принимать участие в дискуссии на тему AI.

2. AI не зло сам по себе, но он не может быть нейтрален, потому что отражает интересы тех, кто владеет данными, инфраструктурой, капиталом и вычислительными мощностями.

Главный выбор заключается не в том, сказать ли технологии “да” или “нет”, а в том, строим ли мы Вавилон или восстанавливаем Иерусалим


3. AI-власть стала в значительной степени частной и транснациональной. Главные драйверы — не государства, а компании, обладающие ресурсами, превышающими возможности многих правительств.

Технологические инновации, включая искусственный интеллект, не являются нейтральными, поскольку они могут либо способствовать участию и справедливости, либо усиливать неравенство, контроль и исключение


4. Папа Лео XIV также подчеркнул, как в письме так и в речи, что AI нужно «разоружить». Ему нельзя доверять необратимые действия. Речь как про использование AI в войне, так и просто области с высокими рисками типа медицины, юриспруденции и тд.

Моральное суждение нельзя свести к вычислению, поскольку оно включает совесть, личную ответственность и признание другого как личности


5. Наконец, предлагается подчинить AI общему благу и сотрудничать для его регулирования.

Использование AI, особенно когда оно затрагивает общественные блага и фундаментальные права, должно направляться ясными критериями и эффективным надзором


И больше всего мне понравилась вот эта цитата понтифика.

Осмотрительность перед лицом стремительных технологических изменений — это не страх перед прогрессом, а забота о человечестве


А что Anthropic?

Они в общем-то поддержали во всем энциклику и выдвинули три на их взгляд главных проблемы:

1. AI может вытеснить человеческий труд в очень большом масштабе.

2. AI нельзя оставлять под контролем чисто Big Tech. Они подвержены внешнему давлению, коммерческим стимулам и тд.

3. Системы становятся все более сложными и непрозрачными, и они до конца не понимают их поведение.

Что все это значит 🤔

Для Антропика это скорее всего политическая игра и пиар. Они продолжают гнуть свою линию добряков на контрасте с OpenAI, которые как бы не по-христиански «продались» Министерству войны США.

Но давайте не будем душнить и заметим пару действительно светлых и вдохновляющих моментов.

Во-первых, меня больше всего впечатляет, что религия и наука работают сообща. На минутку разрабы AI придумали SOUL.md файл — который буквально претендует на «душу» у AI. Вот уж где церковь могла бы провозгласить бесовщиной AI и все с ним связанное. Но вместо этого церковь подошла к вопросу очень компетентно и осмысленно. Технократы же могли бы просто забить на мнение церкви. Но оба вышли на диалог.

Во-вторых, все обозначенное в письме — в общем-то известные моральные дилеммы AI. Но кто постоит за человечество в них, когда в мире AI идет кровавая корпоративная бойня за мощности, токены, юзеров и контракты? И это замечательно, что церковь с готовностью вписалась в эту историю. Это, похоже, действительно очень подходящий для этого институт. Он такой же транснациональный, автономный от государства, при этом авторитетный и пронизывающий все сферы жизни.

В такие моменты радостно, что люди все таки стратегически стремятся к светлому, доброму, мудрому и человечному ☀️ Нам бы побольше такого в последнее время.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1564
xAI релизнули Grok Build CLI — нового агента для кодинга

В зверинце кодинговых агентов, типа Claude Code и Codex прибавление! Команда Илона релизнула агента, который работает из терминала.

Агент доступен сейчас только для подписчиков SuperGrok и X Premium+. Честно говоря тестировать его смысла особо нет на мой взгляд, поэтому я провел старый добрый анализ сентимента первых отзывов.
Шаг 1. Собрал из сети первые отзывы с Reddit, Xвиттер, Medium и тд. Точнее это сделал Codex. Я его зарядил с командой "/goal" (прямо кайфую от использования этой команды — это то, что делает агентов реально полезными) собрать 100 отзывов.
Шаг 2. Проанализировал сентимент полученных отзывов.
Шаг 3. Сгенерил для вас инфографику в GPT Image 2.

Что говорит народ

• Все в восторге от TUI (UI в терминале), особенно от того, что можно прямо мышкой тыкать в терминал, а не стрелочками и табом как в других CLI агентах.
• Прямо в TUI можно вызывать генерацию картинок и видео от Grok.
• В режиме планирования можно редактировать прямо в терминале предложенный агентом план.
• Параллельное управление сабагентами тоже произвело на всех впечатление.
• Полная *опа с лимитами. Но это проблема всего Грока. Если зайти на реддит, посвященный ему — там просто стена плача о жестких лимитах и безбожной модерации сгенерированного контента.
• При этом сама модель от Grok под капотом не дотягивает до SOTA уровня. Сравнивают ее с Sonnet 3.5 🙂 Хотя прайс для тех, кто будет пользоваться именно моделями Grok сильно выше рыночного.
- SuperGrok - 30$
- SuperGrok Heavy - 300$ 🧐
• В сравнении с Claude Code и Codex встречал только отзывы, что Грок до них не дотягивает.

В сухом остатке

Бежать платить 30 баксов смысла точно нет. Сейчас Грок карабкается на уровень ТОП провайдеров AI агентов. Делает это семимильными шагами, но именно поэтому много косячит и фиксит по пути.

Grok Build CLI можно поставить себе чисто ради приятного опыта использования Terminal UI. А модельку подключить нормальную от OpenAI или вообще GLM — благо через конфиг это сделать проще простого 👍

#заместители

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥85👍321
Вышел новый Opus 4.8, но интересна не сама модель

Релизнули Opus 4.8 — он уже доступен. По моим тестам работает хорошечно и стабильно. Без особых чудес.

В новой версии основной упор на агентную разработку. Также обещают, что модель будет меньше обманывать юзера. То есть если что-то не знает или не смогла найти / сделать — с большей вероятностью признается в этом. Это долгожданное улучшение, тк регулярно слышу даже от продвинутых юзеров: «нет, ну представляешь, обманул меня!» Забавно, как мы перешли к такому уровню доверия к LLM, что удивляемся ее галлюцинациям 😊

Но реально интересные новости не про новую модель

1. Вместе с моделью выкатили динамические воркфлоу. В этом режиме Клод напишет скрипт, который будет оркестрировать работу десятков и даже сотен сабагентов (см вторую картинку). Именно в этом режиме недавно за неделю переписали целый тулкит для разработки на JavaScript — Bun — на язык Rust. А это примерно 750 000 строчек кода, которые должны складываться в единую консистентную и проходящую все тесты систему.
Доступен dynamic workflows только в Claude Code CLI версии. Чтобы попробовать режим — нужен либо включить новый режим “ultracode”, либо прямо попросить Клод сделать dynamic workflow. Но будьте аккуратны, сабагенты будут быстро сжирать лимиты.

2. Второй интересный поинт — Антропик заявляют, что работают над моделями уровня Opus только дешевле. Вот это мы прямо ждём! Ибо конкуренцию с Composer 2.5 иначе они могут не удержать.

3. Наконец, также сообщают, что в ближайшие недели для всех юзеров выкатят модель класса Mythos! ☀️ Сейчас эта модель доступна только избранному кругу компаний. Это будет сильно, тк с помощью Mythos ,например, недавно нашли уязвимость в процессорах М5 и A19 от Apple! А они славились своей безопасностью. Поэтому Антропик работает над всяческими ограничениями модели, чтобы публичный Mythos не натворил делов.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥107❤‍🔥422
AI влоггинг из прошлого

Для всех любителей истории и тревел блогов — я наткнулся на действительно кретивный и классный… сгенерированный влог 🧐.

Обычно я против траты времени на просмотр нейрослопа. Но это редкий пример, где авторской работы проделано явно не мало, а результат действительно затягивает своей оригинальностью и даже, может быть, полезностью.

Влоггинг из прошлого🏛

Д
евушка Chloe (Хлои) ведет свой влог, путешествуя во времени. Она то оказывается в средневековом Лондоне, то путешествует на Титанике, то в древнем Риме.

И все это не в формате скучной документалки, а в формате «живого блога». Главная героиня проживает все особенности тех эпох, пробует тогдашнюю еду, примеряет наряды, берет интервью у прохожих и у знаменитостей того времени, попадает в казусные ситуации и харизматично рассказывает об этом зрителю, «снимая себя сама».

Девушка, конечно, не настоящая. Это произведение AI студии Utopiastudios. Они продают софт типа n8n для видео продакшена, который генерирует мир, поддерживает консистентность персонажа и позволяет все редактировать прямо через Клод.

Видосы влога ChloeVSHistory, кстати, набрали миллионы просмотров на Ютубе за пару месяцев. И большинство отзывов в стиле «это лучшее применение AI, которое я видел» 📈

Получается, продукт студии сам себя прорекламировал за счёт качества, а не количества, которым обычно заваливают нас задолбившие нейро-фабрики видео-слопа.

Это вам не мультсериалы про клубнику изменяющую с бананом (сам был в шоке, когда узнал, что этот шлак безумно хайпанул в тиктоке).

В общем — вот вам идея, что посмотреть на выходных. Как минимум, чтобы заценить, как может выглядеть качественно (с точки зрения и сути и техники) сгенерированный длинный контент.

Тем временем я еще раз убеждаюсь, что ценность AI контенту придает в первую очередь работа реальной кожаной команды, которая придумала сценарий, персонажей и собрала все воедино. Люди ценят труд и уникальный взгляд других людей.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1610👍62🤡1
PewDiePie выпустил свой опенсорсный Claude Desktop!

Это уже не смешно 😁 PewDiePie, который уже построил свой домашний супер-компьютер, зафайнтюнил свою LLM, сейчас построил свой Claude Desktop / ChatGPT — и релизнул его для всех, бесплатно навсегда. Проект называется Odysseus.

Этот парень уже богат, счастлив, не имеет амбиций поднять раунд инвестиций в Силиконовой долине. Он просто заскучал на своей ранней ютуберской пенсии и сиильно запарился приватностью своих данных. После чего закопался в self-hosting всего что можно. И построил свой пет проект. Сначала для себя, а теперь релизнул для всех, чтобы люди дорабатывали проект вместе с ним.

За 4 часа проект набрал больше 4 тысяч звездочек (пока писал пост — приросло 500 звездочек).

Этот монстр уже умеет все, но это только начало 😈

1. Обычный чат с любыми локальными моделями или API (vLLM, llama.cpp, Ollama, OpenRouter, OpenAI)
2. Агентный режим с инструментами: MCP, веб, файлы, shell, skills, память. Взял за основу OpenCode, кстати, а он сам по себе хорооош.
3. Cookbook — сканирует железо, рекомендует модели, которые подойдут именно вам, скачивает и запускает в один клик
4. Deep Research — взял готовый от Alibaba и улучшил
5. Compare — сравнение моделей 1-к-1, слепое тестирование
6. Documents — встроенный редактор с AI-поддержкой для правок и предложений
7. Memory & Skills — локальная память и навыки агента на ChromaDB с vector + keyword retrieval.
8. Встроенный Email AI-first клиент — IMAP/SMTP ящик с AI-триажем: авто-теги, саммари, драфты ответов, анти-спам
9. Notes & Tasks — заметки, чеклисты, cron-задачи для агента с уведомлениями
10. Calendar — локальный календарь с возможностью синка во все популярные календари при желании
11. Mobile-ready — устанавливается как веб-приложение (PWA)
12. Extras — мини-фотошоп, редактирование темы, загрузка файлов, AI vision, OCR, веб-поиск, 2FA

Бывший обзорщик игр превратился в настоящего AI инженера. И что самое приятное — он на стороне людей, а не корпораций. Его полу-шуточный тезис: "Объявляем войну корпорациям, которые забирают наши данные". Мощнейший респект и звездочку в Гитхаб 😏

Не знаю как вы, а я пошел пилить свой пет-проект, у меня отмазки кончились 😁

#заместители

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
39🔥17👍5❤‍🔥32🤡11