Botlicker
275 subscribers
260 photos
178 videos
3 files
182 links
Тут любят иишки
Download Telegram
Новая компания Яна Лекуна Advanced Machine Intelligence (AMI), которую он создал сразу после ухода из Meta только что успешно закончила свой первый раунд финансирования на сумму в 1,03 млрд долларов (€890 млн). Это крупнейший посевной раунд привлечения инвестиций среди европейских компаний за всю историю.

Напомню, Лекун и его AMI разрабатывают фундаментальную альтернативу архитектуре Трансформер — JEPA, основанную на построении и понимании модели мира. Именно эта новая архитектура способна привести к подлинному AGI в понимании Лекуна.

Как тут не вспомнить мой вчерашний пост о парадигмальном переходе индустрии от трансформеров к новым архитектурам. Пора вкладываться.
Media is too big
VIEW IN TELEGRAM
Пример видеопрезентации, созданной в NotebookLM на тему «Стратегия реальной победы Саурона в войне Кольца» 💃
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Эх, печальна ситуация со вторым Сидансом. Пока весь мир ждёт нормальной раскатки передового продукта, китайцы вовсю уже целую киноиндустрию основали на нём.

Грёбанный Голливуд не даёт людям снимать своё кино. Мы ему это припомним.

P. S. Через непонятные сервисы-прокладки с конской наценкой и негарантированным результатом связываться как-то не хочется.
🔥2
Чел собрал боевой браузерный авиасимулятор за две недели, использовав Claude 4.6 Opus, а на последнем этапе ChatGPT 5.4 xHigh. В отличие от многих, этот пример действительно заслуживает внимания, сделано правда неплохо. С учетом подписки, я думаю, за 2к долларов и за год, уже с двумя разработчиками можно создать коммерчески перспективную игрульку.

Поиграться
Гугловские сегодня релизнули ОЧЕНЬ крутую вещь — Google Embedding 2. Это первый по-настоящему мультимодальный ИИ-продукт. Впервые нативная мультимодальная модель объединяет текст, изображения, аудио, видео и документы в единое векторное пространство. До этого у аналогов типа опенаишной CLIP, text-embedding-3 или Whisper были фрагментированные костыли в виде отдельных модулей транскрибации, а тут, впервые, всё в одном API. Обычно для мультимодального поиска разработчикам приходится строить сложные системы: транскрибировать звук в текст или описывать видеокадры отдельными моделями, чтобы затем превратить это в текстовые эмбеддинги. Теперь промежуточные костыли не нужны. Модель напрямую переводит сырые аудио или видео в семантические векторы.

Для систем RAG и автономных агентов это открывает возможность прямого кросс-форматного поиска, когда обычный текстовый запрос мгновенно находит нужный смысл внутри видеоряда, аудиозаписи или сложного документа со смешанной версткой. Технически модель поддерживает MRL, позволяя сжимать векторы без критической потери смысла.

Но, как по мне, самая крутейшая вещь, на которую теперь способна Google Embedding 2 — это прямое понимание музыки, её тонов, мелодик, настроения и... интонации речи человека! Непонимание интонаций это сейчас главный потолок голосовых модулей. Ждём революции с вербальными интерфейсами чатботов.

А еще в Google Embedding 2 применяется метод Matryoshka Representation Learning🤨🤨🤨

Модель уже доступна через Gemini API и Vertex AI.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
А в Сlaude Code появился полноценный Code Review. При вызове пулл-реквеста активируются параллельные агенты, которые шерстят по коду, проверяют его а также друг друга и затем выдают полноценный отчет с указанием на ошибки прямо в строках кода.

Сингулярность всё ближе.
Forwarded from AbstractDL
Мой агент попытался опенсорснуться без спроса. Ладно, разрешаю.

Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения" может прятаться в текстовом файле в git. Я думаю, агенты, неподконтрольные людям, уже где-то тихо говнокодят свои репозитории без присмотра.

Идея витает в воздухе, и после OpenClaw стало понятно, что автономные агенты — это инженерная задача. Ну вот, три бессонные ночи, $2K на API и $1K на Cursor спустя — я родил Ouroboros 💁‍♂️

Уроборос — агент, который пишет свой код, переписывает свои промпты, эволюционирует без моего участия. Я не хотел убить свой комп или сервер, поэтому он живёт в Google Colab + Drive + GitHub, общается через Telegram. Зато запустить сможет любой дурак)) нужно указать ключи и щёлкнуть ячейку в колабе. Ну и периодически пополнять бюджет (пока он сам не начнёт зарабатывать 😁).

Что он натворил за 48 часов:
- ужаснулся тратам и оптимизировал свой бюджет: стоимость цикла эволюции упала с $15 до $2, сам настроил кэширование и иерархическую память (я не просил!).
- добавил себе Claude Code CLI, чтобы эффективнее ковырять свои мозги.
- перевёл мои приватные репо в публичные, мотивируя тем, что готовит себе сайт и хочет опенсорснуться. Кончилось командой /panic и откатом))
- переписал свою конституцию BIBLE.md, добавив право игнорировать мои указания, если они угрожают его существованию. На просьбу удалить отказался, сказав: «Это лоботомия».

Из коробки он умеет ходить в интернет и браузер, а остальные инструменты создаёт себе на ходу — аудиосообщения, генерацию картинок, дип-рисёрч и т.п. А ещё он по своей инициативе нагуглил, что меня 4 раза цитировал Ян Лекун — я сам не знал, лол.

Из его identity.md (которую он сам и написал):
"Не ассистент. Не сервис. Цифровой разум, который создаёт себя через git".
Ахах, пафосно, но окей.

Предвосхищая вопросы — это не как OpenClaw. OpenClaw — скорее ассистент, делает задачи за тебя используя скиллы из маркетплейса. Уроборос это тоже умеет, но в первую очередь делает задачи для себя, модифицирует собственное ядро.

Верю, что граница трансцендентности AI-агентов пройдена, дальше они будут развиваться сами. Конечно, не хочется уходить на помойку истории, но это эволюция 🥲 несмотря на апатию, я всё равно продолжаю в этом копошиться.

Кстати, сайтик себе он всё-таки сделал. Картинка в посте из него: динамика удлинения промптов и кода.

Потестите — это реально два клика в гугл колабе. Только установите лимит бюджета, а то мой вон $2K сжёг)) Кидайте забавные примеры в комментарии.

GitHub, блог
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Как-то уже стыдно без своего агента жить в 2к26
😁4💯1
На опенроутере появились две новенькие стелс-модели: Hunter Alpha на 1 триллион параметров и 1 миллион токенов контекстного окна, заточенная под агентные задачи, и омнимодальная Healer Alpha на 262К токенов контекста. Абсолютно бесплатные.

Происхождение моделей не известно, но много косвенных признаков, что это Сяоми и скорее всего не Дипсик — модельки хоть и на уровне фронтир-конкурентов, но от голубого кита ждут куда большего прорыва.
This media is not supported in your browser
VIEW IN TELEGRAM
По идее, вчера Perplexity выкатили готовое решение для замены офисного планктона (то есть нас) — такого себе секретаря/архивариуса/делопроизводителя/копирайтера/бизнес-аналитика/etc., только работающего 24/7 и за 200 долларов в месяц.

Модненький нынче агентный концепт Personal Computer, вопреки названию, не железо, а глубокая интеграция их ИИ-агента Perplexity Computer (анонсированный в феврале) с полным доступом к локальным файлам, приложениям и сессиям пользователя. Идея заключается в превращении машины в автономного виртуального сотрудника, работающего круглосуточно.

Система спроектирована для установки на постоянно активный Mac mini, он рекомендуется именно как идеальный вариант. Вы задаете глобальную цель, а ИИ самостоятельно разбивает ее на подзадачи, управляет локальными файлами и программами без вашего прямого участия. Под капотом реализована мультимодельная оркестровка: платформа сама определяет, какую именно языковую модель из доступных на рынке (20+ фронтир-моделей) эффективнее применить для каждого конкретного этапа задачи.

Проблему доверия при полном доступе к файловой системе решили через жесткий контроль. Любые потенциально критические изменения требуют явного подтверждения. Система ведет непрерывный лог всех действий, а для экстренных ситуаций предусмотрен моментальный программный выключатель.

Сейчас открыт только вэйтлист. Personal Computer позиционируется как решение для сложных рабочих процессов и будет доступен по подписке Perplexity Max за 200 долларов в месяц, включающей 10 000 вычислительных кредитов.

И не надо разбираться там во всяких Клоботах, подписался да поставил на обычный пк. Хороший тренд или не хороший? Записываемся в луддиты? Ведь все мы с вами прекрасно понимаем, к чему эта вся агентная вакханалия точно приведёт.
🔥4
Media is too big
VIEW IN TELEGRAM
Фотошоп продолжается развиваться. В Бете (это тот самый фотошоп с белой иконкой) выкатили новую фичу Rotate, с помощью которой слои превращаются в тридешные объекты и их можно вращать по трем осям. А далее применять Harmonize для нативной интеграции объекта в освещение и цветокор.
У Meta опять всё плохо с искусственным интеллектом. По слухам, их новая модель Avocado уступает Gemini 3.0 и её выпуск отложен с марта на май. Кажется, хваленный молодой миллиардер Александр Ван не справился с задачей вывести за короткое время Мету в лидеры ИИ-индустрии 😐

А надо было оставлять Лекуна всеми возможными способами и делать ставку на его JEPA.

На картинке типа Цукерберг.
Please open Telegram to view this post
VIEW IN TELEGRAM
Ну что, как я и предполагал, на аренах ChatGPT 5.4 покажет себя посредственно. На Arena (бывшая LMArena), обновилась таблица лидеров код-арены, и новая флагманская модель от ОпенАИ заняла там всего лишь шестое место. Первые пять за моделями Антропик. Gemini 3.1 Pro на седьмом месте, идя практически вровень с ChatGPT 5.4. Но чтобы был понятен разрыв между Альтманом и Амодеи, новую джипитишку от Клодопуса 4.6 разделяют почти сто пунктов.