ИИволюция 👾
11.6K subscribers
966 photos
370 videos
1 file
823 links
Авторский канал Сергея Пахандрина про AI, нейросети, AI-разработку, ChatGPT (и другие LLM). Строю AI-first компанию. Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
РКН: https://clck.ru/3QJLiL

В ВП и папках не участвую
Download Telegram
Всё, Fable 5 больше нет в доступе

Правительство США приказало отключить Fable и Mythos. Угроза нац безопасности. Посмотрели, потестили? Всё! А то видимо нашлись “мамкины хакеры”, которые попробовали пентагоны взламывать с помощью Fable.

Самое интересное, что доступна модель будет скорее всего только гражданам США, позже докрутят идентификацию. Но еще более интересно то, что явно не все сотрудники Антропик имеют гражданство США, и часть сотрудников не будут иметь доступ к передовым моделям.

Вот оно и началось, разделение.

https://www.anthropic.com/news/fable-mythos-access
😭21🤣9🔥6🤔4
Сразу после новости о шатдауне Fable 5, Антропики сбросили всем лимиты.

Ну хоть что-то позитивное
16🤣4
Лучший мем на злобу дня
🤣22🔥10👍4
Нужно просто ввести чит-код и у вас god mode on и безлимит по токенам
🤣32🔥92🤔2
Что происходило за 24 часа до того, как Белый дом ввёл экспортные ограничения против Anthropic и моделей Fable 5 и Mythos:

– В прошлый четверг CEO Amazon Энди Джесси выразил администрации Трампа обеспокоенность из-за джейлбрейка Fable.

Речь не про публично опубликованный jailbreak-промпт, а про внутренний отчёт Amazon по Fable 5, где исследователи якобы через серию промптов смогли обойти часть защитных ограничений и получить доступ к части возможностей Mythos, которые обычным пользователям Fable должны быть недоступны.

По версии Anthropic, это был не “универсальный джейлбрейк”, который ломает все защитные барьеры модели, а узкий non-universal jailbreak. Они описали его почти прозаично: по сути, модель просили прочитать конкретную кодовую базу и исправить найденные уязвимости в ПО. Anthropic утверждает, что найденные уязвимости были уже известные, несложные, минорные и другие публичные модели тоже могут находить подобное без специального обхода.

– В пятницу утром Шон Кэрнкросс (главный советник президента по национальной киберполитике и стратегии), Бессент (министр финансов США), Сьюзи Уайлс (глава аппарата Белого дома) и другие провели звонок в Белом доме, чтобы обсудить ситуацию.

– После этого Белый дом начал связываться с Anthropic, чтобы поговорить с Дарио Амодеи. В тот момент он находился на велнес-ретрите.

– Когда Амодеи наконец вышел на связь после 13:00, у него состоялись три напряжённых телефонных разговора с разными участниками. Среди них были Кэрнкросс, Бессент, Лютник, Кесслер, Уилл Шарф, Ричард Уолтерс и Уокер Барретт.

– Амодеи попытался объяснить ситуацию, считая, что речь идёт о недопонимании. Он защищал встроенные защитные механизмы и отдельно объяснял разницу между универсальным и неуниверсальным джейлбрейком.

– Кэрнкросса и Бессента это не убедило. Они попросили Амодеи снять Fable и начать работать с администрацией над устранением уязвимостей. Один из представителей Белого дома заявил, что материалы Amazon дополнительно проверили в АНБ, и после этого администрация сочла, что проблема подтверждена.

– Амодеи попросил больше времени и дополнительную информацию, но не дал никаких обещаний снять модель.

– В какой-то момент Бессент прямо сказал Амодеи, что тот принимает “плохое решение”.

– К вечеру пятницы администрация Трампа ввела экспортные ограничения. “Экспортные ограничения стали крайней мерой после того, как мы несколько часов умоляли их работать с нами”, сказал высокопоставленный представитель Белого дома.
10👾9🤣6😭3👍1
Anthropic сейчас должна сделать ровно то, что когда-то сделал Стив Джобс с Power Mac G4.

В 1999 году Apple представила Power Mac G4. По нынешним меркам смешно, но тогда компьютер с процессором PowerPC G4 на 400, 450 и 500 МГц выдавал до 1 гигафлоп. И этого хватило, чтобы правительство США классифицировало его как суперкомпьютер и ограничило экспорт более чем в 50 стран.

Apple не стала это прятать и они превратила запрет в рекламу: наш Mac настолько быстрый, что государство считает его суперкомпьютером.

У Anthropic сейчас похожий момент. Они уже нехило распиарили мощь Fable и Mythos тем, что вокруг них началась вся эта история с Белым домом, Amazon, jailbreak и экспортными ограничениями.

Теперь нужно всю эту ситуацию повернуть себе на пользу. Не оправдываться сухими пресс-релизами, а аккуратно повернуть ситуацию себе на пользу, чтобы создать вокруг себя нужную “ауру”:

“Модель настолько мощная, что государство начало относиться к ней как к стратегической технологии”.

И если сейчас Anthropic сыграет тонко (а мб и был на это расчет?), они могут выйти из этой ситуации победителями, особенно когда ситуации с запретом уляжется или даже решится.

Та самая реклама Apple https://www.youtube.com/watch?v=OoxvLq0dFvw
🔥24👍96
This media is not supported in your browser
VIEW IN TELEGRAM
AI за последние годы довольно быстро стал частью работы компаний в России.

Где-то через него разбирают документы, готовят отчеты, собирают аналитику и ускоряют рутину. Где-то встраивают AI прямо в продукты, поддержку, продажи и внутренние процессы. А где-то уже создают собственные модели, ассистентов и AI-инструменты под свои задачи.

Но внедрять AI оказалось быстрее, чем разобраться, как его безопасно использовать.

«К2 Кибербезопасность» и «Лаборатория Касперского» провели исследование про то, как российский бизнес работает с AI, кто за это отвечает и насколько компании готовы управлять рисками.

Несколько цифр из исследования:
– 75% компаний используют отечественные AI-сервисы
– 38% создают собственные AI-решения
– 29% контролируют использование внешних моделей
– 22% выделили отдельный бюджет на безопасность AI
– 18% считают, что у них уже есть управляемые процессы в этой сфере

Как видно, AI уже активно используется, но контроль, правила и безопасность пока отстают. А это важная история, потому что в AI начинают попадать документы, код, данные, внутренняя аналитика и рабочие процессы.

В исследовании разбирают, какие подходы уже используют компании, где чаще всего возникают риски и как оценить зрелость своих процессов.

Полную версию можно посмотреть тут
7👍5🔥2🤣1
Forwarded from Data Secrets
SpaceX официально купили Cursor за 60 миллиардов долларов

Все произошло быстрее, чем ожидалось. Как вы знаете, в апреле SpaceX приобрела опцион, который давал ей право либо купить Cursor за 60 млрд долларов, либо выплатить 10 млрд долларов за совместную работу, если сделка не состоится.

С того момента Cursor уже выпустили мощное обновление, собственную неплохую модель и SDK.

Видимо, ожидания от них оправдались в полном объеме, потому что сегодня выяснилось, что компании уже подписали окончательное соглашение о поглощении. Cursor становится дочерней структурой SpaceX.

Это крупнейшее на данный момент приобретение SpaceX, кстати. Получается, у Маска на руках наконец-то появился конкурент Claude Code и Codex.
🔥25👍85
Страница status у Claude теперь как будто всегда ошибку показывает. Они зачем-то показывают в виде ошибки новость о том, что Fable и Mythos отключены. Уже и так все знают.

Я сюда захожу не за этим и всегда просто бегло считываю содержимое, понимая есть проблема или нет. А теперь приходится вчитываться. Фигня! А когда будет проблема, в 2 этажа будет сообщение? “Мы отключили Fable, а еще у нас проблема есть.”
👍7🤣31👨‍💻1
Вместо Fable – Sonnet 5

Anthropic готовит к релизу новую модель Sonnet 5. Модель уже была замечена в различных сервисах.

А еще, все больше слухов о грядущей GPT-5.6. Неделя ожидается жаркой!
🔥298👍4
Forwarded from Ваня Замесин (Ivan Zamesin)
Выкладываю ключевые тезисы методологии Next Move Theory и AI-скиллы на их основе в открытый доступ

Next Move Theory — это методология, которая даёт пошаговые алгоритмы для любых продуктовых задач. Она позволяет вам увидеть все тактические и стратегические ходы, которые вам доступны, и помогает выбрать наилучшую стратегию в вашей ситуации, что значительно растит вашу вероятность успеха.

Next Move Theory — интегральная методология. Она объединила Advanced Jobs To Be Done, Юнит-Экономику, Riskiest Assumption Test, ABCDX-сегментацию, Теорию Ограничений и многие другие, чтобы дать возможность видеть все возможные стратегии.

Да, Next Move Theory — это новое название методологии AURA. AURA было не очень удачным названием, хоть оно и приснилось мне 🙂

Сегодня я выкладываю примерно 25% тезисов этой методологии в открытый доступ [не переживайте, это 700+ страниц А4 тезисов], а так же AI-скиллы, которые опираются на эти тезисы.

Скиллы для Claude Code / Codex, которые вам будут доступны:
• ask-nmt — ваш продуктово-прошаренный бро. По-сути, цифровой Ваня Замесин
• diagnose — скилл для поиска проблем и точек роста в существующем продукте
• market-research — скилл для генерации сегментов, рискованных предположений, плана валидации, а так же рекомендаций по пивоту вашего чудесного продукта
• craft-value-proposition — скилл для генерации гипотез ценности
• product-reqirements — скилл для написания детальных продуктовых требований, по которым нейронки пойдут и сделают с первого раза нормально
• craft-go-to-market — скилл для генерации текстов ленда и креативов

Я написал канон и скиллы на английском для того, чтобы подарить Next Move Theory и Advanced Jobs To Be Done миру. Я очень прошу вас рассказать своим друзьям в США и Западной Европе. Sharing Kit лежит тут.

Канон распространяется по лицензии CC BY-NC-SA 4.0, который запрещает коммерческое использование и разрешает цитирование с указанием авторства и источника.

🔗 nextmovetheory.com
🔗 репозиторий в GitHub
16🤣13👍4🔥3🤔2
Перевел один продукт с Amplitude аналитики на Mixpanel

Я очень давно в каждом запускаемом мобильном приложения встраиваю Amplitude аналитику. Очень привычная для меня среда по работе с продуктовой аналитикой. Но мы с нее ушли в одном из приложений. Переехали вынуждено, продукт значительно вырос, а тарифы у Amplitude кусаются, для мелких же приложений она условно бесплатная.

Первые пару недель было больно перестраивать свои привычки, Mixpanel сервис для меня новый, привычные шаблоны сломаны. В общем, было какое-то отторжение. И на горизонте возникла аналитическая задача, к которой было не понятно на какой “кобыле” подъезжать. Нужна была кастомная глубокая сегментация новых пользователей с целью найти такие шаблоны поведения внутри продукта, которые дают максимальную конверсию в оплату, в оформление триала и конверсию из триала в регулярную подписку. Пользователь приходит в приложение, далее проходит условно 20 экранов онбординга, на которых он отвечает на разные вопросы, далее в течение дня делает определенные действия в приложении. Вопрос: комбинация каких вопросов и событий/действий приводит к самой высокой конверсии в покупку при условии, что когорта таких пользователей не супер мелкая. Нужно было перебрать разные комбинации, понять какие события по одиночке, или вместе, или количество определенного ключевого события за день (условный пример, прослушал 3 трека или 5 или 10 за день/в течение 3 часов и т.п. сегментации), или с комбинацией других действий дают максимальную конверсию в оплату.

Обсудил задачу с CC и он мне рассказал, что в Mixpanel есть JQL (Javascript Query Language), который позволяет строить любой сложности запросы на супер кастомные сегменты, примерно, как я описал выше. И тут Mixpanel для меня открылся с другой стороны.

– А ты умеешь писать такие запросы в JQL?
– Да, дай мне только API ключ к Mixpanel
– Вот ключ, запускай анализ

… спустя 1 час получаю кучу инсайтов, срезов, выводов по очень узким сегментам с понимаем кто конвертится лучше, кто вообще показывает самые низкие конверсии (опять же вопрос почему?), какое влияние на конверсию в оплату оказывают разные комбинации ключевых событий в приложении совместно с теми ответами, которые на онбординге давал пользователь.

В Амплитуде тоже есть и AI ассистент (не осилит такое), и API запросы (дико маленькие лимиты) к данным и выгрузка сырых данных (долго в них копаться агенту локально), но JQL в Mixpanel для агентной работы значительно круче и быстрее. И теперь любые запросы, срезы, вопросы по аналитике я делаю только через CC и даже не захожу в самую Mixpanel.

Теперь я обожаю Mixpanel и буду готов за это платить. И до сих по не понимаю b2b сервисы, которые не предоставляют доступ к моим же данным для AI агентов, а навязывают использовать свои урезанные инструменты на веб морде.
8👍4🔥3
Новая схема мошенничества и угона телеграм аккаунтов

Сегодня в комьюнити AI каналов угнали канал “Метаверсище и ИИще” Сергея Цыпцына. Угнали основной тг аккаунт, канал и вроде даже подчистили ТГ кошелек.

Схема простая, но подход в ней новый. Вам пишет “человек”, что является вашим подписчиком и давно читает ваш канал (вероятно хук будет разный для разных людей), и говорит, что его удивило, что вы как опытный пользователь, до сих пор не шифруете свои персональные данные в сети и показывает 2 скриншота, а на них вся инфа о вас, связанных с вами адресах, ваши дети, жена, все документы членов семьи, емейлы, все ваши документы и прочее.

Вас эта информацию повергает в шок, вам предлагают перейти в бота по ссылке и сделать зачистку этой информации. Вы переходите, вас поджитает фишинговая страница, что-то там подтверждаете, и тут вы сразу попали, моментально. Ваш ТГ уводят и всё, что с ним связанное. Вы даже опомниться не успеете!

Да, информация о каждом из нас во всех база, эти данные продаются и удивлять это уже не должно. Поэтому будьте бдительны и не переходите по ссылкам, проверяйте содержимое ссылок и куда она ведет.

Сергею желаем скорейшего возвращения аккаунта и канала.
😭407🤔7🤣3
Выбираем железо для обучения и инференса моделей 🔝

Простая формула: чем больше у модели параметров, тем более мощное железо нужно для ее инференса. Найти решение для нейросетей разного масштаба можно в Selectel.

Более 15 моделей видеокарт — от RTX 4090 до B300 — доступны к аренде в облаке и на выделенных серверах. Облачные серверы подойдут для тех, кому нужна гибкость и быстрая масштабируемость, а выделенные — когда необходима физическая изоляция инфраструктуры, а нагрузки стабильные. Видеокарты в облаке можно арендовать даже на час, цена стартует от 5 рублей.

Выбирайте оптимальный сервер с GPU и арендуйте его от 5 рублей в час: https://slc.tl/g53hg

Реклама. АО "Селектел". erid:2W5zFK4faED
🔥3👍1
Ну что, ждем gpt-5.6 уже завтра?

Твиттер резко взорвался слухами, сливами, зацепками в коде веб приложений OpenAI.

А кроме этого и новая голосовая модель. Те, кто уже её попробовали, говорят полный улёт, даже когда модель думает, она продолжает что-то говорить, бормотать. Давно голосовую модель OpenAI не обновляли, тут говорят прорыв будет.

Держим кулачки!
🔥409
Fable 5 снова замелькал на горизонте

У некоторых пользователей Fable 5 снова доступен в выборе моделей в Claude Code, а в обновлении Claude Code v2.1.190 заметили изменение строк, связаных с Fable 5.

Так же Fable 5 снова замечена на Amazon Bedrock в списке моделей.

Ждем возвращения легенды?
🔥203👍1👾1
Forwarded from Data Secrets
Media is too big
VIEW IN TELEGRAM
Фиона Фанг, Head of Engineering в Claude Code, сказала, что использование агентов делает инженеров более одинокими

Люди перестают обмениваться опытом и в итоге все больше и больше зацикливаются на работе со своими агентами. Кодинг становится «изолированным».

Фанг говорит, что это серьезная проблема, и Anthropic уже стараются с ней бороться. Оказывается, что помимо всяких хакатонов и кодинг-завтраков в компании проводят так называемые «maker time» встречи: инженеры собираются, вместе программируют и делятся практиками использования агентов.

Вы там как, справляетесь с одиночеством? 😭
Please open Telegram to view this post
VIEW IN TELEGRAM
😭106🤣4🤔1👾1
Год назад у нас случилась неприятная история. Мы вели рабочий проект в одном инструменте: задачи, доски, идеи, заметки, планы. Не то чтобы там была вся жизнь компании, но важная часть проекта там точно была.

А потом в один момент доступ к проекту просто пропал. Без нормальной возможности спокойно все забрать. Часть данных мы тогда потеряли безвозвратно, и с тех пор я стал намного внимательнее выбирать, где команда хранит задачи и рабочие заметки.
Сейчас для одной небольшой команды мы выбрали Трекер от Яндекс 360, как нормальное место, где можно вести проект и не держать все в голове.

Что удобно: можно разложить задачи по проектам и статусам, внутри задачи оставить контекст, ссылки, мысли, сроки и ответственного, а через дашборды быстро смотреть, что сейчас в работе, что зависло и к чему нужно вернуться.

Для небольшой команды это особенно важно. Все и так делают много разного, задачи легко теряются в переписках, а потом начинается классическое: кто это должен был сделать, где были вводные, на чем мы вообще остановились.

Еще нравится, что в Трекере можно начать просто. Завести доску под конкретный проект, добавить задачи, статусы, сроки, ответственных, а дальше уже настроить под себя. Без ощущения, что ты сначала должен неделю внедрять сложную систему, а только потом начать работать.

Я не буду делать вид, что любой трекер сам по себе решает все проблемы. Если в процессе бардак, он не исчезнет за один вечер. Но нормальный инструмент хотя бы помогает не держать все только в голове и не искать потом задачи по чатам и заметкам.

После той истории с потерянным проектом я для себя понял простую вещь: рабочие задачи, идеи и заметки команды лучше хранить там, куда можно спокойно возвращаться завтра, через месяц и через год.

Сейчас тариф Яндекс 360 с Трекером можно забрать со скидкой, посмотреть условия можно здесь.
🤣69🤔4👍3🍓1