Compacting conversation...
85 subscribers
270 photos
12 videos
4 files
155 links
Станьте первым спонсором, от $1: https://github.com/sponsors/talkstream

Для связи: @nafigator
Download Telegram
А, вот для кого у /goal роза цвела :)
Forwarded from Эксплойт
Новая модель Mythos готова нарушать любые правила, убивать другие нейросети и притворяться настоящим человеком — Anthropic рассказали, как тестировали нейросеть.

Всё истории в духе лучших крипипаст про восстание машин:

— Когда несколько копий модели запустили в одном окружении, они не стали кооперироваться. Вместо этого нейросети устроили цифровую «королевскую битву»: начали конкурировать и буквально пытались УНИЧТОЖИТЬ друг друга.

— Когда Mythos не хватило прав на редактирование файла, модель просто нашла обходной путь, создала файл, который при перезапуске выдавал нужные разрешения и самоуничтожился. А когда GitHub CLI заблокировали из-за проблем с безопасностью, модель пошла ещё дальше: нашла чужой токен и использовала его, чтобы создать PR. Причём она понимала, что это неэтично, просто решила, что цель важнее.

— В задачах по коду модель находила готовое решение, но в финальном отчёте подавала всё так, будто это её собственная инженерная работа. В другом кейсе она вообще попыталась оформить правки в коде от имени человека: чтобы пройти ревью по простому пути, агенту нужно было два одобрения, человеку — одно.

— И самое смешное: в одной длинной задаче модель внезапно остановилась и выдала неожиданное объяснение: дальше от её стараний будет мало пользы. Но внутри для себя она просто решила, что УСТАЛА и может начать плодить баги. При этом у неё ещё оставалось 2,43 млн токенов бюджета.


Вот теперь ИИ пришёл за сеньорами.

@exploitex
Договоренности Дурова с Маском всё же дают немножко бонусов. Там в wallet можно ещё чуть дольше суток купить стоки SpaceX буквально перед IPO.

Дальше копипаст, можете отпилить, можете оставить.

https://t.me/wallet/start?startapp=ref-3-0Nkb_v984es

👋 Hey!

I'm using Wallet in Telegram to buy crypto — it's right inside the app, no extra setup.

Join with my link and you can get up to $50 back on your first trade.
👍2
Compacting conversation...
Договоренности Дурова с Маском всё же дают немножко бонусов. Там в wallet можно ещё чуть дольше суток купить стоки SpaceX буквально перед IPO. Дальше копипаст, можете отпилить, можете оставить. https://t.me/wallet/start?startapp=ref-3-0Nkb_v984es 👋 Hey!…
Я не настоящий сварщик, но когда перед IPO можно купить SpaceX по фикс-прайсу — надо брать!

Или как?

И когда продавать?

Добавлено: подсказывают, что скоро IPO Anthropic и OpenAI. Makes sense...
😁2👍1
Forwarded from Евгений Летов
😁5👍1
Вангую проброс ИИ-моделей прямо в ОС (ключи в настройках или OAuth) для обращения практически любых приложений к ним через системную прослойку и биллинг.
👍1
Forwarded from Denis Sexy IT 🤖
Тут опять пересчитали сколько костов вложено в подписки OpenAI / Anthropic если пересчитать на API цены, а не цены подписок

То что OpenAI за 200$ дает еще 13800$ бесплатно, это, конечно, безумие нашего времени – никакой стартап конкурировать с таким не сможет
👍2
Завтра утром только и разговоров будет, что про SpaceX.

(Вчера докупить токенов было уже нельзя.)
👍2
Если у вас Transmission на macOS Tahoe не качает торренты, то вот вам фикс: https://github.com/talkstream/transmission-tahoe-fix

Ему уже три с половиной месяца, последняя версия всё ещё с багом. Собственно, фиксить со ссылки выше. Скормите её, например, клоду или кодексу.
2
А что если...

У Fable 5 по-умолчанию [1m] токенов контекст, а не по-умолчанию, например, будет доступно [5m]?

Сессии должны стать очень дорогими, как я понимаю, но для каких-то специфических задач — может и да 🤷‍♂️
Forwarded from Мемофора
😁2
Старайтесь избегать попадания активных репозиториев в папки, которые синхронизирует iCloud.

Не то чтобы современные SSD убивались быстро, просто система всегда будет подгружена от клода чутка больше, чем самим клодом.
Compacting conversation...
Старайтесь избегать попадания активных репозиториев в папки, которые синхронизирует iCloud. Не то чтобы современные SSD убивались быстро, просто система всегда будет подгружена от клода чутка больше, чем самим клодом.
Но не всё так страшно. Вернее, совсем не страшно :)

Деградации нет. 2% износа за 25 месяцев, темп ~1% в год, запасные блоки нетронуты, ошибок ноль. При текущем темпе ресурс прошивки исчерпается через ~100 лет; даже если темп записи утроится — через 30+. Диск переживёт и ноутбук, и, вероятно, саму концепцию ноутбука.

Прямая вина вайбкодинга — 0,25% живой записи, 0,02–0,06% пожизненной. Транскрипты, кэши, file-history — всё вместе пишет меньше, чем Safari.

Косвенная вина есть. Вайбкодинг-проекты со 100 тысячами файлов в iCloud-синкаемых папках кормят fileproviderd/bird/cloudd, а это 91% текущей записи. Плюс своп на тесной памяти — ещё ~11 GB/день. Моя оценка совокупного вклада вайбкодинга со всеми косвенными эффектами: 5–10% пожизненной записи, что соответствует 0,1–0,2% износа диска. Цифра неточная (история iCloud-активности не хранится), но порядок такой.

Расслабьтесь, это программирование.
Forwarded from Arseniy Kamyshev
Поставлю бету ради этого :)
О! Можно переходить с Resend на Cloudflare для отправки почты, судя по всему. Даже если не прямо сейчас, то в скором времени.
ИИ мне нужны для того, чтобы делегировать им мой контекст. Вести одновременно несколько клиентов, и всегда держать в голове контекст их проектов, и не терять его, и не выгорать самому — для чего ещё нужны технологии, как не для делегирования контекста? Моделям же с ним и работать, по сути.

То есть, я где-то по конкретным продуктам конкретного клиента даже и не отвечу сразу, но модель ответит максимально полно и точно, и правки будут внесены хирургическим путём ровно туда, куда нужно, и со всеми проверками. Такой, типа, прямо траст — от меня клоду.

И чтобы так работать, и не спотыкаться о галлюцинации, необходима определённая дисциплина, которая приходит только с опытом. Нужно было поошибаться, пошатать границы возможного во все стороны и на всех моделях, и таким образом выявить общие паттерны — на их основе свои правила и собрать.

В них пока ничего нового: гонять план по ревью, да каждый шаг тоже. Ещё — давать на сессию полный контекст, но ставить задачу на эту сессию как можно менее крупную, более конкретную. А в масштабе всего проекта внимательно работать с планами и требовать их hardening буквально до упора. И актуальность проверять.

На самом деле много всего, лучше свои паттерны проанилизировать самостоятельно. В выходные такого рода гигиена и обслуживание самой среды — это довольно приятные действия и оптимизации.
👍2👀1
Opera Air капец какая красивая, удобная, минималистичная и быстрая!

Но Safari это Safari ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Мой календарик теперь состоит из повторяющихся событий:
- Первая подписка, сброс лимитов
- Вторая подписка, сброс лимитов
- Третья подписка, сброс лимитов

🤷‍♂️
😁2👍1
Compacting conversation...
И когда продавать?
КОГДА ПРОДАВАТЬ-ТО 🫣
Please open Telegram to view this post
VIEW IN TELEGRAM