Лось в проде
355 subscribers
333 photos
53 videos
23 files
232 links
Разрабатываю всё что разрабатывается :D
http://t.me/WizardJIOCb
Download Telegram
Forwarded from Эксплойт
OpenAI платят домохозяйкам в Индии за мытьё посуды и чистку картошки — за час домашней работы можно получить аж 250 рупий (~190 рублей).

Но есть важное условие: хозяйством нужно заниматься, записывая весь процесс на камеру. Индия стала главным хабом для обучения роботов — сотни тысяч работяг выполняют свои обычные дела под запись, фактически тренируя роботов, которые в будущем оставят их без работы.

ИИкономика будущего.

@exploitex
Т.е. такая вот будет драка да? :D
Все платёжные шлюзы банков перейдут на конкретный серт, и нужно будет клиентам устанавливать у себя на устройстве отдельный серт чтобы эти платежи проходили через платёжные шлюзы банков, а твой сайт здесь немного в стороне, даже посередине между клиентом и банком, но серт нужен клиенту и банку, а не твоему сайту который посередине.
Норм )
Наткнулся на аббревиатуру RSI

RSI в AI-контексте — это Recursive Self-Improvement, рекурсивное самоулучшение.

Когда ИИ начинает улучшать сам процесс создания следующего ИИ.

Главная разница:

AGI — это уровень способностей:

ИИ может решать широкий класс задач на уровне человека или выше.


OpenAI описывает AGI как систему, способную решать задачи человеческого уровня / быть в целом умнее людей.

RSI — это механизм ускорения:

ИИ помогает проектировать, писать, тестировать, обучать и улучшать следующие версии ИИ.


То есть AGI — это «у нас появился очень умный работник».
RSI — это «этот работник начал улучшать фабрику, которая производит ещё более умных работников».
Даже интересно как у GPT пройдёт релиз модели очередной с учётом новых мер контроля, тогда будет с кем сравнивать, много интересного возможно узнаем :)
Forwarded from Сиолошная
Мониторим ситуацию: что стало известно про запрет на экспорт Fable / Mythos от Anthropic. Ссылки: 1, 2, 3, 4, 5, 6.

— перед релизом Fable Anthropic работали с USG (US government, правительство) над мерами безопасности. Обе стороны описывают сотрудничество как «продуктивное». Вполне вероятно, хотя прямого подтверждения ни с одной из сторон нет, что та самая мера по бесшумному ухудшению модели в определённых ситуациях (в купе со всеми другими методами защиты) — это результат совместной работы, который позволил выпустить Fable.

— Anthropic не получили прямого запрета на запуск модели и, собственно, сделали её доступной всем во вторник, 9-го июня (и немногим погодя откатили часть методов защиты, хоть концептуально ничего не поменялось: в случае определённых запросов полный Mythos не будет отвечать, вместо него или пустой ответ, или от Opus 4.8). В одном из источников написано, что они наоборот даже получили одобрение на запуск модели.

— после релиза исследователи из Amazon использовали серию промптов, чтобы заставить модель выдать информацию, которая могла бы помочь в организации кибератак и должна была быть заблокирована. Об этом CEO Amazon Andy Jassy сообщил чиновникам в четверг, мол, так и так, мы обеспокоены, есть вот такой джейлбрейк для Fable. Деталей джейлбрейка пока не было опубликовано, хотя существует некоторый отчёт, который был доступ ограниченному кругу лиц.

— со слов USG, с их стороны уязвимость якобы подтвердили в АНБ и сочли, что у них есть доказательство уязвимости Anthropic.

— в пятницу в полдень представители администрации хотели связаться с CEO Anthropic, однако тот был... на «оздоровительном отдыхе». Представители Anthropic опровергают эту информацию, но соглашаются, что Dario Amodei вышел на связь с USG только через ~75 минут. Я не думаю, что Dario в ту же неделю, что выпустил клёвую модель, сидел отдыхал — вероятно, он с юристами и своей командой думал, что делать и что говорить.

— далее было 3 звонка с более чем 7 представителями USG, которые объясняли, что их «доверенный партнёр» (Amazon) и АНБ нашли джейлбрейк, и просили отключить доступ к Fable + улучшить меры безопасности. Dario пытался объяснить, что это минорная проблема, сам джейлбрейк не очень общий (то есть не позволяет выпытать любую информацию из Mythos), и отказывался отключать модель.

— в ходе звонков Dario просил дать ему больше времени и конкретики, что именно не так, чтобы проработать вопрос, но не пообещал отключить модель.

— по результатам переговоров USG дали Anthropic 90 минут на добровольное отключение модели. Anthropic не стали ничего делать — с их слов, они не считали проблему большой, плюс они не видели каких-то формальных доказательств серьёзности проблемы, «правительство предоставило нам лишь устные доказательства потенциального узкого, не общего джейлбрейка». И также упомянули, что тот же подход работает и с GPT-5.5 (я так понимаю, что работает не только обход систем защиты, но и то, что модель выдаёт конкретную часть информации в ответ на запрос).

— вечером пятницы Anthropic получили письмо счастья на экспортный контроль и отключили модель.

И немного про будущее:
— согласно письму Министерства торговли, для предоставления доустпа к модели внутри страны потребуется лицензия. Кроме того, Anthropic придется подавать дополнительную заявку на получение индивидуально утверждаемых лицензий 👨‍🦳 (но я не понял контекст этого заявления — это в случае, если ограничения останутся? или вообще?)
— представители Белого дома заявляют, что скорее всего не станут распространять экспортные ограничения на другие ИИ-компании
— Администрация президента «откровенно сбита с толку» тем, что Anthropic не захотела выполнять требования по безопасности, которые сама же ранее называла своим главным приоритетом.
Please open Telegram to view this post
VIEW IN TELEGRAM
- Konami отключила доступ к своим играм для пользователей из России и Беларуси.

Как будто в последнее время к ним и так через зелёные магазины заходили, сейчас только через него видимо пойдут.
Куда пойдём?)
😁1
Представляю как они салатик кушают втроём, под столом Трамп с Маском записывают )
😁1
Forwarded from Alexander Shmorgunov
Убило
😁1
Так это всем предстоит моделям\поставщикам выкатывать теперь перед релизом ?)

https://www.anthropic.com/constitution

Главные приоритеты Claude там такие:
- Broadly safe — не подрывать человеческий контроль и надзор над ИИ.
- Broadly ethical — быть честным, избегать опасного и вредного поведения.
- Compliant with Anthropic’s guidelines — следовать более конкретным правилам Anthropic, например по медицине, кибербезопасности, jailbreak’ам, инструментам.
- Genuinely helpful — реально помогать пользователям и операторам, а не просто “отказываться на всякий случай”.
Если эти цели конфликтуют, Claude должен обычно ставить их именно в таком порядке.
О чё то первый раз - Навык GitHub-публикации юзает, обычно просто ссылку кидаешь он пушит, и если креды к серверу есть и даёшь ещё и деплоит
Forwarded from Alexander Shmorgunov
This media is not supported in your browser
VIEW IN TELEGRAM
Орнул. Клодеры, признавайтесь, у вас так?
😁1