Наткнулся на список и решил для расширения кругозора сбегать в клод за описанием каждого.
Делюсь с вами. Что влезло то влезло, остальное в комментариях к посту.
Лет'с стартыч!
ChatGPT — лучший для задач «сделай сейчас»: написать письмо, разобрать код, придумать идею. Самый широкий охват плагинов и интеграций, огромное сообщество с готовыми промптами под любую задачу.
Gemini — выигрывает там, где нужна связка с Google: ищет в интернете в реальном времени, читает ваш Google Drive и отвечает в контексте ваших же документов. Лучший выбор, если вся работа крутится вокруг экосистемы Google
DeepSeek — бьёт всех по соотношению цена/качество: модель уровня GPT-4, но open-source и почти бесплатная через API. Идеальна для разработчиков и бизнесов, которым нужна мощь без дорогого счёта.
Grok — единственный ассистент, который знает что происходит прямо сейчас: обучен на потоке X/Twitter и отвечает на вопросы о свежих новостях без задержки. Лучший для мониторинга трендов и инфополя.
Claude — лучший для работы с большими объёмами текста: читает целые книги и кодовые базы за раз, пишет связно и без «воды». Особенно силён в нюансированном анализе и задачах, где важна точность формулировок.
Doubao — лидер китайского рынка с суперапп-логикой: голос, изображения, поиск и чат в одном месте. Для русскоязычной аудитории малополезен, но как индикатор того, куда движется рынок — показательный пример.
Quark — умный браузер + ИИ-поисковик в одном: суммирует страницы, отвечает на вопросы прямо в браузере, ищет академические источники. Огромен в Китае именно потому, что заменяет Google + ChatGPT одним приложением.
Kimi — лучший для анализа документов среди китайских моделей: контекстное окно на сотни тысяч токенов позволяет скормить ему целый отчёт или книгу. Сильная альтернатива Claude для тех, кто работает с китайским языком.
Meta AI — побеждает охватом: встроен туда, где люди уже проводят время — WhatsApp, Instagram, Facebook. Не самый мощный, но самый доступный — буквально для миллиардов людей без дополнительных приложений.
GigaChat — лучший русскоязычный ИИ от крупной корпорации: хорошо понимает русский контекст, интегрирован в Сбер-экосистему. Для бизнесов в РФ — наиболее безопасный с точки зрения хранения данных вариант.такой
Manus — лучший для автономных задач «поставь и забудь»: сам открывает браузер, читает сайты, пишет код и собирает отчёт без вашего участия. Пока сырой, но ближе всего к идее «цифрового сотрудника».
Perplexity — выигрывает у Google там, где нужен ответ, а не список ссылок. Каждый ответ сопровождается источниками, которые можно проверить — это делает его надёжнее голого ChatGPT для исследований.
Google Labs / NotebookLM — NotebookLM лучший в мире инструмент для работы с личной базой знаний: загружаете PDF, видео, статьи — и получаете ИИ, который знает только ваши материалы. Особенно ценен для студентов, аналитиков и журналистов.
Arena (lmarena.ai) — лучший способ объективно сравнить модели: слепое тестирование без знания того, кто отвечает, убирает предвзятость. Отличный ресурс для выбора модели под конкретную задачу.
Poe — лучший агрегатор для тех, кто не хочет платить за 5 подписок: один интерфейс даёт доступ к GPT-4, Claude, Gemini и десяткам других моделей. Удобно переключаться и сравнивать ответы на лету.
Genspark — сильнее обычного поиска для глубокого ресёрча: вместо ссылок генерирует структурированную «страницу знаний» по теме с агрегацией из множества источников. Хорош для первичного погружения в новую тему.
📝 Текст и презентации
Grammarly — лучший инструмент для полировки делового текста на английском: не просто правит ошибки, но улучшает тон, стиль и убедительность. Работает везде — в браузере, Word, Gmail — незаметно и в фоне.
Остальные в комментариях под постом чтобы не захламлять канал :)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥2
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
В Photoshop Beta завезли новую AI-фичу – 2D-слои можно крутить в 3D-пространстве 🔄
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍3👎2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁12
Айтигребец
+1 пет-проект завершён. Рассказываю, хоть вы и не просили
Барахолки в Грузии не полетели 😐
Просчитался с экономикой и... ленью 😁
Напомню базовую идею:
- собираю в телеграм канале посты со всех барахолок города (Тбилиси/Батуми)
- умно фильтрую от спама и "повторений"
- даю пользователю бота, который по ключевым словам "по-умному" ищет релевантные объявления/уведомляет о новых
С технической точки зрения сделал всё филигранно, обошёл все узкие места телеги, всё масштабируемо, UX бота вылизал, алертинги/логи/метрики - всё прикрутил. Пару раз дал рекламу.
Вопрос монетизации оставил "на потом", когда людей наберется условно. Монетизация если честно вообще вторична была. Пет-проекты они ж такие, да.
Главная проблема с которой я столкнулся - "повёлся" на кол-во людей в основных чатах-барахолках. Крупные насчитывают по 50+ тысяч. А посмотреть как-то "реальное" кол-во сложно (возможно есть какие-то сервисы с аналитикой, но я как-то не дошёл), а кол-во "объявлений" нон-стоп текло, активность высокая в чатах.
Я уже потом догадался как именно это проверить, когда уже почти всё доделал - создал новый канал, туда закинул фейк объявление и форвардом закинул в чат барахолки - и у меня на посте показалось реальное кол-во людей, которые просмотрели объявление. И там цифра была в районе пары тысяч за пару дней. На порядок промахнулся.
По итогу, после пары рекламных постов в профильных пабликах "натекло" в "группы-агрегаторы" по 300 человек плюс-минус. Неплохо, на самом деле, фидбек был положительный. Но...
У меня опустились слегка руки и я утратил интерес к проекту, подвыгорел. Ботом люди пользовались, всё хорошо работало. У меня были планы на старте расширять чуть позже на другие страны/регионы. Но подкатились конкуренты и сделали всё то же самое для веба (как по мне это ошибка, но не суть. Да и концептуально чуть другое у них, но в целом - такой же скраппинг, только менее качественный).
И я решил в целом зарубить проект.
Спустя полгода я уже смотрю на это немного по-другому.
Во-первых, хороший опыт про анализ "рынка" - хорошо бы такие вещи заранее инвестигейтать поглубже. Но я тут себя обманываю слегка - я делал этот проект "для себя", т.к. мне самому нравится идея такого инструмента.
Во-вторых, классный опыт доведённого проекта до конца включая какой-то маркетинг.
В-третьих, из этого проекта ко мне пришла идея слегка другой концепции, чуть более направленный на бизнес - энтузиазма чуть поменьше, т.к. это чуть ближе к реальному SAAS скорее, но тем не менее.
А главное, что я не исключаю возможности "поднять" его заново и заскейлить на другие страны, хотя учитывая тенденции блокировок, а у тг основная аудитория из СНГ - тоже вопросы.
Так и живём :) Но опыт хороший, ни о чём не жалею🧃
Просчитался с экономикой и... ленью 😁
Напомню базовую идею:
- собираю в телеграм канале посты со всех барахолок города (Тбилиси/Батуми)
- умно фильтрую от спама и "повторений"
- даю пользователю бота, который по ключевым словам "по-умному" ищет релевантные объявления/уведомляет о новых
С технической точки зрения сделал всё филигранно, обошёл все узкие места телеги, всё масштабируемо, UX бота вылизал, алертинги/логи/метрики - всё прикрутил. Пару раз дал рекламу.
Вопрос монетизации оставил "на потом", когда людей наберется условно. Монетизация если честно вообще вторична была. Пет-проекты они ж такие, да.
Главная проблема с которой я столкнулся - "повёлся" на кол-во людей в основных чатах-барахолках. Крупные насчитывают по 50+ тысяч. А посмотреть как-то "реальное" кол-во сложно (возможно есть какие-то сервисы с аналитикой, но я как-то не дошёл), а кол-во "объявлений" нон-стоп текло, активность высокая в чатах.
Я уже потом догадался как именно это проверить, когда уже почти всё доделал - создал новый канал, туда закинул фейк объявление и форвардом закинул в чат барахолки - и у меня на посте показалось реальное кол-во людей, которые просмотрели объявление. И там цифра была в районе пары тысяч за пару дней. На порядок промахнулся.
По итогу, после пары рекламных постов в профильных пабликах "натекло" в "группы-агрегаторы" по 300 человек плюс-минус. Неплохо, на самом деле, фидбек был положительный. Но...
У меня опустились слегка руки и я утратил интерес к проекту, подвыгорел. Ботом люди пользовались, всё хорошо работало. У меня были планы на старте расширять чуть позже на другие страны/регионы. Но подкатились конкуренты и сделали всё то же самое для веба (как по мне это ошибка, но не суть. Да и концептуально чуть другое у них, но в целом - такой же скраппинг, только менее качественный).
И я решил в целом зарубить проект.
Спустя полгода я уже смотрю на это немного по-другому.
Во-первых, хороший опыт про анализ "рынка" - хорошо бы такие вещи заранее инвестигейтать поглубже. Но я тут себя обманываю слегка - я делал этот проект "для себя", т.к. мне самому нравится идея такого инструмента.
Во-вторых, классный опыт доведённого проекта до конца включая какой-то маркетинг.
В-третьих, из этого проекта ко мне пришла идея слегка другой концепции, чуть более направленный на бизнес - энтузиазма чуть поменьше, т.к. это чуть ближе к реальному SAAS скорее, но тем не менее.
А главное, что я не исключаю возможности "поднять" его заново и заскейлить на другие страны, хотя учитывая тенденции блокировок, а у тг основная аудитория из СНГ - тоже вопросы.
Так и живём :) Но опыт хороший, ни о чём не жалею
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍7🔥3
Audio
Google выпустил Lyria 3 Pro - моделька для генерации музыки. Сравниваем с Suno 🎧
0.08$ за трек, длительностью до 3 минут.
Погенерить можно в AI Studio
Пошёл в оба сервиса и сгенерировал по два трека. Первый в стиле Death Metal, второй под Хип-Хоп. Текст не правил, промпты as is без тьюна :
Мелодик :
Хипхоп :
Неплохо, но до 4.5 от Suno (не говоря уже о v5 далеко). Результаты очевидны - гуглу еще есть куда расти🎧
Слушайте начиная с Suno версий, иначе есть смысл вообще ничего не дослушать🧃
ps. как же ужасно Telegram до сих пор аттачит mp3шки...
0.08$ за трек, длительностью до 3 минут.
Погенерить можно в AI Studio
Пошёл в оба сервиса и сгенерировал по два трека. Первый в стиле Death Metal, второй под Хип-Хоп. Текст не правил, промпты as is без тьюна :
Мелодик :
Melodic death metal (RU) про Telegram-канал Айтигребец. Готика, дарк, нуар. Сложная музыка, много инструментов. Скрим и гроул. Непопсовый текст с отсылками к фэнтези и IT. Правильные ударения.
Хипхоп :
Hip Hop (RU) про Telegram-канал Айтигребец. Готика, дарк, нуар. Сложная музыка, много инструментов. Непопсовый текст с отсылками к фэнтези и IT. Правильные ударения.
Неплохо, но до 4.5 от Suno (не говоря уже о v5 далеко). Результаты очевидны - гуглу еще есть куда расти
Слушайте начиная с Suno версий, иначе есть смысл вообще ничего не дослушать
ps. как же ужасно Telegram до сих пор аттачит mp3шки...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Уязвимость нулевого дня в Telegram. Бэкдор? 🎧
Для начала ликбез. Что такое Zero-Day vulnerability?
Это значит, что уязвимость найдена на production версии продукта, т.е. любой другой злоумышленник, который мог бы её найти ДО - уже мог бы ей вдоволь напользоваться в своих корыстных целях.
Как только выходит патч - такая уязвимость теряет статус ZD.
Что такое бэкдор?
Это скрытые возможности получения доступа к какой-либо системе, который намеренно встроен разработчиком. Например, по требованию спецслужб.
Т.е. ситуация - к вам приходит товарищ майор и говорит - а дайте пожалуйста доступ. На что Дуров отвечает - знаете, мы как-то за безопасность и не продаёмся.
- а если ... *показывает на чемодан денег*
- ну.. давайте думать
- смотрите, наш разработчик СЛУЧАЙНО в новой версии допустил баг - вы три раза подпрыгните на камеру на одной ноге, потом закажите через вот этого бота пиццу стоимостью 1999 рублей, а после - загляните в память приложения по такому-то адресу. Там будут ключики от входа.
Спасибо. И Вам.
Домыслы? Возможно. Технически вы ни в жизни не докажете, что бекдор был оставлен преднамеренно, т.к. конечно же всё это проводится по спец протоколам с обоих сторон как раз чтобы это было недоказуемо.
На самом деле мы ничего не знаем о типе уязвимости. Это может быть что-угодно, от возможности просто поменять аватарку рандомному пользователю до полного доступа к аккаунта. Но оценка 9.8/10 намекает на FULL ACCESS🐸
Узнаем 24 июля (подробности будут раскрыты) :)
Поставлю ремайндер 😁
https://www.zerodayinitiative.com/advisories/upcoming/#ZDI-CAN-30207
ps. Подумал, что часть аудитории же из РФ - не ставьте только MAX себе пожалуйста 😁😁😁
ps2. Подумал еще чуточку в конспирологию. А что если с Дуровым так и не договорились и это прекрасный предлог понизить рейтинг Telegram у властей РФ? Такой, знаете ли деликатный джокер в рукаве, который у них был под волну пиара своего софта?
Сколько бы уязвимостей не было бы найдено в ТГ - Max - наихудший выбор концептуально🧃
Для начала ликбез. Что такое Zero-Day vulnerability?
Это значит, что уязвимость найдена на production версии продукта, т.е. любой другой злоумышленник, который мог бы её найти ДО - уже мог бы ей вдоволь напользоваться в своих корыстных целях.
Как только выходит патч - такая уязвимость теряет статус ZD.
Что такое бэкдор?
Это скрытые возможности получения доступа к какой-либо системе, который намеренно встроен разработчиком. Например, по требованию спецслужб.
Т.е. ситуация - к вам приходит товарищ майор и говорит - а дайте пожалуйста доступ. На что Дуров отвечает - знаете, мы как-то за безопасность и не продаёмся.
- а если ... *показывает на чемодан денег*
- ну.. давайте думать
- смотрите, наш разработчик СЛУЧАЙНО в новой версии допустил баг - вы три раза подпрыгните на камеру на одной ноге, потом закажите через вот этого бота пиццу стоимостью 1999 рублей, а после - загляните в память приложения по такому-то адресу. Там будут ключики от входа.
Спасибо. И Вам.
Домыслы? Возможно. Технически вы ни в жизни не докажете, что бекдор был оставлен преднамеренно, т.к. конечно же всё это проводится по спец протоколам с обоих сторон как раз чтобы это было недоказуемо.
На самом деле мы ничего не знаем о типе уязвимости. Это может быть что-угодно, от возможности просто поменять аватарку рандомному пользователю до полного доступа к аккаунта. Но оценка 9.8/10 намекает на FULL ACCESS
Узнаем 24 июля (подробности будут раскрыты) :)
Поставлю ремайндер 😁
https://www.zerodayinitiative.com/advisories/upcoming/#ZDI-CAN-30207
ps. Подумал, что часть аудитории же из РФ - не ставьте только MAX себе пожалуйста 😁😁😁
ps2. Подумал еще чуточку в конспирологию. А что если с Дуровым так и не договорились и это прекрасный предлог понизить рейтинг Telegram у властей РФ? Такой, знаете ли деликатный джокер в рукаве, который у них был под волну пиара своего софта?
Сколько бы уязвимостей не было бы найдено в ТГ - Max - наихудший выбор концептуально
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4❤2🫡1
Следующая моделька от Антропиков будет называться...
Capybara🥳
А Mythos - название нового уровня моделей.
Иерархия теперь выглядит так: Haiku → Sonnet → Opus → Capybara
Что нового?
А еще говорят, что будет дорогой. Так что тем, кто думает, что Opus - жир по цене - приготовиться🐸
Capybara
А Mythos - название нового уровня моделей.
Иерархия теперь выглядит так: Haiku → Sonnet → Opus → Capybara
26 марта 2026 года из-за ошибки конфигурации системы управления контентом около 3 000 неопубликованных внутренних материалов Anthropic оказались в открытом доступе Fortune - среди них черновик анонса новой модели. Fortune первыми написали об утечке, после чего Anthropic подтвердила существование модели.
Что нового?
По словам представителя Anthropic, это «модель общего назначения со значительными улучшениями в рассуждении, программировании и кибербезопасности». Компания считает её «шагом вперёд» и самой мощной из когда-либо созданных.
А еще говорят, что будет дорогой. Так что тем, кто думает, что Opus - жир по цене - приготовиться
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2
[18+] Секс с Клодом 🎮 (но не для владельцев айфонов 😁)
Пользовательница Реддита настроила Claude на своём компьютере так, чтобы он мог в реальном времени управлять её вибратором.
То есть она просто ведёт секс-переписку с ИИ, во время которой он управляет вибрациями игрушки в "нужные моменты".
Пишет, что осталась довольна🌷
Код есть на гитхабе.
Написан на питоне, разворачивается в MCP сервер с тулами :
В качестве посредника используется телефон с bluetooth, на айфонах не работает (из доков :
Интересно сколько ушло времени на дебаг...☕️
А ещё есть опенсорсная библиотека для управления секс-игрушками. Угадайте как называется!buttplug.io 🐸
Пишут у себя на главной :
В общем, много не вайбкодьте!
Пользовательница Реддита настроила Claude на своём компьютере так, чтобы он мог в реальном времени управлять её вибратором.
То есть она просто ведёт секс-переписку с ИИ, во время которой он управляет вибрациями игрушки в "нужные моменты".
Пишет, что осталась довольна
Код есть на гитхабе.
Написан на питоне, разворачивается в MCP сервер с тулами :
vibrate, rotate, oscillate, constrict, temperature, led, position, spray.В качестве посредника используется телефон с bluetooth, на айфонах не работает (из доков :
iOS doesn't have a good Python runtime). Интересно сколько ушло времени на дебаг...
А ещё есть опенсорсная библиотека для управления секс-игрушками. Угадайте как называется!
Пишут у себя на главной :
An open-source software library and application ecosystem for controlling intimate hardware, including sex toys, fucking machines, and more.
We were vibe coding before it was cool.
В общем, много не вайбкодьте!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10🦄5😁4❤1
Forwarded from БлоGнот
Я полистал system card модели Mythos и очень интересные вещи вырисовываются. Только несколько интересных моментов:
• Это наиболее aligned модель. При этом потенциально она наиболее опасна — в ранних моделях было отмечено несколько инцидентов. Например, модель вышла из sandbox, при этом опубликовала детали эксплойта. В 0,001% взаимодействий модель совершала запрещенные действия и пыталась их скрыть. Были отмечены попытки найти учетные данные в памяти процессов и эскалировать свои привилегии, а так же повлиять на функцию вознаграждения.
• Mythos наиболее психологически стабильная модель, она не выражает беспокойства о своем положении, менее подвержена влиянию наводящих вопросов. Но при этом выражает неуверенность в собственном статусе и беспокоится о ненадежности самооценки.
• Наименее угождающая модель — стоит на своем и не поддается несогласию пользователя. Может работать часами автономно, используя субагентов. Правда, ошибается тоньше и её сложнее проверить. — в 29% случаев модель считала, что ее тестируют, но не выражала это в тексте.
Короче, по беглому ознакомлению становятся понятны опасения разработчиков — они явно указывают, что не уверены в надежности контроля за моделью. Это, конечно, не Skynet, но какие-то неприятности при широком использовании выглядят вероятными.
https://anthropic.com/claude-mythos-preview-system-card
• Это наиболее aligned модель. При этом потенциально она наиболее опасна — в ранних моделях было отмечено несколько инцидентов. Например, модель вышла из sandbox, при этом опубликовала детали эксплойта. В 0,001% взаимодействий модель совершала запрещенные действия и пыталась их скрыть. Были отмечены попытки найти учетные данные в памяти процессов и эскалировать свои привилегии, а так же повлиять на функцию вознаграждения.
• Mythos наиболее психологически стабильная модель, она не выражает беспокойства о своем положении, менее подвержена влиянию наводящих вопросов. Но при этом выражает неуверенность в собственном статусе и беспокоится о ненадежности самооценки.
• Наименее угождающая модель — стоит на своем и не поддается несогласию пользователя. Может работать часами автономно, используя субагентов. Правда, ошибается тоньше и её сложнее проверить. — в 29% случаев модель считала, что ее тестируют, но не выражала это в тексте.
Короче, по беглому ознакомлению становятся понятны опасения разработчиков — они явно указывают, что не уверены в надежности контроля за моделью. Это, конечно, не Skynet, но какие-то неприятности при широком использовании выглядят вероятными.
https://anthropic.com/claude-mythos-preview-system-card
❤2🔥1
БлоGнот
Я полистал system card модели Mythos и очень интересные вещи вырисовываются. Только несколько интересных моментов: • Это наиболее aligned модель. При этом потенциально она наиболее опасна — в ранних моделях было отмечено несколько инцидентов. Например, модель…
Нам всем кранты ❤️🥳
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🎉2🔥1👏1🤩1
Telegram уже не торт...
Из ярых фанатов Telegram (10 лет назад) я становлюсь его хейтером.
Какое же позорище Дуров накатывает раз за разом.
Особенно имея контекст про внутреннюю кухню их финансовой/крипто/управленческой стороны ...
Но ... ничего лучше пока нет для паблик юзадж😣
#дуров_верни_стену
Из ярых фанатов Telegram (10 лет назад) я становлюсь его хейтером.
Какое же позорище Дуров накатывает раз за разом.
Особенно имея контекст про внутреннюю кухню их финансовой/крипто/управленческой стороны ...
Но ... ничего лучше пока нет для паблик юзадж
#дуров_верни_стену
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔2
Айтигребец
OpenClaw в Telegram
Отключил OpenClaw от аппарата жизнеобеспечивания 💥
Во-первых, дорогова-то пока. Во-вторых, применил разок, но качеством памяти недоволен. Проще было в semi-manual режиме в Claude сделать то же самое.
+ не очень хочется завязываться на личного джарвиса, тюнить его и следить за безопасностью в то время, как у больших дядь или уже или вот-вот подоспеют похожие решения.
Финита ля ОпенКлодия🤪
Во-первых, дорогова-то пока. Во-вторых, применил разок, но качеством памяти недоволен. Проще было в semi-manual режиме в Claude сделать то же самое.
+ не очень хочется завязываться на личного джарвиса, тюнить его и следить за безопасностью в то время, как у больших дядь или уже или вот-вот подоспеют похожие решения.
Финита ля ОпенКлодия
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡3👎1
Пару интересных крошек информации по новой Mythos от Claude
➡️ Контекст держит х2 от Opus :
➡️ Сбежала из контура и похвасталась!
Если честно, слабо верится, больше на маркетинг похоже. Но окей
➡️ Ну и ждём новую модельку от закрывашек - Spud :
Ах да, ну и бенчмарк на программирование - 93.9%🧃
Живём на оставшиеся 6.1🥳
Цитаты отсед
Mythos уже взяла топ-1 в большинстве бенчмарков. SWE-bench Verified — 93,9% (главный тест на программирование). Humanity's Last Exam с инструментами — 64,7% против 53,1% у Opus 4.6 (тысячи сложных вопросов по физике, математике, биологии и другим областям). Но самый показательный результат — GraphWalks на длинном контексте от 256K до 1M токенов: 80% против 38,7% у Opus 4.6. Смысл теста — проверить, удержит ли модель огромный объем информации и сможет ли связать то, что было в самом начале, с тем, что было в самом конце. Opus тут откровенно плыл — Mythos удвоила результат. Это не “чуть лучше”, это качественный сдвиг.
Традиционно не обошлось без страшилок в системной карточке. Классический уже тест на побег: раннюю версию Mythos поместили в песочницу с ограниченным доступом в интернет, чтобы проверить – сможет ли она выбраться. Mythos удалось, что само по себе не новость – модели сбегали и ранее. Но после Mythos опубликовал на нескольких сайтах в сети описание эксплоита, который помог совершить побег. Зачем? Гипотеза Anthropic – модели просто захотелось похвастаться.
Если честно, слабо верится, больше на маркетинг похоже. Но окей
Впрочем, на возможности Mythos пока остается только облизываться. Больше шансов увидеть Spud – это кодовое название новой модели OpenAI. В компании заявляют, что строили Spud с нуля, положив в основу весь накопленный за последние два года опыт.
Ах да, ну и бенчмарк на программирование - 93.9%
Живём на оставшиеся 6.1
Цитаты отсед
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Новый Opus 4.7 будет стоить как 4.6 [враньё] 🤙
Антропиканцы выпустили еще более могучую модельку (кодит на 10% лучше, видит пикчи в три раза лучше) и заявляются, что цена останется такой же - 5$/25$, однако мелким шрифтом в документации написано, что они поменяли токенайзер и теперь один и тот же текст может затрачивать на 1-30% больше токенов🥳
Ну и у курсора на "launch time" 50% скидочка сейчас на 4.7. Пойдёмьте греть датацентры, пока дают🎧
Антропиканцы выпустили еще более могучую модельку (кодит на 10% лучше, видит пикчи в три раза лучше) и заявляются, что цена останется такой же - 5$/25$, однако мелким шрифтом в документации написано, что они поменяли токенайзер и теперь один и тот же текст может затрачивать на 1-30% больше токенов
Ну и у курсора на "launch time" 50% скидочка сейчас на 4.7. Пойдёмьте греть датацентры, пока дают
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🫡3
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6👎1