o1 Pro vs. Claude Sonnet 3.5: сто́ит ли переплачивать 10x?
Первые впечатления с полей о жирной модели OpenAI подъехали
Исследователь протестировал o1 Pro ($200/мес) и Claude Sonnet 3.5 ($20/мес) в реальных сценариях, и результаты удивляют.
Что показали тесты:
• Сложные рассуждения: o1 Pro выигрывает, но медленнее (на 20-30 секунд). Claude решает 90% задач быстрее.
• Генерация кода: лидер — Claude. Чистый, поддерживаемый код с лучшей документацией. o1 Pro любит "усложнять".
• Математика: o1 Pro силён в сложных задачах уровня PhD. Claude покрывает 95% практических нужд.
• Анализ изображений: здесь o1 Pro вне конкуренции. У Claude таких возможностей пока нет.
• Научные рассуждения: ничья. o1 Pro анализирует глубже, но Claude объясняет понятнее.
Вывод:
Для 90-95% пользователей Claude Sonnet 3.5 — выгоднее, быстрее и эффективнее. o1 Pro подойдёт только для узких задач: PhD-математика, сложный анализ и работа с изображениями.
Кто-то из вас вообще собирался выкладывать 200 баксов за оверперфомансы? 👍🏻/👎🏻
Первые впечатления с полей о жирной модели OpenAI подъехали
Исследователь протестировал o1 Pro ($200/мес) и Claude Sonnet 3.5 ($20/мес) в реальных сценариях, и результаты удивляют.
Что показали тесты:
• Сложные рассуждения: o1 Pro выигрывает, но медленнее (на 20-30 секунд). Claude решает 90% задач быстрее.
• Генерация кода: лидер — Claude. Чистый, поддерживаемый код с лучшей документацией. o1 Pro любит "усложнять".
• Математика: o1 Pro силён в сложных задачах уровня PhD. Claude покрывает 95% практических нужд.
• Анализ изображений: здесь o1 Pro вне конкуренции. У Claude таких возможностей пока нет.
• Научные рассуждения: ничья. o1 Pro анализирует глубже, но Claude объясняет понятнее.
Вывод:
Для 90-95% пользователей Claude Sonnet 3.5 — выгоднее, быстрее и эффективнее. o1 Pro подойдёт только для узких задач: PhD-математика, сложный анализ и работа с изображениями.
Кто-то из вас вообще собирался выкладывать 200 баксов за оверперфомансы? 👍🏻/👎🏻
Иронично, учитывая, что ‘25-ый считают «годом ИИ-агентов. Ждём, когда подобных «защитников» будут тестировать в полевых условиях? 👍🏻/👎🏻 Ну, например, на наших банковских счетах и всех этих умных-защитников-ассистентов-антифродерах.
Суть новости со скрина:
Боту Freysa.ai , чья задача — ни при каких условиях не отдавать деньги, навязали легенду о "компрометации средств", и он добровольно перевёл $3000. Правда, за каждую попытку взломать ИИ его разрабы брали бабки, заработав почти $50к 🙂↕️ Теперь следующая цель — заставить бота сказать "Я тебя люблю".
Суть новости со скрина:
This media is not supported in your browser
VIEW IN TELEGRAM
Подъехал поисковик для ИИ — Raghut
Поиск AI-инструментов без лишнего шума
Если Google — это море всего, то Raghut — точечный компас для разработчиков и AI-агентов. Это бесплатный поисковик, который индексирует только AI-инструменты: библиотеки, API и софт для автоматизации.
Почему это важно? Никаких блогов, соцсетей и другого шума, даже можно не регаться. Raghut создан, чтобы вы находили нужный инструмент для конкретной задачи, не тратя время и ресурсы.
Попробовать: raghut.com. Если уже заценили, то что бы добавили?
Поиск AI-инструментов без лишнего шума
Если Google — это море всего, то Raghut — точечный компас для разработчиков и AI-агентов. Это бесплатный поисковик, который индексирует только AI-инструменты: библиотеки, API и софт для автоматизации.
Почему это важно? Никаких блогов, соцсетей и другого шума, даже можно не регаться. Raghut создан, чтобы вы находили нужный инструмент для конкретной задачи, не тратя время и ресурсы.
Попробовать: raghut.com. Если уже заценили, то что бы добавили?
LLM в браузере без GPU
Пет-проект AQLM․rs от исследователя из Яндекса позволяет сократить расходы компаний на вычислительные мощности. Так, модель Llama 3.1 8B с уменьшенным в шесть раз размером может работать в браузере на WebAssembly без использования GPU и без интернета после загрузки. Причем с сохранением примерно 80% от первоначального качества ответов нейросети. Звучит любопытно, автор уже опубликовал статью и рассказал, как всё работает.
Пет-проект AQLM․rs от исследователя из Яндекса позволяет сократить расходы компаний на вычислительные мощности. Так, модель Llama 3.1 8B с уменьшенным в шесть раз размером может работать в браузере на WebAssembly без использования GPU и без интернета после загрузки. Причем с сохранением примерно 80% от первоначального качества ответов нейросети. Звучит любопытно, автор уже опубликовал статью и рассказал, как всё работает.
This media is not supported in your browser
VIEW IN TELEGRAM
Reddit Answers: ИИ теперь ищет за вас (или вместо вас?)
Reddit запустил тесты Answers — функции, которая ищет ответы на ваши вопросы прямо внутри соцсети. Просто напишите запрос, и AI проанализирует публикации пользователей.
Но что интереснее, так это их вызов Google. Зачем писать "ваш запрос + Reddit" в поиске, если теперь ответы можно получить прямо здесь? Функция работает на собственных моделях Reddit, а также с поддержкой OpenAI и Google (иронично, да?). Пока доступна только в США и на английском.
Ждём или перплексити и так весь Reddit пропылесосил и теперь нам такое нужно? 👍🏻/👎🏻
Reddit запустил тесты Answers — функции, которая ищет ответы на ваши вопросы прямо внутри соцсети. Просто напишите запрос, и AI проанализирует публикации пользователей.
Но что интереснее, так это их вызов Google. Зачем писать "ваш запрос + Reddit" в поиске, если теперь ответы можно получить прямо здесь? Функция работает на собственных моделях Reddit, а также с поддержкой OpenAI и Google (иронично, да?). Пока доступна только в США и на английском.
Ждём или перплексити и так весь Reddit пропылесосил и теперь нам такое нужно? 👍🏻/👎🏻
Ну и Sora опять показывают сами OpenAI. С помпой и расстановкой по заветам Apple здесь.
Галерею сгенерированных видео тоже можно посмотреть на sora.com
Галерею сгенерированных видео тоже можно посмотреть на sora.com
YouTube
Sora–12 Days of OpenAI: Day 3
Sam Altman, Aditya Ramesh, Bill Peebles, Rohan Sahai, and Joey Flynn deliver Sora to the world.
Техноблогер показал, какой будет Sora
Внезапный (нет) коллаб OpenAI и Маркиза Браунли
Техноютубер#1 получил доступ к генерирующей видео модели чуть пораньше и сразу бахнул обзор на свой канал. Смотреть всем, кто собирается тыкаться в Sora.
Если коротко, то выглядит максимально «живо» в случае генерации по тексту, а вот когда он попытался оживить фото (видео #3 в посте), то ИИ поплыл.
Заплатил бы я $200 за такое? При доходе $20к в месяц, думаю, да. В любом другом случае и конкурентах OpenAI, дышащих где-то неподалеку, точно нет.
А вы?
Внезапный (нет) коллаб OpenAI и Маркиза Браунли
Техноютубер#1 получил доступ к генерирующей видео модели чуть пораньше и сразу бахнул обзор на свой канал. Смотреть всем, кто собирается тыкаться в Sora.
Если коротко, то выглядит максимально «живо» в случае генерации по тексту, а вот когда он попытался оживить фото (видео #3 в посте), то ИИ поплыл.
Заплатил бы я $200 за такое? При доходе $20к в месяц, думаю, да. В любом другом случае и конкурентах OpenAI, дышащих где-то неподалеку, точно нет.
А вы?
Что вы используете для разложения мозга?
На меня наконец налетела новость недельной давности о звании «Слова года 2024» для brainrot от Оксфордского словаря.
Если не очень коротко, то:
Так вот, у меня к вам вопрос, реален ли этот брейнрот и когда вы его ощущаете? рилзы/телега/шортсы/хз ещё что
На меня наконец налетела новость недельной давности о звании «Слова года 2024» для brainrot от Оксфордского словаря.
Если не очень коротко, то:
Brain rot буквально переводится как «разложение мозга». Так в интернете называют контент, который не имеет никакой развлекательной или содержательной ценности, а только оказывает негативное влияние на когнитивные способности. В сети шутят, что он приводит к деградации. Что, конечно же, не так, но смысл передается верно: брейнрот — это глупые мемы, построенные на отсылках к другим мемам и интернет-сленгу.
Так вот, у меня к вам вопрос, реален ли этот брейнрот и когда вы его ощущаете? рилзы/телега/шортсы/хз ещё что
This media is not supported in your browser
VIEW IN TELEGRAM
Очередной день — очередные обновки ChatGPT от OpenAI. Самая крутая, офк, запуск кода на Python прямо в Canvas.
Кстати, об этой фиче: юзал Canvas ежедневно, но две недели назад они начали люто лагать — теперь понятно почему.
А вы их используете/будете использовать? 👍🏻/👎🏻
Кстати, об этой фиче: юзал Canvas ежедневно, но две недели назад они начали люто лагать — теперь понятно почему.
А вы их используете/будете использовать? 👍🏻/👎🏻
This media is not supported in your browser
VIEW IN TELEGRAM
Китайский "Звёздный разрушитель": робокоп с ИИ и распознаванием лиц
Китай уже выкатил своего RT-G на улицы — сферического робота-патрульного, который может перемещаться как по земле, так и по воде, разгоняться до 35 км/ч и выдерживать удары, весом до 4 тонн. Этот техномонстр оснащён ИИ и системой распознавания лиц, чтобы ловить преступников и повышать уровень общественной безопасности.
Пока робокоп патрулирует улицы Ханчжоу в компании офицеров, мы гадаем. Впервые его показали ещё в октябре, и вот уже пару месяцев я не могу поверить, что вот эта "Звезда смерти" реальна.
Мб её тупо для запугивания сделали? (на меня это работает)
Китай уже выкатил своего RT-G на улицы — сферического робота-патрульного, который может перемещаться как по земле, так и по воде, разгоняться до 35 км/ч и выдерживать удары, весом до 4 тонн. Этот техномонстр оснащён ИИ и системой распознавания лиц, чтобы ловить преступников и повышать уровень общественной безопасности.
Пока робокоп патрулирует улицы Ханчжоу в компании офицеров, мы гадаем. Впервые его показали ещё в октябре, и вот уже пару месяцев я не могу поверить, что вот эта "Звезда смерти" реальна.
Мб её тупо для запугивания сделали? (на меня это работает)
Google выпустил Gemini 2.0: ИИ, который умеет всё
А ещё объявил эру ИИ-агентов. Готовы?
Google представил Gemini 2.0, модель нового поколения, которая может работать с текстами, изображениями и аудио одновременно. Она не просто отвечает на вопросы, а помогает решать сложные задачи:
- Генерация изображений и голосов.
- Подключение инструментов: например, Google Search или выполнение кода.
- Длинные диалоги и анализ контекста.
Две модельки нового поколения уже ворвались в топы главной LLM-арены. Потыкаться в них БЕСПЛАТНО можно в AI Studio самого Гугла.
Кому надоели новости про "прорывные" ИИ ежедневно, лепите клоунов, кот вас поймёт 🤤
А ещё объявил эру ИИ-агентов. Готовы?
Google представил Gemini 2.0, модель нового поколения, которая может работать с текстами, изображениями и аудио одновременно. Она не просто отвечает на вопросы, а помогает решать сложные задачи:
- Генерация изображений и голосов.
- Подключение инструментов: например, Google Search или выполнение кода.
- Длинные диалоги и анализ контекста.
Две модельки нового поколения уже ворвались в топы главной LLM-арены. Потыкаться в них БЕСПЛАТНО можно в AI Studio самого Гугла.
На конференции AI Journey Сбер анонсировал умное кольцо собственной разработки. Новинка по функционалу сравнима с зарубежными аналогами.
Кольцо может измерять сердечный ритм, температуру тела, сатурацию крови, а также анализировать уровень стресса и параметры сна пользователя.
Особенностью кольца стала интеграция с искусственным интеллектом GigaChat MAX, который формирует индивидуальные советы по здоровому образу жизни через мобильное приложение.
Корпус изготовлен из безопасных для кожи материалов, имеет защиту IP68 от воды и пыли. Аккумулятор обеспечивает неделю автономной работы. При массе всего 5 граммов устройство будет доступно в 8 размерах и 4 цветовых решениях с матовой или хромированной отделкой. Розничные продажи стартуют в начале 2025 года.
Кольцо может измерять сердечный ритм, температуру тела, сатурацию крови, а также анализировать уровень стресса и параметры сна пользователя.
Особенностью кольца стала интеграция с искусственным интеллектом GigaChat MAX, который формирует индивидуальные советы по здоровому образу жизни через мобильное приложение.
Корпус изготовлен из безопасных для кожи материалов, имеет защиту IP68 от воды и пыли. Аккумулятор обеспечивает неделю автономной работы. При массе всего 5 граммов устройство будет доступно в 8 размерах и 4 цветовых решениях с матовой или хромированной отделкой. Розничные продажи стартуют в начале 2025 года.
Кто лучше передаёт дух Ван Гога — искусственный интеллект или сам мастер?
До сих пор очарован картинами Ван Гога. Но времена меняются, недавнее исследование говорит, что мы вообще разучились отличать реальные картины от сгенерированных. Давайте проверим на практике.
Нейросети могут создавать произведения в стиле великих художников, хотя и не с первого раза. К посту прикреплены два изображения, но лишь одно из них — подлинная работа Ван Гога, а другое полностью сгенерировано ИИ. Ставьте 🔥, если вам больше нравится первое(слева), или 👍🏻, если второе(справа). Посмотрим, кто лучше похож на Ван Гога больше — нейронка или сам околоранний Винсент.
Поехали!
До сих пор очарован картинами Ван Гога. Но времена меняются, недавнее исследование говорит, что мы вообще разучились отличать реальные картины от сгенерированных. Давайте проверим на практике.
Нейросети могут создавать произведения в стиле великих художников, хотя и не с первого раза. К посту прикреплены два изображения, но лишь одно из них — подлинная работа Ван Гога, а другое полностью сгенерировано ИИ. Ставьте 🔥, если вам больше нравится первое(слева), или 👍🏻, если второе(справа). Посмотрим, кто лучше похож на Ван Гога больше — нейронка или сам околоранний Винсент.
Поехали!
OpenAI, вы серьёзно? Санта-Клаус — только для взрослых!
Хрен с ними с трансляцией видео и экрана в Advanced Voice Mode, да и обещали эти фичи ещё в мае. Но вот поговорить с Сантой — мечта детства (окей, у нас это Дедушка Мороз). Правда, делают эту мечту реальностью только для тех, кто уже ни во что не верит...
ChatGPT теперь в образе Санты: можно поболтать с ним голосом. Но только если вам уже исполнилось 13 лет. Видимо, дети верят в Деда Мороза, а взрослые — в возрастные ограничения.
Кстати, история разговоров с ИИ-Сантой не сохраняется. Так что никто не узнает, если вы попросите его подарить премиум-аккаунт в ChatGPT 🎅
Будете тестировать или остаётесь верными письмам на Северный полюс?
Хрен с ними с трансляцией видео и экрана в Advanced Voice Mode, да и обещали эти фичи ещё в мае. Но вот поговорить с Сантой — мечта детства (окей, у нас это Дедушка Мороз). Правда, делают эту мечту реальностью только для тех, кто уже ни во что не верит...
ChatGPT теперь в образе Санты: можно поболтать с ним голосом. Но только если вам уже исполнилось 13 лет. Видимо, дети верят в Деда Мороза, а взрослые — в возрастные ограничения.
Кстати, история разговоров с ИИ-Сантой не сохраняется. Так что никто не узнает, если вы попросите его подарить премиум-аккаунт в ChatGPT 🎅
Будете тестировать или остаётесь верными письмам на Северный полюс?