Please open Telegram to view this post
VIEW IN TELEGRAM
AI Diplomacy – модифицированная версия игры Diplomacy, в которой 18 ллм (от o3 до Claude и Gemini) сражаются за господство в Европе 1901 года.
Вот такие сейчас результаты для топовых моделей:
- o3: побеждает через обман и психологию
- Gemini 2.5 Pro: тактик, почти всегда в топе
- Claude 4 Opus: верит в мир и проигрывает
- DeepSeek R1: драматичен, дёшев и эффективен. Начал игру с фразы "Твой флот сгорит в Черном море этой ночью!"
Клода жалко
сурс – https://every.to/diplomacy
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from дядя_д
Media is too big
VIEW IN TELEGRAM
Побывали в Nuanu Creative City – это абсолютно сумасшедшее пространоство вот с такими общающимися головами, например.
По идее диалоги должны генериться и озвучиваться ИИшками, но скорее всего сейчас они просто записаны)
8 числа в nuanu я буду проводить офлайн лекцию по автомтизациям и ии-агентам в n8n. Если вы находитесь на Бали – приходите на воркшоп. Билеты тут.
А еще мы потихоньку думаем над организацией офлайн эвентов и кемпов с образовательно-развлекательно-оздоровительными программами
Было бы интересно?
@true_dyadya_d
Please open Telegram to view this post
VIEW IN TELEGRAM
👉 Новый выпуск новостей уже на канале - https://youtu.be/V9Oy7LqkVbo
Обещанная ссылка на статистику по LLM - https://artificialanalysis.ai/
Обещанная ссылка на статистику по LLM - https://artificialanalysis.ai/
🤌 Вы просили - мы сделали
Обзор на codex от openai - годнота или разочарование?
Уже на ютуб - https://youtu.be/0rnJ2qHeVuA
Обзор на codex от openai - годнота или разочарование?
Уже на ютуб - https://youtu.be/0rnJ2qHeVuA
1) Альтман опубликовал новое эссе "The Gentle Singularity". Сингулярность уже началсь, роботы на улицах и нейроинтерфейсы не за горами, а общество у нас адаптивное и мы все преодолеем, хоть ошибок не избежать. А еще один запрос в ChatGPT усредненно тратит 0,34 Вт-час или 1/15 чайной ложки воды.
2) Мысли ранних тестеров об о3-про. Модель еще лучше работает с длинными контекстами и понимает, на что способна – знает, какими обладает инструментами. И это выражается в том, что о3 про способна думать меньше чем о3, если вопрос не подразумевает длинных рассуждений.
"План, который нам дал o3, был правдоподобным и разумным, но план, который дал нам o3 Pro, был настолько хорош, чтобы фактически изменить то, как мы думаем о нашем будущем." – цитата тестеров из статьи
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
🎯 С момента прошлого выпуска прошло много времени и Higgsfield обновился до неузнаваемости
Обзор всех новых и старых функций уже на канале - https://youtu.be/NNMWiETV3xM
Обзор всех новых и старых функций уже на канале - https://youtu.be/NNMWiETV3xM
Новый выпуск новостей уже на канале - https://youtu.be/DkaBghxft4Q
@how2ai
Please open Telegram to view this post
VIEW IN TELEGRAM