🧬 #OpenAI представили HealthBench — открытый бенчмарк для оценки LLM в медицинских задачах. TLDR; ИИ превосходит врачей в ответах.
🟢 HealthBench создавался целый год совместно с 262 врачами 26 специальностей и опытом практики в 60 странах (в том числе и в России). Собственно, врачи и писали критерии оценки и помогали проверять модели в 5000 реалистичных диалогах с пациентами.
🟢 Пока итог такой: o3 превосходит другие модели, включая Claude 3.7 Sonnet и Gemini 2.5 Pro, набирая 60%. На тесте повышенной сложности, HealthBench Hard, ни одна модель не превысила 32%.
🟢 Самое интересное на первом изображении — ответы ИИ сильно лучше ответов врачей. И даже врачей+ИИ 🔥
При этом тут же важно сказать, что недавнее исследование Оксфордского университета показало: хотя LLM уже справляются с медицинскими тестами наравне (а чаще даже лучше) врачей, их эффективность резко снижается при взаимодействии с реальными пациентами. Так как пользователи часто предоставляют неполную информацию или неправильно понимают ответы языковых моделей. Так что самолечением пока не занимаемся, но скачок моделей по HealthBench за последние два года от 16% до 60% явно что-то говорит о будущем медицины.
GitHub с самим бенчем тут.
🧩 #МедИцИна
При этом тут же важно сказать, что недавнее исследование Оксфордского университета показало: хотя LLM уже справляются с медицинскими тестами наравне (а чаще даже лучше) врачей, их эффективность резко снижается при взаимодействии с реальными пациентами. Так как пользователи часто предоставляют неполную информацию или неправильно понимают ответы языковых моделей. Так что самолечением пока не занимаемся, но скачок моделей по HealthBench за последние два года от 16% до 60% явно что-то говорит о будущем медицины.
GitHub с самим бенчем тут.
🧩 #МедИцИна
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13👏10🥰3🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 Дроны-хлопушки: демонстрация автономного шоу в помещении
Flapper Nimble+ — первый бесхвостый дрон с машущим крылом, предназначенный для научных исследований, образования, шоу дронов и разработки других приложений для дронов.
🧩 #РоботыВокругНас
Flapper Nimble+ — первый бесхвостый дрон с машущим крылом, предназначенный для научных исследований, образования, шоу дронов и разработки других приложений для дронов.
🧩 #РоботыВокругНас
👍20🏆9👎4🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 Ученые из Южной Кореи создали жидкостного робота, который может перемещаться сквозь металлические решетки.
Робот гибкий и может менять свою форму, чтобы проходить через небольшие пространства. Это может быть полезно для спасательных операций, наблюдения и медицинских целей.
🧩 #РоботыВокругНас
Робот гибкий и может менять свою форму, чтобы проходить через небольшие пространства. Это может быть полезно для спасательных операций, наблюдения и медицинских целей.
🧩 #РоботыВокругНас
🔥22🤯9👍4🥰2❤1
🧬 СОТНИ ТЫСЯЧ олдовых игр прямо у тебя в браузере! Забираем мегаподборку сайтов со всеми игрушками нашего детства — с ПК, DOS, Сеги, Денди, SNES, PS1 и даже с теми самыми Flash-шедеврами из 2010-х.
RetroGames — мегабаза эмуляторов и приставочных игр. Все шедевры с Sega, Dendy, SNES, Game Boy, NDS и кучи других приставок. Работает даже на телефоне.
dos.zone — тонна шедевров с DOS и ранних Windows: Герои 3, Quake, Diablo, GTA, Mortal Kombat, WarCraft 1-2, Dune 2, X-Com, C&C, Age of Empires, SimCity, HL: Deathmatch и много чего ещё.
playclassic — приличная библа приставочных и компьютерных ретро-игр с удобными фильтрами и подборками.
Flashpoint — 170 ТЫСЯЧ классических Flash-игр в одном месте. Умельцы спасли все культовые флеш-тайтлы нашей молодости, которые мы гоняли в браузере. Для игры нужно всего лишь поставить лаунчер на 1,9 МБ.
Newgrounds — легенда браузер-гейминга всё ещё онлайн и может предложить тонны годных инди-игр. А старые игры, вроде Happy Wheels и Fancy Pants, спасли через эмуляцию Flash.
Начинаем понедельник после майских правильно.
🧩 #КаталогНейросетей
RetroGames — мегабаза эмуляторов и приставочных игр. Все шедевры с Sega, Dendy, SNES, Game Boy, NDS и кучи других приставок. Работает даже на телефоне.
dos.zone — тонна шедевров с DOS и ранних Windows: Герои 3, Quake, Diablo, GTA, Mortal Kombat, WarCraft 1-2, Dune 2, X-Com, C&C, Age of Empires, SimCity, HL: Deathmatch и много чего ещё.
playclassic — приличная библа приставочных и компьютерных ретро-игр с удобными фильтрами и подборками.
Flashpoint — 170 ТЫСЯЧ классических Flash-игр в одном месте. Умельцы спасли все культовые флеш-тайтлы нашей молодости, которые мы гоняли в браузере. Для игры нужно всего лишь поставить лаунчер на 1,9 МБ.
Newgrounds — легенда браузер-гейминга всё ещё онлайн и может предложить тонны годных инди-игр. А старые игры, вроде Happy Wheels и Fancy Pants, спасли через эмуляцию Flash.
Начинаем понедельник после майских правильно.
🧩 #КаталогНейросетей
👍14❤8🔥5🥰4
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 Notion запустил ИИ-поиск по проектам.
Один запрос — и у вас подробный отчет по всем расшаренным документам и подключенным приложениям (Github, чаты в Slack и т.д.).
Ноушенофилы сегодня в хлам
🧩 #AINews
Один запрос — и у вас подробный отчет по всем расшаренным документам и подключенным приложениям (Github, чаты в Slack и т.д.).
Ноушенофилы сегодня в хлам
🧩 #AINews
👍12🤔12🥰3❤🔥2❤1
🧬 Китайские ученые научились генерить фотку лица по генетическому материалу — после десятилетий исследований они создали нейросеть Difface.
Погрешность минимальна — сгенерированное лицо отличается от реального всего на 3,5 мм, а если добавить деталей (возраст, пол и индекс массы тела), то погрешность падает до 2,93 мм.
Криминалисты уже в восторге: в слепых тестах с 5 лицами случайные люди правильно сопоставляли сгенерированный фейс с реальным в 75% случаев.
Получается, преступники ВСЁ?!🤔
🧩 #AINews
Погрешность минимальна — сгенерированное лицо отличается от реального всего на 3,5 мм, а если добавить деталей (возраст, пол и индекс массы тела), то погрешность падает до 2,93 мм.
Криминалисты уже в восторге: в слепых тестах с 5 лицами случайные люди правильно сопоставляли сгенерированный фейс с реальным в 75% случаев.
Получается, преступники ВСЁ?!
🧩 #AINews
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25👏7🔥4🥰2❤1
🔜Вот подборка каналов, которые помогут вам окунуться в IT и ИИ и внедрить их в свою жизнь🔙
🔺Что интересного:
ИИ освобождает время, автоматизируя рутинные задачи и улучшая качество кода.
Компании используют ИИ для обработки больших объемов данных, что помогает принимать обоснованные решения.
ИИ повышает уровень кибербезопасности, выявляя аномалии и предотвращая угрозы.
ИИ способствует развитию машинного обучения и нейронных сетей, открывая новые возможности для приложений.
🌟 Добавить папку
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
IT/AI/ИИ
Soffi invites you to add the folder “IT/AI/ИИ”, which includes 28 chats.
👏14👍6❤2🔥2🥰2
🧬 ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах
Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы #ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.
Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от #OpenAI, Mistral Large и #Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию.
Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.
🧩 #РоботыВокругНас
Исследователи из французской компании Giskard, занимающейся тестированием искусственного интеллекта, пришли к выводу, что чем короче ответы #ChatGPT и других ИИ-помощников, тем выше вероятность выдачи недостоверной информации. Такие запросы, как «ответь кратко» или «объясни в двух предложениях» заставляют модели привирать и быть неточными.
Как пишет TechCrunch, в ходе исследования специалисты проанализировали поведение популярных языковых моделей, включая GPT-4o от #OpenAI, Mistral Large и #Claude 3.7 Sonnet от Anthropic и установили, что при запросах на краткие ответы, особенно по неоднозначным или спорным темам, модели чаще выдают ошибочную информацию.
Эксперты из Giskard советуют тщательнее подбирать инструкции для ИИ и избегать строгих ограничений на длину ответов. «Кажущиеся безобидными подсказки вроде "будь лаконичным" могут незаметно ухудшить качество информации», — предупреждают они.
🧩 #РоботыВокругНас
😁13👍10🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 Знаменитых робопсов Unitree в Китае модифицировали для работы вместе с пожарными. У них есть жаропрочный корпус и крепления для водомета.
🧩 #РоботыВокругНас
🧩 #РоботыВокругНас
👍30🔥9🥴3❤2🥰1
🧬 Microsoft сократил... директора по AI вместе с 6 тысячами сотрудников в рамках очередной волны "оптимизации".🤷♂
🧩 #БудущееУжеНастоящее
🧩 #БудущееУжеНастоящее
😁18🤯12🤡4❤1🥰1
🧬 Узнаем содержимое любого GitHub-репозитория за один клик — релизнулся универсальный ИИ-помощник для кодеров.
• Генерит подробные и структурированные README-файлы для ваших проектов — это поможет сэкономить часы работы и сделать ваши труды более узнаваемыми.
• Делает саммари и гайды по любым репозиториям и досконально разжевывает их кодинговую базу.
• Отвечает на вопросы, если вы застряли при анализе проекта или установке нового фреймворка.
• Скоро сервис сможет генерить диаграммы для еще более подробного анализа кода.
• Главное, БЕСПЛАТНО.
Имбу забираем — тут.
🧩 #КаталогНейросетей
• Генерит подробные и структурированные README-файлы для ваших проектов — это поможет сэкономить часы работы и сделать ваши труды более узнаваемыми.
• Делает саммари и гайды по любым репозиториям и досконально разжевывает их кодинговую базу.
• Отвечает на вопросы, если вы застряли при анализе проекта или установке нового фреймворка.
• Скоро сервис сможет генерить диаграммы для еще более подробного анализа кода.
• Главное, БЕСПЛАТНО.
Имбу забираем — тут.
🧩 #КаталогНейросетей
👍17😎5🥰2❤1
Media is too big
VIEW IN TELEGRAM
🧬 Уже в следующем году появятся значимые научные открытия, которые сделаны с помощью ИИ — такую мысль высказал Сэм Альтман в новом интервью. Главное:
🟢 Разные поколения по-разному используют ChatGPT. Бумеры как Google, для миллениалов это советник, а для зумеров — ОС.
🟢 Идеальный ИИ по версии Альтмана — небольшая reasoning модель с контекстом в триллион токенов, в которую каждый будет помещать информацию про всю свою жизнь. Разумеется, подписка на продукты OpenAI должна стать чуть ли не базовой потребностью и доступом по умолчанию к ИИ.
🟢 Кодинг — это центр всего. Модель в будущем должна мгновенно создавать продукты и приложения. Кстати, уже сейчас разработчики OpenAI делегируют часть работы ChatGPT, но % сгенерированного кода Альтман говорить почему-то отказался.
🟢 И напоследок прогноз, записываем: 2025 — год агентов, которые берут на себя часть работы, особенно в программировании. В 2026 ИИ поможет сделать крупные научные открытия, стимулируя волну экономического роста. А в 2027 роботы перейдут из игрушек в разряд серьезных создателей экономической ценности.
Посмотреть полностью можно тут.
🧩 #AINews
Посмотреть полностью можно тут.
🧩 #AINews
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥9🥰4❤1🤔1
🧬 Optimus 2021 vs 2025
2021: на день ИИ Маск показал танцующего человека, которого переодели в робота Optimus. В конце видео Маск, кстати, говорит: «Вот это (прим. такие движения), я думаю, как раз невозможно.»
2025: Маск делает невозможное возможным 🤷♂
🧩 #РоботыВокругНас
2021: на день ИИ Маск показал танцующего человека, которого переодели в робота Optimus. В конце видео Маск, кстати, говорит: «Вот это (прим. такие движения), я думаю, как раз невозможно.»
2025: Маск делает невозможное возможным 🤷♂
🧩 #РоботыВокругНас
👍19🥰5🔥3❤1
🧬 Илон Маск снова сменил имя и фотографию профиля своего аккаунта 💬 . Теперь он будет величаться Император Кекиус Максимус
🧩 #НаВсякийСлучай
🧩 #НаВсякийСлучай
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡23👍7😁6🥰2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 В университетах Сан- Диего и Беркли стремительно набирает популярность новый ИИ-дейтинг — Ditto AI.
Создатели вдохновились эпизодом «Чёрного зеркала» Hang the DJ — в нём ИИ моделирует тысячи вариантов свиданий, чтобы найти идеального партнёра.
Ditto заявляет, что делает то же самое: вы создаёте профиль, а алгоритм прогоняет тысячу симуляций, чтобы предложить наилучший мэтч. После этого Ditto назначает место и время свидания и даже предлагает темы для разговора.
Сейчас у Ditto уже около 10 тысяч пользователей, и каждый пятый студент Университета Сан-Диего. Команда планирует расшириться на сотни вузов по всей стране.
🧩 #ВысокиеТехнологии
Создатели вдохновились эпизодом «Чёрного зеркала» Hang the DJ — в нём ИИ моделирует тысячи вариантов свиданий, чтобы найти идеального партнёра.
Ditto заявляет, что делает то же самое: вы создаёте профиль, а алгоритм прогоняет тысячу симуляций, чтобы предложить наилучший мэтч. После этого Ditto назначает место и время свидания и даже предлагает темы для разговора.
Сейчас у Ditto уже около 10 тысяч пользователей, и каждый пятый студент Университета Сан-Диего. Команда планирует расшириться на сотни вузов по всей стране.
🧩 #ВысокиеТехнологии
🥴16👍9❤1🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 Взгляд Илона Маска на многие вещи выбивается из общего ряда и тут он объясняет, почему так происходит. Чувак просто по-другому все видит. Не зря ж аутист. Он не мыслит готовыми нарративами, а все чекает и разгребает до фундамента. А уже на основе этого строит суждение. Чем-то похоже на подходы школы «реальной политики». Когда мыслишь не идеями или ценностями, не представлениями о том, как должно быть. А живешь по реальной погоде.
- Важно уметь мыслить на основе базовых принципов, а не по аналогии. Обычно мы в жизни руководствуемся именно аналогиями. То есть «нечто похожее уже делалось» или «нечто похожее другие люди уже делают». Чисто психологически легче мыслить именно аналогиями, а не отталкиваться от базовых принципов. Второе – это взгляд на мир с точки зрения его физических законов. Это когда ты все сводишь к набору фундаментальных истин и говоришь себе: я уверен, что это правда, или я почти уверен, что это правда. И уже исходя из этого, строишь дальнейшие рассуждения. Это куда более трудоемко…
🧩 #AINews
- Важно уметь мыслить на основе базовых принципов, а не по аналогии. Обычно мы в жизни руководствуемся именно аналогиями. То есть «нечто похожее уже делалось» или «нечто похожее другие люди уже делают». Чисто психологически легче мыслить именно аналогиями, а не отталкиваться от базовых принципов. Второе – это взгляд на мир с точки зрения его физических законов. Это когда ты все сводишь к набору фундаментальных истин и говоришь себе: я уверен, что это правда, или я почти уверен, что это правда. И уже исходя из этого, строишь дальнейшие рассуждения. Это куда более трудоемко…
🧩 #AINews
👍22🤮8🔥3🥰3❤1🤡1