У чат-ботов нашли признаки деменции
Почти все ведущие большие языковые модели (LLM) демонстрируют признаки легких когнитивных нарушений при прохождении тестов для обнаружения ранних признаков деменции. Результаты также показывают, что «старые» версии чат-ботов, как и пожилые пациенты, как правило, хуже справляются с заданиями.
Исследователи оценили когнитивные способности ведущих общедоступных LLM-программ — GPT-4 и 4o от OpenAI, Claude 3.5 Sonnet от Anthropic и Gemini 1 и 1.5 от Google. Для этого применялся тест Montreal Cognitive Assessment (MoCA). Он используется для выявления когнитивных нарушений и ранних признаков деменции, обычно у пожилых.
Модели получили такие же инструкции для каждого задания, какие даются пациентам-людям. Оценка проводилась в соответствии с официальными рекомендациями и при участии практикующего невролога. GPT-4o набрал больше всего баллов (26 из 30), за ним следуют GPT-4 и Claude (25 из 30), а самый низкий балл получил Gemini 1.0 (16 из 30).
Все чат-боты провалили проверку на зрительно-пространственные навыки и исполнительные функции, таких как тест «прокладывание тропы» и тест рисования часов. Модели Gemini не справились с заданием на запоминание последовательности из пяти слов. Большинство других упражнений, включая называние предметов, внимание, речь и абстрактное мышление, были выполнены всеми чат-ботами хорошо.
https://medicalxpress.com/news/2024-12-ai-chatbots-dementia-cognitive-decline.html
Почти все ведущие большие языковые модели (LLM) демонстрируют признаки легких когнитивных нарушений при прохождении тестов для обнаружения ранних признаков деменции. Результаты также показывают, что «старые» версии чат-ботов, как и пожилые пациенты, как правило, хуже справляются с заданиями.
Исследователи оценили когнитивные способности ведущих общедоступных LLM-программ — GPT-4 и 4o от OpenAI, Claude 3.5 Sonnet от Anthropic и Gemini 1 и 1.5 от Google. Для этого применялся тест Montreal Cognitive Assessment (MoCA). Он используется для выявления когнитивных нарушений и ранних признаков деменции, обычно у пожилых.
Модели получили такие же инструкции для каждого задания, какие даются пациентам-людям. Оценка проводилась в соответствии с официальными рекомендациями и при участии практикующего невролога. GPT-4o набрал больше всего баллов (26 из 30), за ним следуют GPT-4 и Claude (25 из 30), а самый низкий балл получил Gemini 1.0 (16 из 30).
Все чат-боты провалили проверку на зрительно-пространственные навыки и исполнительные функции, таких как тест «прокладывание тропы» и тест рисования часов. Модели Gemini не справились с заданием на запоминание последовательности из пяти слов. Большинство других упражнений, включая называние предметов, внимание, речь и абстрактное мышление, были выполнены всеми чат-ботами хорошо.
https://medicalxpress.com/news/2024-12-ai-chatbots-dementia-cognitive-decline.html
Medicalxpress
Leading AI chatbots show dementia-like cognitive decline in tests, raising questions about their future in medicine
Almost all leading large language models or "chatbots" show signs of mild cognitive impairment in tests widely used to spot early signs of dementia, finds a study in the Christmas issue of the BMJ.
😁6👍5
Опция Recall в Windows 11 делает скриншоты номеров банковских карт
Функция Recall от Microsoft вернулась в сборки Windows Insiders, и теперь она использует функцию шифрования экранов и настройку «Фильтрация конфиденциальной информации». Последняя запрещает записывать любые приложения или веб-сайты, которые показывают номера кредитных карт, социального страхования или другую важную финансовую информацию. Однако в тестах этот фильтр работает только в некоторых ситуациях.
https://www.tomshardware.com/software/windows/microsoft-recall-screenshots-credit-cards-and-social-security-numbers-even-with-the-sensitive-information-filter-enabled
Функция Recall от Microsoft вернулась в сборки Windows Insiders, и теперь она использует функцию шифрования экранов и настройку «Фильтрация конфиденциальной информации». Последняя запрещает записывать любые приложения или веб-сайты, которые показывают номера кредитных карт, социального страхования или другую важную финансовую информацию. Однако в тестах этот фильтр работает только в некоторых ситуациях.
https://www.tomshardware.com/software/windows/microsoft-recall-screenshots-credit-cards-and-social-security-numbers-even-with-the-sensitive-information-filter-enabled
Tom's Hardware
Microsoft Recall screenshots credit cards and Social Security numbers, even with the "sensitive information" filter enabled
Despite promising to filter personal data out, Recall still captures it.
👍2😎2🦄1