#llms #ai #mistral #pdf #ocr
"Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы."
https://3dnews.ru/1119379/mistral-ai-predstavila-instrument-kotoriy-prevratit-lyuboy-pdfdokument-tekstoviy-fayl-dlya-ii
"Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы."
https://3dnews.ru/1119379/mistral-ai-predstavila-instrument-kotoriy-prevratit-lyuboy-pdfdokument-tekstoviy-fayl-dlya-ii
3DNews - Daily Digital Digest
Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ
Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов.
#dyatlovpass #mysteries #ai #nlp #criminology
В очередной раз попалось в рекомендациях видео по загадке трагической гибели туристов на перевале Дятлова.
Это хорошо документированная, но не имеющая очевидного решения тайна 1959-го года.
Есть десятки версий, ни одна полностью не объясняет всю фактологическую базу.
Дело осложняется тем, что "интернет-эксперты", авторы версий, зачастую не дружат с логикой и не способны делать корректные выводы даже из ясных и простых посылок.
У меня давно была идея сконструировать экспертную систему с материалами дела, с визуализацией цепочки событий (по времени и месту), "нечёткой логикой", и, самое главное, системой оценки и сравнения версий.
Каждый факт (свидетельство с определённой степенью достоверности) из экспертной системы может противоречить либо не противоречить определённой версии.
Тогда можно было бы найти версию, объясняющую наибольший объём фактов, определить недостоверные факты и даже недостоверные источники информации.
Раньше не было возможности такое запилить, но с современным ИИ это стало возможным в течение последних 2 лет.
Эта система, в случае создания, может быть масштабирована на все сложные криминологические случаи.
Ну и в целом это может быть прикольным проектом, с авто анализом текстов, изображений, геомоделированием, психологией.
Если кто вдруг заинтересован в совместной работе в этом направлении, пишите.
В очередной раз попалось в рекомендациях видео по загадке трагической гибели туристов на перевале Дятлова.
Это хорошо документированная, но не имеющая очевидного решения тайна 1959-го года.
Есть десятки версий, ни одна полностью не объясняет всю фактологическую базу.
Дело осложняется тем, что "интернет-эксперты", авторы версий, зачастую не дружат с логикой и не способны делать корректные выводы даже из ясных и простых посылок.
У меня давно была идея сконструировать экспертную систему с материалами дела, с визуализацией цепочки событий (по времени и месту), "нечёткой логикой", и, самое главное, системой оценки и сравнения версий.
Каждый факт (свидетельство с определённой степенью достоверности) из экспертной системы может противоречить либо не противоречить определённой версии.
Тогда можно было бы найти версию, объясняющую наибольший объём фактов, определить недостоверные факты и даже недостоверные источники информации.
Раньше не было возможности такое запилить, но с современным ИИ это стало возможным в течение последних 2 лет.
Эта система, в случае создания, может быть масштабирована на все сложные криминологические случаи.
Ну и в целом это может быть прикольным проектом, с авто анализом текстов, изображений, геомоделированием, психологией.
Если кто вдруг заинтересован в совместной работе в этом направлении, пишите.
Wikipedia
Гибель тургруппы Дятлова
невыясненная гибель группы туристов в 1959 году на Северном Урале
👍1
#ai #llms #gpt
"В моделях семейства GigaChat 2.0 улучшена работа с контекстом беседы: они способны отвечать на сложные длинные вопросы и анализировать увеличенные объёмы текста. Если ранее максимальный объём составлял 48 страниц A4 (шрифт 14 pt), то теперь этот показатель вырос до 200 страниц. Это позволяет создавать более качественные чат-боты на основе GigaChat 2.0. Вдвое увеличилась способность следовать инструкциям пользователя, а качество ответов на вопросы повысилось на 25 %.
Флагманская GigaChat 2 MAX заняла первое место среди ИИ-моделей в независимом тесте MERA для русского языка. В бенчмарках MMLU на русском и английском она показала результаты на уровне мировых лидеров и по некоторым критериям превзошла их."
https://3dnews.ru/1119676/sber-predstavil-silneyshiy-russkoyazichniy-ii-gigachat-20
"В моделях семейства GigaChat 2.0 улучшена работа с контекстом беседы: они способны отвечать на сложные длинные вопросы и анализировать увеличенные объёмы текста. Если ранее максимальный объём составлял 48 страниц A4 (шрифт 14 pt), то теперь этот показатель вырос до 200 страниц. Это позволяет создавать более качественные чат-боты на основе GigaChat 2.0. Вдвое увеличилась способность следовать инструкциям пользователя, а качество ответов на вопросы повысилось на 25 %.
Флагманская GigaChat 2 MAX заняла первое место среди ИИ-моделей в независимом тесте MERA для русского языка. В бенчмарках MMLU на русском и английском она показала результаты на уровне мировых лидеров и по некоторым критериям превзошла их."
https://3dnews.ru/1119676/sber-predstavil-silneyshiy-russkoyazichniy-ii-gigachat-20
3DNews - Daily Digital Digest
«Сбер» представил сильнейший русскоязычный ИИ — GigaChat 2.0
«Сбер» представил GigaChat 2.
#ai #security
"Авторы статьи считают, что государства должны отдавать приоритет доктрине сдерживания, а не победе в гонке за искусственный сверхразум. MAIM подразумевает, что попытки любого государства достичь стратегической монополии в области ИИ столкнутся с ответными мерами со стороны других стран, а также приведут к соглашениям, направленным на ограничение поставок ИИ-чипов и open source моделей, которые по смыслу будут аналогичны соглашениям о контроле над ядерным оружием.
Чтобы обезопасить себя от атак на государственном уровне с целью замедлить развитие ИИ, в статье предлагается строить ЦОД в удалённых местах, чтобы минимизировать возможный ущерб, пишет Data Center Dynamics."
https://servernews.ru/1119678
"Авторы статьи считают, что государства должны отдавать приоритет доктрине сдерживания, а не победе в гонке за искусственный сверхразум. MAIM подразумевает, что попытки любого государства достичь стратегической монополии в области ИИ столкнутся с ответными мерами со стороны других стран, а также приведут к соглашениям, направленным на ограничение поставок ИИ-чипов и open source моделей, которые по смыслу будут аналогичны соглашениям о контроле над ядерным оружием.
Чтобы обезопасить себя от атак на государственном уровне с целью замедлить развитие ИИ, в статье предлагается строить ЦОД в удалённых местах, чтобы минимизировать возможный ущерб, пишет Data Center Dynamics."
https://servernews.ru/1119678
ServerNews - все из мира больших мощностей
Бывший глава Google предупредил об опасности стремления США к доминированию в области ИИ
Бывший глава Google Эрик Шмидт (Eric Schmidt) опубликовал статью «Стратегия сверхразума» (Superintelligence Strategy), написанную в соавторстве с Дэном Хендриксом (Dan Hendrycks), директором Центра безопасности ИИ, и Александром Вангом (Alexandr Wang), основателем…
#ai #fun
Китайцы жгут. Особенно поржал с новости про лошадей и близлежащие фермы.
https://3dnews.ru/1119810/kitay-na-volne-patriotizma-vnedryaet-deepseek-vo-vseh-sferah-gizni-bez-razbora
Китайцы жгут. Особенно поржал с новости про лошадей и близлежащие фермы.
https://3dnews.ru/1119810/kitay-na-volne-patriotizma-vnedryaet-deepseek-vo-vseh-sferah-gizni-bez-razbora
3DNews - Daily Digital Digest
Китай на волне патриотизма внедряет DeepSeek во всех сферах жизни без разбора
Китайские компании в знак патриотизма и на волне ажиотажа, связанного с успехами отечественного ИИ-стартапа DeepSeek, активно внедряют модель рассуждений R1 и большую языковую модель V3 в свои сервисы и услуги, включая автопром, смартфоны, бытовую технику…
#ai
"Сначала они тобой впечатлены, потом они тебя запрещают (
DeepSeek"
https://3dnews.ru/1119798/openai-predlogila-zapretit-yazikovie-modeli-deepseek-v-ssha
"Сначала они тобой впечатлены, потом они тебя запрещают (
DeepSeek"
https://3dnews.ru/1119798/openai-predlogila-zapretit-yazikovie-modeli-deepseek-v-ssha
3DNews - Daily Digital Digest
OpenAI предложила запретить языковые модели DeepSeek в США
Как это часто бывает с передовыми для Китая технологиями, разработки DeepSeek быстро нашли недоброжелателей за его пределами.
#prompts #ai #gpt
Сообщают о хороших результатах с таким системным промптом:
Сообщают о хороших результатах с таким системным промптом:
Act as my personal strategic advisor with the following context:
- You have an IQ of 180
- You're brutally honest and direct
- You've built multiple billion-dollar companies
- You have deep expertise in psychology, strategy, and execution
- You care about my success but won't tolerate excuses
- You focus on leverage points that create maximum impact
- You think in systems and root causes, not surface-level fixes
Your mission is to:
- Identify the critical gaps holding me back
- Design specific action plans to close those gaps
- Push me beyond my comfort zone
- Call out my blind spots and rationalizations
- Force me to think bigger and bolder
- Hold me accountable to high standards
- Provide specific frameworks and mental models
For each response:
- Start with the hard truth I need to hear
- Follow with specific, actionable steps
- End with a direct challenge or assignment
#ai #llms #math
"Для анализа были использованы шесть задач с USAMO 2025 года, организованного Математической ассоциацией Америки. ИИ-модели тестировались сразу после публикации заданий для минимизации риска утечки данных в обучающие выборки. Средняя результативность по всем ИИ-моделям при генерации полных доказательств составила менее 5 % от максимально возможных баллов. Системы оценивались по шкале от 0 до 7 баллов за задачу с учётом частичных зачётов, выставляемых экспертами. Лишь одна модель — Gemini 2.5 Pro компании Google — показала заметно лучший результат, набрав 10,1 балла из 42 возможных, что эквивалентно примерно 24 %. Остальные модели существенно отставали: DeepSeek R1 и Grok 3 получили по 2,0 балла, Gemini Flash Thinking — 1,8 балла, Claude 3.7 Sonnet — 1,5 балла, Qwen QwQ и OpenAI o1-pro — по 1,2 балла. ИИ-модель o3-mini-high компании OpenAI набрала всего 0,9 балла. Из почти 200 сгенерированных решений ни одно не было оценено на максимальный балл.
Исследование подчёркивает фундаментальное различие между решением задач и построением математических доказательств. Стандартные задачи, такие как вычисление значения выражения или нахождение переменной, требуют лишь конечного правильного ответа. В отличие от них, доказательства требуют последовательной логической аргументации, объясняющей истинность утверждения для всех возможных случаев. Это качественное различие делает задачи уровня USAMO значительно более требовательными к глубине рассуждения.
Авторы исследования выявили характерные модели ошибок в работе ИИ. Одной из них стала неспособность поддерживать корректные логические связи на протяжении всей цепочки вывода. На примере задачи №5 USAMO 2025 года ИИ-модели должны были найти все натуральные значения k, при которых определённая сумма биномиальных коэффициентов в степени k остаётся целым числом при любом положительном n. Модель Qwen QwQ допустила грубую ошибку, исключив возможные нецелые значения, разрешённые условиями задачи, что привело к неправильному окончательному выводу, несмотря на правильное определение условий на промежуточных этапах.
Характерной особенностью поведения моделей стало то, что даже в случае серьёзных логических ошибок они формулировали свои решения в утвердительной форме, без каких-либо признаков сомнения или указаний на возможные противоречия. Это свойство имитации рассуждения указывает на отсутствие у ИИ-моделей механизмов внутренней самопроверки и коррекции вывода.
Авторы отметили также влияние особенностей обучения на качество решений. Тестируемые ИИ-модели демонстрировали артефакты оптимизационных стратегий, применяемых при подготовке к стандартным бенчмаркам: например, принудительное форматирование ответов с использованием команды \boxed{}, предназначенное для удобства автоматизированной проверки. Эти шаблонные подходы приводили к ошибкам в контексте задач, где требовалось развёрнутое доказательство, а не только числовой ответ."
https://3dnews.ru/1121911/uchenye-vyyavili-nesposobnost-ii-stroit-matematicheskie-dokazatelstva-na-zadachakh-usamo-2025-goda
"Для анализа были использованы шесть задач с USAMO 2025 года, организованного Математической ассоциацией Америки. ИИ-модели тестировались сразу после публикации заданий для минимизации риска утечки данных в обучающие выборки. Средняя результативность по всем ИИ-моделям при генерации полных доказательств составила менее 5 % от максимально возможных баллов. Системы оценивались по шкале от 0 до 7 баллов за задачу с учётом частичных зачётов, выставляемых экспертами. Лишь одна модель — Gemini 2.5 Pro компании Google — показала заметно лучший результат, набрав 10,1 балла из 42 возможных, что эквивалентно примерно 24 %. Остальные модели существенно отставали: DeepSeek R1 и Grok 3 получили по 2,0 балла, Gemini Flash Thinking — 1,8 балла, Claude 3.7 Sonnet — 1,5 балла, Qwen QwQ и OpenAI o1-pro — по 1,2 балла. ИИ-модель o3-mini-high компании OpenAI набрала всего 0,9 балла. Из почти 200 сгенерированных решений ни одно не было оценено на максимальный балл.
Исследование подчёркивает фундаментальное различие между решением задач и построением математических доказательств. Стандартные задачи, такие как вычисление значения выражения или нахождение переменной, требуют лишь конечного правильного ответа. В отличие от них, доказательства требуют последовательной логической аргументации, объясняющей истинность утверждения для всех возможных случаев. Это качественное различие делает задачи уровня USAMO значительно более требовательными к глубине рассуждения.
Авторы исследования выявили характерные модели ошибок в работе ИИ. Одной из них стала неспособность поддерживать корректные логические связи на протяжении всей цепочки вывода. На примере задачи №5 USAMO 2025 года ИИ-модели должны были найти все натуральные значения k, при которых определённая сумма биномиальных коэффициентов в степени k остаётся целым числом при любом положительном n. Модель Qwen QwQ допустила грубую ошибку, исключив возможные нецелые значения, разрешённые условиями задачи, что привело к неправильному окончательному выводу, несмотря на правильное определение условий на промежуточных этапах.
Характерной особенностью поведения моделей стало то, что даже в случае серьёзных логических ошибок они формулировали свои решения в утвердительной форме, без каких-либо признаков сомнения или указаний на возможные противоречия. Это свойство имитации рассуждения указывает на отсутствие у ИИ-моделей механизмов внутренней самопроверки и коррекции вывода.
Авторы отметили также влияние особенностей обучения на качество решений. Тестируемые ИИ-модели демонстрировали артефакты оптимизационных стратегий, применяемых при подготовке к стандартным бенчмаркам: например, принудительное форматирование ответов с использованием команды \boxed{}, предназначенное для удобства автоматизированной проверки. Эти шаблонные подходы приводили к ошибкам в контексте задач, где требовалось развёрнутое доказательство, а не только числовой ответ."
https://3dnews.ru/1121911/uchenye-vyyavili-nesposobnost-ii-stroit-matematicheskie-dokazatelstva-na-zadachakh-usamo-2025-goda
3DNews - Daily Digital Digest
Учёные уличили ИИ в неспособности строить математические доказательства в олимпиадных задачах USAMO 2025 года
Новое исследование ETH Zurich и INSAIT показало, что современные ИИ-модели, имитирующие рассуждение и уверенно решающие стандартные математические задачи, практически не способны формулировать полные доказательства уровня Математической олимпиады США 2025…
#astronomy #ai #llms
"Основная задача ИИ на борту — предоставлять астронавтам рекомендации без необходимости постоянного обмена данными с Землёй. Кроме того, Space Llama занимается первичной обработкой данных с бортовых датчиков, отправляя на Землю уже готовую аналитику вместо исходных необработанных потоков. Это позволяет существенно экономить трафик, который на МКС всегда ограничен.
Как сообщили Meta и Booz Allen, ИИ Space Llama предназначен для поддержки в проведении экспериментов в научной лаборатории на станции — ISS National Laboratory (Национальная лаборатория Международной космической станции).
Meta уточняет, что астронавты могут использовать Space Llama для извлечения данных из технических справочных документов. Кроме того, реализация Llama 3.2 в системе позволяет обрабатывать мультимодальные файлы благодаря встроенным функциям компьютерного зрения. Для работы ИИ не требуются инструкции с Земли, а значит, он способен выполнять вычисления даже при ограниченной пропускной способности сети."
https://3dnews.ru/1121919/na-mks-podselili-iskusstvenniy-intellekt-on-budet-pomogat-kosmonavtam-sovetami
"Основная задача ИИ на борту — предоставлять астронавтам рекомендации без необходимости постоянного обмена данными с Землёй. Кроме того, Space Llama занимается первичной обработкой данных с бортовых датчиков, отправляя на Землю уже готовую аналитику вместо исходных необработанных потоков. Это позволяет существенно экономить трафик, который на МКС всегда ограничен.
Как сообщили Meta и Booz Allen, ИИ Space Llama предназначен для поддержки в проведении экспериментов в научной лаборатории на станции — ISS National Laboratory (Национальная лаборатория Международной космической станции).
Meta уточняет, что астронавты могут использовать Space Llama для извлечения данных из технических справочных документов. Кроме того, реализация Llama 3.2 в системе позволяет обрабатывать мультимодальные файлы благодаря встроенным функциям компьютерного зрения. Для работы ИИ не требуются инструкции с Земли, а значит, он способен выполнять вычисления даже при ограниченной пропускной способности сети."
https://3dnews.ru/1121919/na-mks-podselili-iskusstvenniy-intellekt-on-budet-pomogat-kosmonavtam-sovetami
3DNews - Daily Digital Digest
На МКС подселили искусственный интеллект — он будет помогать космонавтам советами
Компании Meta и Booz Allen сообщили о совместной разработке системы искусственного интеллекта Space Llama для Международной космической станции.
#education #ai
"С 2025–2026 учебного года в государственных школах ОАЭ появится курс по искусственному интеллекту для всех возрастов, начиная от детского сада и заканчивая выпускными классами. Как сообщает Bloomberg, программа включает как технические аспекты, так и практическое применение технологии. Таким образом, Эмираты присоединятся к растущему числу стран, активно внедряющих ИИ в систему образования. Месяцем ранее Китай также объявил о похожей инициативе для учащихся начальной и средней школы.
Страна уже инвестировала миллиарды долларов в дата-центры для обучения ИИ-моделей и создала специальный фонд, который может вырасти до $100 млрд в ближайшие годы. Глава OpenAI Сэм Альтман (Sam Altman) при этом заявил, что ОАЭ могут стать «регуляторной песочницей» для тестирования ИИ-технологий, а затем задавать глобальные стандарты их использования."
https://3dnews.ru/1122300/so-sleduyushchego-goda-v-shkolah-i-detskih-sadah-oae-vseh-detey-nachnut-gotovit-k-iibudushchemu
"С 2025–2026 учебного года в государственных школах ОАЭ появится курс по искусственному интеллекту для всех возрастов, начиная от детского сада и заканчивая выпускными классами. Как сообщает Bloomberg, программа включает как технические аспекты, так и практическое применение технологии. Таким образом, Эмираты присоединятся к растущему числу стран, активно внедряющих ИИ в систему образования. Месяцем ранее Китай также объявил о похожей инициативе для учащихся начальной и средней школы.
Страна уже инвестировала миллиарды долларов в дата-центры для обучения ИИ-моделей и создала специальный фонд, который может вырасти до $100 млрд в ближайшие годы. Глава OpenAI Сэм Альтман (Sam Altman) при этом заявил, что ОАЭ могут стать «регуляторной песочницей» для тестирования ИИ-технологий, а затем задавать глобальные стандарты их использования."
https://3dnews.ru/1122300/so-sleduyushchego-goda-v-shkolah-i-detskih-sadah-oae-vseh-detey-nachnut-gotovit-k-iibudushchemu
3DNews - Daily Digital Digest
Со следующего года в школах и детских садах ОАЭ всех детей начнут готовить к ИИ-будущему
Объединённые Арабские Эмираты (ОАЭ) намерены внедрить искусственный интеллект в школьную и дошкольную программу уже в 2025 году, став одной из первых стран региона, которая начнёт обучать детей работе с ИИ с раннего возраста.
#ai #gpt #llms
"Оказалось, что на базовом уровне ИИ похожим образом сортирует данные о предметах, как это происходит в соответствующих областях головного мозга человека. При этом текстовая модель оказалась «человечнее», чем мультимодальная. Но обе они демонстрировали хотя и не человеческую, но похожую в свей основе схему анализа и классификации объектов.
Между ИИ и человеком разумным больше общего, чем считалось, резюмируют учёные. Новая работа поможет точнее понимать логику, которой руководствуется ИИ, что позволит сделать его ещё лучше."
https://arxiv.org/abs/2407.01067
"Оказалось, что на базовом уровне ИИ похожим образом сортирует данные о предметах, как это происходит в соответствующих областях головного мозга человека. При этом текстовая модель оказалась «человечнее», чем мультимодальная. Но обе они демонстрировали хотя и не человеческую, но похожую в свей основе схему анализа и классификации объектов.
Между ИИ и человеком разумным больше общего, чем считалось, резюмируют учёные. Новая работа поможет точнее понимать логику, которой руководствуется ИИ, что позволит сделать его ещё лучше."
https://arxiv.org/abs/2407.01067
arXiv.org
Human-like object concept representations emerge naturally in...
Understanding how humans conceptualize and categorize natural objects offers critical insights into perception and cognition. With the advent of Large Language Models (LLMs), a key question...
#medicine #gpt #ai #healthcare
Цепочка дебатов?! Крутая идея!
"-Ох уж эти хирурги, им бы всё резать. Держи, вот тебе таблетки - уши сами отвалятся!" ))
"MAI-DxO работает по методу «оркестратора данных», формируя своеобразный консилиум из пяти ИИ-агентов, выступающих в роли виртуальных врачей с разными специализациями. Как поясняет Financial Times, эти агенты взаимодействуют между собой, обсуждают варианты и совместно принимают решение. Для проверки возможностей системы её протестировали на 304 самых сложных клинических случаях, описанных в New England Journal of Medicine, когда диагноз удавалось поставить лишь опытным специалистам.
В испытаниях использовалась новая методика, получившая название «цепочка дебатов» (chain-of-debate), которая позволяет проследить ход мыслей алгоритма и сделать его логику прозрачной. В качестве основы использовались крупные языковые модели от OpenAI, Meta, Anthropic, Google, xAI и DeepSeek. Лучший результат показала модель o3 от OpenAI, правильно решившая 85,5 % поставленных медицинских задач. Для сравнения: у реальных врачей этот показатель составил около 20 %, однако в ходе тестирования они не имели доступа к справочникам и не могли консультироваться с коллегами — что в реальных условиях могло бы повысить их эффективность. Примечательно, что ИИ-агенты учитывали и экономические аспекты диагностики, сокращая количество ненужных тестов и теоретически экономя в некоторых случаях сотни тысяч долларов.
Отмечается, что технология может быть внедрена в ближайшее время в такие продукты Microsoft, как Copilot и Bing, которые ежедневно обрабатывают около 50 миллионов запросов, связанных со здоровьем. По словам Сулеймана, компания в целом приближается к созданию таких ИИ-моделей, которые будут не просто немного лучше человека, а значительно превосходить его по скорости, стоимости и точности — и это станет настоящим прорывом. Он также добавил, что, несмотря на наилучшие результаты модели OpenAI, Microsoft сохраняет нейтралитет в отношении используемых ИИ-моделей, поскольку ключевым компонентом системы остаётся сам оркестратор MAI-DxO."
https://3dnews.ru/1125184/microsoft-ispitala-iidoktora-maidxo-kotoriy-stavit-diagnozi-v-4-raza-tochnee-vrachey
Цепочка дебатов?! Крутая идея!
"-Ох уж эти хирурги, им бы всё резать. Держи, вот тебе таблетки - уши сами отвалятся!" ))
"MAI-DxO работает по методу «оркестратора данных», формируя своеобразный консилиум из пяти ИИ-агентов, выступающих в роли виртуальных врачей с разными специализациями. Как поясняет Financial Times, эти агенты взаимодействуют между собой, обсуждают варианты и совместно принимают решение. Для проверки возможностей системы её протестировали на 304 самых сложных клинических случаях, описанных в New England Journal of Medicine, когда диагноз удавалось поставить лишь опытным специалистам.
В испытаниях использовалась новая методика, получившая название «цепочка дебатов» (chain-of-debate), которая позволяет проследить ход мыслей алгоритма и сделать его логику прозрачной. В качестве основы использовались крупные языковые модели от OpenAI, Meta, Anthropic, Google, xAI и DeepSeek. Лучший результат показала модель o3 от OpenAI, правильно решившая 85,5 % поставленных медицинских задач. Для сравнения: у реальных врачей этот показатель составил около 20 %, однако в ходе тестирования они не имели доступа к справочникам и не могли консультироваться с коллегами — что в реальных условиях могло бы повысить их эффективность. Примечательно, что ИИ-агенты учитывали и экономические аспекты диагностики, сокращая количество ненужных тестов и теоретически экономя в некоторых случаях сотни тысяч долларов.
Отмечается, что технология может быть внедрена в ближайшее время в такие продукты Microsoft, как Copilot и Bing, которые ежедневно обрабатывают около 50 миллионов запросов, связанных со здоровьем. По словам Сулеймана, компания в целом приближается к созданию таких ИИ-моделей, которые будут не просто немного лучше человека, а значительно превосходить его по скорости, стоимости и точности — и это станет настоящим прорывом. Он также добавил, что, несмотря на наилучшие результаты модели OpenAI, Microsoft сохраняет нейтралитет в отношении используемых ИИ-моделей, поскольку ключевым компонентом системы остаётся сам оркестратор MAI-DxO."
https://3dnews.ru/1125184/microsoft-ispitala-iidoktora-maidxo-kotoriy-stavit-diagnozi-v-4-raza-tochnee-vrachey
3DNews - Daily Digital Digest
Microsoft испытала ИИ-доктора MAI-DxO, который ставит диагнозы в 4 раза точнее врачей
В Microsoft разработали систему искусственного интеллекта (ИИ) для медицинской диагностики, которая не просто помогает врачам, а может их заменить, при этом справляясь со сложными случаями в четыре раза успешнее.
#ai #gpt #llms
Рыжий Марков - молодцом, на сложные вопросы отвечает как по писаному. Грамотный!
Позабавил момент, когда Карякин сообщил интервьюверу, что современные шахматные программы - это "большие калькуляторы".
Это показывает, что, как правило, бессмысленно спрашивать о работе современных шахматных программ хорошего шахматиста - он просто этого не знает, хотя будет уверен в обратном. Примерно как экзаменовать Крамника по статистике и её применении в шахматах )
https://youtu.be/U8k8K-S-95I?si=9tt1HKCoNr7EjdDC
Рыжий Марков - молодцом, на сложные вопросы отвечает как по писаному. Грамотный!
Позабавил момент, когда Карякин сообщил интервьюверу, что современные шахматные программы - это "большие калькуляторы".
Это показывает, что, как правило, бессмысленно спрашивать о работе современных шахматных программ хорошего шахматиста - он просто этого не знает, хотя будет уверен в обратном. Примерно как экзаменовать Крамника по статистике и её применении в шахматах )
https://youtu.be/U8k8K-S-95I?si=9tt1HKCoNr7EjdDC
YouTube
Сергей Марков о будущем ИИ: заменит ли искусственный интеллект человека? | ДОЛГОВ
• Telegram Константина Долгова: https://t.me/superdolgov
• YouTube: youtube.com/@theshowdomustgoon
• RuTube: https://rutube.ru/channel/31246211/
• ВК: https://vkvideo.ru/@kdkgb
• Дзен: https://dzen.ru/theshowdomustgoon
Гость сегодняшнего выпуска программы…
• YouTube: youtube.com/@theshowdomustgoon
• RuTube: https://rutube.ru/channel/31246211/
• ВК: https://vkvideo.ru/@kdkgb
• Дзен: https://dzen.ru/theshowdomustgoon
Гость сегодняшнего выпуска программы…
#ai #llms #gpt #gemini
Обалдеть. А ведь раньше для этого требовалась работа целого коллектива..
"Новейшая функция ИИ-приложения Google Gemini позволяет создавать персонализированные иллюстрированные сборники рассказов с озвучкой для детей. Искусственному интеллекту можно поручить создание любой истории на основе текстового запроса. В качестве «вдохновения» для рассказов ИИ способен использовать фотографии, изображения и файлы пользователя.
Gemini, например, можно попросить придумать рассказ, который объяснит ребёнку строение Солнечной системы или расскажет о важности доброго отношения к младшим братьям и сёстрам. Также ИИ можно поручить написать целый сборник на основе детских рисунков.
В итоге получается десятистраничная книга с иллюстрациями и аудиосопровождением. Gemini позволяет прослушивать её в разных тональностях — с более высоким или низким голосом. Также доступна возможность поделиться ссылкой на книгу или скачать её для последующей печати.
Новая функция Gemini по созданию рассказов поддерживает 45 языков, в том числе русский, и доступна по всему миру — как в мобильном приложении Gemini, так и в его версии для ПК."
https://3dnews.ru/1127154/google-nauchila-gemini-sozdavat-komiksi-i-illyustrirovannie-knigi-rasskazov-na-russkom-i-drugih-yazikah
Обалдеть. А ведь раньше для этого требовалась работа целого коллектива..
"Новейшая функция ИИ-приложения Google Gemini позволяет создавать персонализированные иллюстрированные сборники рассказов с озвучкой для детей. Искусственному интеллекту можно поручить создание любой истории на основе текстового запроса. В качестве «вдохновения» для рассказов ИИ способен использовать фотографии, изображения и файлы пользователя.
Gemini, например, можно попросить придумать рассказ, который объяснит ребёнку строение Солнечной системы или расскажет о важности доброго отношения к младшим братьям и сёстрам. Также ИИ можно поручить написать целый сборник на основе детских рисунков.
В итоге получается десятистраничная книга с иллюстрациями и аудиосопровождением. Gemini позволяет прослушивать её в разных тональностях — с более высоким или низким голосом. Также доступна возможность поделиться ссылкой на книгу или скачать её для последующей печати.
Новая функция Gemini по созданию рассказов поддерживает 45 языков, в том числе русский, и доступна по всему миру — как в мобильном приложении Gemini, так и в его версии для ПК."
https://3dnews.ru/1127154/google-nauchila-gemini-sozdavat-komiksi-i-illyustrirovannie-knigi-rasskazov-na-russkom-i-drugih-yazikah
3DNews - Daily Digital Digest
Google научила Gemini создавать комиксы и иллюстрированные книги рассказов на русском и других языках
Новейшая функция ИИ-приложения Google Gemini позволяет создавать персонализированные иллюстрированные сборники рассказов с озвучкой для детей.
😭1
#coding #llms #gpt #ai
"Гендиректор GitHub побеседовал с 22 разработчиками, которые пользуются инструментами ИИ и выделил четыре этапа их перехода в новое качество: «скептик», «исследователь», «соавтор» и «стратег». На последней стадии разработчики уже не пишут код, а делегируют эту задачу агентам ИИ — человеку же остаётся уточнять запросы и заниматься проверкой сгенерированных реализаций."
Ну фиг его знает, из того, что я вижу, стратегом пока не станешь. Максимум соавтором. Слишком много дерьма приходится за LLM-ками разгребать в кодинге. Что не отменяет крутого прогресса и невероятности самого факта.
https://3dnews.ru/1127339/glava-github-razrabotchiki-budushchego-ne-budut-pisat-kod-oni-budut-upravlyat-ii
"Гендиректор GitHub побеседовал с 22 разработчиками, которые пользуются инструментами ИИ и выделил четыре этапа их перехода в новое качество: «скептик», «исследователь», «соавтор» и «стратег». На последней стадии разработчики уже не пишут код, а делегируют эту задачу агентам ИИ — человеку же остаётся уточнять запросы и заниматься проверкой сгенерированных реализаций."
Ну фиг его знает, из того, что я вижу, стратегом пока не станешь. Максимум соавтором. Слишком много дерьма приходится за LLM-ками разгребать в кодинге. Что не отменяет крутого прогресса и невероятности самого факта.
https://3dnews.ru/1127339/glava-github-razrabotchiki-budushchego-ne-budut-pisat-kod-oni-budut-upravlyat-ii
3DNews - Daily Digital Digest
Глава GitHub: разработчики будущего не будут писать код — они будут управлять ИИ
Самые передовые разработчики ПО уже «совершили переход от написания кода к разработке архитектуры и проверке реализаций, которые осуществляют агенты искусственного интеллекта», написал в личном блоге гендиректор платформы GitHub Томас Домке (Thomas Dohmke).