Aspiring Data Science

77 viewsAnatoly Alekseev, edited 05:07

#python #llms #ai #gpt

https://www.youtube.com/watch?v=J-vxmg_kQVU

Тестирую 13 ЛУЧШИХ нейросетей в реальной задаче разработчика

В этом видео мы сравним лучшие нейросети по рейтингу LMSYS arena в задаче написания кода! Будем разрабатывать свой аналог chatGPT.
🔥 Список нейросетей в тесте:
claude 3.7
claude 3.7 think
grok 3
grok 3 think
gemini 2.0 flash
gemini 2.0 flash think
openai…

98 viewsAnatoly Alekseev, 07:24

Aspiring Data Science

#coding #ai #llms #gpt

108 viewsAnatoly Alekseev, 08:50

Aspiring Data Science

#llms #ai #mistral #pdf #ocr

"Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы."

https://3dnews.ru/1119379/mistral-ai-predstavila-instrument-kotoriy-prevratit-lyuboy-pdfdokument-tekstoviy-fayl-dlya-ii

3DNews - Daily Digital Digest

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов.

114 viewsAnatoly Alekseev, edited 14:33

Aspiring Data Science

#dyatlovpass #mysteries #ai #nlp #criminology

В очередной раз попалось в рекомендациях видео по загадке трагической гибели туристов на перевале Дятлова.

Это хорошо документированная, но не имеющая очевидного решения тайна 1959-го года.

Есть десятки версий, ни одна полностью не объясняет всю фактологическую базу.

Дело осложняется тем, что "интернет-эксперты", авторы версий, зачастую не дружат с логикой и не способны делать корректные выводы даже из ясных и простых посылок.

У меня давно была идея сконструировать экспертную систему с материалами дела, с визуализацией цепочки событий (по времени и месту), "нечёткой логикой", и, самое главное, системой оценки и сравнения версий.

Каждый факт (свидетельство с определённой степенью достоверности) из экспертной системы может противоречить либо не противоречить определённой версии.

Тогда можно было бы найти версию, объясняющую наибольший объём фактов, определить недостоверные факты и даже недостоверные источники информации.

Раньше не было возможности такое запилить, но с современным ИИ это стало возможным в течение последних 2 лет.

Эта система, в случае создания, может быть масштабирована на все сложные криминологические случаи.

Ну и в целом это может быть прикольным проектом, с авто анализом текстов, изображений, геомоделированием, психологией.

Если кто вдруг заинтересован в совместной работе в этом направлении, пишите.

Wikipedia

Гибель тургруппы Дятлова

невыясненная гибель группы туристов в 1959 году на Северном Урале

👍1

114 viewsAnatoly Alekseev, edited 07:27

Aspiring Data Science

#ai #llms #gpt

"В моделях семейства GigaChat 2.0 улучшена работа с контекстом беседы: они способны отвечать на сложные длинные вопросы и анализировать увеличенные объёмы текста. Если ранее максимальный объём составлял 48 страниц A4 (шрифт 14 pt), то теперь этот показатель вырос до 200 страниц. Это позволяет создавать более качественные чат-боты на основе GigaChat 2.0. Вдвое увеличилась способность следовать инструкциям пользователя, а качество ответов на вопросы повысилось на 25 %.

Флагманская GigaChat 2 MAX заняла первое место среди ИИ-моделей в независимом тесте MERA для русского языка. В бенчмарках MMLU на русском и английском она показала результаты на уровне мировых лидеров и по некоторым критериям превзошла их."

https://3dnews.ru/1119676/sber-predstavil-silneyshiy-russkoyazichniy-ii-gigachat-20

3DNews - Daily Digital Digest

«Сбер» представил сильнейший русскоязычный ИИ — GigaChat 2.0

«Сбер» представил GigaChat 2.

115 viewsAnatoly Alekseev, edited 16:16

Aspiring Data Science

#ai #security

"Авторы статьи считают, что государства должны отдавать приоритет доктрине сдерживания, а не победе в гонке за искусственный сверхразум. MAIM подразумевает, что попытки любого государства достичь стратегической монополии в области ИИ столкнутся с ответными мерами со стороны других стран, а также приведут к соглашениям, направленным на ограничение поставок ИИ-чипов и open source моделей, которые по смыслу будут аналогичны соглашениям о контроле над ядерным оружием.

Чтобы обезопасить себя от атак на государственном уровне с целью замедлить развитие ИИ, в статье предлагается строить ЦОД в удалённых местах, чтобы минимизировать возможный ущерб, пишет Data Center Dynamics."

https://servernews.ru/1119678

ServerNews - все из мира больших мощностей

Бывший глава Google предупредил об опасности стремления США к доминированию в области ИИ

Бывший глава Google Эрик Шмидт (Eric Schmidt) опубликовал статью «Стратегия сверхразума» (Superintelligence Strategy), написанную в соавторстве с Дэном Хендриксом (Dan Hendrycks), директором Центра безопасности ИИ, и Александром Вангом (Alexandr Wang), основателем…

121 viewsAnatoly Alekseev, 14:04

Aspiring Data Science

#ai #fun

Китайцы жгут. Особенно поржал с новости про лошадей и близлежащие фермы.

https://3dnews.ru/1119810/kitay-na-volne-patriotizma-vnedryaet-deepseek-vo-vseh-sferah-gizni-bez-razbora

3DNews - Daily Digital Digest

Китай на волне патриотизма внедряет DeepSeek во всех сферах жизни без разбора

Китайские компании в знак патриотизма и на волне ажиотажа, связанного с успехами отечественного ИИ-стартапа DeepSeek, активно внедряют модель рассуждений R1 и большую языковую модель V3 в свои сервисы и услуги, включая автопром, смартфоны, бытовую технику…

96 viewsAnatoly Alekseev, 14:50

Aspiring Data Science

#ai

"Сначала они тобой впечатлены, потом они тебя запрещают (

DeepSeek"

https://3dnews.ru/1119798/openai-predlogila-zapretit-yazikovie-modeli-deepseek-v-ssha

3DNews - Daily Digital Digest

OpenAI предложила запретить языковые модели DeepSeek в США

Как это часто бывает с передовыми для Китая технологиями, разработки DeepSeek быстро нашли недоброжелателей за его пределами.

101 viewsAnatoly Alekseev, edited 14:52

Aspiring Data Science

#prompts #ai #gpt

Сообщают о хороших результатах с таким системным промптом:

Act as my personal strategic advisor with the following context:

- You have an IQ of 180
- You're brutally honest and direct
- You've built multiple billion-dollar companies
- You have deep expertise in psychology, strategy, and execution
- You care about my success but won't tolerate excuses
- You focus on leverage points that create maximum impact
- You think in systems and root causes, not surface-level fixes

Your mission is to:

- Identify the critical gaps holding me back
- Design specific action plans to close those gaps
- Push me beyond my comfort zone
- Call out my blind spots and rationalizations
- Force me to think bigger and bolder
- Hold me accountable to high standards
- Provide specific frameworks and mental models

For each response:

- Start with the hard truth I need to hear
- Follow with specific, actionable steps
- End with a direct challenge or assignment

132 viewsAnatoly Alekseev, 03:38

Aspiring Data Science

#ai #llms #math

"Для анализа были использованы шесть задач с USAMO 2025 года, организованного Математической ассоциацией Америки. ИИ-модели тестировались сразу после публикации заданий для минимизации риска утечки данных в обучающие выборки. Средняя результативность по всем ИИ-моделям при генерации полных доказательств составила менее 5 % от максимально возможных баллов. Системы оценивались по шкале от 0 до 7 баллов за задачу с учётом частичных зачётов, выставляемых экспертами. Лишь одна модель — Gemini 2.5 Pro компании Google — показала заметно лучший результат, набрав 10,1 балла из 42 возможных, что эквивалентно примерно 24 %. Остальные модели существенно отставали: DeepSeek R1 и Grok 3 получили по 2,0 балла, Gemini Flash Thinking — 1,8 балла, Claude 3.7 Sonnet — 1,5 балла, Qwen QwQ и OpenAI o1-pro — по 1,2 балла. ИИ-модель o3-mini-high компании OpenAI набрала всего 0,9 балла. Из почти 200 сгенерированных решений ни одно не было оценено на максимальный балл.

Исследование подчёркивает фундаментальное различие между решением задач и построением математических доказательств. Стандартные задачи, такие как вычисление значения выражения или нахождение переменной, требуют лишь конечного правильного ответа. В отличие от них, доказательства требуют последовательной логической аргументации, объясняющей истинность утверждения для всех возможных случаев. Это качественное различие делает задачи уровня USAMO значительно более требовательными к глубине рассуждения.

Авторы исследования выявили характерные модели ошибок в работе ИИ. Одной из них стала неспособность поддерживать корректные логические связи на протяжении всей цепочки вывода. На примере задачи №5 USAMO 2025 года ИИ-модели должны были найти все натуральные значения k, при которых определённая сумма биномиальных коэффициентов в степени k остаётся целым числом при любом положительном n. Модель Qwen QwQ допустила грубую ошибку, исключив возможные нецелые значения, разрешённые условиями задачи, что привело к неправильному окончательному выводу, несмотря на правильное определение условий на промежуточных этапах.

Характерной особенностью поведения моделей стало то, что даже в случае серьёзных логических ошибок они формулировали свои решения в утвердительной форме, без каких-либо признаков сомнения или указаний на возможные противоречия. Это свойство имитации рассуждения указывает на отсутствие у ИИ-моделей механизмов внутренней самопроверки и коррекции вывода.

Авторы отметили также влияние особенностей обучения на качество решений. Тестируемые ИИ-модели демонстрировали артефакты оптимизационных стратегий, применяемых при подготовке к стандартным бенчмаркам: например, принудительное форматирование ответов с использованием команды \boxed{}, предназначенное для удобства автоматизированной проверки. Эти шаблонные подходы приводили к ошибкам в контексте задач, где требовалось развёрнутое доказательство, а не только числовой ответ."

https://3dnews.ru/1121911/uchenye-vyyavili-nesposobnost-ii-stroit-matematicheskie-dokazatelstva-na-zadachakh-usamo-2025-goda

3DNews - Daily Digital Digest

Учёные уличили ИИ в неспособности строить математические доказательства в олимпиадных задачах USAMO 2025 года

Новое исследование ETH Zurich и INSAIT показало, что современные ИИ-модели, имитирующие рассуждение и уверенно решающие стандартные математические задачи, практически не способны формулировать полные доказательства уровня Математической олимпиады США 2025…

86 viewsAnatoly Alekseev, 18:05

Aspiring Data Science

#astronomy #ai #llms

"Основная задача ИИ на борту — предоставлять астронавтам рекомендации без необходимости постоянного обмена данными с Землёй. Кроме того, Space Llama занимается первичной обработкой данных с бортовых датчиков, отправляя на Землю уже готовую аналитику вместо исходных необработанных потоков. Это позволяет существенно экономить трафик, который на МКС всегда ограничен.

Как сообщили Meta и Booz Allen, ИИ Space Llama предназначен для поддержки в проведении экспериментов в научной лаборатории на станции — ISS National Laboratory (Национальная лаборатория Международной космической станции).

Meta уточняет, что астронавты могут использовать Space Llama для извлечения данных из технических справочных документов. Кроме того, реализация Llama 3.2 в системе позволяет обрабатывать мультимодальные файлы благодаря встроенным функциям компьютерного зрения. Для работы ИИ не требуются инструкции с Земли, а значит, он способен выполнять вычисления даже при ограниченной пропускной способности сети."

https://3dnews.ru/1121919/na-mks-podselili-iskusstvenniy-intellekt-on-budet-pomogat-kosmonavtam-sovetami

3DNews - Daily Digital Digest

На МКС подселили искусственный интеллект — он будет помогать космонавтам советами

Компании Meta и Booz Allen сообщили о совместной разработке системы искусственного интеллекта Space Llama для Международной космической станции.

95 viewsAnatoly Alekseev, 18:13

Aspiring Data Science

#dl #ai #math #alphaproof

https://www.youtube.com/watch?v=ygqNjojA3Hk

YouTube

СПбМО -- 2025.04.22 -- AI в математике

Это запись доклада "AI и математика: что модели могут сейчас и куда мы идём" на заседании Санкт-Петербургского математического общества 22 апреля 2025 года.

Подписывайтесь на мой телеграм-канал "Sineкура":
https://t.me/sinecor

Слайды доклада размещены на…

86 viewsAnatoly Alekseev, edited 10:40

Aspiring Data Science

#education #ai

"С 2025–2026 учебного года в государственных школах ОАЭ появится курс по искусственному интеллекту для всех возрастов, начиная от детского сада и заканчивая выпускными классами. Как сообщает Bloomberg, программа включает как технические аспекты, так и практическое применение технологии. Таким образом, Эмираты присоединятся к растущему числу стран, активно внедряющих ИИ в систему образования. Месяцем ранее Китай также объявил о похожей инициативе для учащихся начальной и средней школы.

Страна уже инвестировала миллиарды долларов в дата-центры для обучения ИИ-моделей и создала специальный фонд, который может вырасти до $100 млрд в ближайшие годы. Глава OpenAI Сэм Альтман (Sam Altman) при этом заявил, что ОАЭ могут стать «регуляторной песочницей» для тестирования ИИ-технологий, а затем задавать глобальные стандарты их использования."

https://3dnews.ru/1122300/so-sleduyushchego-goda-v-shkolah-i-detskih-sadah-oae-vseh-detey-nachnut-gotovit-k-iibudushchemu

3DNews - Daily Digital Digest

Со следующего года в школах и детских садах ОАЭ всех детей начнут готовить к ИИ-будущему

Объединённые Арабские Эмираты (ОАЭ) намерены внедрить искусственный интеллект в школьную и дошкольную программу уже в 2025 году, став одной из первых стран региона, которая начнёт обучать детей работе с ИИ с раннего возраста.

93 viewsAnatoly Alekseev, 03:09

Aspiring Data Science

#ai #gpt #llms

"Оказалось, что на базовом уровне ИИ похожим образом сортирует данные о предметах, как это происходит в соответствующих областях головного мозга человека. При этом текстовая модель оказалась «человечнее», чем мультимодальная. Но обе они демонстрировали хотя и не человеческую, но похожую в свей основе схему анализа и классификации объектов.

Между ИИ и человеком разумным больше общего, чем считалось, резюмируют учёные. Новая работа поможет точнее понимать логику, которой руководствуется ИИ, что позволит сделать его ещё лучше."

https://arxiv.org/abs/2407.01067

arXiv.org

Human-like object concept representations emerge naturally in...

Understanding how humans conceptualize and categorize natural objects offers critical insights into perception and cognition. With the advent of Large Language Models (LLMs), a key question...

123 viewsAnatoly Alekseev, 18:33

Aspiring Data Science

#medicine #gpt #ai #healthcare

Цепочка дебатов?! Крутая идея!

"-Ох уж эти хирурги, им бы всё резать. Держи, вот тебе таблетки - уши сами отвалятся!" ))

"MAI-DxO работает по методу «оркестратора данных», формируя своеобразный консилиум из пяти ИИ-агентов, выступающих в роли виртуальных врачей с разными специализациями. Как поясняет Financial Times, эти агенты взаимодействуют между собой, обсуждают варианты и совместно принимают решение. Для проверки возможностей системы её протестировали на 304 самых сложных клинических случаях, описанных в New England Journal of Medicine, когда диагноз удавалось поставить лишь опытным специалистам.

В испытаниях использовалась новая методика, получившая название «цепочка дебатов» (chain-of-debate), которая позволяет проследить ход мыслей алгоритма и сделать его логику прозрачной. В качестве основы использовались крупные языковые модели от OpenAI, Meta, Anthropic, Google, xAI и DeepSeek. Лучший результат показала модель o3 от OpenAI, правильно решившая 85,5 % поставленных медицинских задач. Для сравнения: у реальных врачей этот показатель составил около 20 %, однако в ходе тестирования они не имели доступа к справочникам и не могли консультироваться с коллегами — что в реальных условиях могло бы повысить их эффективность. Примечательно, что ИИ-агенты учитывали и экономические аспекты диагностики, сокращая количество ненужных тестов и теоретически экономя в некоторых случаях сотни тысяч долларов.

Отмечается, что технология может быть внедрена в ближайшее время в такие продукты Microsoft, как Copilot и Bing, которые ежедневно обрабатывают около 50 миллионов запросов, связанных со здоровьем. По словам Сулеймана, компания в целом приближается к созданию таких ИИ-моделей, которые будут не просто немного лучше человека, а значительно превосходить его по скорости, стоимости и точности — и это станет настоящим прорывом. Он также добавил, что, несмотря на наилучшие результаты модели OpenAI, Microsoft сохраняет нейтралитет в отношении используемых ИИ-моделей, поскольку ключевым компонентом системы остаётся сам оркестратор MAI-DxO."

https://3dnews.ru/1125184/microsoft-ispitala-iidoktora-maidxo-kotoriy-stavit-diagnozi-v-4-raza-tochnee-vrachey

3DNews - Daily Digital Digest

Microsoft испытала ИИ-доктора MAI-DxO, который ставит диагнозы в 4 раза точнее врачей

В Microsoft разработали систему искусственного интеллекта (ИИ) для медицинской диагностики, которая не просто помогает врачам, а может их заменить, при этом справляясь со сложными случаями в четыре раза успешнее.

103 viewsAnatoly Alekseev, edited 00:59

Aspiring Data Science

#ai #gpt #llms

Рыжий Марков - молодцом, на сложные вопросы отвечает как по писаному. Грамотный!

Позабавил момент, когда Карякин сообщил интервьюверу, что современные шахматные программы - это "большие калькуляторы".

Это показывает, что, как правило, бессмысленно спрашивать о работе современных шахматных программ хорошего шахматиста - он просто этого не знает, хотя будет уверен в обратном. Примерно как экзаменовать Крамника по статистике и её применении в шахматах )

https://youtu.be/U8k8K-S-95I?si=9tt1HKCoNr7EjdDC

YouTube

Сергей Марков о будущем ИИ: заменит ли искусственный интеллект человека? | ДОЛГОВ

• Telegram Константина Долгова: https://t.me/superdolgov
• YouTube: youtube.com/@theshowdomustgoon
• RuTube: https://rutube.ru/channel/31246211/
• ВК: https://vkvideo.ru/@kdkgb
• Дзен: https://dzen.ru/theshowdomustgoon

Гость сегодняшнего выпуска программы…

111 viewsAnatoly Alekseev, edited 17:34

Aspiring Data Science

#ai #llms #gpt #gemini

Обалдеть. А ведь раньше для этого требовалась работа целого коллектива..

"Новейшая функция ИИ-приложения Google Gemini позволяет создавать персонализированные иллюстрированные сборники рассказов с озвучкой для детей. Искусственному интеллекту можно поручить создание любой истории на основе текстового запроса. В качестве «вдохновения» для рассказов ИИ способен использовать фотографии, изображения и файлы пользователя.

Gemini, например, можно попросить придумать рассказ, который объяснит ребёнку строение Солнечной системы или расскажет о важности доброго отношения к младшим братьям и сёстрам. Также ИИ можно поручить написать целый сборник на основе детских рисунков.

В итоге получается десятистраничная книга с иллюстрациями и аудиосопровождением. Gemini позволяет прослушивать её в разных тональностях — с более высоким или низким голосом. Также доступна возможность поделиться ссылкой на книгу или скачать её для последующей печати.

Новая функция Gemini по созданию рассказов поддерживает 45 языков, в том числе русский, и доступна по всему миру — как в мобильном приложении Gemini, так и в его версии для ПК."

https://3dnews.ru/1127154/google-nauchila-gemini-sozdavat-komiksi-i-illyustrirovannie-knigi-rasskazov-na-russkom-i-drugih-yazikah

3DNews - Daily Digital Digest

Google научила Gemini создавать комиксы и иллюстрированные книги рассказов на русском и других языках

Новейшая функция ИИ-приложения Google Gemini позволяет создавать персонализированные иллюстрированные сборники рассказов с озвучкой для детей.

😭1

93 viewsAnatoly Alekseev, edited 05:30

Aspiring Data Science

#coding #llms #gpt #ai

"Гендиректор GitHub побеседовал с 22 разработчиками, которые пользуются инструментами ИИ и выделил четыре этапа их перехода в новое качество: «скептик», «исследователь», «соавтор» и «стратег». На последней стадии разработчики уже не пишут код, а делегируют эту задачу агентам ИИ — человеку же остаётся уточнять запросы и заниматься проверкой сгенерированных реализаций."

Ну фиг его знает, из того, что я вижу, стратегом пока не станешь. Максимум соавтором. Слишком много дерьма приходится за LLM-ками разгребать в кодинге. Что не отменяет крутого прогресса и невероятности самого факта.

https://3dnews.ru/1127339/glava-github-razrabotchiki-budushchego-ne-budut-pisat-kod-oni-budut-upravlyat-ii

3DNews - Daily Digital Digest

Глава GitHub: разработчики будущего не будут писать код — они будут управлять ИИ

Самые передовые разработчики ПО уже «совершили переход от написания кода к разработке архитектуры и проверке реализаций, которые осуществляют агенты искусственного интеллекта», написал в личном блоге гендиректор платформы GitHub Томас Домке (Thomas Dohmke).

89 viewsAnatoly Alekseev, 06:31

Aspiring Data Science

#llms #ai #gpt

https://www.youtube.com/watch?v=u44m5cY0JOg

YouTube

Иван Бондаренко | GPT для бедных. Зачем нужны малые языковые модели?

Спикер: Иван Бондаренко, Индустриальный доцент НГУ, научный сотрудник лаб. прикладных цифровых технологий ММФ НГУ

Data Fest 2025: https://ods.ai/events/datafest2025
Презентацию к докладу можно скачать в треке секции NLP: https://ods.ai/tracks/df25-nlp
______…

92 viewsAnatoly Alekseev, 07:27

About

Blog

Apps

Platform