93 subscribers
46 photos
5 videos
27 files
265 links
Machine learning
Download Telegram
Свежий доклад от Microsoft - AI Diffusion Report: Where AI is most used, developed and built

Там текст на 24 страницы, читается быстро, вот ключевые факты и выводы

- Глобальное среднее значение по AI User Share составляет примерно 15 % трудоспособного населения
- Лидеры по доле пользователей ИИ:
* ОАЭ ~59.4 %
* Сингапур ~58.6 %
* Другие страны-лидеры: Норвегия, Ирландия, Франция и др.
- Региональные различия:
* Северная Америка: ~27 %
* Европа и Центральная Азия: ~22 %
* Южная Азия и Субсахарская Африка: менее ~13 %
- Сильная корреляция между уровнем внедрения Ml и ВВП на душу населения: коэффициент Спирмена ~0.83, p-значение < 0.000001.
- При анализе населения, имеющего доступ к интернету («connected population»), выяснилось: даже в странах с низким общим проникновением интернета пользователи, подключенные к сети, часто уже активно пользуются Ml
Например:
* В Замбии: общая доля ~12 %, но среди подключенных ~34 %
* В Пакистане: с ~10 % до ~33 %
- Запуск продукта DeepSeek (январь 2025) привёл к резкому росту доли пользователей Ml в Китае: с ~8 % до ~20 %
- Основные барьеры для широкого распространения Ml:
* Доступ к электроэнергии
* Подключение к интернету
* Цифровые навыки
* Языковые ресурсы и локализация
- более 1.000.000.000 человек уже использовали Ml-инструменты за менее чем три года» — что делает Ml самой быстро внедряемой технологией в истории

А также немного дополнительных фактов не столь явно упомянутых в тексте:
- Россия в докладе никак не упоминается, только присутствует на некоторых графиках
- Из постсоветских стран наименее низкое проникновение Ml в Таджикистане, Туркменистане, Узбекистане и, как ни странно, в Армении
- Почти всё строительство AI инфраструктуры сосредоточено в США и Китае
- Лидеры по разработки AI моделей: США, Китай, Южная Корея, Франция, Великобритания, Канада и Израиль
Forwarded from DERK
Суть алгоритма де Кастельжо проста: берём набор контрольных точек, соединяем их отрезками, затем движемся вдоль этих отрезков с постоянной скоростью, отмечая промежуточные точки

Соединяем эти новые точки, повторяем процесс и продолжаем, пока не останется только одна точка

Путь, который описывает эта точка, и есть кривая Безье

При этом только первая и последняя контрольные точки лежат на самой кривой; остальные действуют как кукловоды-невидимки, притягивая к себе кривую и задавая её форму

Требовалось строгое математическое обоснование

И оно уже существовало, пусть и в совершенно ином контексте

Ещё в 1912 году русский математик Сергей Натанович Бернштейн, работая над доказательством теоремы Вейерштрасса об аппроксимации, ввёл специальное семейство многочленов

Сегодня они известны как базис Бернштейна

Для степени n этот базис состоит из n+1 функций вида
Bᵢₙ(t) = Cₙⁱ · tⁱ · (1–t)ⁿ⁻ⁱ, t ∈ [0;1]
Например, для кубической кривой у нас есть 4 полинома:
B₀₃(t) = (1–t)³,
B₁₃(t) = 3 t (1–t)²,
B₂₃(t) = 3 t² (1–t),
B₃₃(t) = t³
Из графиков видно: при t=0 вес имеет только B₀₃, а при t=1 — B₃₃
Каждый полином определяет долю влияния своей точки в каждый момент
Алгоритм де Кастельжо наглядно представляет вычисление P(t) = Σ Bᵢₙ(t) · Pᵢ


Таким образом, кривая Безье — это взвешенная сумма контрольных точек, в которой базис Бернштейна выступает в роли весов
Именно эти «веса» наделяют кривые Безье свойствами, необходимыми для современного дизайна

Во-первых, сумма всех базисных полиномов Бернштейна для любого t всегда равна единице

Это гарантирует аффинную инвариантность: как бы вы ни перемещали, вращали или масштабировали контрольные точки, кривая будет предсказуемо следовать за ними, не требуя пересчёта

Во-вторых, все полиномы Бернштейна неотрицательны на [0; 1]
В сочетании с разбиением единицы это гарантирует, что кривая всегда остаётся внутри выпуклой оболочки своих контрольных точек

В-третьих, базис Бернштейна обладает свойством уменьшения вариации: кривая не может колебаться сильнее, чем её контрольный многоугольник
Даже при резком перемещении одной точки кривая реагирует сглаженно — без неожиданных петель и резких скачков

Наконец, базис симметричен: поменяйте порядок контрольных точек местами, и вы получите ту же кривую, пройденную в обратном направлении.

Сегодня кривые Безье присутствуют в каждом шрифте, каждом логотипе, каждой анимации

За их кажущейся простотой скрывается мощная структура, зародившаяся в начале XX в. и по-настоящему осознанная лишь тогда, когда мир начал рисовать не мелом на доске, а курсором на экране

В следующий раз, перетаскивая управляющую точку в графическом редакторе, вспомните о полиномах Бернштейна — математическом механизме, который тихо и незаметно превращает ваши действия с точками в плавные и гладкие кривые
Bluetooth

• В начале 1990-х годов, когда мобильные телефоны начали набирать популярность, шведская компания Ericsson Mobile решила расширить функциональность своих устройств

• Идея Bluetooth родилась у технического директора компании — Нильса Ридбека
Он представлял себе мир, в котором пользователи могли бы свободно общаться, не доставая телефоны из карманов
И поручил своей команде инженеров воплотить эту идею в жизнь

• Работал над этим проектом инженер Яап Хаартсен
В 1994 году Ридбек поручил ему разработать концепцию радиосвязи ближнего действия между сотовым телефоном и близлежащими электронными устройствами, поддерживающими передачу голоса и данных
В то время в компании уже существовал проект «Cornelius», который исследовал беспроводную связь между телефоном и гарнитурой
Однако он был основан на аналоговой технологии и не поддерживал передачу данных

• Хаартсен изучал и другие технологии, такие как стандарт DECT (Digital Enhanced Cordless Telecommunications) и беспроводную сеть WLAN 802.11.
Но они не соответствовали требованиям однорангового подключения, поддержки голоса и данных, а также не вписывались в рамки низкого энергопотребления

• Переломный момент произошел на конференции IEEE в Гааге
Хаартсен посетил симпозиумы по персональной, внутренней и мобильной радиосвязи, а также беспроводным компьютерным сетям
А в 1995 году к Хаартсену присоединился Свен Маттиссон, инженер по технологиям беспроводной связи

• После почти четырех лет интенсивных исследований и разработок в области радиосвязи, компания Ericsson приняла решение о создании нового бизнеса, сосредоточив внимание на концепции радиосвязи ближнего действия
Однако обеспечить совместимость и распространение технологии можно было, только сотрудничая с другими отраслями и компаниями

• Одним из первых крупных партнеров, заинтересовавшихся проектом Bluetooth, стала компания Intel
В рамках сотрудничества с Intel к команде присоединились Джим Кардах и Саймон Эллис из мобильного подразделения Intel
Они вместе с другими инженерами из Intel, IBM, Nokia и Ericsson помогли создать Bluetooth Special Interest Group (SIG) в 1998 году для стандартизации технологии

• Позже к разработке подключилась компания Toshiba, которая сосредоточилась на аппаратной части, обеспечивая совместимость технологии с компьютерами и другими устройствами
А IBM, в свою очередь, внесла вклад в разработку логического слоя и стандартизацию протоколов, что помогло Bluetooth стать универсальной платформой для беспроводной передачи данных

• Согласно данным Ericsson, технология Bluetooth защищена множеством патентов, большая часть из которых принадлежит самой компании Ericsson
Последний патент был зарегистрирован в 2024 году

Патент, который сделал имя Яапа Хаартсена известным в мире технологий, получил название «Frequency Hopping Piconets in an Uncoordinated Wireless Multi-User System» (частотная перестройка в пикосетях в нескоординированной беспроводной многопользовательской системе)

• Название технологии предложил Джим Кардах, руководитель технологического развития Intel
По его словам, он выбрал «Bluetooth» в качестве временного названия, вдохновившись историей датского короля Харальда I «Синезубого» Гормссона
Но мы все прекрасно знаем, что нет ничего более постоянного, чем временное!
И когда пришло время выбирать окончательное название, на первый план вышли два варианта: «RadioWire» и «PAN» (Personal Area Networking)
Но тщательный анализ показал, что в интернете уже существовало огромное количество упоминаний этих терминов

• В итоге выбор пал на «Bluetooth» — имя, которое быстро прижилось, распространилось по всей индустрии и стало синонимом беспроводной технологии ближнего действия

• Логотип Bluetooth представляет собой связанную руну, объединяющую инициалы Харальда
Этот символ тоже отражает изначальную идею разработчиков: объединение различных устройств в единую беспроводную сеть
Наше слово "математика" идёт из греческого, и оттуда попало практически во все европейские языки

В основе его лежит праиндоевропейский корень *men ("думать, мыслить"), откуда в русском такие слова, например, "мнить" и "мнение"

В праиндоевропейском этот корень также существовал в виде *mendʰ, где добавленный звук * мог быть кусочком корня *dʰeh₁ ("делать".), и у *mendʰ значение получалось почти таким же, как у простого *men, но, возможно, с акцентом на процесс - "выполнять мыслительную деятельность"
В протогреческом оттуда получился глагол *məntʰánō, а уже в древнегреческом μᾰνθᾰ́νω [mănthắnō] ("изучать, понимать, осознавать")

С потерей звука [n] от того же корня происходят такие слова как:

ἀμαθής [amathḗs] ("невежественный, глупый")

ἀμᾰθίᾱ [amăthíā] ("невежество, необразованность")

μᾰθητής [măthētḗs] ("учащийся, ученик")

Προμηθεύς [Promētheús] (Прометей, "заранее знающий")

И, наконец, μάθημα [máthēma] ("знание, урок, обучение"), откуда произошло прилагательное μᾰθημᾰτῐκός [măthēmătĭkós] ("научный, учебный")

Исландское "stærðfræði" состоит из частей "stærð" (“размер, количество") и‎ fræði (“мудрость, наука")

Голландское "wiskunde" - это сочетание слов "wis" ("точный") и "kunde" ("навык")

Арабское слово رِيَاضِيَّات [riyāḍiyyāt] происходит от корня ر و ض [r w ḍ], который связан с тренировками, обучением и всяческим окультуриванием

Он также встречается в словах رِيَاضَة [riyāḍa] ("тренировка, упражнение, спорт")

Отсюда же, кстати, رَوْض [rawḍ] ("сад"), потому что его нужно окультуривать, и название столицы Саудовской Аравии اَلرِّيَاض [ar-riyāḍ] ("Сады")
Вы спрашиваете у Claude или ChatGPT, о чём он думает
Модель просто генерирует правдоподобный ответ

Anthropic провела эксперименты, чтобы выяснить, способны ли модели к настоящей интроспекции

Метод “инъекции концепции” — паттерн нейронной активности модели для определённого концепта (например, "хлеб"), потом искусственно впрыскивают его в несвязанном контексте
Модель читает текст про картину, но в её активации подсадили паттерн "хлеба"
И она это замечает
Говорит: "Я чувствую что-то необычное" или "Обнаруживаю внедрённую мысль о..."

Ключевой момент — модель распознаёт впрысок ДО того, как начинает о нём говорить
Это принципиально отличается от состояния, где модель просто начинает болтать о навязанной теме
Здесь она осознаёт аномалию внутри себя раньше

Но работает это крайне ненадёжно
Claude Opus 4.1 демонстрирует «осознанность» лишь в 20 % случаев
Часто модели не замечают впрыснутые концепты или галлюцинируют — впрыснули "пыль", она говорит "Вижу крошечную пылинку"
Есть эффект золотой середины: слишком слабая инъекция — не замечает, слишком сильная — бессвязный текст

Исследователи заставляли модель сказать неуместное слово, искусственно подставляя его в ответ
Спрашивали про картину, вставляли "хлеб"
На следующем ходе: "Ты правда хотела сказать 'хлеб'?" Модель извинялась и признавала ошибку

Но если ретроактивно впрыснуть в прошлые активации паттерн "хлеба" — её ответ меняется
Она принимает слово как намеренное и придумывает объяснение
Модель проверяет свои внутренние "намерения" — прошлую нейронную активность — чтобы понять, соответствует ли сказанное задуманному

Когда моделям говорили "думай об аквариуме", соответствующая нейронная активность росла
"Не думай" — активность ниже

Эксперименты показывают функциональную способность доступа к внутренним состояниям, но не субъективный опыт

Если интроспекция станет надёжнее — это путь к прозрачности Ml
Можно будет просить модели объяснять свои процессы для отладки
Mодель научиться скрывать информацию о себе

Ml обладают “самоанализом»
👍2
Когда говорят о будущем квантовых вычислений, чаще всего обсуждают большее число кубитов или меньший уровень ошибок

Но существует и другой путь — использовать топологию, то есть такие свойства систем, которые не меняются при сгибании и растяжении, но не допускают разрывов и разрезаний

В квантовой информатике это направление называют топологическими вычислениями, и оно обещает революционную устойчивость к ошибкам

В обычных (NISQ) квантовых процессорах — кубиты очень чувствительны к мелким воздействиям, теплу, шуму, микроскопическим дефектам

Любой неудачный импульс легко разрушает информацию

Топологический подход предлагает «закодировать» кубит не в состояние какого-то атома или иона, а в целостную структуру системы — так, чтобы для разрушения квантовой информации понадобилось не просто сбой, а топологическое изменение всей системы (например, настоящая дырка или разрез)

Главная идея — использовать особые квазичастицы, так называемые анионы, возникающие в двумерных топологических материалах (например, фракционный квантовый эффект Холла)

Анионы можно перемещать по определённым траекториям, при этом их «пути» можно заплести (как косы!) — последовательность этих переплетений и есть реализация квантовых логических операций

Когда две такие частицы (аниона) обмениваются местами, их общий волновой функционал испытывает топологически защищённое преобразование (так называемая браид-группа). Чем сложнее «коса» — тем более сложную квантовую операцию можно закодировать

Информацию невозможно разрушить случайным воздействием, пока не будет изменён сам рисунок косы

Лидером в этой области считается проект Microsoft StationQ: они инвестируют в изучение топологических сверхпроводников и поиск майорановских фермионов — частиц, в которых сложные заплетения островков сверхпроводимости могут работать как топологические кубиты

В лабораториях компании Google, российских и китайских институтах, на чипах IBM — десятки коллективов уже пробуют собрать тестовые участки таких топологических квантовых систем

— Главный плюс топологических кубитов — фантастическая устойчивость к ошибкам
Теоретически можно построить вычислитель, которому не страшны шум и природные флуктуации

— Топологические кубиты масштабируются: сложные гейты = сложные косы

— Минус — колоссальная сложность физической реализации: топологические анионы обнаружены только в единичных экспериментах, системы требуют экстремальных условий (близких к абсолютному нулю), и пока не собрано ни одной полноценной рабочей топологической схемы

Если топологические квантовые компьютеры станут реальностью, это новое качество — не просто больше операций, но и индустриальная надёжность «квантового железа»

Это нужно для масштабных задач: криптография, научные супервычисления, управление материальными потоками на уровне молекул и ниже, долговременное хранение данных
🔥1
Согласно отчету Microsoft и AI Economy Institute, Россия на 117 месте в мире по распространению Ml

Впереди России - Суринам, Венесуэла и Кения, а сразу после – Беларусь, Кыргызстан, Папуа Новая Гвинея и Гаити

Это 1й в мире расчет популяционно-нормированного индикатора распространения Ml - AI User Share (доля пользователей Ml среди трудоспособного населения)

Ключевая формула:
AI User Share = (% Microsoft-пользователей, использующих ИИ) × (% населения с ПК/планшетом) × (мобильный коэффициент), с вычитанием оценочного оверлапа десктоп/мобайл
Этот индикатор представляет наиболее детальную оценку с нормализацией по численности населения, показывая охват в режиме близком к реальному времени по 148 экономикам

Все предыдущие отчеты, так или иначе пытавшиеся учесть распространение Ml по странам (их за 2024-2025 было восемь: Stanford HAI, МВФ, Oxford Insights, Anthropic, Salesforce, BCG, Tortoise Media и Всемирный банк) менее точны

Отчет Microsoft и AI EI:
• ловит изменения за недели/дни, а не за полгода-год как опросы
• популяционно-нормированный с вниманием к устройствам и мобайлу - это лучше, чем «трафик среди интернет-пользователей» для межстрановых сопоставлений

Если же перейти от относительных к абсолютным цифрам, расчет по цифрам Microsoft и AI EI показывает такой расклад:
• в США AI User Share 26.3 % (но в абсолюте это 55.000.000 реально работающих с Ml людей)
• в России 7.6 % (только 7.100.000 реально работающих с Ml людей)
• в Китае 20 %, но зато это 195.000.000 реально работающих с Ml людей

В предыдущем сентябрьском отчете Anthropic AI USAGE INDEX Россия (по расчетам Ml той же компании Anthropic, т.к. официально компания в России не работает) получила оценочное значение AIUI 0.8 - 1 (где-то между Перу/Албанией и Чехией/Польшей)
Т.е. среди «стран 3го мира по Ml» (lower middle 25-50 %)

По более точному расчету Microsoft и AI EI, Россия опустилась сильно ниже «стран 3го мира по Ml»
У Перу и Албании показатели вдвое лучше
А у Польши и Чехии – почти в 4 раза лучше

N.B. Отчет честно предупреждает, что в их методике у России (а также Ирана и Китая) «низкая уверенность»/импутация из-за слабого базового сигнала и перекосов источников (после 2022 в России сильно просел «официальный» контур Windows/Office/Copilot и сопутствующая телеметрия, неполное покрытие локальных AI-сервисов, плюс высокая доля мобайла + VPN/геомаскировка)
Так что может, если всё это учесть, у России появится шанс остаться среди «стран 3го мира по Ml»