Как работает цифровое министерство пропаганды.
Практический кейс алгоритмической цензуры Яндекса.
В наше время две темы чрезвычайно важны и актуальны, как для каждого из нас, так и для всего общества.
1. Расширяющийся контроль государства и мегакорпораций в формировании медийной повестки.
2. Рост значения фактора предвзятости алгоритмов машинного обучения при принятии решений государством и бизнесом.
Кейс, о котором я хочу рассказать, объединяет обе темы, что делает его особенно важным и показательным.
Целый год я изучал работу алгоритма публикации постов Яндекс Дзена на собственном опыте. Изучал, поставив, как говорит Нассим Талеб, «шкуру на кон».
И вот результат.
✔️ Шкуру я проиграл.
✔️ Но зато теперь понимаю, как работает алгоритмическая цензура Яндекс Дзена.
Полагаю, этот мой опыт может быть полезен и тем, кто пишет для Яндекс Дзена, и тем, кто читает посты на этой платформе.
Продолжить чтение (6 мин)
- на Medium http://bit.do/fPNJg
- на Яндекс Дзен https://clck.ru/ToVsz
#Цензура #Яндекс #ЯндексДзен
Практический кейс алгоритмической цензуры Яндекса.
В наше время две темы чрезвычайно важны и актуальны, как для каждого из нас, так и для всего общества.
1. Расширяющийся контроль государства и мегакорпораций в формировании медийной повестки.
2. Рост значения фактора предвзятости алгоритмов машинного обучения при принятии решений государством и бизнесом.
Кейс, о котором я хочу рассказать, объединяет обе темы, что делает его особенно важным и показательным.
Целый год я изучал работу алгоритма публикации постов Яндекс Дзена на собственном опыте. Изучал, поставив, как говорит Нассим Талеб, «шкуру на кон».
И вот результат.
✔️ Шкуру я проиграл.
✔️ Но зато теперь понимаю, как работает алгоритмическая цензура Яндекс Дзена.
Полагаю, этот мой опыт может быть полезен и тем, кто пишет для Яндекс Дзена, и тем, кто читает посты на этой платформе.
Продолжить чтение (6 мин)
- на Medium http://bit.do/fPNJg
- на Яндекс Дзен https://clck.ru/ToVsz
#Цензура #Яндекс #ЯндексДзен
Medium
Цифровое министерство пропаганды
Практический кейс алгоритмической цензуры Яндекса
Тайный язык людей непостижим для ИИ.
Большой брат и цензура в Метаверсе преодолимы.
В 1й в истории битве андроритмов и алгоритмов победа будет за нами.
Китай (и не только он) стремиться взять под контроль властей политические ценности, идеалы и стандарты цифровой социо-коммуникационной инфосреды. Уже сегодня эта среда (Интернет) настолько огромна, что для контроля за ней в Китае работает целая армия спецов. Ну а чтоб держать под контролем бесчисленное множество цифровых миров Метаверса, никакой армии уже не хватит. Это могут сделать лишь специально настроенные и обученные алгоритмы.
Китай первым понял это и начал мобилизацию сетевых алгоритмов. Его примеру последуют и другие страны, узаконивающие уголовку за сетевой контент определенного смысла и тупо табуирующие отдельные фамилии и слова.
Казалось бы, ничто не сможет противостоять колоссальной вычислительной мощи госмашины алгоритмов контроля и цензуры цифровой социо-коммуникационной инфосреды.
И тем не менее, это не так. В 1й в истории цивилизации битве андроритмов и алгоритмов с неотвратимостью победят люди. Ибо мы обладаем тайным языком, не доступным для алгоритмов.
Известно, что люди – уникальный вид из-за наличия у нас развитого абстрактного языка. Он обладает безграничной смысловой мощью, ибо он «открыто-бесконечен» (т.е. обладает свойством ничем не ограниченной открытости для любых изменений, исправлений и дополнений (в английском это open-endedness).
На практике это позволяет:
1) бесконечно расширять язык новыми словами, символами и знаками;
2) бесконечно адаптировать смысл элементов языка и их сочетаний;
3) когда 1-2 недостаточно, строить на основе языка новые метаязыки более высокого уровня абстрагирования.
Алгоритмы же так не умеют. И если по отношению к т.н. «явным коммуникационным сигналам» у алгоритмов сохраняются шансы научиться их распознавать, то в отношении т.н. «скрытых коммуникационных сигналов» (понимаемых лишь «своими» - разделяющими контекст коммуникации) у алгоритмов нет ни шанса.
Как показало новое исследование «Стратегическая передача сигналов идентификации в гетерогенных сетях», поставившее целью экспериментально проверить «Теорию скрытой передачи сигналов» Пола Смальдино:
1) Как только риски и иные связанные с проявлением своей социально-политической идентичности издержки становятся высоки, люди переходят к «скрытым сигналам», которые кодируют информацию таким образом, что ее могут понять лишь те, кто разделяет их взгляды. Т.е. эти сигналы точно воспринимаются целевой аудиторией («своими» - «мы»), но весьма затруднительны для понимания «чужими» - «они».
2) Скрытые сигналы позволяют людям получать выгоду от того, что их идентифицируют «свои», одновременно избегая затрат, связанных с обнаружением себя «чужими». Это происходит за счет того, что общение с использованием скрытых сигналов содержит несколько одновременных смысловых слоев, которые не одинаково очевидны для всех типов получателей. Фоновые знания получателя и восприятие контекста влияют на то, будут ли раскрыты эти слои и каким образом.
3) Если значение некоторых слов или фраз, как маркеров веры, известно только «своим», их использование на публике позволяет говорящему передать сообщение «своим» слушателям («я разделяю ваши ценности»), не засвечиваясь перед остальными (среди которых немало «чужих»).
Т.к. для алгоритмов ИИ тайный язык скрытых сигналов непостижим, исследователи набирали оценщиков для классификации явных и скрытых сигналов среди сообщений Twitter среди людей на платформе Mechanical Turk. Отобрали 2 тыс. оценщиков: примерно по 500 крайне левых, умеренно левых, крайне правых и умеренно правых (определялось их ответами на вопросы анкеты).
Для выявления скрытых и явных твитов оценщики использовали методику Смальдино (чем экстремальней позиция, тем выше доля скрытых сигналов и аффектация).
Как и язык, скрытые сигналы open-endedness. Цензуре и Большому брату с этим не совладать.
https://www.pnas.org/doi/10.1073/pnas.2117898119
#Цензура #БольшойБрат #Metaverse
Большой брат и цензура в Метаверсе преодолимы.
В 1й в истории битве андроритмов и алгоритмов победа будет за нами.
Китай (и не только он) стремиться взять под контроль властей политические ценности, идеалы и стандарты цифровой социо-коммуникационной инфосреды. Уже сегодня эта среда (Интернет) настолько огромна, что для контроля за ней в Китае работает целая армия спецов. Ну а чтоб держать под контролем бесчисленное множество цифровых миров Метаверса, никакой армии уже не хватит. Это могут сделать лишь специально настроенные и обученные алгоритмы.
Китай первым понял это и начал мобилизацию сетевых алгоритмов. Его примеру последуют и другие страны, узаконивающие уголовку за сетевой контент определенного смысла и тупо табуирующие отдельные фамилии и слова.
Казалось бы, ничто не сможет противостоять колоссальной вычислительной мощи госмашины алгоритмов контроля и цензуры цифровой социо-коммуникационной инфосреды.
И тем не менее, это не так. В 1й в истории цивилизации битве андроритмов и алгоритмов с неотвратимостью победят люди. Ибо мы обладаем тайным языком, не доступным для алгоритмов.
Известно, что люди – уникальный вид из-за наличия у нас развитого абстрактного языка. Он обладает безграничной смысловой мощью, ибо он «открыто-бесконечен» (т.е. обладает свойством ничем не ограниченной открытости для любых изменений, исправлений и дополнений (в английском это open-endedness).
На практике это позволяет:
1) бесконечно расширять язык новыми словами, символами и знаками;
2) бесконечно адаптировать смысл элементов языка и их сочетаний;
3) когда 1-2 недостаточно, строить на основе языка новые метаязыки более высокого уровня абстрагирования.
Алгоритмы же так не умеют. И если по отношению к т.н. «явным коммуникационным сигналам» у алгоритмов сохраняются шансы научиться их распознавать, то в отношении т.н. «скрытых коммуникационных сигналов» (понимаемых лишь «своими» - разделяющими контекст коммуникации) у алгоритмов нет ни шанса.
Как показало новое исследование «Стратегическая передача сигналов идентификации в гетерогенных сетях», поставившее целью экспериментально проверить «Теорию скрытой передачи сигналов» Пола Смальдино:
1) Как только риски и иные связанные с проявлением своей социально-политической идентичности издержки становятся высоки, люди переходят к «скрытым сигналам», которые кодируют информацию таким образом, что ее могут понять лишь те, кто разделяет их взгляды. Т.е. эти сигналы точно воспринимаются целевой аудиторией («своими» - «мы»), но весьма затруднительны для понимания «чужими» - «они».
2) Скрытые сигналы позволяют людям получать выгоду от того, что их идентифицируют «свои», одновременно избегая затрат, связанных с обнаружением себя «чужими». Это происходит за счет того, что общение с использованием скрытых сигналов содержит несколько одновременных смысловых слоев, которые не одинаково очевидны для всех типов получателей. Фоновые знания получателя и восприятие контекста влияют на то, будут ли раскрыты эти слои и каким образом.
3) Если значение некоторых слов или фраз, как маркеров веры, известно только «своим», их использование на публике позволяет говорящему передать сообщение «своим» слушателям («я разделяю ваши ценности»), не засвечиваясь перед остальными (среди которых немало «чужих»).
Т.к. для алгоритмов ИИ тайный язык скрытых сигналов непостижим, исследователи набирали оценщиков для классификации явных и скрытых сигналов среди сообщений Twitter среди людей на платформе Mechanical Turk. Отобрали 2 тыс. оценщиков: примерно по 500 крайне левых, умеренно левых, крайне правых и умеренно правых (определялось их ответами на вопросы анкеты).
Для выявления скрытых и явных твитов оценщики использовали методику Смальдино (чем экстремальней позиция, тем выше доля скрытых сигналов и аффектация).
Как и язык, скрытые сигналы open-endedness. Цензуре и Большому брату с этим не совладать.
https://www.pnas.org/doi/10.1073/pnas.2117898119
#Цензура #БольшойБрат #Metaverse
Цензура в Китае стала тотальной.
Теперь под контролем не только тексты, но и программы.
18 мая тысячи разработчиков программного обеспечения в Китае проснулись и обнаружили, что их программы, размещенные в китайском репозитории программ с открытым исходным кодом Gitee - китайском конкуренте международной платформы репозитория ПО с открытым кодом GitHub, - заблокированы и скрыты от посторонних глаз.
Позже в тот же день Gitee опубликовала заявление, объясняющее ситуацию так.
1. Заблокированный код теперь проверяется вручную, поскольку с этого момента все программы с открытым исходным кодом обязаны проходить проверку перед публикацией.
2. У компании Gitee «не было иного выбора», кроме как подчиниться.
«Для китайского сообщества разработчиков ПО с открытым исходным кодом (сама суть которого прозрачность и глобальное сотрудничество) произошедшее стал шоком» – пишет MIT Technology Review (1).
Общедоступные проекты, размещенные на платформе Gitee, стали недоступны внезапно и без предварительного уведомления. В результате этого прерывается предоставление услуг и срываются коммерческие сделки. Чтобы код снова стал общедоступным, разработчикам необходимо подать заявку и подтвердить, что «он не содержит ничего, что нарушает китайское законодательство или авторские права».
Административная цензура ПО с открытым кодом – это нонсенс, противоречащий базовым принципам таких разработок (ведь это программы, которые любой желающий может свободно распространять, изменять и полностью переделывать).
Если административный каток государства, наехавший в прошлом году на китайских техногигантов, эксперты называли «выстрелом себе в ногу», то цензура ПО с открытым кодом может стать для Китая «выстрелом себе в голову».
Для России произошедшее весьма важно.
Разработчики открытого ПО начали блокировать России доступ к кодам на GitHub (он принадлежит Microsoft).
Есть ли выход?
Говорят, что целых два:
• переходить на китайский Gitee (Китай двумя руками за)
• делать (подобно Китаю в 2013) свой суверенный аналог GitHub) (с подачи премьер-министра уже начали и обещают запустить до конца года)
Что тут скажешь?
✔️ На китайский суверенный GitHub уже наложила большую волосатую лапу цензура КПК.
✔️ Российский же суверенный аналог, ясен пень, будет не подцензурен и не подконтролен.
Вспоминается «Дорожная история» Высоцкого (2).
Ищу я выход из ворот,
Но нет его, есть только вход,
и то не тот.…
1 2
#Китай #Цензура
Теперь под контролем не только тексты, но и программы.
18 мая тысячи разработчиков программного обеспечения в Китае проснулись и обнаружили, что их программы, размещенные в китайском репозитории программ с открытым исходным кодом Gitee - китайском конкуренте международной платформы репозитория ПО с открытым кодом GitHub, - заблокированы и скрыты от посторонних глаз.
Позже в тот же день Gitee опубликовала заявление, объясняющее ситуацию так.
1. Заблокированный код теперь проверяется вручную, поскольку с этого момента все программы с открытым исходным кодом обязаны проходить проверку перед публикацией.
2. У компании Gitee «не было иного выбора», кроме как подчиниться.
«Для китайского сообщества разработчиков ПО с открытым исходным кодом (сама суть которого прозрачность и глобальное сотрудничество) произошедшее стал шоком» – пишет MIT Technology Review (1).
Общедоступные проекты, размещенные на платформе Gitee, стали недоступны внезапно и без предварительного уведомления. В результате этого прерывается предоставление услуг и срываются коммерческие сделки. Чтобы код снова стал общедоступным, разработчикам необходимо подать заявку и подтвердить, что «он не содержит ничего, что нарушает китайское законодательство или авторские права».
Административная цензура ПО с открытым кодом – это нонсенс, противоречащий базовым принципам таких разработок (ведь это программы, которые любой желающий может свободно распространять, изменять и полностью переделывать).
Если административный каток государства, наехавший в прошлом году на китайских техногигантов, эксперты называли «выстрелом себе в ногу», то цензура ПО с открытым кодом может стать для Китая «выстрелом себе в голову».
Для России произошедшее весьма важно.
Разработчики открытого ПО начали блокировать России доступ к кодам на GitHub (он принадлежит Microsoft).
Есть ли выход?
Говорят, что целых два:
• переходить на китайский Gitee (Китай двумя руками за)
• делать (подобно Китаю в 2013) свой суверенный аналог GitHub) (с подачи премьер-министра уже начали и обещают запустить до конца года)
Что тут скажешь?
✔️ На китайский суверенный GitHub уже наложила большую волосатую лапу цензура КПК.
✔️ Российский же суверенный аналог, ясен пень, будет не подцензурен и не подконтролен.
Вспоминается «Дорожная история» Высоцкого (2).
Ищу я выход из ворот,
Но нет его, есть только вход,
и то не тот.…
1 2
#Китай #Цензура
MIT Technology Review
How censoring China’s open-source coders might backfire
Many suspect the Chinese state has forced Gitee, the Chinese competitor to GitHub, to censor open-source code in a move developers worry could obstruct innovation.
Контрабанда, торговля рабами, … поиск и перевод в Интернете.
Что Микрософту виселица, когда на кону огромные бабки.
Процитированная Карлом Марксом в первом томе Капитала, а теперь ставшая мемом фраза Томаса Даннинга "нет такого преступления, на которое не пойдет капитал ради прибыли в 300%" в оригинале звучит так: "при 300 процентах нет такого преступления, на которое он не рискнул бы, хотя бы под страхом виселицы. Если шум и брань приносят прибыль, капитал станет способствовать тому и другому. Доказательство: контрабанда и торговля рабами."
В 21 веке к названным двум видам бизнеса много чего добавилось. Например, поисковые системы в Интернете.
Революция генеративного ИИ, как никогда остро поставила вопрос – можно ли положиться на моральность мотивов крупнейших IT корпораций, определяющих будущее место и роль ИИ для всего человечества?
В качестве информации к размышлению, вот конкретный кейс – на что идет Microsoft ради прибыли на рынке Интернет поисковых систем в Китае.
Новое исследование Citizen Lab – это "Эксклюзив: цензура Microsoft Bing в Китае даже «более экстремальна», чем у китайских компаний" [1].
Оказалось, что готовность Microsoft выполнять цензурные требования КПК даже выше, чем у китайских компаний – китов этого бизнеса.
✔️ Вот как, например, Microsoft Bing выполняет запрос на перевод за пределами Китая [2], а вот так – внутри Китая [3]
✔️ А вот так выглядит перевод того же текста китайским Baidu [4]
Там, где Baidu цензурирует строку или предложение, содержащее триггерный контент, Microsoft Bing цензурирует весь контент (выдает пустой результат).
«Если вы попытаетесь перевести пять абзацев текста, и два предложения будут содержать упоминание Си, конкуренты Bing в Китае удалят эти два предложения и переведут остальное. В нашем тестировании Bing всегда цензурирует весь вывод. Вы получаете пробел. Это более экстремально», — рассказал изданию Rest of World Джеффри Нокель, старший научный сотрудник Citizen Lab.
Согласно требованиям КПК, в Интернете цензурируется широкий спектр тематик: от критики правительства до упоминания партийных лидеров, от религии до эротики, от диссидентов до артистов …
Напомню, что Bing стал единственным крупным иностранным сервисом перевода и поиска, доступным в Китае после того, как Google ушел с китайского рынка в 2010 году.
Резюме простое:
• Фразу «если шум и брань приносят прибыль, капитал станет способствовать тому и другому» 100%-но подтвердил триумф бизнеса на социальных сетях.
• Если ИИ повторит тот же путь, ведомый интересами прибыли крупнейших IT корпораций, результат будет тот же (если не хуже).
1 https://restofworld.org/2024/microsoft-bing-chinese-censorship/
2 https://149346090.v2.pressablecdn.com/wp-content/uploads/2024/06/Screenshot-bing-nonchina-062424.jpeg
3 https://149346090.v2.pressablecdn.com/wp-content/uploads/2024/06/Screenshot-bing-china-062424.jpeg
4 https://149346090.v2.pressablecdn.com/wp-content/uploads/2024/06/Screenshot-baidu-062624.jpg
#Китай #Цензура
Что Микрософту виселица, когда на кону огромные бабки.
Процитированная Карлом Марксом в первом томе Капитала, а теперь ставшая мемом фраза Томаса Даннинга "нет такого преступления, на которое не пойдет капитал ради прибыли в 300%" в оригинале звучит так: "при 300 процентах нет такого преступления, на которое он не рискнул бы, хотя бы под страхом виселицы. Если шум и брань приносят прибыль, капитал станет способствовать тому и другому. Доказательство: контрабанда и торговля рабами."
В 21 веке к названным двум видам бизнеса много чего добавилось. Например, поисковые системы в Интернете.
Революция генеративного ИИ, как никогда остро поставила вопрос – можно ли положиться на моральность мотивов крупнейших IT корпораций, определяющих будущее место и роль ИИ для всего человечества?
В качестве информации к размышлению, вот конкретный кейс – на что идет Microsoft ради прибыли на рынке Интернет поисковых систем в Китае.
Новое исследование Citizen Lab – это "Эксклюзив: цензура Microsoft Bing в Китае даже «более экстремальна», чем у китайских компаний" [1].
Оказалось, что готовность Microsoft выполнять цензурные требования КПК даже выше, чем у китайских компаний – китов этого бизнеса.
✔️ Вот как, например, Microsoft Bing выполняет запрос на перевод за пределами Китая [2], а вот так – внутри Китая [3]
✔️ А вот так выглядит перевод того же текста китайским Baidu [4]
Там, где Baidu цензурирует строку или предложение, содержащее триггерный контент, Microsoft Bing цензурирует весь контент (выдает пустой результат).
«Если вы попытаетесь перевести пять абзацев текста, и два предложения будут содержать упоминание Си, конкуренты Bing в Китае удалят эти два предложения и переведут остальное. В нашем тестировании Bing всегда цензурирует весь вывод. Вы получаете пробел. Это более экстремально», — рассказал изданию Rest of World Джеффри Нокель, старший научный сотрудник Citizen Lab.
Согласно требованиям КПК, в Интернете цензурируется широкий спектр тематик: от критики правительства до упоминания партийных лидеров, от религии до эротики, от диссидентов до артистов …
Напомню, что Bing стал единственным крупным иностранным сервисом перевода и поиска, доступным в Китае после того, как Google ушел с китайского рынка в 2010 году.
Резюме простое:
• Фразу «если шум и брань приносят прибыль, капитал станет способствовать тому и другому» 100%-но подтвердил триумф бизнеса на социальных сетях.
• Если ИИ повторит тот же путь, ведомый интересами прибыли крупнейших IT корпораций, результат будет тот же (если не хуже).
1 https://restofworld.org/2024/microsoft-bing-chinese-censorship/
2 https://149346090.v2.pressablecdn.com/wp-content/uploads/2024/06/Screenshot-bing-nonchina-062424.jpeg
3 https://149346090.v2.pressablecdn.com/wp-content/uploads/2024/06/Screenshot-bing-china-062424.jpeg
4 https://149346090.v2.pressablecdn.com/wp-content/uploads/2024/06/Screenshot-baidu-062624.jpg
#Китай #Цензура
Rest of World
Exclusive: Microsoft Bing’s censorship in China is even “more extreme” than Chinese companies’
New Citizen Lab study comes as U.S. lawmakers scrutinize Microsoft’s willingness to comply with demands from Beijing.