Жалкие низкочастотники
8.11K subscribers
206 photos
11 videos
229 links
Реклама не продаётся и не покупается!

Это мой персональный канал безумных ссылок. Ожидаются: безумные картинки, странная математика, кибернекрофилия, нёрдовский юмор. Правила: https://t.me/pathetic_low_freq/285
Download Telegram
Существует направление, следуя которому с Гавайев, можно пересечь линию перемены дат 7 раз. Основная причина такой аномалии - государство Кирибати bit.ly/2SnyNal, где теперь есть часовой пояс UTC+14 bit.ly/2IBqCHm, первым на Земле встречающий Новый Год. До того, как подвинули линию, Кирибати с населением около 100К и площадью около 800 км² находилось в двух разных датах одновременно, что немного мешало делам.
Источник: bit.ly/2X8CfJ3, старая подборка странных фактов про даты и время: bit.ly/2StqLvU
Мы тут с Гришей Сапуновым (экс-яндексоид, ныне известный machine learner из компании Intento) решили, что, раз уж оба, каждый для себя, регулярно читаем какие-то научные статьи по машинному обучению и нейросетям и пишем себе какие-то заметки, можно сделать на двоих общий канальчик и шарить там краткие разборы попавшихся нам интересных штук. Поэтому мы завели вот такой канал @gonzo_ML.

Кому интересно — добро пожаловать, но там будет не научпоп, а заметки для людей более-менее в теме.
This media is not supported in your browser
VIEW IN TELEGRAM
В рубрике "странные роботы": BionicFlyingFox от Festo. Кинематика летучей мыши. Мозги, к сожалению, внешние, как и position tracking. Но всё равно симпатично. Подробнее: bit.ly/2CIgw0V, bit.ly/2C724jR.
Когда интернета ещё не было, компьютеры соединялись друг с другом телефонными звонками с помощью модемов. Тогда же появился wardialing bit.ly/2Tcfp4Z -- техника прозвона большого числа случайных номеров с целью поиска интересных компьютерных систем. Сначала она называлась hammer dialing, а потом в 1983 году вышел полюбившийся народу точностью технических подробностей фильм WarGames bit.ly/2VnHvqi, сюжет которого был с ней связан, и техника прочно переименовалась в wardialing. Юридически это тогда находилось в серой зоне, но позже в разных странах приняли различные запрещающие/ограничивающие правила.

Звонили, конечно, не руками. Помню, популярными утилитами были ToneLoc и THC-SCAN, а из появившихся в этом веке я слышал о WarVOX bit.ly/2EnVsO6. На АТС с импульсным набором за день можно было обзвонить пару тысяч номеров. Помимо модемов попадались факсы, PBX, сердитые люди, а также всякие неведомые штуки. Найденными интересными номерами потом обменивались и делились во всяких e-zines, вроде bit.ly/2TrhV6o.

Годы спустя, на заре беспроводного интернета появился семантически родственный wardriving bit.ly/2Bbid7f -- техника сканирования улиц на автомобиле с целью поиска и составления карты открытых wifi-сетей. Энтузиасты придумали также помечать места с открытым доступом специальными значками мелом, т.н. warchalking bit.ly/2T64Zng (см рисунок слева). Любопытно, что эта идея, судя по всему, появилась по аналогии с hoboglyphs bit.ly/2tI0XCp -- тайным языком символов, используемых бездомными в США со времён Великой Депрессии для обозначения питьевой воды, злых собак, мест для ночлега и т.п. (см картинку справа).

Ожидаю возрождения традиции в виде warflying на базе дронов со сканнерами wifi/bluetooth.
This media is not supported in your browser
VIEW IN TELEGRAM
Внезапно: VR-эксплорер для гиперболических пространств. Сайт проекта: bit.ly/2EI9k7a, видео: bit.ly/2IQ31Tk
И до кучи: VR-эксплорер Mandelbulb-а bit.ly/2NKgzyA, это такой 3d аналог фрактала Мандельброта на кватернионах bit.ly/2HeadTh
This media is not supported in your browser
VIEW IN TELEGRAM
Мощный пост от Stanislas Chaillou из Школы Дизайна Гарварда про применение ML в архитектурном планировании, очень рекомендую хотя бы пролистать: bit.ly/2XDhjtJ.
Помимо безумных завораживающих картинок радует системность подхода.
Сегодня, оказывается, ровно год этому канальчику. По этому поводу я хотел рассказать про историю появления его названия, но передумал, может, расскажу ещё через год. Напишу лучше трешовый пост про азбуку Морзе:

Намедни товарищ рассказал мне, как случайно поселился на ночь в отеле, где проходил слёт энтузиастов азбуки Морзе. Мы немного пошутили на эту тему, а потом я задумался, а чего вообще такого эзотерического можно сделать с помощью азбуки Морзе. Естественно, подумал про палиндромы и полез поискать в сети, что на эту тему уже есть готового. Докладываю:

0. Число 73 является палиндромом как в записи азбукой Морзе, так и в двоичной записи.

1. Если игнорировать паузы между буквами, то самое длинное известное английское слово, являющееся палиндромом в записи азбукой Морзе -- "INTRANSIGENCE" (13 букв), оно кодируется в 28 сигналов "**–*–*–**––******––**–*–*–**". С другой стороны, слово "RAPHAELESQUE" из 12 букв кодируется в 32 сигнала "*-**-*--******-**-******--*-**-*", т.е. имеет самую длинную известную запись-палиндром в виде кода Морзе. Большие словари таких английских слов-Морзе-палиндромов есть, например, тут bit.ly/2tVMKlw и тут bit.ly/2hB7itR. А вот тут bit.ly/2NSyGCm есть немного немецких слов, в том числе слово Reittier ("*-****--****-*"), являющееся палиндромом и в немецком, и в коде Морзе.

2. Но игнорировать паузы между буквами неправильно, потому что на слух звуковой код таких строк палиндромом уже не будет! Чтобы учесть паузы, можно построить таблицу, какая буква в какую переходит при зеркальном отражении её кода, и искать с её помощью настоящие палиндромы. Например, слово "ROTOR" имеет код ("*–* ––– – ––– *–*") и является, таким образом, истинным палиндромом в коде Морзе (а также в русском, английском, немецком языках). Можно также пытаться составлять предложения-палиндромы, например, REBEL OWNS SAGO FEVER ("*-* * -*** * *-** / --- *-- -* *** / *** *- --* --- / **-* * ***- * *-*"). Небольшой словарик доступных для этого английских слов (т.е. слов, отражающихся в другие валидные слова) есть тут bit.ly/2Hpoz6T.

3. Хороших русских словарей я вообще не нашёл, поэтому бегло построил словарик сам. Помимо банальных (вроде "РОТОР", "ТОПОТ", "ПОТОП") нашлось слово "СИФИЛИС", которое в коде Морзе выглядит как "*** ** **−* ** *−** ** ***", и слово "НАБОЖНА" ("−* *− −*** −−− ***− −* *−").

Такие дела.
Барабанные ритмы и где они обитают
На длинных выходных нашлось время доделать старую затею: взял несколько сотню тысяч доступных онлайн midi-файлов, выделил из них 33К нетривиальных повторяющихся перкуссионных паттернов, а потом упаковал их в латентное пространство с помощью VAE/ACAI нейросети. Интерактивная визуализация (со звуком) доступна тут bit.ly/2TrgtSx, почитать подробнее можно на медиуме bit.ly/2J4GemE, а на гитхабе можно скачать несколько тысяч новых, сгенерированных нейросетью ритмов bit.ly/2EQ3Gil
This media is not supported in your browser
VIEW IN TELEGRAM
Студенты из Осло собирают прототип чего-то типа LED-дисплея на базе ферромагнитной жидкости. Тредик с подробностями: bit.ly/2URTWuU
SHI Weili обучил GAN на данных NASA восстанавливать спутниковое фото участка поверхности Земли по карте высот, уровню воды и гео координатам, a затем использовал эту сеть для "мелиорации" Марса, т.е. построил изображения Марса как бы с земным климатом и геологией.
Видео облёта планеты: vimeo.com/313612849
Сайт проекта: bit.ly/2UOKtnZ
Внезапно: на канализационных люках в Оклахоме нарисована локальная карта + точка "вы находитесь здесь".
Надпись на люке "A LAND RUN CITY" -- отсылка к земельным гонкам 22 апреля 1889 года, когда 8 тысяч квадратных километров земли распределялись между гражданами бесплатно по принципу "кто первый добежит и займёт", в результате чего город Оклахома и появился.
Кстати, на реддите есть отличный канал про канализационные люки с немного стрёмным названием https://www.reddit.com/r/manholeporn
Авторы свежей статьи bit.ly/2JIgm0r утверждают, что нашли алгоритм умножения целых чисел за O(n log n), работающий для достаточно больших чисел (от 2^4096 бит в двоичной записи). С точки зрения теории это большой шаг, предыдущей вехой был, кажется, алгоритм Шёнхаге—Штрассена bit.ly/1QrwSvo 1971 года, который давал сложность O(n log n log log n) и его последующие косметические доработки. С точки зрения практики эффекты пока не так понятны. Сложность статьи заметно выше моего уровня, так что подождём подтверждений/опровержений ;)
This media is not supported in your browser
VIEW IN TELEGRAM
Товарищ Lingdong Huang придумал рекурсивный язык RRPL bit.ly/2UkvHrS для описания структуры начертания глифов и использовал его для кодирования 5000+ классических китайских иероглифов bit.ly/2CEfns4, а затем сделал поверх этого несколько странных визуализаций bit.ly/2CHe3Vf. Самая весёлая из них -- такая: он сделал t-SNE проекцию пространства описаний иероглифов на плоскость и построил для них кратчайший маршрут полного обхода (TSP) bit.ly/2FJREZH (оно же на гифке выше).

Ну и чтоб два раза не вставать: у товарища Raven Kwok нашлось несколько интересных экспериментов в духе ascii-art на базе иероглифов. Например, бегущую горизонтальную синусоиду bit.ly/2CGGvXB и волны плотности на поле знаков bit.ly/2U7QcJq
This media is not supported in your browser
VIEW IN TELEGRAM
USSOCOM bit.ly/1OzKLUH (командование спецопераций США) заключило контракт yhoo.it/2HMQCho на поставку экзоскелетов с Sarcos Robotics sarcos.com, которые делают штуки вроде той, что на гифке.
Что вообще может пойти не так? Пойду, что ли, MechWarrior заново пройду. А вы видео посмотрите: bit.ly/2HYNzC7
Бытует легенда, что в раскладке QWERTY, унаследованной от печатных машинок, буквы частотных комбинаций специально расположены так, чтоб их приходилось набирать одним и тем же пальцем, т.е. чтобы литерные рычаги не сталкивались и не "залипали". То есть, современная клавиатура специально рассчитана для замедления скорости печати. После того как Коэльо пересказал эту байку в книге "Вероника решает умереть", она стала крайне популярной в народе. Но это неправда, а реальная история происхождения раскладки интереснее и является хорошим аргументом в пользу принципа бритвы Хэнлона.

Кристофер Шоулз bit.ly/1ZakuqM запатентовал bit.ly/2FCXn1Y свою первую машинку в 1868 году. Клавиатура на ней была похожа на пианино: 36 клавиш в два ряда, буквы по алфавиту, ноль и единица отсутствовали, т.к. заменялись при печати буквами O и I. Дальше он несколько лет дорабатывал конструкцию, в т.ч. изменил клавиатуру: сделал 4 ряда клавиш, в первом ряду были цифры, во втором -- гласные и знаки, в нижних двух остались согласные по алфавиту. Получилась вот такая раскладка с неудобной, но понятной инженерной логикой:

2 3 4 5 6 7 8 9 -
A E I . ? Y U O ,
B C D F G H J K L M
Z X W V T S R Q P N

Затем ещё лет 20 отдельные буквы переставлялись по различным причинам (хороший разбор bit.ly/2Abi1D8), в основном, после общения с потенциальными покупателями. Визит в 1870 к Эдисону в American Telegraph Works привёл к таким изменениям: букву I (напомню, она заменяла единицу) подтянули вправо к 8 и O, чтобы проще было набирать актуальные даты вроде I87O; S поместили между Z и E, т.к. телеграфисты, с трудом различая на слух морзянку для Z (... .) и SE (.../.), часто определяли их из последующего контекста, после чего им надо было быстро нагонять набор, так что эти буквы хотелось иметь рядом; часто используемые буквы W и T подняли в основной ряд, и т.п.. Потом продажа технологии Ремингтону в 1873 году привела к тому, что буквы Y и R по просьбе покупателя тоже подняли в первый ряд. По легенде это было сделано для того, чтобы на основном ряду можно было быстро набрать название бренда TYPE WRITER для эффектной демонстрации конечным покупателям в магазине, но подтверждений этой истории нет. После сделки с Ремингтоном бизнес машинок для телеграфистов стал неплохо расти, а в 1882 году Ремингтон решил сам выпускать машинки для стенографистов, и вместе с изобретателем метода шестипальцевого набора William Ozmun Wyckoff открыл под это отдельную компанию, а чтобы уйти из-под изначальных патентов, они косметически переставили ещё несколько букв (C, X и M). В результате получилась примерно та раскладка, которую мы имеем сегодня.

Многие национальные раскладки по миру унаследованы от QWERTY: в Германии принята QWERTZ, во Франции AZERTY. В конце ХХ века у нас тоже на какое-то время получила большую популярность раскладка ЯВЕРТЫ, в основном в связи с кустарной руссификацией первой волны зарубежных ПК типа ZX Spectrum. Сейчас она гордо называется "фонетической раскладкой" bit.ly/2U6bUgF, но соответствия букв вроде Я<->Q и Ь<->X далеки от фонетики; честнее будет сказать, что она использует в качестве основы кодировку КОИ-7 bit.ly/2U53GWa, которая, в свою очередь, восходит к внутреннему коду БЭСМ-6 (см инструкцию "АВТОКОД БЭСМ-6" 1967 года, страницы 66-67 bit.ly/2V9dRFw). Но основной раскладкой в СССР всегда была ЙЦУКЕН bit.ly/2OAJCVz, восходящая к дореволюционной и дореформенной ЙIУКЕН (см, например, упоминание в статье 1912 года bit.ly/2YEfz40), именно в таком виде американские машинки продавались в дореволюционной России. Откуда взялась эта ЙIУКЕН, точно не известно, но, судя по статистике, при её разработке пытались учесть однобуквенные частоты. В Ководстве у Лебедева bit.ly/2Wvd7uA были также некоторые мысли о её сходстве с русской наборной кассой.
Идея оптимизации раскладки под скорость набора существует давно и периодически возрождается. Ещё во времена Шоулза существовала ветвь машинок Blickensderfer bit.ly/2V7ewY5, раскладка которых строилась вокруг волшебной строки DHIATENSOR, по расчёту автора содержащей 70% буквоупотреблений. Эта ветка не выдержала конкуренции, но новую жизнь идея оптимизации обрела в работах Августа Дворака bit.ly/2O2a9xT -- он, опираясь на физиологию кистей рук и на статистику текстов, в 1932 году предложил оптимизированную раскладку имени себя. Например, в первоначальной её версии цифровой ряд выглядел так: 7531902468. Захватить рынок такой революционной оптимизации не удалось, но в восьмидесятых интерес к раскладке Дворака был оживлён её нативной поддержкой в продуктах Apple (начиная с модели Apple II bit.ly/2TIBZxb). В этом веке прогресс продолжается: довольно известна автоматически расчитанная раскладка Colemak bit.ly/2JSLF8P, и для неё были разработаны специальные промежуточные раскладки (Tarmak) для облегчения постепенного переучивания с QWERTY. А последний из известных мне проектов -- Halmak bit.ly/2JSLVoj. Пару лет назад эту раскладку подобрали генетическим алгоритмом, оптимизируя скорость набора на большом корпусе текстов, и по утверждению автора, она даёт +134% к эффективности относительно QWERTY (для сравнения, Дворак на этой же шкале даёт +77%).
Я тут уже как-то писал https://t.me/pathetic_low_freq/170 про конференцию по вычислительной ереси SIGBOVIK, которая проходит в Carnegie Mellon каждый год 1 апреля. В этом году я таки не поленился и подал туда свою статью bit.ly/2Us4vaQ про зеркальные QR-коды bit.ly/2UEp8gG. Статью взяли, вчера прошла сама конференция. Устроители уже выложили proceedings http://sigbovik.org/2019/proceedings.pdf, и по слухам я даже получил какой-то official award (пока не знаю, какой и за что).

Беглый взгляд на proceedings порадовал как минимум следующими статьями:
1. Survival in chessland — субъективный статистический взгляд на шахматы, кем из фигур лучше быть в шахматах, чтобы дожить до конца партии, и где лучше прятаться?
2. Optimizing The Sacrifice — воссоздание и оптимизация погони семьи за Александром в финальной сцене "Жертвоприношения" Тарковского — при оптимальных действиях финальный шестиминутный план можно гарантированно сократить до 28 секунд (алгоритмы приводятся).
3. "93% of Paint Splatters are Valid Perl Programs" — с какой вероятностью случайные пятна и брызги краски, распознанные с помощью OCR, будут являеться валидным Perl-кодом (спойлер в названии статьи).
This media is not supported in your browser
VIEW IN TELEGRAM
Очень простой, но ламповый киберпанк: Dan The Geek собрал на Adafruit PyPortal фоторамку, показывающую бесконечный ряд несуществующих людей и котов (с thispersondoesnotexist.com и thiscatdoesnotexist.com). Чуть подробнее тут bit.ly/2K5BUUS. Надо себе на рабочее место такую организовать.
Немецкий парк-заповедник возле городка Güstrow повесил у себя десяток вебкамер bit.ly/2UnaDBp, чтобы желающие могли посмотреть на зверушек. Большая часть камер висит в диких местах, т.е. там натурально лес, через который раз в несколько часов проходят дикие звери. И хотя места для камер выбирали осмысленно (озеро, около которого днём любят валяться медведи, место, где оставляют корм рысям и т.п.), поймать зверей бывает довольно сложно. Чтобы не мучаться в ожидании, я на выходных собрал простой скрипт, который раз в Х минут качает картинки, пропускает их через нейросетевой детектор и, если чего нашлось, кидает их в специальный телеграм-канал: https://t.me/WebCamWatcher.

В качестве детектора я для разнообразия взял модель Tensorflow Object Detection из коробки bit.ly/2lPqHJk (в прошлый раз я для измерения очереди брал Facebook Detectron bit.ly/2FQBSL9). Качество вышло так себе, очень много ложных срабатываний, а рысей и волков моделька регулярно считает овцами и собаками. В следующий раз надо будет попробовать YOLO-детектор. Короче, я затюнил эвристику поверх модели в пользу точности и в ущерб полноте, и теперь примерно пару раз в день в канальчик приходит фото зверушек и ссылкой, по которой на них дальше можно смотреть в реальном времени. Пока не надоест, будет крутиться на моём домашнем компе, пользуйтесь ;)

Немного картинок и кусок кода в моём посте на медиуме: bit.ly/2VmmmgH.
bit.ly/IrPf5e Мощная подборка замеченных заимствований визуальных образов в компьютерных играх -- из фильмов, у художников, друг у друга. Как поёт классик, культура -- это палимпсест :)