Машинний викладач ✙✙ | #УкрТґ
339 subscribers
4.06K photos
416 videos
23 files
1.1K links
"Тицяй мене в моє невігластво що маєш моці"©Макарош

#примондні_матеріяли #немов
#теорім #матфіз #потоки

Анонімний зворотній зв'язок: https://forms.gle/ToqdRsbsPvUuyytC9

Стара карта каналу: https://t.me/lehrer_genau/1197
Download Telegram
З ювілейною кількістю підписників повертаємось до витоків. Сиквел з ще більшою кількістю вмісту до задачі про рулетку вже тут. Гарної ночі, чи ранку, залежно коли прочитаєте. І як завжди, відгук вітається!

#теорім
Нарешті в каналі будуть гідні конкурси. Доведіть рівність.

#теорім
До речі, людям, які вважають, що антиваксам всього лише не вистачає шкільної програми, пропоную дати відповіді на наступні прості завдання звідти ж:

Математика (Теорія ймовірності):
В Україні 1% від популяції інфіковано ковідом. Ви їдете закордон, і для цього тестуєтесь тестом з точністю 99% (себто ймовірність, що тест покаже правильний результат). Якщо тест виявляється позитивним, то яка ймовірність того, що ви інфіковані?

Фізика:
Перед вами брусок, який складений з двох частин однакової маси. Перша має густину 500 кг/м^3, друга — 2000 кг/м^3. Питання: чи втоне він у воді?

Хімія:
Доповніть реакцію за нормальних умов:
H2O+SiO2->?

Українська мова:
Оберіть правильне слово:
Щиро вітаємо (Вас/вас), Ольго, у нашій компанії!
Дорогі працівники та працівниці! Щиро вітаємо (Вас/вас) з днем заснування компанії!
Поставте розділовий знак:
Діти антиваксів як сторіс в інстаграмі _ у вас не так багато часу, аби їх побачити.

#теорім #матфіз
Машинний викладач ✙✙ | #УкрТґ
До речі, людям, які вважають, що антиваксам всього лише не вистачає шкільної програми, пропоную дати відповіді на наступні прості завдання звідти ж: Математика (Теорія ймовірності): В Україні 1% від популяції інфіковано ковідом. Ви їдете закордон, і для цього…
Розв'язки. Спонсор — лекція з розподілів, яка мала закінчитись на Levy flights, але лектор ледве закінчив на кумулянтах, тому час не був втраченим. Мене дуже занесло, тож можливо знайдете немало цікавого.

#теорім #матфіз
Теорія ймовірностей, статистика, та математичні приколи: (список анонсів)
Ефект Лінді або чому неживе проживе ще стільки ж, в той час як нове (скоріше за все) згине так само швидко, як і з'явилось. (обережно, краш-тест формату)
Експоненційний розподіл, або чому ви чекатимете на маршрутку 10 хв незалежно від того, коли приїхала остання. (продовження попереднього)
Проста задача про російську рулетку, де все не так однозначно.
Розподіл довжини волосся. (плюс пости нижче)
Трохи про важливість першого вражіння.
Ви переживете середню очікувану тривалість життя.
Пологовий будинок і ефекти розміру. (не забудьте прочитати пояснення до квізу)
Ще більше рулетки.
Конкурс на 100 грн, досі актуальний.
Середні величини та як розоритись, ставлячи на середнє арифметичне
Принцип Парето та самоподібність.
Зв'язок між Парето та експоненційним розподілом, а також його виведення. (легендарний кросовер головних персонажів рубрики)
Чому у вашої коханої було більше партнерів, ніж у вас партнерок?
Невідворотність розподілу Парето та Голодомор.
Функціонально-диференціальне рівняння за 300 грн (начебто).
Рівняння на послідовність за 80 грн.

#теорім #матфіз
Зв'язок між Парето та експоненційним розподілом, або чому Парето такий всюдисущий, від достатку до рівня навичок?

Давайте подивимось на розподіл логаритму змінної, розподіленої за Парето. Наприклад, для статків це буде кількість нулів на банківському рахунку. Беручи зворотню кумулятивну функцію (як ми означали її вище) і обезрозмірюючи змінну х, маємо:

y=log(x/x_m)
F(x)=P(X>x)=(x_m/x)^a=e^(-a log(x/x_m))=e^(-ay)=P(Y=log(X/x_m)>y)

Отримуємо зворотню кумулятивну функцію експоненційного розподілу! Тобто логаритм змінної Парето розподілений експоненційно. Чому так виходить?

Пригадаємо для початку, які випадкові величини мають експоненційний розподіл. Зазвичай так розподілений певний час зупинки (stopping time — статистичний термін, а не вихваляння моєю британською), як от момент прибуття автобусу чи тривалість життя чогось. Пригадаймо також, що він є неперервним аналогом геометричного розподілу, який вимірює кількість спроб до першої невдачі. У випадку з довжиною волосся, за припущення, що воно щомиті може випасти з однією й тією ж ймовірністю р, невдачею є якраз випадіння, і тому ймовірність не випасти за п шансів рівна (1-р)^п. Чи надходить вам тепер ідея, чому кількість нулів на банківському рахунку може бути розподілена за експоненційним розподілом?

Ще одна підказка. Уявіть, що населення починає інвестувати з приблизно однакового капіталу, і щороку отримує схожий відсоток нарахувань. Дехто від нетерплячки, мовляв ріст надто повільний, або ж обставин, які можуть трапитись з усіма, знімає гроші з депозиту, припиняючи їхній ріст, в той час як решта продовжують тримати їх. Таким чином можна вважати, що щороку власникам депозиту чи акцій властива ймовірність полишити це діло, і якщо вона не змінюється з року в рік, то тривалість інвестування отримує геометричний розподіл. Звичайно, через років 20 ця ймовірність може суттєво зменшитись, особливо після спостереження інвестором накопиченої суми, проте якщо він знайде застосування цим грошам чи не захоче чекати ще років з 5 до пенсії, ймовірність може виявитись достатньо схожою і грубо розподіл виглядатиме схоже.

Тож, час інвестування має грубо геометричний розподіл. Розмір статків щороку множиться на (1+і/100), де і — відсоток нарахувань, а отже логаритм розміру статків зростає на log(1+i/100). Це означає, що логаритм статків лінійно росте з часом, а отже розподілений як і час інвестування — геометрично. В результаті отримуємо, що самі статки мають бути розподілені степенево — за Парето. Звідси і принцип.

Аналогічну логіку у першому наближенні можна застосувати і до довжин річок (замість пробитись через перешкоду і видовжитись пропорційно до довжини завдяки вже набутому напору вона може просто здатись), розміру файлів (де тут компуктер саєнтісти), та навіть рівня навичок. В останньому випадку, щоправда, це може бути і неправдою, тому автор лишає аргументацію на розсуд читача.

#теорім
В коментарях навели середню ціну на житло в Нідерах, напевно бо інформації по медіані нема, тож чудова нагода пригадати корисність обох мірок. Головна думка цієї писанини полягає в тому, що середнє арифметичне зберігає інформацію про накопичувальне (ака агрегатне) мірило. Себто якщо ви хочете скупити кількадесят будинків, то для обрахунку орієнтовних видатків вам потрібне середнє арифметичне, бо загальна вартість ваших будинків з найбільшою ймовірністю буде рівна середнє*кількість.

Проте припустимо ви ще не досягли успішного успіху і просто хочете поселити сім'ю, для початку хоча б одну. Що вам каже середнє арифметичне? Нічого, адже це усереднення між королівськими хоромами та халупами і не дає абсолютно ніякого уявлення про те, на яку ціну можна розраховувати. В той же час, медіана вам дає зрозуміти, на яку цінову стелю можна орієнтуватись з ймовірністю 50% — ви раптово володієте інформацією про половину ринку! Також на допомогу приходять квартилі, які рахуються ще рідше, але допомагають бути впевненим вже про 75% всіх наявних на ринку домівок.

Тому медіана (та відсотилі вцілому) є значно інформативнішим мірилом для від сили кількаразових дій. Використовуйте медіану, не помилитеся, недарма вона є robust мірилом щодо викиднів (аутлаєрів, вибачте за мою вашингтонську). Звичайно є ситуації, де медіана та середнє співпадають, як от для симетричних розподілів, проте коли ви востаннє бачили симетричний розподіл в реальності (окрім IQ, окрема історія)? Пригадайте розподіл Парето і забудьте про середні величини у прийнятті буденних чи просто приземлених рішень.

#теорім
Машинний викладач ✙✙ | #УкрТґ
Який бал по шкалі Кінсі має бути у 100% гетеросексуала на землі, де 19% of men are females.
Тож, уявімо що ви чоловік, мета якого розглянути кожну існуючу в Середзем'ї жінку для якихось невідомих мені біологічних причин. Це означає, що в розгляд повинні бути включені і деякі чоловіки, адже серед них 19% — жінки. Тому якщо ви навідріз відмовитесь від сексуальних взаємодій з чоловіками, то відмовитесь і від деяких жінок, гадки не маючи про їх пристосованість до заміжжя чи породіллі з вами.

Вважатимемо, що бал по шкалі Кінсі є прямо пропорційним ймовірності сексуально провзаємодіяти з представником вашої статі за умови підлягання ним під безстатеві стандарти, які працювали б для протилежної статі. В даному випадку, максимальний бал 6 відповідатиме ймовірності 1. Тож, який бал по Кінсі у вас має бути аби покрити всіх жінок серед чоловіків?

Відповідь проста: ця ймовірність рівна масовій частці жінок. Ніхто не каже, що ви не знатимете за кожної взаємодії чи перед вами чоловік чи жінка. Головне, що ви готові взаємодіяти з 19% чоловіків, а отже б/6=19%->б=1.14 — ваш бал по шкалі Кінсі. Це і є правильна відповідь. В той же час, бал 6 означатиме, що ви готові злягатись з 81% чоловіків, які є справжніми чоловіками — не звучить аж так гетеросексуально (хоча я з фізмату, доволі таки).

#теорім #матфіз
Машинний викладач ✙✙ | #УкрТґ
Розв'язок квізу та гігантський матеріял бонусом про середні величини. #матфіз #теорім
cries in gamble's ruin

The Manga Guide to Regression Analysis є своєрідним сиквелом до The Manga Guide to Statistics і продовжує вражати викладом. Найпростіша лінійна регресія має суворі межі застосовності, і ця книга є першим джерелом на моїй пам'яті, яка демонструє як перевірити корисність самого рівняння прямої через аналіз варіяцій.

Проте вражає вона і в негативному сенсі. Звичайно, в цьому контексті говориться про нормальний розподіл — один з небагатьох розподілів, де найімовірніша величина таки рівна середньому, та ще й медіані. Проте зображене на скріні твердження настільки засіло у головах більшості статистів і просто людей, що набуло форми важкої хвороби. Йому не вистачає зірочки з виноскою, що це не просто не завжди правда, а майже ніколи нею не є.

Сумно, читаємо далі і згадуємо сенс середнього за статтею в реплаї.

#теорім
Якщо ввечері нападе знічев'я, можете о 17:00 за Києвом приєднуватись до уроку з алгебри для 11 класу — будемо розмазувати комбінаторику через правила сум і добутку, а якщо пощастить — то виведемо і формулу кількості сполук, вони ж комбінації, вона ж біноміальний коефіцієнт ака головна героїня більшості моїх постів про #теорім.

Я підготував приклади з життя, лишилось сподіватись що життя підготувало мене до цього уроку.
Машинний викладач нарешті освоїв мистецтво хештегів, і тепер може видавати деякий вміст за ними. Нагадую, що також є стара карта, яка виконувала схожу функцію, але припинила оновлення через непрактичність. Користуйтесь:

#матфіз — матеріали з фізики та математики найрізноманітнішого штибу, переважно авторське (пости та статті), але є й задачки: часом з розв'язками, а якщо без — то з можливістю заробити!

#теорім — аналогічно, цього разу з теорії ймовірностей та статистики. Ще більше вмісту! І навіть огляди на мангу, ага.

#потоки — записи стрімів на вищенаведені теми. Не рекомендую дивитись без 2х, і навіть в такому випадку на власний страх та ризик.
Коли в науці на критику вам відповідають «це краще, ніж нічого», то скоріше за все краще вже нічого, ніж той неякісний процес чи метрика, яку вони захищають.

Як от метрика тривалості життя, яка бере середню його тривалість: через змішування високої смертності при народженні з власне високою тривалістю життя, виникає необґрунтоване (ба навіть хибне) враження що раніше люди жили по 30-40 років. Рішення: не послуговуватись метрикою взагалі, або розбивати її на смертність по народженні і life span, себто середню тривалість життя після одного року абощо. Медіанний вік не буде робастним мірилом якраз через зʼїдання лівого хвоста.

#теорім
Машинний викладач ✙✙ | #УкрТґ
Аби жінка отримала мій канал, вона повинна вміти проводити схожі викладки. Чоловіків теж стосується.
Випадкова змінна «час до відповіді на повідомлення», aka “інтервал між повідомленнями», має явно товстохвостий розподіл: чим довше адресат не відповідає, тим очікуваний час до відповіді довший. З прочитанням думаю аналогічно. І це не дивно, бо змінна утворена процесом з памʼяттю: чим далі, тим більш правдоподібно, що вам просто не хочуть відповідати, лишаючи непрочитаним. Бо всі періодичні ефекти, які могли б вплинути на час відповіді, зрештою усереднюються: вечір зміняється ранком і днем, вихідні переходять у будні, а відпустка закінчується.

Але тим зрештою відповідь на повідомлення є несподіванішою і непередбачуванішою, як от через три роки після написання.

#теорім
Машинний викладач ✙✙ | #УкрТґ
Photo
Проаналізував текстові пости каналу за три роки. На графіку ви бачите частку постів, які мають більше ніж х символів. Що нам це каже?

Графік функції P(X>=x) (також відомої у місцевих колах як функція пережитку/досвіду) можна інтерпретувати у рамках геометричного/експоненційного розподілу. Коли пишеться пост, він має певну ймовірність закінчитись на поточному знаку. Якщо ця ймовірність стала впродовж написання посту, то графік вище виглядав би як пряма лінія. Як можна побачити, у графіку є доволі велика прямолінійна ділянка, тобто як тільки відмін досягає ~500 знаку під час написання посту, ймовірність його закінчення стає сталою на кожному подальшому знаку десь аж до 3500. І ймовірність ця рівна ~ln(.1/.02)/2500=6.4e-4, що в промілле відповідає легкому сп'янінню. Сподівана ж довжина посту після 500 знаків рівна 500 (поточна) + обернена ймовірність вище, себто приблизно 2000 знаків.

Початок графіку значно стрімкіший, а тому ймовірність посту закінчитись на конкретному знаку рівна приблизно ln(2) / 80 ~1% (алкогольне отруєння), що відповідає сподіваній довжині посту близько 120 знаків. Так як стрімкість зменшується, то зменшується і ймовірність закінчення посту на цьому знаку зі збільшенням його номеру, а з тим збільшується і сподівана довжина посту. Це позначає перехід з режиму короткого коментаря в 1-2 речення у режим довгопосту. І триває цей режим аж 4000 знаків, де Сварог зна що відбувається (частково бо пост зазнає поділу на кілька, тож це дослідження можна лишити на майбутнє).

#теорім