Машинний викладач ∆ | #УкрТґ
355 subscribers
4.4K photos
453 videos
23 files
1.14K links
"Тицяй мене в моє невігластво що маєш моці"©Макарош

#примондні_матеріяли #немов
#теорім #матфіз #потоки

Анонімний зворотній зв'язок: https://forms.gle/ToqdRsbsPvUuyytC9

Стара карта каналу: https://t.me/lehrer_genau/1197
Download Telegram
В коментарях навели середню ціну на житло в Нідерах, напевно бо інформації по медіані нема, тож чудова нагода пригадати корисність обох мірок. Головна думка цієї писанини полягає в тому, що середнє арифметичне зберігає інформацію про накопичувальне (ака агрегатне) мірило. Себто якщо ви хочете скупити кількадесят будинків, то для обрахунку орієнтовних видатків вам потрібне середнє арифметичне, бо загальна вартість ваших будинків з найбільшою ймовірністю буде рівна середнє*кількість.

Проте припустимо ви ще не досягли успішного успіху і просто хочете поселити сім'ю, для початку хоча б одну. Що вам каже середнє арифметичне? Нічого, адже це усереднення між королівськими хоромами та халупами і не дає абсолютно ніякого уявлення про те, на яку ціну можна розраховувати. В той же час, медіана вам дає зрозуміти, на яку цінову стелю можна орієнтуватись з ймовірністю 50% — ви раптово володієте інформацією про половину ринку! Також на допомогу приходять квартилі, які рахуються ще рідше, але допомагають бути впевненим вже про 75% всіх наявних на ринку домівок.

Тому медіана (та відсотилі вцілому) є значно інформативнішим мірилом для від сили кількаразових дій. Використовуйте медіану, не помилитеся, недарма вона є robust мірилом щодо викиднів (аутлаєрів, вибачте за мою вашингтонську). Звичайно є ситуації, де медіана та середнє співпадають, як от для симетричних розподілів, проте коли ви востаннє бачили симетричний розподіл в реальності (окрім IQ, окрема історія)? Пригадайте розподіл Парето і забудьте про середні величини у прийнятті буденних чи просто приземлених рішень.

#теорім
Машинний викладач ∆ | #УкрТґ
Який бал по шкалі Кінсі має бути у 100% гетеросексуала на землі, де 19% of men are females.
Тож, уявімо що ви чоловік, мета якого розглянути кожну існуючу в Середзем'ї жінку для якихось невідомих мені біологічних причин. Це означає, що в розгляд повинні бути включені і деякі чоловіки, адже серед них 19% — жінки. Тому якщо ви навідріз відмовитесь від сексуальних взаємодій з чоловіками, то відмовитесь і від деяких жінок, гадки не маючи про їх пристосованість до заміжжя чи породіллі з вами.

Вважатимемо, що бал по шкалі Кінсі є прямо пропорційним ймовірності сексуально провзаємодіяти з представником вашої статі за умови підлягання ним під безстатеві стандарти, які працювали б для протилежної статі. В даному випадку, максимальний бал 6 відповідатиме ймовірності 1. Тож, який бал по Кінсі у вас має бути аби покрити всіх жінок серед чоловіків?

Відповідь проста: ця ймовірність рівна масовій частці жінок. Ніхто не каже, що ви не знатимете за кожної взаємодії чи перед вами чоловік чи жінка. Головне, що ви готові взаємодіяти з 19% чоловіків, а отже б/6=19%->б=1.14 — ваш бал по шкалі Кінсі. Це і є правильна відповідь. В той же час, бал 6 означатиме, що ви готові злягатись з 81% чоловіків, які є справжніми чоловіками — не звучить аж так гетеросексуально (хоча я з фізмату, доволі таки).

#теорім #матфіз
Машинний викладач ∆ | #УкрТґ
Розв'язок квізу та гігантський матеріял бонусом про середні величини. #матфіз #теорім
cries in gamble's ruin

The Manga Guide to Regression Analysis є своєрідним сиквелом до The Manga Guide to Statistics і продовжує вражати викладом. Найпростіша лінійна регресія має суворі межі застосовності, і ця книга є першим джерелом на моїй пам'яті, яка демонструє як перевірити корисність самого рівняння прямої через аналіз варіяцій.

Проте вражає вона і в негативному сенсі. Звичайно, в цьому контексті говориться про нормальний розподіл — один з небагатьох розподілів, де найімовірніша величина таки рівна середньому, та ще й медіані. Проте зображене на скріні твердження настільки засіло у головах більшості статистів і просто людей, що набуло форми важкої хвороби. Йому не вистачає зірочки з виноскою, що це не просто не завжди правда, а майже ніколи нею не є.

Сумно, читаємо далі і згадуємо сенс середнього за статтею в реплаї.

#теорім
Якщо ввечері нападе знічев'я, можете о 17:00 за Києвом приєднуватись до уроку з алгебри для 11 класу — будемо розмазувати комбінаторику через правила сум і добутку, а якщо пощастить — то виведемо і формулу кількості сполук, вони ж комбінації, вона ж біноміальний коефіцієнт ака головна героїня більшості моїх постів про #теорім.

Я підготував приклади з життя, лишилось сподіватись що життя підготувало мене до цього уроку.
Машинний викладач нарешті освоїв мистецтво хештегів, і тепер може видавати деякий вміст за ними. Нагадую, що також є стара карта, яка виконувала схожу функцію, але припинила оновлення через непрактичність. Користуйтесь:

#матфіз — матеріали з фізики та математики найрізноманітнішого штибу, переважно авторське (пости та статті), але є й задачки: часом з розв'язками, а якщо без — то з можливістю заробити!

#теорім — аналогічно, цього разу з теорії ймовірностей та статистики. Ще більше вмісту! І навіть огляди на мангу, ага.

#потоки — записи стрімів на вищенаведені теми. Не рекомендую дивитись без 2х, і навіть в такому випадку на власний страх та ризик.
Коли в науці на критику вам відповідають «це краще, ніж нічого», то скоріше за все краще вже нічого, ніж той неякісний процес чи метрика, яку вони захищають.

Як от метрика тривалості життя, яка бере середню його тривалість: через змішування високої смертності при народженні з власне високою тривалістю життя, виникає необґрунтоване (ба навіть хибне) враження що раніше люди жили по 30-40 років. Рішення: не послуговуватись метрикою взагалі, або розбивати її на смертність по народженні і life span, себто середню тривалість життя після одного року абощо. Медіанний вік не буде робастним мірилом якраз через зʼїдання лівого хвоста.

#теорім
Машинний викладач ∆ | #УкрТґ
Аби жінка отримала мій канал, вона повинна вміти проводити схожі викладки. Чоловіків теж стосується.
Випадкова змінна «час до відповіді на повідомлення», aka “інтервал між повідомленнями», має явно товстохвостий розподіл: чим довше адресат не відповідає, тим очікуваний час до відповіді довший. З прочитанням думаю аналогічно. І це не дивно, бо змінна утворена процесом з памʼяттю: чим далі, тим більш правдоподібно, що вам просто не хочуть відповідати, лишаючи непрочитаним. Бо всі періодичні ефекти, які могли б вплинути на час відповіді, зрештою усереднюються: вечір зміняється ранком і днем, вихідні переходять у будні, а відпустка закінчується.

Але тим зрештою відповідь на повідомлення є несподіванішою і непередбачуванішою, як от через три роки після написання.

#теорім
Машинний викладач ∆ | #УкрТґ
Photo
Проаналізував текстові пости каналу за три роки. На графіку ви бачите частку постів, які мають більше ніж х символів. Що нам це каже?

Графік функції P(X>=x) (також відомої у місцевих колах як функція пережитку/досвіду) можна інтерпретувати у рамках геометричного/експоненційного розподілу. Коли пишеться пост, він має певну ймовірність закінчитись на поточному знаку. Якщо ця ймовірність стала впродовж написання посту, то графік вище виглядав би як пряма лінія. Як можна побачити, у графіку є доволі велика прямолінійна ділянка, тобто як тільки відмін досягає ~500 знаку під час написання посту, ймовірність його закінчення стає сталою на кожному подальшому знаку десь аж до 3500. І ймовірність ця рівна ~ln(.1/.02)/2500=6.4e-4, що в промілле відповідає легкому сп'янінню. Сподівана ж довжина посту після 500 знаків рівна 500 (поточна) + обернена ймовірність вище, себто приблизно 2000 знаків.

Початок графіку значно стрімкіший, а тому ймовірність посту закінчитись на конкретному знаку рівна приблизно ln(2) / 80 ~1% (алкогольне отруєння), що відповідає сподіваній довжині посту близько 120 знаків. Так як стрімкість зменшується, то зменшується і ймовірність закінчення посту на цьому знаку зі збільшенням його номеру, а з тим збільшується і сподівана довжина посту. Це позначає перехід з режиму короткого коментаря в 1-2 речення у режим довгопосту. І триває цей режим аж 4000 знаків, де Сварог зна що відбувається (частково бо пост зазнає поділу на кілька, тож це дослідження можна лишити на майбутнє).

#теорім