Машинний викладач ∆ | #УкрТґ
350 subscribers
4.36K photos
445 videos
23 files
1.13K links
"Тицяй мене в моє невігластво що маєш моці"©Макарош

#примондні_матеріяли #немов
#теорім #матфіз #потоки

Анонімний зворотній зв'язок: https://forms.gle/ToqdRsbsPvUuyytC9

Стара карта каналу: https://t.me/lehrer_genau/1197
Download Telegram
Машинний викладач ∆ | #УкрТґ
Експоненційний розподіл Процес вивчення статистики починається з теорії ймовірності. Часто, як от на фізфаці, він там і закінчується, що є дуже сумно, але сьогодні не про те. Після освоєння комбінаторики для власне підрахунку чисельників та знаменників у…
Який розподіл має довжина волосся?

Поки код раниться, а моя шведська сім'я (яка й підкинула цю ідею) підписана на мене лише наполовину, можна й активно попрокрастинувати. Тож, ваші варіянти? Перш ніж читати далі, спробуйте отримати його самостійно.

Фізики знають лише два розподіли: нормальний та ті, що до нього зводяться: Пуассона та біноміальний. Пуассоном користуються в ядерній фізиці, а біноміальний... Хороше питання чи він стає у фізиці в пригоді взагалі, не зважаючи на свою всюдисущність у математиці. Тож, чи розподілена довжина волосся нормально? Підійдіть до дзеркала, незалежно від музичних вподобань чи статі. Скоріше за все, ви не зможете виокремити певну середню довжину волосся, відносно якої симетрично розподіляться решта волосин. Особисто у мене складається враження, що на голові є кілька зон, і для кожної з них треба отримувати розподіл окремо, аби не мати каші. Тож, спостерігаєте нормальний розподіл на чубі? Навряд.

Куди кращим припущенням здається експоненційний розподіл. Найпростіша модель наступна: ваше волосся рівномірно росте, але щомиті має певну ймовірність випасти, такий собі процес Бернуллі, який зупиняється на досягненні значення бінарної випадкової величини Х=1. Це призводить до звичайного геометричного розподілу, який у неперервному випадку зводиться до експоненційного — деталі у реплаї. Що не так з моделлю?

По перше, волосся постійно підстригається, та ще й під різну довжину, тому це застосовано лише якщо волосся починало з однакової довжини. Підозрюю, що до першої православної стрижки кучері немовлят саме такий розподіл і мають. Проте є цікавіше питання: чи залежить ймовірність випасти від довжини? Пригадайте як ви висмикували волосину у себе чи когось. Пригадайте міцність однієї волосини. Тепер усвідомте її вагу і прийдіть до висновку, що навряд. Можливо, зі старістю цибулина значно втрачає міцність і призводить до ймовірнішого випадіння, але це вже до біологів.

Кінцівка буде як у Кінга — ніяка.

#теорім
Чи справді перше враження найважливіше?

Додамо в крінжу статистики. Чи певно часто чули і можливо навіть бачили емпіричні доведення, що перше враження має невимовну вагу, і зафакап ти перші 30 с спілкування з людиною — тобі вже не реабілітуватися. Проте що як це лише є наслідком максими Your inference is only as good as your priors ? Давайте розбиратись.

Нехай перед зустріччю з вами людина, для простоти, має лише дві рівноправні гіпотези щодо вас: H="ви крутий" і Г="ви зашквар". Поки що проігноруємо слова її подружок у поточному розгляді. Тепер, ви робите певну дію Д, яку для простоти означимо крінжовою. Якщо людина раціональна, то її віра у вашу крутість буде оновлена згідно з теоремою Баєса:

Р(Н|Д)=Р(Д|Н)Р(Н)/Р(Д)

Аналогічно, віра що ви зашквар стане рівна:

Р(Г|Д)=Р(Д|Г)Р(Г)/Р(Д)

Поділимо ці два вирази один на одний і введемо поняття шансу: відношення ймовірності події до ймовірності її доповнення. До того як ви зашкваритесь, наприклад, цей шанс рівний одиниці:

Р(Н|Д)/Р(Г|Д)=О(Н|Д)=Р(Д|Н)/Р(Д|Г)*О(Н)

Отримали зручний спосіб робити баєсівське оновлення переконань. Якщо ця людина очікує, що зашкварний робитиме крінжу вдев'ятеро частіше, ніж крутий, то шанси в її очах що ви крутий падають вдев'ятеро. Що робити, скажете ви? Щось круте мабуть, бо зараз ви такий на максимум 10%.

Після вчинення вами чогось, що за стандартами спостерігача може вважатись крутим, його переконання щодо вашої зашкварності знову оновляться:

О(Н|Д',Д)=Р(Д'|Н)/Р(Д'|Г)*О(Н|Д)

Якщо круті (в очах того самого судді) роблять щось таке вчетверо частіше за зашкварних, то ви звичайно опиняєтесь у гіршій ситуації, ніж були до знайомства. Проте, як бачите, це дуже залежить від людини, і у вас є нічогенький шанс реабілітуватись, якщо вона дозволяє робити крутим крінжу частіше ніж очікує від зашкварних чогось надзвичайного (не зовсім вірно, зате слів менше).

Отже, так як в цій простій моделі оновлення комутативні (вона очікує від вас крінжу не через те, що спостерігала її, а бо вже вважає вас зашкваром, тому Р(Д'|Н,Д)=Р(Д'|Н)), за перше враження можна перейматись лише тому, що ймовірність її вразити пропорційна до ймовірності наступної зустрічі, яка, звичайно, суттєво знизилась після такого. Мої співчуття.

#теорім
З ювілейною кількістю підписників повертаємось до витоків. Сиквел з ще більшою кількістю вмісту до задачі про рулетку вже тут. Гарної ночі, чи ранку, залежно коли прочитаєте. І як завжди, відгук вітається!

#теорім
Нарешті в каналі будуть гідні конкурси. Доведіть рівність.

#теорім
До речі, людям, які вважають, що антиваксам всього лише не вистачає шкільної програми, пропоную дати відповіді на наступні прості завдання звідти ж:

Математика (Теорія ймовірності):
В Україні 1% від популяції інфіковано ковідом. Ви їдете закордон, і для цього тестуєтесь тестом з точністю 99% (себто ймовірність, що тест покаже правильний результат). Якщо тест виявляється позитивним, то яка ймовірність того, що ви інфіковані?

Фізика:
Перед вами брусок, який складений з двох частин однакової маси. Перша має густину 500 кг/м^3, друга — 2000 кг/м^3. Питання: чи втоне він у воді?

Хімія:
Доповніть реакцію за нормальних умов:
H2O+SiO2->?

Українська мова:
Оберіть правильне слово:
Щиро вітаємо (Вас/вас), Ольго, у нашій компанії!
Дорогі працівники та працівниці! Щиро вітаємо (Вас/вас) з днем заснування компанії!
Поставте розділовий знак:
Діти антиваксів як сторіс в інстаграмі _ у вас не так багато часу, аби їх побачити.

#теорім #матфіз
Машинний викладач ∆ | #УкрТґ
До речі, людям, які вважають, що антиваксам всього лише не вистачає шкільної програми, пропоную дати відповіді на наступні прості завдання звідти ж: Математика (Теорія ймовірності): В Україні 1% від популяції інфіковано ковідом. Ви їдете закордон, і для цього…
Розв'язки. Спонсор — лекція з розподілів, яка мала закінчитись на Levy flights, але лектор ледве закінчив на кумулянтах, тому час не був втраченим. Мене дуже занесло, тож можливо знайдете немало цікавого.

#теорім #матфіз
Теорія ймовірностей, статистика, та математичні приколи: (список анонсів)
Ефект Лінді або чому неживе проживе ще стільки ж, в той час як нове (скоріше за все) згине так само швидко, як і з'явилось. (обережно, краш-тест формату)
Експоненційний розподіл, або чому ви чекатимете на маршрутку 10 хв незалежно від того, коли приїхала остання. (продовження попереднього)
Проста задача про російську рулетку, де все не так однозначно.
Розподіл довжини волосся. (плюс пости нижче)
Трохи про важливість першого вражіння.
Ви переживете середню очікувану тривалість життя.
Пологовий будинок і ефекти розміру. (не забудьте прочитати пояснення до квізу)
Ще більше рулетки.
Конкурс на 100 грн, досі актуальний.
Середні величини та як розоритись, ставлячи на середнє арифметичне
Принцип Парето та самоподібність.
Зв'язок між Парето та експоненційним розподілом, а також його виведення. (легендарний кросовер головних персонажів рубрики)
Чому у вашої коханої було більше партнерів, ніж у вас партнерок?
Невідворотність розподілу Парето та Голодомор.
Функціонально-диференціальне рівняння за 300 грн (начебто).
Рівняння на послідовність за 80 грн.

#теорім #матфіз
Зв'язок між Парето та експоненційним розподілом, або чому Парето такий всюдисущий, від достатку до рівня навичок?

Давайте подивимось на розподіл логаритму змінної, розподіленої за Парето. Наприклад, для статків це буде кількість нулів на банківському рахунку. Беручи зворотню кумулятивну функцію (як ми означали її вище) і обезрозмірюючи змінну х, маємо:

y=log(x/x_m)
F(x)=P(X>x)=(x_m/x)^a=e^(-a log(x/x_m))=e^(-ay)=P(Y=log(X/x_m)>y)

Отримуємо зворотню кумулятивну функцію експоненційного розподілу! Тобто логаритм змінної Парето розподілений експоненційно. Чому так виходить?

Пригадаємо для початку, які випадкові величини мають експоненційний розподіл. Зазвичай так розподілений певний час зупинки (stopping time — статистичний термін, а не вихваляння моєю британською), як от момент прибуття автобусу чи тривалість життя чогось. Пригадаймо також, що він є неперервним аналогом геометричного розподілу, який вимірює кількість спроб до першої невдачі. У випадку з довжиною волосся, за припущення, що воно щомиті може випасти з однією й тією ж ймовірністю р, невдачею є якраз випадіння, і тому ймовірність не випасти за п шансів рівна (1-р)^п. Чи надходить вам тепер ідея, чому кількість нулів на банківському рахунку може бути розподілена за експоненційним розподілом?

Ще одна підказка. Уявіть, що населення починає інвестувати з приблизно однакового капіталу, і щороку отримує схожий відсоток нарахувань. Дехто від нетерплячки, мовляв ріст надто повільний, або ж обставин, які можуть трапитись з усіма, знімає гроші з депозиту, припиняючи їхній ріст, в той час як решта продовжують тримати їх. Таким чином можна вважати, що щороку власникам депозиту чи акцій властива ймовірність полишити це діло, і якщо вона не змінюється з року в рік, то тривалість інвестування отримує геометричний розподіл. Звичайно, через років 20 ця ймовірність може суттєво зменшитись, особливо після спостереження інвестором накопиченої суми, проте якщо він знайде застосування цим грошам чи не захоче чекати ще років з 5 до пенсії, ймовірність може виявитись достатньо схожою і грубо розподіл виглядатиме схоже.

Тож, час інвестування має грубо геометричний розподіл. Розмір статків щороку множиться на (1+і/100), де і — відсоток нарахувань, а отже логаритм розміру статків зростає на log(1+i/100). Це означає, що логаритм статків лінійно росте з часом, а отже розподілений як і час інвестування — геометрично. В результаті отримуємо, що самі статки мають бути розподілені степенево — за Парето. Звідси і принцип.

Аналогічну логіку у першому наближенні можна застосувати і до довжин річок (замість пробитись через перешкоду і видовжитись пропорційно до довжини завдяки вже набутому напору вона може просто здатись), розміру файлів (де тут компуктер саєнтісти), та навіть рівня навичок. В останньому випадку, щоправда, це може бути і неправдою, тому автор лишає аргументацію на розсуд читача.

#теорім
В коментарях навели середню ціну на житло в Нідерах, напевно бо інформації по медіані нема, тож чудова нагода пригадати корисність обох мірок. Головна думка цієї писанини полягає в тому, що середнє арифметичне зберігає інформацію про накопичувальне (ака агрегатне) мірило. Себто якщо ви хочете скупити кількадесят будинків, то для обрахунку орієнтовних видатків вам потрібне середнє арифметичне, бо загальна вартість ваших будинків з найбільшою ймовірністю буде рівна середнє*кількість.

Проте припустимо ви ще не досягли успішного успіху і просто хочете поселити сім'ю, для початку хоча б одну. Що вам каже середнє арифметичне? Нічого, адже це усереднення між королівськими хоромами та халупами і не дає абсолютно ніякого уявлення про те, на яку ціну можна розраховувати. В той же час, медіана вам дає зрозуміти, на яку цінову стелю можна орієнтуватись з ймовірністю 50% — ви раптово володієте інформацією про половину ринку! Також на допомогу приходять квартилі, які рахуються ще рідше, але допомагають бути впевненим вже про 75% всіх наявних на ринку домівок.

Тому медіана (та відсотилі вцілому) є значно інформативнішим мірилом для від сили кількаразових дій. Використовуйте медіану, не помилитеся, недарма вона є robust мірилом щодо викиднів (аутлаєрів, вибачте за мою вашингтонську). Звичайно є ситуації, де медіана та середнє співпадають, як от для симетричних розподілів, проте коли ви востаннє бачили симетричний розподіл в реальності (окрім IQ, окрема історія)? Пригадайте розподіл Парето і забудьте про середні величини у прийнятті буденних чи просто приземлених рішень.

#теорім