Нотатки Грея
1.08K subscribers
4 photos
1 file
15 links
Download Telegram
Перед новорічними святами інтернет облетіла страшна звістка — на Reddit з'явився пост, де анонімний бекенд-розробник із сервісу доставки їжі розкривав страшні подробиці ціноутворення та розподілу замовлень. Мовляв, компанія розраховує «індекс відчаю» водіїв і показує найбіднішим найгірші замовлення — пост зібрав 86 тисяч лайків і 36 мільйонів переглядів на X.

Але це було фейком.

Автор Platformer Кейсі Ньютон докладно описав, як ледь не попався на містифікацію. Документи й навіть бейдж співробітника виявилися згенерованими нейромережею. Причому викрити фейк допомогла та ж технологія, яка його створила. Google Gemini зміг розпізнати власний водяний знак SynthID на зображенні бейджа. Але вісімнадцятисторінковий «технічний документ» про внутрішню архітектуру системи виглядав досить переконливо, щоб досвідчений журналіст витратив час на його вивчення.

Цікаво, що до мене одночасно надійшло кілька посилань про те, як люди використовують AI для написання наукових статей — цілком легітимно, так би мовити.

https://www.platformer.news/fake-uber-eats-whisleblower-hoax-debunked/?ref=platformer-newsletter
16😁13👍9😨1
Дослідники з Університету Торонто (Gans & Goldfarb, NBER, січень 2026) ставлять під сумнів апокаліптичні прогнози щодо автоматизації. Їхній аргумент простий: більшість оцінок ризику базуються на припущенні, що завдання в професії незалежні одне від одного. Автоматизував 9 із 10 — втратив 90% роботи. Але реальність інша: завдання часто комплементарні, як деталі в механізмі. Якщо одна ланка слабка — весь продукт страждає.

Коли машина бере на себе рутину, працівник не просто "втрачає" ці завдання — він перерозподіляє свій час на те, що залишилося, і виконує це якісніше. Автори називають це "ефектом фокусування". Класичний приклад: банкомати не знищили професію касира — касири стали "relationship bankers", зосередившись на складних клієнтських взаємодіях. Те саме відбувається з радіологами, юристами, аналітиками.

Що це означає практично? Питання не в тому, чи може ШІ виконати якесь завдання, а в тому, де залишаються "вузькі місця", які люди закривають краще. Поки такі місця є — працівник може стати ціннішим, а не дешевшим. Іронічно, що саму статтю автори написали за допомогою ChatGPT 5.2 Pro та Claude Opus 4.5 — живий приклад власної теорії.

Щоправда, побоюватись є чого — якщо ШІ опанує всі елементи завдання, включаючи "вузькі місця", тобто почне їх виконувати краще за людину, то людина одразу втратить всю роботу.

https://www.nber.org/papers/w34639
👍2216
Я зазвичай не пишу про компанії Маска — дуже багато інформаційного шуму та маніпуляцій. Але тут цікава новина — xAI підняла Round E обсягом 20 млрд доларів, що більш ніж планувалось. Серед інвесторів Fidelity, Qatar Investment Authority, MGX та Nvidia й Cisco.

В повідомленні їдеться, що у Grok активної аудиторії 600 млн користувачів, але це загальна аудиторія X, яка має доступ до Grok — далеко не всі реально користуються. Для порівняння — у OpenAI аудиторія приблизно 480 млн, але це точно користувачі саме бота.

Цікаво, що немає інформації про оцінку компанії. Це зазвичай такий показник, що майже обовʼязково згадується в повідомленнях, але тут немає. Сами робить висновки, чому.

https://x.ai/news/series-e
🤣14👍4💯1
Ларрі Пейдж юридично залишає Каліфорнію. Як пише Business Insider, його сімейний офіс Koop, структури для фінансування літаючих автомобілів і AI-стартапу в авіації та навіть благодійний фонд його дружини Люсінди Саутворт — все перереєстровано в Делавері.

Причиною став податок штату Каліфорнія, який запропоновано проголосувати в листопаді цього року: він становитиме 5% від активів для резидентів зі статком понад мільярд доларів. Якщо мешканці штату схвалять цей податок, то він набуде чинності ретроактивно з 1 січня цього року.

Пейдж при цьому не переїжджає фізично. Втім, як і багато інших, які переїхали юридично в інші штати, включаючи Делавер і Техас. Щоправда, обіцянки Девіда Сакса, що незабаром Остін обійде Сан-Франциско як технологічна столиця США, виглядають завчасними.

https://www.businessinsider.com/larry-page-leave-california-wealth-billionaire-tax-koop-google-2026-1
👍18🤣21👏1👌1
Останні дні року у когось дуже напружені, а у мене зазвичай дуже спокійні та з'являється час для експериментів. Тому, коли я зустрів новину про українські бенчмарки для LLM, навіть порадів, що якраз є час погратися.

Ukrainian LLM Leaderboard — проєкт спільноти lang-uk для оцінки якості мовних моделей на українських бенчмарках. Лідерборд включає як стандартні тести (MMLU, GSM8K, HellaSwag, ARC), перекладені українською, так і унікальні українські бенчмарки — передусім ЗНО (географія, історія, мова і література, математика).

Наразі перше місце посідає MamayLM-Gemma-3-12B-IT — локалізована версія Gemma 3, дотренована на 75B токенів українських текстів командою INSAIT.

Чесно кажучи, я розумію всі переваги використання локалізації для LLM — дійсно, краще мати правильний токенізатор, власний датасет та інше, але щоразу я бачу такі проєкти, у мене виникає питання — а чи не простіше закидати проблему грошима/потужностями, тобто взяти більшу модель, або навіть дуже велику, яка й датасет матиме більший, та якось з мовою впорається? Тому поглянувши на проєкт, я спробував прогнати бенчмарки на інших моделях.

Лідерборд використовує lm-evaluation-harness з кастомними тасками. Стандартна конфігурація потребує доступу до logprobs моделі, тому тестування через більшість API неможливе.

Я адаптував конфігурацію для роботи з OpenAI-сумісними API, замінивши multiple-choice таски на generate_until з відповідним парсингом відповідей. Це дозволило протестувати моделі, недоступні для локального запуску. Хоча так, це трохи знижує точність та іноді виникають помилки парсингу.

Було протестовано дві моделі:
Gemma 3 27B IT — більша модель від Google у порівнянні з лідером, але не локалізована
Qwen3-30B-A3B — MoE-модель з 30B параметрів, але лише 3B активних

Результати


MamayLM-12B Gemma 27B Qwen3-30B
MMLU-UK 64.29% 68.52% 62.01%
Belebele 89.89% 90.89% 80.00%
GSM8K 67.00% 65.13% 44.66%
IFEval 61.18% 78.30% 76.98%
ARC Easy 79.76% 92.01% 87.61%
FLORES (переклад) 34.26 0.71* 19.90
ЗНО Географія 85% 86% 81%
ЗНО Історія 77% 75% 66%
ЗНО Мова і літ. 49% 47% 32%
ЗНО Математика 25% 14% 4%


*Результат FLORES для Gemma 3 27B некоректний через проблеми з парсингом.

Висновки

Гіпотеза 1: Чи можна взяти більшу LLM та досягти відповідної якості без локалізації?

Так, частково підтверджується. Gemma 3 27B без жодної українськомовної адаптації показує результати на рівні або краще за MamayLM-12B у більшості тестів на reasoning (MMLU, IFEval, ARC). Водночас локалізована модель зберігає перевагу у перекладі (FLORES) та культурно-специфічних завданнях (ЗНО мова і література).

Гіпотеза 2: MoE-архітектура компенсує менший розмір?

Не підтверджується. Qwen3-30B-A3B з 3B активних параметрів програє обом dense-моделям майже у всіх тестах, попри загальну кількість 30B параметрів.

Практичний висновок: Більші за кількістю параметрів моделі краще узагальнюють та краще справляються з задачами на reasoning. Якщо вам важливо, щоб модель мислила та розмовляла саме українською, то альтернативи локалізації немає — навіть більша модель, але без локалізації, буде мислити іншою мовою та виглядати як дуже розумний іноземець, з артефактами з іншої мови. А якщо вам потрібно, щоб модель знала локальні факти, то вони мають бути присутніми в датасеті або доступними через retrieval.
36👍31👎1🤮1
Цікава колонка в Financial Times доводить, що у Європі не потрібні безпілотні автомобілі. Популярна теза, що вони знижують аварійність, дещо нерелевантна — середній рівень смертності в аваріях й так вдвічі нижчий за США, а у деяких країнах взагалі нульовий.

Крім того, європейські міста мають досить розвинену мережу громадського транспорту та інфраструктуру для пішоходів й велотранспорту (я памʼятаю, як в деяких компаніях політика відряджень вважала США країною без громадського транспорту та дозволяла брати машини в оренду коштом компанії). Таксі Waymo приблизно половину пробігу виконують у порожньому стані, а це лише додасть навантаження на міста. В яких, до речі, в багатьох випадках існують закрити для автотранспорту райони, переважно історичні.

Waymo планував в цьому році запуститися у Лондоні — отже, подивимось, як це буде.

https://www.ft.com/content/781c88b6-ec6a-4eda-8963-654391aa914c
👍45👏5😁2🤔1
DOU періодично підкидає новини з розробки "національної LLM". Зараз там готують датасет, як я розумію, та готуються до дуже важливого етапу — голосувати за назву моделі. Так, це був сарказм.

Щоправда, я не дуже розумію, чому попри наявність щонайменш двох дійсно локалізованих LLM (дивись лідерборд, що я згадував вчора) на базі той же Gemma 3 потрібно ще доробляти третю. Але добре — почекаємо та подивимось, що буде зроблено, а не піарні заяви. А поки що у мене тут черговий side-project намалювався. Згодом сподіваюсь розповісти.
👍178
Чому б не похайпувати, вірно? Особливо читаючи відгуки про те, як Орешником без бойової частини намагалися вцілити по підземнім газовим сховищам (ПГС).

Оскільки у багатьох, здається, Google заборонений, то уявлення про ПГС виглядає як про таку нафтобазу з резервуарами, тільки під землею. Та, якщо попасти по ней ракетою, то все вибухне й не буде у нас газу. Саме так вважають росіяни, яки з утра вже повідомлюють, що уламками від того Орешника зруйновано найбільше ПГС у Європі — Більче-Волицько-Угерське на 17 млрд кубів газу.

Я не буду розраховувати потужність вибуху, хоча більшість вказує, що вона дорівнює 1-2 звичайним балістичним ракетам. Чи можна так зруйнувати та змусити вибухнути власне ПГС?

Ні.

ПГС — це не нафтобаза з резервуарами на відкритому повітрі. Це виснажене родовище газу, від якого залишився, умовно кажучи, набір порожнин та пор у породі. Туди закачують газ під тиском та закривають шаром непроникної глини, що не дає газу випаровуватися. Більшість ПГС залягають на глибинах від 400 метрів до 2 кілометрів.

Памʼятаєте, як під час бомбардувань Іранських ядерних об'єктів експерти саркастично казали, що ці обʼєкти знаходяться на глибинах в декілька сот метрів або кілометра, тому навіть дуже потужна бомба не достане? ПГС залягає глибше та при цьому це ж не резервуар, а пласт породи. Навіть якщо десь в результаті вибуху утвориться свердловина, газ не вибухне, бо під землею нема кисню.

Звичайно, вразливі місця є. Бо є наземне обладнання — компресори, газорозподілювачі, трубопроводи тощо. Якщо їх зруйнувати або пошкодити, неможливо буде закачати газ або підняти його. Тобто доступ до запасів газу у сховище буде неможливий на час ремонту або монтажу нового обладнання.

Але це теж не одна точка, що можна вразити. ПГС — це сотні свердловин, десятки газорозподільчих пунктів та декілька компресорних станцій. Це дуже розгалужена система, що займає декілька десятків квадратних кілометрів. Зруйнувати її навіть Орешником неможливо. Так, може пошкодити, що призведе до зменшення пропускної здатності системи. Але, як бачимо, в цьому випадку вибухова хвиля спричинила спрацьовування захисту на деяких пунктах та й все.

Це не означає, що нам взагалі пофиг на той Орешник. Хоча, якщо замислитись, що вся та росія за два роки змогла аж двічі запустити набір болванок за десятки мільйонів доларів без помітної шкоди — так, майже пофиг. Як казав Олег Скрипка — ми переживаємо, але не дуже, тобто ми взагалі не переживаємо.
58👍23💯1
Не дивуйтесь — я хоч й не є віруючим, але все ж цікавлюся релігією. Недарма людство декілька тисячоліть витрачало ресурси на цю сферу, тому не варто її сприймати з позиції радянського атеїста, про товстих попів та опіум для народу.

Але зараз я просто позначу два факти про УГКЦ, що мене здивували.

Ми звикли сприймати українські церкви, з одного боку, як суто етнічні, тобто пов'язані з українською нацією, з іншого — як церкви відносно молоді, що відокремились відносно нещодавно. УГКЦ в цьому сенсі так й виглядає — вона й почалася з унії наприкінці XVI століття, тобто пізніше православної або власне католицької, та досить довго не існувала офіційно в Україні, бо була заборонена в СРСР після другої світової війни. Тому, чесно кажучи, я був дуже здивований, коли, зустрів популярний подкаст про католицтво Pints with the Aquinas (YouTube мені порекомендував випуск, де майже половину з кількох годин його автор з гостем палили люльки та обговорювали це) та дізнався, що його ведучий Мэтт Фрадд є парафіянином УГКЦ — хоча він народився в Австралії, мешкає в США та начебто ніяк не повʼязаний з Україною або діаспорою.

Виявилось, що це не виключення. Досить помітна частина католиків на Заході відвідують католицькі церкви східного обряду. Чому? Упродовж останніх 60 років римо-католицька багато чого робила для модернізації, починаючи з літургічної реформи, більш активного залучення вірян, використання сучасних технологій для спілкування зі спільнотами тощо. Дехто сприймає це як спрощення, втрату традицій, іноді втрату відчуття єдності спільноти. Церкви східного обряду, навпаки, позиціонують себе як традиційні, літургія виглядає більш урочисто, а, наприклад, коли папа Франциск зробив гучну заяву про можливість благословіння одностатевих шлюбів, голова УГКЦ виступив з зауваженням — й це досить широко висвітлювалось. Багато парафій активно використовують англійську в своїй діяльності та навіть деяка частина літургій проводиться англійською.

Дивно, так? Я ніколи не сприймав саме церкву як канал звʼязку та інтеграції з західним світом, але, здається, так воно і є.

А другий факт саме про історію. Чи знаєте ви, що в Україні ДВІ греко-католицькі церкви? Так, окрім УГКЦ існує ще окрема Мукачівська єпархія, що підпорядкована напряму Ватикану. Це такий артефакт складної історії західної частини України, бо вона спочатку була утворена, коли ця частка земель входила до Угорщини, деякий час навіть була підпорядкована Єгерському римо-католицькому єпископу, але згодом виборола свою незалежність та перейшла до прямого підпорядкування Святому престолу в Римі. В 19 столітті з її складу була відділена ще одна єпархія, що згодом стала Словацькою греко-католицькою церквою, а на початку 20 століття — ще одна, з якої була утворена Угорська греко-католицька церква.

Та зараз саме ці церкви становлять жорстку опозицію всім спробам за останні 30 років обʼєднати Мукачівську єпархію з УГКЦ — бо зараз існування окремої єпархії робить її неукраїнської та дає підстави стверджувати, що це русинська традиція — тим більше, що УГКЦ почалася з Брестської унії 1596 року, а Мукачівська єпархія утворилася в результаті Ужгородської унії 1646 року. Як можна здогадатись, чималу роль відіграють тут й політичні кола Угорщини, що багато років говорять про захист етнічних угорців та навіть намагаються зазіхати на територію України.

Між іншим, у 2024 році єпископом був призначений молодий (44 роки) уродженець Прикарпаття (попередній єпископ був словак), що став активно співслужити з головою УГКЦ — це, здається, було свідоме рішення Ватикану, результатом чого може бути мʼяка відмова від русинської ідентичності та поступовий рух до УГКЦ. Треба розуміти, що там ще й РПЦ (у вигляді УПЦ (МП)) має досить великий вплив, що починає слабшати. Ось таке сплетіння історії та сучасної геополітики.
43👍24🤔2😇1
Це було так давно, що навіть не памʼятаю, коли саме. Але, мабуть, хтось ще памʼятає у 80-х роках минулого століття популярну книгу про НЛО та прибульців з інших планет під авторством Еріка фон Денікена — навіть з фото "з архивів Пентагону" та іншим.

Так ось, вчора у віці 90 років фон Денікен помер. А ось його проект, багато кому відомий під назвою SETI, здається, ні. Між іншим, а ви запускали на домашньому компʼютері на початку 2000-х SETI@home?
😢23🫡61💔1
Я вже й хвилюватися почав — де ж новини про залізниці на болотах? Це тому, що забув, що у них там війна війною, а новорічний запій за розкладом. Ось перший робочий день — і звично сумна картина показує, що весь 2025 рік російські залізниці навантажували ще менше, ніж рік тому. Ця тенденція почалася наприкінці 2023 року та зберігається досі. Аномалія жовтня 2025 року — це статистична спритність рук, адже умовний "плюс", що було досягнуто — це приблизно година роботи всієї мережі, яку зарахували "авансом" з листопада. 

Не варто забувати, що це лише один кількісний показник. Аналогічна картина з вантажообігом (він, між іншим, почав падати швидше за навантаження, тобто не тільки везуть менше, але й на меншу відстань). Весь цей час погіршуються і якісні показники — наприклад, обіг вагона, динаміка якого показує, що вагони дедалі більше стоять, ніж їдуть. А ще вагонів стає більше, ніж потрібно, та навіть більше, ніж може проковтнути мережа. А ще набув чинності новий Прейскурант 10-01 (хоча, здається, він вже якось інакше зветься) — тобто, головний збірник тарифів, де більшість тарифів "проіндексовано", тобто збільшено, що дуже гучно критикували, а зараз за декілька місяців ми побачимо, як це відобразиться на обсягах роботи.

Ще не забувайте, що десь в показниках є слон у кімнаті — військові перевезення. Вони не потрапляють у звіти, але пропускна здатність витрачається, можливість маневрувати зменшується, тобто здоровʼя це не додає.

Це дуже дивний приклад — як все ж таки можна повільно, але впевнено нищити таку велику галузь, для такої великої країни має стратегічне значення. Але виглядає так, що доконають неодмінно.
🔥42👍20😐43🤡1
Поки всі вважали Сальвадор передовою країною в використанні криптовалюти на державному рівні, виявилося, що в іншій країні в крипті розраховується й бізнес, й звичайні громадяни. А саме у Венесуелі.

Завдяки санкціям с 2020 року державна компанія PdVSA (та, що видобуває та продає нафту) вимагає від покупців сплачувати в USDT. Дехто вважає, що 80% надходжень за нафту — це саме крипта.

А завдяки інфляції, тобто девальвації національної валюти — болівара, — на 99,8% більшість жителів теж віддають перевагу розрахункам в USDT.

Щоправда, Tether активно співпрацює з урядом США та блокує гаманці, що використовуються в операціях з обходу санкцій. Але це навряд чи щось зминіть для простих громадян Венесуели.

https://www.wsj.com/finance/currencies/maduros-crypto-backed-oil-deals-put-tether-at-center-of-venezuela-money-drama-3fc53b29
👍7🤔4