FSCP
18.1K subscribers
30.2K photos
3.46K videos
859 files
77.3K links
another filter bubble канал изначально созданный несколькими друзьями чтобы делиться копипастой, иногда оценочным суждением

технологии, деньги, социум

редакция @id9QGq_bot
реклама @johneditor
в будущее возьмут не всех
выводы самостоятельно

мир меняется
Download Telegram
Влияет ли fine tuning LLM на новых знаниях на галлюцинации модели?


На этот интригующий вопрос решили ответить исследователи из Google.


Основные тезисы:

1. LLM с трудом удается переварить новые фактические знания посредством fine tuning-a. Примеры, вводящие новые знания, изучаются значительно медленнее, чем те, которые соответствуют уже существующим знаниям модели.

2. По мере того, как LLM со временем усваивает новые знания, ее склонность к галлюцинациям возрастает. При этом наблюдается линейная корреляция между долей примеров fine tuning-a, вводящих новые знания, и увеличением количества галлюцинаций.

3. Fine tuning в основном помогает модели более эффективно использовать уже существующие знания, а не приобретать новые знания. Примеры fine tuning-a, соответствующие уже существующим знаниям модели, изучаются быстрее и повышают производительность.

4. Авторы разработали контролируемое исследование, в котором варьировали долю примеров fine tuning-a, вводящих новые знания, и анализировали их влияние на производительность модели. Также исследователи впервые предложили классифицировать факты по отношению к базе знаний модели на четыре категории.

5. Fine tuning на новых фактических знаниях создает риск overfitting-a, что может привести к снижению производительности и усилению галлюцинаций. Ранняя остановка (early stopping) во время fine tuning-a помогает снизить этот риск.

6. Точная настройка примеров, отнесенных к категории «Может быть, известно» (те вопросы, на которые модель спорадически давала правильные ответы), оказалась особенно полезной. Этот выбор улучшил способность модели обрабатывать такие примеры без значительного увеличения галлюцинаций.


📜 Пэйпер
_______
Источник | #nn_for_science
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
Франция. Почтовый банк 🏦 напоминает своим клиентам, что

Если вы желаете снять наличными с вашего счета сумму больше, чем 1500€, вы должны предоставить банку письменное подтверждение предстоящих расходов.

То есть, прежде чем потратить ваши кровно заработанные, вы должны спросить разрешения у вашего банка…

Какого, спрашивается, лешего ?
_______
Источник | #being_human_rus
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
Одной стороны, ни пульса, ни ног у времени нет. Но, с другой стороны, все стараются держать руку на пульсе времени и идти с ним в ногу, поэтому корпоративная модель мира регулярно обновляется. В результате люди отпускают прикольные бородки и надевают шелковые галстуки, чтобы их не выгнали из офиса
_______
Источник | #viktorpelevin
@F_S_C_P

-------
поддержи канал
-------
How the sun sees you (перевод) https://t.me/lab66/1801

Возможно кто-то из вас помнит великолепный "ультрафиолет" ролик 2018 года, от фотографа Thomas Leveritt, или как он сам себя называет пионера УФ-кинематографа. Поспорить сложно, так как даже спустя 6 лет лучшее что иллюстрирует действие ультрафиолета на кожу - это именно работа Томаса. И она отличнейшим образом вписывается в обсуждаемый в тред фотозащиты /PHOTOPROTECT-2024/

p.s. вроде бы ролик снят в коллаборации с NIVEA, но в отличие от уникального 💔 фотографа, массовую продукцию этого бренда косметики лучше тщательно избегать, как минимум их шампуней, кондиционеров, да и кремов солнцезащитных, в общем-то, тоже 😎
_______
Источник | #lab66

___________________
Аллея героев-фотосенсебилизаторов

Информация о фототоксичности растений известна достаточно давно, десятилетия. И может показаться, что производители косметики это знают, учитывают. Но нет! Что лишний раз подтверждает тезис о том, что косметика и косметология - это про абсолютный шаманизмъ, а не про науку, медицину и физиологию.

Судите сами, в продаже можно найти солнцезащитные (!) кремы практически со всеми перечисленными в [заметке] фототоксичными растениями, с несчастным алоэ, с лаймом, грейпфрутом, лимоном, даже со зверобоем и календулой (притом детское!) нашлось. Да, не все выносят это на этикетку, но тем не менее покупатель на такую продукцию находится.

Я абсолютно не удивлюсь, если какой-то косметолог-маркетолог выпустит солнцезащитный крем с экстрактом Борщевика Сосновского. А может такой крем уже где-то и есть?
_______
Источник | #lab66
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
Обсессивно-компульсивное расстройство [ОКР]
или как вспомнить, закрыл ли я дверь или кран

Для словаря:
• Обсессии — навязчивые мысли, от которых хочется избавиться. Пример: я точно выключил воду? Я точно закрыл дверь?

• Компульсии — действия, которые помогают избавиться от навязчивых мыслей. Пример: нужно вернуться домой, проверить, закрыл ли кран и дверь!
Как себе помочь?

Мы много действий совершаем не думая, автоматически. Долго ли вам нужно думать, чтобы решить задачу 2+2=? Ответ приходит мгновенно.

Мы автоматически, без дополнительного напоминания себе, делаем много разных действий: закрываем дверь в машине [не оставляем ее открытой], закрываем воду, почистив зубы, нажимаем кнопку слива на бачке унитаза. Все эти действия мы делаем не задумываясь.

Например, чтобы затопить квартиру, нужно сознательно быть в моменте, осознавать свою цель, зафиксировать действия:

• обратить внимание, что кран я не закрываю, после того, как помыл руки;
• закрыть слив пробкой или тряпкой, и запомнить, что вода начинает набираться;
• почувствовать ногами мокроту, когда ванна переливается на пол и при этом сознательно покинуть дом.

Практика: спросите себя, оставляли ли вы сознательно дверь, кран открытыми? Была ли такая цель?

Если мы не помним, закрыли ли кран или дверь — значит мы его автоматически закрыли!
_______
Источник | #dianalysis
@F_S_C_P

Генерируй картинки с ⛵️MIDJOURNEY в Telegram
А теперь расскажите про эффективность вашей интернет-рекламы и SMM https://t.me/marketinghuyarketing/2504

———
Весь Росатом работал на Джире — и что случилось в день Х habr.com

———
Tesla отказалась от поддержки Steam в свежих экземплярах Model X — r/teslamotors

———
Вслед за Киргизией и Грузией, в Турции также готовят варианты закона об иностранных агентах. https://t.me/boris_rozhin/123879

———
В Индонезии начала работать сеть Starlink tass.ru

———
Bloomberg: ОАЭ выпустили новую модель Falcon, чтобы составить конкуренцию OpenAI

———
Президент Ирана Эбрахим Раиси и министр иностранных дел погибли в результате крушения вертолета. bloomberg.com

———
В Таджикистане официально запретили ношение хиджаба. taen-1.livejournal.com

———
МИД РФ готовится воссоздать магазины беспошлинной торговли, аналогичные советским «Березкам». В настоящий момент ведется работа по документальному оформлению деятельности этих магазинов.

———
"Арабский шенген" может заработать уже в 2024 году

Единая виза Совета сотрудничества арабских государств Персидского залива (ССАГПЗ), аналогичная шенгенской, должна быть введена в действие к концу этого года. Об этом заявил председатель Qatar Tourism Саад бин Али Аль Харджи 15 мая 2024 года в ходе Катарского экономического форума.

———
Коммерсантъ: Яндекс готовится начать серийное производство роботов-курьеров

———
РЖД переведет все рабочие устройства сотрудников на ОС «Аврора». Стоимость проекта до конца года может превысить 600 млн рублей

———
@F_S_C_P

-------
поддержи канал
-------
Этот USB-накопитель может хранить только 8 КБ данных, но прослужит вам 200 лет.

Компания Machdyne начала производство USB-накопителя Blaustahl, который имеет 8 КБ FRAM (8192 символа) и предназначен для длительного хранения текста

Он оснащен микроконтроллером Raspberry Pi RP2040, что делает его пригодным для различных приложений безопасного хранения данных

Устройство использует FRAM (сегнетоэлектрическое ОЗУ), известное своим сверхнизким энергопотреблением, высокой скоростью записи и чрезвычайно высокой стойкостью к записи, способной выдержать один миллион миллиардов циклов чтения/записи

Чтобы быть готовым к выводу текста через 200 лет Blaustahl имеет встроенный текстовый редактор, доступный через программы последовательной связи, такие как PuTTY и Tera Term

Устройство позиционируестя как средство для безопасного хранения паролей, ключей криптовалюты, заметок и данных геокэшинга

_______
Источник | #black_triangle_tg
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
Media is too big
VIEW IN TELEGRAM
Midjourney + Runway = Pixar Lord of the Rings🧙‍♂

Пока что трейлер, но надеюсь через годик - два будем смотреть полнометражку

Больше от автора тут - www.youtube.com
_______
Источник | #Futuris
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
"Монополия" наглядно показывает, как преимущество одного игрока над другими имеет свойство усиливаться.
Любопытны эксперименты психолога Пола Пифф из Университета в Беркли. Он 100 раз усаживал за "Монополию" двух игроков, а монетка определяла, кто из них станет "богатым": сможет ходить по 2 раза, получит в 2 раза больше стартовой валюты или прочих преференций.

"Богатые" с лёгкостью реализовывали своё преимущество и уже через четверть часа начинали вести себя вызывающе: громко смеялись, сильнее стучали фишками по столу, подгоняли противника, занимали больше места на столе и даже больше съедали снеков. И чем больше они разоряли противника, тем хуже вели себя со своими противниками: больше их подкалывали, обзывали, отзывались всё с большим пренебрежением.

И самое главное: "богатые" объясняли свою победу уникальной стратегией, большим опытом или тактическим предвидением.

И если даже в таком очевидном и откровенно игровом, несерьёзном случае люди готовы были успех обосновывать какими-то собственными качествами, хотя он элементарно объясняется выпадением нужной стороной монетки, что и говорить про менее очевидные случаи?

P.S. В других исследованиях Пол Пифф развивает вопрос неподобающего поведения богатых: по их результатам богатый человек чаще врёт в переговорах, одобряет неэтичное поведение и берёт взятки.
_______
Источник | #truefinance
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
Черно-белая фотография с наложенной цветной сеткой заставляет мозг видеть цвета там, где их нет
_______
Источник | #thedankestmemes
@F_S_C_P

-------
поддержи канал
-------
Казалось бы, хомяк в дикой природе ходит постоянно бухой в стельку. Если посчитать пропорции масс с человеком, то его суточная норма — 7 бутылок водки, ужратых в одно лицо. Нормальных, полулитровых, а не мерзавчиков.

Если дать им выбор между водой и водкой, будут водку. Потому что она калорийнее и вкуснее. Даже тёплая из мыльниц. Если дать им выбор между водкой и шоколадным коктейлем, выберут коктейль, потому что он калорийнее и вкуснее. Если дать выбор между сладким сиропом с 0 калорий и любым алкоголем, хомяк сделает тот же выбор, что дядя Витя из соседнего подъезда.

В общем, хомяку не пофиг, что пить. Хотя в целом он предпочитает крепкий односолодовый виски.

На самом деле в кровь им весь этот алкоголь почти не попадает. Поэтому хомяк себя контролирует и стёкл как трезвышко. Процессу опьянения вредит алкогольдегидрогеназа, которую они используют, чтобы употреблять внутрь свои перебродившие фрукты из запасов. А они, если что, лежат в норе всю зиму и консервируются довольно плохо.

Учитывая, как часто учёные спаивали хомяков, кажется, на них списывают пропавший из сейфа руководителя уютной лаборатории спирт.

Это всё на сегодня, что вам нужно знать про фундаментальную науку.
_______
Источник | #Fourier_series
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
This media is not supported in your browser
VIEW IN TELEGRAM
Отношение молодежи к легкой и красивой жизни. Эфир 21.11.1991, Россия

Фрагмент телепередачи "До 16 и старше", где показаны интервью реальных подростков. Те, кто сейчас предъявляют претензии к современной молодежи, просто забыли, что было 30 лет назад. Посмотрите, что говорит паренёк и сравните с тем, о чем мечтают сегодняшние молодые люди.
_______
Источник | #Life90x
@F_S_C_P

-------
поддержи канал
-------
стоимость обслуживания долга США продолжает делать экспоненциальный туземун https://t.me/markettwits/284822

———
Индия вскоре начнет переговоры о заключении соглашения о зоне свободной торговли с ЕАЭС

———
КНР - потребление электроэнергии (апр) = +7% г/г - до 741,2 млрд кВтч — Национальное энергетическое управление

———
Стоимость золота обновила прежние максимумы и достигла рекордных $2433 за унцию.

———
CoreWeave, провайдер хостинга с GPU, привлек 7,5 млрд долларов с помощью облигаций, которые использует на расширение датацентров и закупку видеокарт у Nvidia. www.theinformation.com
Nvidia активно сотрудничает с рядом таких независимых провайдеров (то есть не относящихся к Microsoft, Apple, Google, Amazon) и даже инвестирует в некоторые, создавая себе таким образом гарантированный спрос среди тех, кто не начнет заниматься разработкой собственных чипов.

———
Reuters: Tesla разрабатывает планы строительства ЦОД внутри Китая для обучения алгоритма беспилотного вождения

———
Blue Origin Джеффа Безоса отправила туристов в космос впервые после двухлетнего перерыва — видео

———
WSJ: Neuralink получила «зеленый свет» на имплантацию мозгового чипа второму пациенту

———
Тегеранская фондовая биржа приостановила работу на несколько дней после сообщения о гибели президента Ирана Эбрахима Раиси — ISNA

———
YouTube начал блокировать оппозиционный контент по требованию Роскомнадзора https://t.me/arhbigteh/1086

———
Starlink завершает эпоху анлимов. Цены на тарифный план Starlink Mobile Global выросли вдвое - с $200 до $400.

———
Deblur-GS — восстанавливает размытые видео

———
Лондонский суд вынес решение в пользу основателя Wikileaks Джулиана Ассанжа, у него снова будет возможность оспорить решение об экстрадиции в США www.theguardian.com

———
Международный уголовный суд (МУС) выдал ордера на арест премьер-министра и министра обороны Израиля Биньямина Нетаньяху и Йоава Галланта в связи с военными преступлениями в Газе www.forbes.ru
Ордер на арест также выписан на лидера ХАМАС Яхье Синвара.

———
Российский апелляционный военный суд признал законным 27-летний приговор Дарье Треповой rg.ru

———
@F_S_C_P

-------
поддержи канал
-------
This media is not supported in your browser
VIEW IN TELEGRAM
В Индии случился пожар на складе пиротехники.
@F_S_C_P

-------
поддержи канал
-------
У Р Киплинга есть рассказ – «Кошка, которая гуляла сама по себе» и так уж вышло, что я смотрел три экранизации этого сюжета.
68 года 88 и 2009 года
И недавно, наблюдая за своим котом я подумал, а ведь чем современнее мультфильм, тем меньше в него вложено труда и тем меньше я в нем вижу креативности, творчества и заботы о зрителе. А следующая мысль была – с 2009 года прошло достаточно времени, вероятно вышел новый ремейк… и решил проветрить свою догадку. И точно, вышел новый мультфильм - Волшебный фонарь — Кошка, гулявшая сама по себе — Серия 84. Он мои ожидания не обманул. Признаки деградации налицо. Если вы знаете другие экранизации этого рассказа, то поделитесь ими пожалуйста. Просто любопытно.
А поделиться я хотел с вами своим недоумением. 2024-1968= 56 за последние 56 лет технические возможности человечества шагнули далеко вперед и у мультипликаторов появилось множество новых технических возможностей, а культура мультипликации открыла новые приемы художественного воздействия на зрителя. Но год от года качество экранизации только деградировало. Ладно, пусть так, но зачем экранизировать рассказ хуже, чем твой предшественник? Зачем вообще браться за такую работу? Чтобы новые поколения в шуме современных мультфильмов потеряли достойные экранизации и заменить их на низкопробные? Очевидно, нет. Но тогда ЧТО?!

youtu.be 1968 года
youtu.be 1988 года
youtu.be 2009 года
youtu.be вероятно 2019 год
_______
Источник | #advocatEgorov
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot
Галерея 2.0

Google Photo - это гугловский сервис для хранения фото и медиа (проще говоря, местный вариант "галереи") - добавил специального умного ИИ-ассистента. Он будет работать в рамках фичи Ask Photos.

Ассистент упростит многие полезные манипуляции, например:

1. Найдет нужно фото по описанию. Допустим, вам по какой-то причине нужно найти классный кадр из 2020 года, где ваш песель радостно бежит по лужайке. Руками вы бы задолбались его искать, а так просто вбиваете Ask Photo команду "покажи фотографию собаки, бегущей по лужайке". Если таких кадров несколько, то получите подборку, из которой уже выберете нужную.

2. Покажет фото по типу локаций. Например, вы любите буддийские монастыри, и пока были в Тае, фоткались во многих из них. Даете соответствующую команду, и ИИ найдет все фото, где в метаданных в геолокации буддийский храм.

3. Отфильтрует фото документов, паспортов, конспектов и т.д.

4. Покажет динамику. Например, можете попросить собрать видос про взросление ребенка. Google слепит клип из релевантных фото и видео. Да, Apple уже давно такое умеет, но их девайсы делают подборку сами, а тут можно гибко задать тему и критерии.

Я выделил самые интересные возможности на мой личный взгляд, на самом деле там еще дофига разных примочек и сценариев. Но даже эти четыре звучат как новый уровень хранения воспоминаний.

Само собой, Ask Photos будет заряжен гугловской LLM Gemini.

_______
Источник | #fichism
@F_S_C_P

Генерируй картинки с ⛵️MIDJOURNEY в Telegram
KV-cache для больших промптов в Gemini

Гигантский контекст Gemini 1.5 в 2 миллиона токенов имеет уйму применений, но цена и скорость таких огромных промптов оставляет желать лучшего. Даже со всеми современными оптимизациями, на обработку запроса, использующего все 2m контекста, нужны десятки секунд и несколько долларов ($1.4 Flash/$14 Pro), даже если нужно всего несколько предложений аутпута. Инпут токены хоть и дешевле, но с таким размером контекста их обычно в разы больше чем аутпут токенов.

Google обещает решить эту проблему новой фичей, context caching, которая разрешает переиспользование KV кэшей для больших промптов. Если кэшировать промпты, то задержка обработки запросов уменьшается в десятки раз, а инпут токены становятся в два раза дешевле. Хранение кэша будет платным, с почасовой оплатой, но даже с ней это стаёт выгоднее начиная с трёх запросов к промпту в час.

Кстати, если вы ещё не пробовали Gemini 1.5 - обязательно попробуйте (щедрые лимиты, но нужен VPN), возможность закинуть всю кодбазу в контекст и задавать о ней вопросы ощущается магической.

Неплохо было бы иметь такую фичу в API GPT-4o и Claude.
_______
Источник | #ai_newz
@F_S_C_P

Генерируй картинки с ⛵️MIDJOURNEY в Telegram
https://forum.makerdao.com/t/reconciling-the-two-opposing-paths-for-decentralized-stablecoins/24280

Очень интересно.

Кто-то предлагает разделить DAI на два стейбла:

1) демократический с функцией заморозки, чтоб всякие педерасты и террористы им не пользовались;

2) террористический под названием TrueDai, который само собой, как и Монеро, со временем делистнут со всех централизованных бирж;

MakerDAO хотят отвязаться от управления не блокируемым токеном, чтобы не присесть на демократическую бытылку, а дальше - пусть рыночек выбирает куда ему пойти
_______
Источник | #mendeleevshina
@F_S_C_P

Генерируй картинки с ⛵️MIDJOURNEY в Telegram
Часть II. Субъективное доверие

Безусловно, не все доверие можно доказать криптографически и исключительно программными методами. Часто доверие требует субъективной оценки: насколько верные данные оракул передал в блокчейн? была ли работа выполнена качественно? можно ли доверять этому проекту или предложению? хороший ли это сотрудник? были ли инвестиции в этот нон-профит эффективны?

Для решений этой задачи используется комбинация криптоэкономических и субъективных инструментов. Простейшим примером такого будет персональная репутация и крипто+экономические механизмы гарантии достоверности. Разберём пример.

Репутация. Цифровая и децентрализованная репутация это всегда три элемента:

1. Уникальный идентификатор пользователя или организации
2. Отдельные credentials, штампики, факты, куски информации о субъекте, которые могут (и чаще должны) быть приватны и не видны никому, кроме владельца идентификатора. Это может быть финансовая история, уровень образования, ценности, количество часов игры в доту, экзиты на сотни миллионов, навыки, отношения с группой людей, любимый цвет или адрес прописки.
3. Скоринг репутации в рамках отдельно взятого домена. Для этого нужно взять credentials и посчитать некоторый score, который может быть в виде числа (я фанат пиццы на 10/10) или в виде длинного эссе о жизни и любви отдельного персонажа. Часто скоринг делают через ML алгоритмы, а иногда даже через LLM, которые могут обработать мегабайт текста и выдать саммари в абзац.

Криптоэкономика. Инструменты гарантии и автоматизации цифровых репутационных систем. Главная их задача это сделать так, чтобы система была максимально прозрачной и бесперебойной без необходимости центрального арбитра: как доказать честность без справки из каких-нибудь органов? как доказать финансовую состоятельность без доверия одному банку? как доказать, что ты не верблюд без паспорта государства Х? Это необходимо для удешевления транзакционных издержек (см. пункт I данного эссе), для борьбы с излишней субъективностью, коррупцией и излишней властью одного провайдера репутации.

Очевидным образом, криптоэкон задачки решаются через:

1. Криптографию. Для гарантии приватности, pseudonymity, integrity authenticity данных, в том числе через zero-knowledge криптографию (я могу доказать ЛЮБОЙ факт не разглашая ничего о факте.
2. Экономику. Тут есть сотни дизайнов, но самый распространенный — это work token со слешенгом: люди делают депозит и проверяют определенную информацию, а если их проверка неверна или они вступают в сговор, то автоматически, через смарт-контракт, теряют весь или часть депозита. Подробнее можно почитать в дизайне PoS эфира или токена EIGEN.

Это примитивные кубики. Реальные системы для гавернанса и управления сообществ с миллионами участников, организаций с миллиардной капитализацией и институтами основополагающих функций общества будут, конечно, куда сложнее. Но об этом дальше.

Программируемая (кибер-) экономика: Часть I, Часть II
_______
Источник | #cryptoEssay
@F_S_C_P

-------
поддержи канал
-------
This media is not supported in your browser
VIEW IN TELEGRAM
Динамика снижения уровня Аральского моря, 1957–2022 (Reddit)
___
Источник | #rationalnumbers
@F_S_C_P

Узнай судьбу картами Таро:
Anna Taro bot