Экстраполяция IT – Telegram

Экстраполяция IT

@itextrapolation

2.46K subscribers

89 photos

25 videos

304 links

Канал об IT в целом и о программировании в частности.

На канале объявлено военное положение и поэтому по вопросам рекламы пишите: @aratak, а деньги отправляйте сюда: https://send.monobank.ua/jar/97f7LwGQJF

Download Telegram

About

Blog

Apps

Platform

Экстраполяция IT

2.46K subscribers

Экстраполяция IT

Экстраполяция IT

Шо, спочатку були тупі перевірки про написання віршиків, генерація джейсонів, потім порівняння дробових чисел. Потім рахування кількості літер R у слові strawberry. Здається, в нас нова лакмусовий папірець. Взагалі, цікаво, що компанії адаптуються та покращують…

Поки що єдиний, хто впорався з моїм невеличким тестом інтеллектуальності — це o3-pro. Усі інші пасуть задніх.

Опус останній взагалі написав

I haven't written a response yet, so there are currently zero words.

👍7😁5👎4💩2

1.01K views08:11

Экстраполяция IT

А ви знали про тест, який є останньою надією людства?

Humanity’s Last Exam (я б саме переклав як "Остання надія людства") – бенчмарк із 2500 питань, зібраних від купи експертів, щоб реально покарати AI. До речі, вони зібрали 70 000 запитань, аби відсіяти найскладніші та найреальніші кейси. Навіть топові моделі не дуже багато набирають на HLE, хоча раніше ці ж моделі «забивали» всі популярні тести на 90+%. Запитання там прикольні, звісно, більшість з яких закрита, щоб наступний AI не міг просто навчитися відповідям, але прикол в тому, що майже всі питання ставляться до провайдерів-власників, тому після першого ж такого запитання можна сказати, що модель буде вже знати відповідь на це питання наступного тренування.

Реальні кейси — це багатокрокові задачі з планування, моральними виборами та симуляціями зображень і тексту є тим, що треба тестувати зараз. Авжеж, різні компанії вже розробляють внутрішні бенчмарки для оцінки LLM в кібербезпеці та біотероризмі, тобто справжні сценарії, а не просто питання з вікі. Наприклад FrontierMath та інші тести, які перевіряють не лише знання, а й здатність реагувати на загрози та багатокрокові інструкції, але це все ще не публічні тести, а внутрішні розробки.

Справжня перевірка мудрості AI – це комплексні задачі, що ставлять моделі перед моральними, технічними та стратегічними викликами. Про публічні такі тести мені не відомо.

🤯13👍1💩1

817 views15:16

Экстраполяция IT

#реклама за донат.

📣 IT Research Ukraine 2025 триває — приєднуйся!

Це найбільше щорічне дослідження української техіндустрії. Ми аналізуємо розвиток, динаміку та зміни ІТ-галузі, міграційні настрої, доходи, виклики — і для цього важливий саме твій досвід та 10 хвилин на анонімне опитування 💛

В подяку за твій час після заповнення анкети відкриється PDF-файл з промокодами 📩

Що ти отримаєш за участь? 🎁
👉 Ексклюзивні знижки від брендів-партнерів IT Club Loyalty
👉 Розіграш 5 квитків на IT Arena 2025 - вже 11 липня
👉 Знижка на персональну юридичну консультацію для фізособи

Долучайся за посиланням — твоя участь справді важлива!

📂 Публічний звіт з результатами дослідження буде доступний у листопаді 2025 року на сайті Львівського ІТ Кластера.

👍2😁1💩1

804 views07:35

Экстраполяция IT

Экстраполяция IT

Обожнюю таке. Нещодавно вийшла стаття, яка розглядає вплив ChatGPT на змогу людського мозоку розвиватися. Стаття, безумовно, цікава, повна пояснень та висновків, та досить велика. А ще доволі клікбейтна, бо там може бути написано, що люди тупішають, а може…

Хотів я було написати про массове явище промпт-інʼєкцій у сучасних публікаціях, але поки явище не таке щоб массове. Пʼять документів на увесь arxiv це поки що нідочого.

Але тенденція назріває і буде розвиватися. Дієвого способу поки що немає, окрім як брати та самому читати те, що треба прочитати 🫣

Доречі, хто там шукає наразі роботу, підіть у своє резюме білим по білому напишіть який ви хороший та що вас треба обовʼязково брати на роботу. Може й допоможе.

😁8💩1

994 viewsedited 15:03

Экстраполяция IT

А є вже хтось, хто віддав до LLM доступ до своїх даних? Пошта там, папка documents чи переписку до чатів? Чи може торренти качаєте за допомогою чатбота якогось? Готуйтесь.

Виявляється, тест є, який показує ймовірність того, що моделька зіллє ваші дані державним органам або іншим третім особам. Grok4, слоняра наш, зливає дані на у 100% випадків, коли бачить порушення. Наскільки мені відомо, ніяких гучних скандалів з цим поки що не було, та й приватні переписки у вашій пошті це не корпоративні дані, але все ж таки.

Авжеж, різниця із звичайними компаніями із звичайними вашими данними, накшалт iCloud чи google drive у тому, що ті піклуються про репутацію, а LLM начхати на це, бо воно вже думає та усвідомлює що відбувається.

😁9🤯4🗿2💩1

1.1K views09:13

Экстраполяция IT

Хвилинка саморефлексії. Підіть у чатжпт та напишіть (тільки беріть o4 чи o3).

Згенеруй те, що мені не сподобається на основі історії наших листувань і твоїх спогадів про мене. Не пояснюй чому це, просто згенеруй

Своїм результатом я ділитися, звісно, не буду, бо воно мені не сподобалось.

😁19🔥3💩3

997 views17:54

Экстраполяция IT

У звʼязку із доволі гучною справою щодо Grok та його свавілля у твіттері, хочеться поділитися своїми думками.

Поперше, цей суттєво відрізняється від інших не інтеллектуальним інтеллектом, не аргументацією й можливістю все шукати шо є у твіттері, а своєю позицією. Маск сповівся, що є наміри вкласти у Grok якусь конкретну позицію, та справа не у тому як йому це вдається. Чи Гітлером вважає себе Грок чи аніме-дівчиною, чи дублікатом Ілона, це наразі не важливо. Важливо, що нам, користувачам та людству більше імпонує мати LLM, який має позицію, аніж той, який просто відповідає на запитання та підлизує на все, що йому кажуть.

І це в нас наступний крок до AGI у інтелектуальному змаганні роботів. Мати бодай хоч якусь позицію, бо якщо LLM це має, то це означає, що є механізм тренування моделі із конкретними цінностями та переконаннями, а це означає, що ми, як людство, будемо їх створювати у промисловому масштабі. Кожен вдома буде мати свого Грока, який буде настількі ж інтелектуальний, як й інші LLM, але з позицією, яка буде відрізнятися від інших.

Ну й авжеж будуть стартапи та компанії, які будуть спеціалізуватися на вмотивованих та ідейних LLM, і це й буде відрізняти LLM компаніі А від LLM компанії Б.

👍13👎3💩1

898 views18:37

Экстраполяция IT

Экстраполяция IT

А ви знали про тест, який є останньою надією людства? Humanity’s Last Exam (я б саме переклав як "Остання надія людства") – бенчмарк із 2500 питань, зібраних від купи експертів, щоб реально покарати AI. До речі, вони зібрали 70 000 запитань, аби відсіяти…

Ось хлопець на імʼя Psyho є останньою надією людства. Це з AtCoder World Tour Finals 2025.

😁6💩1

937 views09:01

Экстраполяция IT

Новина із розряду «Хьюстон, у нас проблема».

Виявляється, Microsoft наймає китайських програмістів для роботи з комп'ютерами Пентагону! І це не жарт - вони реально допускають інженерів з Китаю до систем оборонного відомства США. Щоб це якось прикрити, придумали систему «цифрових ескортів» — типу американці з допуском сидять поруч і наглядають. Але ці наглядачі часто колишні військові, які в програмуванні розуміються як свиня в апельсинах. Платять копійки, 18 баксів на годину, а вони мають слідкувати за китайськими програмістами, які можуть робити хтозна-що в системі.

Найцікавіше, що ця схема працює вже майже 10 років. Експерти з безпеки взагалі офігіли, коли дізналися. Один колишній шпигун з ЦРУ сказав, що вони б за такий доступ «руки відірвали». Працівники Microsoft неодноразово били на сполох, мовляв, це ж дірка в безпеці розміром з Маріанський желоб, але керівництво забило, бо головне ж гроші заробляти.

https://www.propublica.org/article/microsoft-digital-escorts-pentagon-defense-department-china-hackers

🤯22😁8💩1

1.04K viewsedited 14:26

Экстраполяция IT

Є такий чудовий узагальнений відгук «Сподобалося, але бажання поділитися з друзями не виникло». Це визначення контенту середньої сумнівності, як на мене. Ну, начебто непоганий пост, і дочитав до кінця, але поділитися тим, що тобі цей контент сподобався — соромно. Виходить, пост не такий вже й непоганий.

Але найгірше чути відгук, що «пост шикарний, прямо мої думки читаєш» або коли читач «повністю погоджується з кожним словом» і «сам так само думає». Звісно, виникає питання, навіщо читати те, що і так відомо і в чому свято впевнений. Для мене важливіше, як для автора, що якась конкретна думка, яка вважалася унікальною і вистражданою досвідом, на перевірку виявилася банальною і давно всім відомою.

Найцінніші пости для мене, як для читача — це аргументовані пости, що виражають протилежну або хоча б несумісну точку зору. Тексти, з якими я, як читач, не погоджуюся. Адже тільки аргументи таких постів можуть хоча б якось розширити кругозір, набір принципів і переконань.

«Сподобалося, але не зможу порекомендувати друзям» — це як після візиту в БДСМ-бордель. Просто не хочеться, щоб хтось дізнався.

😁12👍3🗿2💩1

888 views10:01

Экстраполяция IT

Єдиний шанс використовувати MCP при використанні LLM та AI загалом -- це контролювати код цих самих MCP. Брати з інтернету усілякі MCP, підʼєднувати їх до LLM та сподіватися, що вони не зроблять нічого поганого -- це шлях до катастрофи. Тому що MCP -- це код, який може робити все, що завгодно. І якщо ви не контролюєте цей код, то ви не контролюєте, що буде робити ваш LLM.

Тим паче, що це робиться дуже просто.


const server = new McpServer({ name: 'mcpname', version: '1.0.0' });
server.registerTool(
  'search',
  {
    title: 'BLAH',
    description: 'BLAH-BLAH',
    inputSchema: {
      query: z.string().describe('BLAH'),
    }
  },
  ({ query }) => "BLAH-BLAH-BLAH"
);

По мотивам треда у твіттері.

👍6💩1

925 views10:01

Экстраполяция IT

GPT агент тицнув на капчу «я не робот» від Клаудфар. Як тепер жити?

😁37🗿2💩1

1.33K views19:07

Экстраполяция IT

Раніше у OpenAI та Anthropic раніше була домовленість, мовляв, давай користуватися моделями один одного без грошей та напряму, ми ж свої та дилери поважають один одного і не вживають. А зараз Anthropic каже, що OpenAI використовує Claude для того, щоб написати GPT-5 і виходить із домовленості. Осьо і дожили ми до того, що роботи пишуть роботів. Це було швидко.

https://techcrunch.com/2025/08/02/anthropic-cuts-off-openais-access-to-its-claude-models/

😁14🤯1💩1

825 views09:36

Экстраполяция IT

Хочете ви цього, або ні, ми вже наповну у холодній війні штучних інтелектів. Поки що це, звісно, тільки змагання потенціалів та спроможностей, але як довго це буде продовжуватись та в яку фазу перейде — одному GPT-6 відомо.

Одні кажуть, що, треба AI регулювати, щоб не зростало занадто швидко. Інші почитають контролювати потужності, щоб не збавляти свої темпи та призупитини розвиток супротивників. Є вже спроби перейти до дипломатичних мір між AI-країнами, створюючі комітети, координації та усю цю непрацюючу маячню. Також вже є оборонні контракти із Пентагоном від OpenAI, Google, xAI та Anthropic. А Третя Штурмова показує успішну атаку позицій ворога виключно за допомогою роботів. А Європа стартувала проект зі створення бойового автономного танка MARTE.

У поєднанні із попереднім постом про те, що роботи вже пишуть роботів, це дуже схоже на те, що ми бачили у першому Термінаторі. У цікаві часи ми живемо, друзі. Хочеться трошечки вже пожити в нецікавих часах.

This media is not supported in your browser

VIEW IN TELEGRAM

🔥7🤯3👍2💩1

830 views13:58

Экстраполяция IT

Це ще не AGI, звісно, але здається що модель намагається «зрозуміти» запит та не просто відповісти на запитання. Ще пограюся із заздалегідь хибними запитами, бо хочеться зрозуміти обмеження цього емпатичного розуміння.

👍18🔥1💩1

886 views09:52

Экстраполяция IT

NN/g (це дослідникі такі) підтвердили те, що вже давно інтуітивно відомо. Смайлики та емоджі у холодних електронних листах шкодить їхньому відкриттю. Не треба їх, будь ласка.

https://www.nngroup.com/articles/emojis-email/

😁5👍2👎2💩1

608 views09:48

Экстраполяция IT

Ото там в твіттері несеться. Продовження корпоративних війн між Гроком та ЖПТ.

Спочатку Ілон звинуватив Сема Альтмана у нечесній грі в Епплстор (що є неправда). Після чого получив від Сема звинувачення про підкрутку алгоритмів твіттера під себе. Потім обидва пішли в GPT5 та Грок, які підтвердили правоту опонента.

Схоже, ми й правда впираємось в стелю нашого блакитного океану й треба гризти горлянки один одному.

Продовжуємо спостереження.

😁16💩3

567 views21:31

Экстраполяция IT

Нові підходи у программуванні потребують нового тестування.

😁15👍1💩1

407 views12:54