К посту про принципы написания хороших промптов. Есть еще интересная статья, которая промпты рассматривает с более технической точки зрения. Авторы делят промпты на ‘hard’ и ‘soft’. Первые представляют собой запрос на естественном языке, а вторые – векторы, на которых можно дообучить модель. Они указывают на противоречие между ограниченными возможностями модели по восприятию контекста и необходимостью писать развернутые промпты для получения наиболее точного результата. То есть, модель не может воспринимать очень большие и развернутые промпты, однако краткие промпты не дают ей достаточных инструкций. В качестве решения предлагается, например, дистилляция знаний (‘knowledge distillation’). Подход заключается в том, что большую модель («учителя») обучают на более развернутых промптах и забирают ее ответы. Затем по развернутым промптам составляют более краткие и на них (и полученных ранее ответах модели-учителя) обучают другую модель («ученика»). Таким образом, «ученик» воспринимает более краткие инструкции лучше.
Еще вариант – преобразовать ‘hard’ промпты в ‘soft’ и сжать. Так промпты занимают меньше места в памяти и проще воспринимаются нейросетью.
Сжатие промптов может осуществляться с помощью фильтрации, когда для каждого токена в запросе рассчитывается информативность, затем наименее информативные токены отбрасываются.
В целом авторы статьи выделяют три основных направления для развития промпт-инжиниринга:
измерение информативности запросов на естественном языке и фильтрация излишней (наименее информативной) части запроса, чтобы сократить его настолько, насколько возможно;
большие языковые модели должны сосредоточиться на преобразовании естественного языка с сохранением наибольшего объема смысловых нюансов; языковые модели меньшего размера должны применяться для создания наборов тренировочных данных, в которых информация представлена в сжатом виде;
одновременная оптимизация ‘hard’ и ‘soft’ промптов.
Тема 'soft’-промптов хорошо раскрыта в посте на medium
Еще вариант – преобразовать ‘hard’ промпты в ‘soft’ и сжать. Так промпты занимают меньше места в памяти и проще воспринимаются нейросетью.
Сжатие промптов может осуществляться с помощью фильтрации, когда для каждого токена в запросе рассчитывается информативность, затем наименее информативные токены отбрасываются.
В целом авторы статьи выделяют три основных направления для развития промпт-инжиниринга:
измерение информативности запросов на естественном языке и фильтрация излишней (наименее информативной) части запроса, чтобы сократить его настолько, насколько возможно;
большие языковые модели должны сосредоточиться на преобразовании естественного языка с сохранением наибольшего объема смысловых нюансов; языковые модели меньшего размера должны применяться для создания наборов тренировочных данных, в которых информация представлена в сжатом виде;
одновременная оптимизация ‘hard’ и ‘soft’ промптов.
Тема 'soft’-промптов хорошо раскрыта в посте на medium
vc.ru
Промпт-инжиниринг. Принципы написания хороших промптов — ChatGPT на vc.ru
ИИ, жизнь, баланс ChatGPT 16.06.2024
Про то, как ChatGPT мне логотип нарисовал. Роль – «an artist, who creates logos for companies, hired to create a logo for my blog».
Сам логотип я использую, это текущее фото канала, а концепция на скринах (отдельно не просила ее писать, видимо, он по описанию роли предположил, что нужно)
Сам логотип я использую, это текущее фото канала, а концепция на скринах (отдельно не просила ее писать, видимо, он по описанию роли предположил, что нужно)
На Хабре вышла статья об эксперименте, в котором автор с использованием модели Codestral-22B-v0.1-Q4_K_M пишет игру на C#. Получилось круто и интересно, советую к прочтению
Хабр
Кажется, LLM программирует лучше меня
Может ли искусственный интеллект (ИИ) превзойти программиста-человека при написании кода? Спустя ряд экспериментов становится понятно, что ответ на этот вопрос – уверенное да! Эволюция программистов В...
Есть ощущение, что многие люди боятся ИИ, потому что склонны его (не только его, вообще все) очеловечивать. Это свойство нашего мозга, нам даже если показать движущиеся картинки с треугольниками, мы им придумаем историю, мотивы и характер (Как в знаменитом эксперименте F. Heider и M. Simmel, про который можно почитать здесь. Чаще всего, описывая страх перед ИИ, люди говорят что-то вроде «Вот станет он умнее нас и захватит мир» (а захват мира – это точно умное решение?) или «Вот станет он умнее и поработит нас» (зачем? – ну надо).
Я решила погуглить исследования на тему страха людей перед ИИ (не об оправданности, а именно о причинах) и нашла некоторое количество интересных публикаций. Приведу здесь одну.
Я решила погуглить исследования на тему страха людей перед ИИ (не об оправданности, а именно о причинах) и нашла некоторое количество интересных публикаций. Приведу здесь одну.
Авторы статьи «Why are we Afraid of Artificial Intelligence (AI)?» предложили заполнить опросник 929 студентам румынского города Тимишоара, чтобы выяснить их отношение к развитию ИИ. Авторы, кстати, сами отмечают, что выбрали именно студентов, поскольку студенты – наиболее образованная группа населения, которая, как ожидается, получит больше всего пользы от ИИ. Интересно, что ответили бы их родители.
Студенты ответили, например, что использование устройств с ИИ повлияет скорее негативно на межличностные отношения, при этом женщины так считают чаще мужчин (скрин 1), а гуманитарии – чаще технарей (скрин 2). (Все скрины подписаны)
Страх кибератак и потери своих личных данных тоже чаще выражают женщины (скрин 3) и струденты гуманитарных вузов (скрин 4).
Студенты ответили, например, что использование устройств с ИИ повлияет скорее негативно на межличностные отношения, при этом женщины так считают чаще мужчин (скрин 1), а гуманитарии – чаще технарей (скрин 2). (Все скрины подписаны)
Страх кибератак и потери своих личных данных тоже чаще выражают женщины (скрин 3) и струденты гуманитарных вузов (скрин 4).
В посте на vc я писала про исследования, связанные со страхом потери рабочих мест / реальной потерей рабочих мест из-за развития ИИ. В опроснике студентов тоже спросили, что они думают о возможности наступления экономического кризиса из-за развития ИИ. Респонденты в большинстве своем оценили такой риск скорее как нейтральный или «достаточно вероятный») (скрины 5 и 6).
Почти три четверти опрошенных студентов опасаются, что ИИ будет использован для создания нового оружия (об этом беспокоятся и многие эксперты). Более половины считают, что ИИ приведет к увеличению числа военных конфликтов в мире.
Захват мира искусственным интеллектом немногие считают очень вероятным, однако женщины и студенты гуманитарных вузов снова выражают больше настороженности (скрины 7 и 8).
Почти три четверти опрошенных студентов опасаются, что ИИ будет использован для создания нового оружия (об этом беспокоятся и многие эксперты). Более половины считают, что ИИ приведет к увеличению числа военных конфликтов в мире.
Захват мира искусственным интеллектом немногие считают очень вероятным, однако женщины и студенты гуманитарных вузов снова выражают больше настороженности (скрины 7 и 8).
Похожим образом распределены ответы на вопрос о возможности уничтожения человечества искусственным интеллектом. Уничтожение человечества по мнению примерно 35% студентов будет связано с тем, что ИИ сочтет людей угрозой.
Возможно, люди сами о себе не очень хорошего мнения (не умеем в отношения, всё время создаем оружие, плохо распоряжаемся данными) и транслируют это мнение, когда говорят о страхе перед ИИ 🤔
Возможно, люди сами о себе не очень хорошего мнения (не умеем в отношения, всё время создаем оружие, плохо распоряжаемся данными) и транслируют это мнение, когда говорят о страхе перед ИИ 🤔
К вопросу о замене людей искусственным интеллектом. В 2023 году The Harris Poll провели опрос американцев на предмет того, что они думают о замене судей на роботов. 79% опрошенных считают, что суды несправедливы, причем 58% либо столкнулись с несправедливостью сами, либо слышали о ней из рассказов знакомых. 43% респондентов предпочли бы видеть ИИ в качестве судьи по своему делу.
В исследовании 2011 года «Extraneous Factors in Judicial Decisions», проведенном над израильскими судьями, авторы показали, что на вынесение приговоров влияют разные внешние факторы, например, обеденный перерыв. Феномен получил название «эффект голодного судьи» («hungry judge effect»). У него есть критики, которые считают, что влияние эффекта переоценено, однако сложно отрицать, что человек не может быть совершенно объективен. По этой причине некоторые люди считают, что ИИ справится лучше (но мы-то знаем, что и это не так).
В исследовании 2011 года «Extraneous Factors in Judicial Decisions», проведенном над израильскими судьями, авторы показали, что на вынесение приговоров влияют разные внешние факторы, например, обеденный перерыв. Феномен получил название «эффект голодного судьи» («hungry judge effect»). У него есть критики, которые считают, что влияние эффекта переоценено, однако сложно отрицать, что человек не может быть совершенно объективен. По этой причине некоторые люди считают, что ИИ справится лучше (но мы-то знаем, что и это не так).
У меня скоро будет пост на vc про ресурсы, с которых можно начать знакомиться с ИИ. Оставлю здесь для затравки некоторые штуки, которыми периодически пользуюсь под разные задачи (кроме ChatGPT, про который уже и так много написано):
- Нейрохолст для генерации картинок с помощью трех нейросетей: Холст, DALL-E 3 и Midjourney v6. Он вообще платный, но после регистрации вам дается небольшой запас внутренней валюты на несколько бесплатных тестов. Проводила в нем небольшие эксперименты, мне пока всё понравилось;
- Perplexity для поиска литературы. Есть платная версия Pro, которой можно пользоваться бесплатно, но число запросов ограничено: можно сделать пять запросов, потом подождать четыре часа и сделать еще пять и т.д. Не могу сформулировать свое отношение: вроде бы потенциально полезный инструмент, но пока выглядит сыровато, если честно. Хотелось бы наблюдать развитие работы с запросами;
- PaLM – многофункциональный помощник. Я в нем картинки иногда делаю для личного пользования. Получается здорово;
- Notability – это мобильное приложение для записи конспектов. ИИ там распознает почерк и позволяет искать по рукописному конспекту (моя мечта со школы, если честно). Как человек, который постоянно учится и предпочитает всё писать от руки, я им довольна (хотя у меня такой почерк, что ИИ не всегда с ним справляется; я тоже не всегда справляюсь);
- встроенный помощник в Google Colab для дебаггинга функций. Это на случай, когда лазать по Stackoverflow нет времени или желания.
#инструменты
- Нейрохолст для генерации картинок с помощью трех нейросетей: Холст, DALL-E 3 и Midjourney v6. Он вообще платный, но после регистрации вам дается небольшой запас внутренней валюты на несколько бесплатных тестов. Проводила в нем небольшие эксперименты, мне пока всё понравилось;
- Perplexity для поиска литературы. Есть платная версия Pro, которой можно пользоваться бесплатно, но число запросов ограничено: можно сделать пять запросов, потом подождать четыре часа и сделать еще пять и т.д. Не могу сформулировать свое отношение: вроде бы потенциально полезный инструмент, но пока выглядит сыровато, если честно. Хотелось бы наблюдать развитие работы с запросами;
- PaLM – многофункциональный помощник. Я в нем картинки иногда делаю для личного пользования. Получается здорово;
- Notability – это мобильное приложение для записи конспектов. ИИ там распознает почерк и позволяет искать по рукописному конспекту (моя мечта со школы, если честно). Как человек, который постоянно учится и предпочитает всё писать от руки, я им довольна (хотя у меня такой почерк, что ИИ не всегда с ним справляется; я тоже не всегда справляюсь);
- встроенный помощник в Google Colab для дебаггинга функций. Это на случай, когда лазать по Stackoverflow нет времени или желания.
#инструменты
В свежем (опубликовано в апреле этого года) исследовании Honor отношения россиян к ИИ выяснилось, что мы большие любители технологий: аж 82% жителей крупных городов в возрасте от 14 до 59 лет относятся к ИИ позитивно. 62,3% стали использовать ИИ чаще, чем в 2023 году.
В выборку попали только города-миллионники, там живет около четверти россиян, если верить Википедии.
Еще один опрос был проведен по заказу ВТБ, он тоже вышел в апреле. Там взяли выборку от 18 до 60 лет и города с населением свыше 100 тысяч человек. Получилось, что 66% опрошенных интересуются ИИ, но только 48% (от общего числа, не из тех 60%) смогли выбрать корректное определение ИИ из предложенных. 39% боятся, что их заменит ИИ на рабочем месте (достаточно среднемировой показатель, если судить по тем исследованиям, которые попадались мне на глаза). Еще боятся, что ИИ выйдет из-под контроля и уничтожит человечество, будет использоваться мошенниками и всё такое.
В общем, результаты не то чтобы шокируют, но следить за общественным мнением интересно (и важно).
К области ИИ сейчас много интереса и, как это обычно бывает, очень много мифов. Чтобы не попасть под их влияние, нужно изучать технологию самостоятельно и искать надежные источники. Чем мы, собственно, тут и занимаемся.
В выборку попали только города-миллионники, там живет около четверти россиян, если верить Википедии.
Еще один опрос был проведен по заказу ВТБ, он тоже вышел в апреле. Там взяли выборку от 18 до 60 лет и города с населением свыше 100 тысяч человек. Получилось, что 66% опрошенных интересуются ИИ, но только 48% (от общего числа, не из тех 60%) смогли выбрать корректное определение ИИ из предложенных. 39% боятся, что их заменит ИИ на рабочем месте (достаточно среднемировой показатель, если судить по тем исследованиям, которые попадались мне на глаза). Еще боятся, что ИИ выйдет из-под контроля и уничтожит человечество, будет использоваться мошенниками и всё такое.
В общем, результаты не то чтобы шокируют, но следить за общественным мнением интересно (и важно).
К области ИИ сейчас много интереса и, как это обычно бывает, очень много мифов. Чтобы не попасть под их влияние, нужно изучать технологию самостоятельно и искать надежные источники. Чем мы, собственно, тут и занимаемся.
Honor
Исследование HONOR: 82% россиян позитивно относятся к технологиям искусственного интеллекта - HONOR Евразия
По результатам исследования, проведенного компанией HONOR в апреле 2024 года, россияне с воодушевлением встречают технологическое будущее и регулярно пользуются технологиями искусственного интеллекта (ИИ).
Список моих больших постов на vc:
1. Небольшой кейс с написанием кода исключительно силами ChatGPT
2. Промпт-инжиниринг
3. Про ИИ, который отнимает работу (или нет)
4. GPT изнутри
5. Доступные ресурсы для использования ИИ под разные задачи
6. Разведочный (исследовательский поиск) - про один из аспектов развития поисковых систем
7. Мой опыт работы и обучения
8. Как нейросети работают с изображениями
9. Почему ИИ сложнее, чем кажется
10. Generative adversarial networks
11. Когнитивные искажения
12. Про любимую летнюю школу
13. LlaMA
14. Toolformer (про обучение языковых моделей пользоваться разными инструментами)
15. LLaVA (мультимодальная модель)
16. Искажения памяти (у людей)
17. Работа с изображениями, на этот раз про трансформеры
18. BERT
19. ИИ в оптимизации поисковых систем
20. Рекомендательные алгоритмы
21. ИИ-агенты
22. ИИ-ученый
23. RLHF
24. Ответственный подход к ИИ
25. LangChain и LangFlow
26. Оценка способностей нейросетей к рассуждению
27. Chinchilla и уменьшение больших моделей
28. Machine UnLearning
29. Модели пространства состояний
30. Про волшебные сказки
31. Про безответственный подход к ИИ
32. Tiny Troupe
33. Интерпретируемость и объяснимость ИИ
34. Языковые модели + эволюционные алгоритмы
35. Диффузионные модели
36. CAMEL
37. Объединенные модели
38. Теория разума в больших языковых моделях
39. Подходы к улучшению ИИ
40. Кооперация человека с ИИ
41. Инженеры-призраки
42. Магистратура
43. Модели пространства состояний, часть 2
44. Thought rollback
45. Проблемы с оценкой безопасности
46. Проблемы оценки теории разума
47. Полезность объяснений ИИ
48. Персонализация и искажения
49. NeRF
50. Чего ИИ не умеет
51. Надежность ИИ-агентов
52. Личный бренд
53. Графовые нейронные сети
54. ПО с открытым исходным кодом
55. Аблитерация
56. "Сильный ИИ". Современное состояние и развитие
57. Социальные связи
58. Как люди используют ИИ
59. Правовое регулирование ИИ (подробно)
60. ИИ и воображение
61. Вайб-кодинг
62. Про создание безопасных языковых моделей
63. Прямая оптимизация предпочтений
64. Невзламываемые модели, часть 1
65. Невзламываемые модели, часть 2
66. ИИ шантажирует разработчиков
67. WEIRD AI
68. Теория охоты на информацию
69. Сложные нейросети мозга
70. Социальное обучение
71. (Не)достижимость сверхинтеллекта
72. Обучение в контексте
73. Эссе про этику в ИИ
74. Модели в гармонии
#лонгрид
1. Небольшой кейс с написанием кода исключительно силами ChatGPT
2. Промпт-инжиниринг
3. Про ИИ, который отнимает работу (или нет)
4. GPT изнутри
5. Доступные ресурсы для использования ИИ под разные задачи
6. Разведочный (исследовательский поиск) - про один из аспектов развития поисковых систем
7. Мой опыт работы и обучения
8. Как нейросети работают с изображениями
9. Почему ИИ сложнее, чем кажется
10. Generative adversarial networks
11. Когнитивные искажения
12. Про любимую летнюю школу
13. LlaMA
14. Toolformer (про обучение языковых моделей пользоваться разными инструментами)
15. LLaVA (мультимодальная модель)
16. Искажения памяти (у людей)
17. Работа с изображениями, на этот раз про трансформеры
18. BERT
19. ИИ в оптимизации поисковых систем
20. Рекомендательные алгоритмы
21. ИИ-агенты
22. ИИ-ученый
23. RLHF
24. Ответственный подход к ИИ
25. LangChain и LangFlow
26. Оценка способностей нейросетей к рассуждению
27. Chinchilla и уменьшение больших моделей
28. Machine UnLearning
29. Модели пространства состояний
30. Про волшебные сказки
31. Про безответственный подход к ИИ
32. Tiny Troupe
33. Интерпретируемость и объяснимость ИИ
34. Языковые модели + эволюционные алгоритмы
35. Диффузионные модели
36. CAMEL
37. Объединенные модели
38. Теория разума в больших языковых моделях
39. Подходы к улучшению ИИ
40. Кооперация человека с ИИ
41. Инженеры-призраки
42. Магистратура
43. Модели пространства состояний, часть 2
44. Thought rollback
45. Проблемы с оценкой безопасности
46. Проблемы оценки теории разума
47. Полезность объяснений ИИ
48. Персонализация и искажения
49. NeRF
50. Чего ИИ не умеет
51. Надежность ИИ-агентов
52. Личный бренд
53. Графовые нейронные сети
54. ПО с открытым исходным кодом
55. Аблитерация
56. "Сильный ИИ". Современное состояние и развитие
57. Социальные связи
58. Как люди используют ИИ
59. Правовое регулирование ИИ (подробно)
60. ИИ и воображение
61. Вайб-кодинг
62. Про создание безопасных языковых моделей
63. Прямая оптимизация предпочтений
64. Невзламываемые модели, часть 1
65. Невзламываемые модели, часть 2
66. ИИ шантажирует разработчиков
67. WEIRD AI
68. Теория охоты на информацию
69. Сложные нейросети мозга
70. Социальное обучение
71. (Не)достижимость сверхинтеллекта
72. Обучение в контексте
73. Эссе про этику в ИИ
74. Модели в гармонии
#лонгрид
vc.ru
Пример использования ChatGPT для написания кода
ChatGPT стал предметом обсуждения уже весьма давно и материалов на эту тему в Интернете есть бесконечное множество. Однако он так прекрасен и многогранен, что всегда можно написать по меньшей мере еще один материал и инициировать еще одно обсуждение, чем…
❤🔥1
AI, life and balance pinned «Список моих больших постов на vc: 1. Небольшой кейс с написанием кода исключительно силами ChatGPT 2. Промпт-инжиниринг 3. Про ИИ, который отнимает работу (или нет) 4. GPT изнутри 5. Доступные ресурсы для использования ИИ под разные задачи 6. Разведочный …»
Я люблю всякие штуки для учебы, которые помогают оптимизировать процесс. Давно уже, листая ленту, наткнулась на рекламу Turbolearn.ai, попробовала бесплатную версию, делюсь впечатлениями. ВПН не нужен, карту привязывать тоже не нужно.
Главная функция, которую хотелось испытать – запись лекций. На момент тестирования я готовилась к поступлению в летнюю школу Neuromatch (учусь прямо сейчас и расскажу про нее обязательно позже), нужно было повторить матанализ, линал и статистику.
В самом начале нужно выбрать предмет, для которого будет вестись запись (у меня это Math), чтобы повысить качество распознавания специфических терминов.
Затем запись расшифровывается. И превращается в красивый структурированный конспект. Я ничего туда не добавляла, все иконки и заголовки расставлены автоматически.
Обратите внимание на раздел про моделирование бросания монеты. Таблицу с примером для биномиального распределения преподаватель не зачитывал и на слайдах ее не было. Turbolearn сгенерировал всё сам.
Главная функция, которую хотелось испытать – запись лекций. На момент тестирования я готовилась к поступлению в летнюю школу Neuromatch (учусь прямо сейчас и расскажу про нее обязательно позже), нужно было повторить матанализ, линал и статистику.
В самом начале нужно выбрать предмет, для которого будет вестись запись (у меня это Math), чтобы повысить качество распознавания специфических терминов.
Затем запись расшифровывается. И превращается в красивый структурированный конспект. Я ничего туда не добавляла, все иконки и заголовки расставлены автоматически.
Обратите внимание на раздел про моделирование бросания монеты. Таблицу с примером для биномиального распределения преподаватель не зачитывал и на слайдах ее не было. Turbolearn сгенерировал всё сам.