Как превратить коллекцию гравюр Пушкинского музея в онтологию
Как найти «зиму» в коллекции гравюр, если на изображении нет ни снега, ни льда? Традиционные методы вроде поиска по ключевым словам здесь бессильны. В этом случае онтология ICON помогает превратить коллекцию в «умные данные», способные отвечать на сложные искусствоведческие вопросы.
Что такое онтологии — и зачем они нужны?
Онтология в компьютерных науках — это способ моделирования и представления данных, их описание и формализация. Онтологии используются не только в теоретических исследованиях, как в случае с коллекцией Пушкинского музея.
Они также помогают и в таких сферах, как
• обработка данных на естественном языке
• оптимизация производственных процессов
• и даже выявление потенциальных киберугроз
Кстати, больше узнать об онтологиях — и о том, как создавать их самостоятельно, — можно из нашего глоссария.
Какие вопросы можно задать онтологии гравюр Пушкинского музея?
Например, вопрос «На каких изображениях распознается оливковая ветвь?», потому что онтология поможет собрать все произведения с определенным символом. Это очень полезно, потому что исследователь — в отличие от поиска коллекции — не может просмотреть 100 000 гравюр вручную.
Кроме того, онтология может выявить скрытые паттерны. Ей можно задать вопрос: «Связан ли выбор мифологических сюжетов с местом обучения художника?» Онтология сопоставит место учебы сотен мастеров с иконографией их работ и выдаст корреляцию, чтобы вы точно знали, кто и где чаще рисовал Венеру, а кто – Вакха.
Наконец, «как всё-таки найти зиму без снега и льда»? Онтология связывает аллегорию зимы с такими мотивами, как «меховая шапка», «восседать на облаке», «голая ветвь». Дальше, например, фигура в центре распознается как «Эол» (бог ветров) или «Борей» (бог северных ветров). Благодаря таким мотивам можно понять, что на картине изображена зима, даже если мы не видим ни снега, ни льда. Любое другое визуальное воплощение будет описываться так же, как и зима, то есть как композиция из фигуры и ее атрибутов.
О том, как онтология производит распознавание и использует классическую теорию интерпретации Эрвина Панофски, вы узнаете из полной версии материала на сайте.
Время чтения: 6 минут
🤖 «Системный Блокъ» @sysblok
Как найти «зиму» в коллекции гравюр, если на изображении нет ни снега, ни льда? Традиционные методы вроде поиска по ключевым словам здесь бессильны. В этом случае онтология ICON помогает превратить коллекцию в «умные данные», способные отвечать на сложные искусствоведческие вопросы.
Что такое онтологии — и зачем они нужны?
Онтология в компьютерных науках — это способ моделирования и представления данных, их описание и формализация. Онтологии используются не только в теоретических исследованиях, как в случае с коллекцией Пушкинского музея.
Они также помогают и в таких сферах, как
• обработка данных на естественном языке
• оптимизация производственных процессов
• и даже выявление потенциальных киберугроз
Кстати, больше узнать об онтологиях — и о том, как создавать их самостоятельно, — можно из нашего глоссария.
Какие вопросы можно задать онтологии гравюр Пушкинского музея?
Например, вопрос «На каких изображениях распознается оливковая ветвь?», потому что онтология поможет собрать все произведения с определенным символом. Это очень полезно, потому что исследователь — в отличие от поиска коллекции — не может просмотреть 100 000 гравюр вручную.
Кроме того, онтология может выявить скрытые паттерны. Ей можно задать вопрос: «Связан ли выбор мифологических сюжетов с местом обучения художника?» Онтология сопоставит место учебы сотен мастеров с иконографией их работ и выдаст корреляцию, чтобы вы точно знали, кто и где чаще рисовал Венеру, а кто – Вакха.
Наконец, «как всё-таки найти зиму без снега и льда»? Онтология связывает аллегорию зимы с такими мотивами, как «меховая шапка», «восседать на облаке», «голая ветвь». Дальше, например, фигура в центре распознается как «Эол» (бог ветров) или «Борей» (бог северных ветров). Благодаря таким мотивам можно понять, что на картине изображена зима, даже если мы не видим ни снега, ни льда. Любое другое визуальное воплощение будет описываться так же, как и зима, то есть как композиция из фигуры и ее атрибутов.
О том, как онтология производит распознавание и использует классическую теорию интерпретации Эрвина Панофски, вы узнаете из полной версии материала на сайте.
Время чтения: 6 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как превратить коллекцию гравюр Пушкинского музея в «умные данные» для цифровой науки - Системный Блокъ Как онтология ICON помогает…
Как найти «зиму» в коллекции гравюр, если на изображении нет ни снега, ни льда? Традиционный поиск по ключевым словам здесь бессилен. В этой статье мы расскажем, как с помощью онтологии ICON и классической теории Эрвина Панофски превратить коллекцию гравюр…
❤22🔥18👏7
Английский vs Корейский в K-pop
K-pop покоряет мир, и его тексты тоже меняются, подстраиваясь под международную аудиторию. На основе корпуса из 290 песен корейских исполнителей расскажем о новых стратегиях использования английской лексики в песнях и о возникших гендерных различиях в лексике.
Вот они слева направо
Путь на мировой рынок для K-pop открыло выступление BTS на American Music Awards и победа на Billboard Music Awards в 2017 году. Начиная с этого времени, в песнях K-pop групп стало значительно больше английских слов. Чтобы отследить эту динамику, в ходе исследования тексты группировали по годам. Особое внимание было уделено последнему слову в строке, типично являющимся в корейском сказуемым или определением.
Что выяснилось?
С 2020 года строки стали значительно чаще заканчиваться на английском. В 2022 году английский в этой позиции впервые обогнал корейский. Особенно тренд усилился в 2023: уже больше половины строк завершались на английском.
Boys and girls
Корейские музыкальные коллективы, как правило, делятся на мужские и женские; смешанные составы встречаются редко. Корпус включает 161 песню, исполненную женщиной или женской группой, 129 песен, исполненных мужчиной или мужской группой, и одну песню смешанного коллектива.
Анализ частотности слов показал, что слово «boy» встречается 105 раз и чаще употребляется в текстах женских коллективов, а «girl» — 102 раза, и преобладает в песнях мужских исполнителей. Согласно графику, слово «love» значительно чаще используется мужскими коллективами (268 употреблений против 93 у женских), в то время как корейское слово «사랑», означающее «любовь» чаще встречается в текстах женских групп.
Так, в песнях мужских коллективов заметно более выраженное предпочтение к использованию английских заимствований, в то время как у женских это предпочтение выражено слабее.
Полный анализ тенденции к англизации текстов K-pop, включая другие примеры, найдете в полной версии статьи.
Время чтения: 7 минут
🤖 «Системный Блокъ» @sysblok
K-pop покоряет мир, и его тексты тоже меняются, подстраиваясь под международную аудиторию. На основе корпуса из 290 песен корейских исполнителей расскажем о новых стратегиях использования английской лексики в песнях и о возникших гендерных различиях в лексике.
Вот они слева направо
Путь на мировой рынок для K-pop открыло выступление BTS на American Music Awards и победа на Billboard Music Awards в 2017 году. Начиная с этого времени, в песнях K-pop групп стало значительно больше английских слов. Чтобы отследить эту динамику, в ходе исследования тексты группировали по годам. Особое внимание было уделено последнему слову в строке, типично являющимся в корейском сказуемым или определением.
Что выяснилось?
С 2020 года строки стали значительно чаще заканчиваться на английском. В 2022 году английский в этой позиции впервые обогнал корейский. Особенно тренд усилился в 2023: уже больше половины строк завершались на английском.
Boys and girls
Корейские музыкальные коллективы, как правило, делятся на мужские и женские; смешанные составы встречаются редко. Корпус включает 161 песню, исполненную женщиной или женской группой, 129 песен, исполненных мужчиной или мужской группой, и одну песню смешанного коллектива.
Анализ частотности слов показал, что слово «boy» встречается 105 раз и чаще употребляется в текстах женских коллективов, а «girl» — 102 раза, и преобладает в песнях мужских исполнителей. Согласно графику, слово «love» значительно чаще используется мужскими коллективами (268 употреблений против 93 у женских), в то время как корейское слово «사랑», означающее «любовь» чаще встречается в текстах женских групп.
Так, в песнях мужских коллективов заметно более выраженное предпочтение к использованию английских заимствований, в то время как у женских это предпочтение выражено слабее.
Полный анализ тенденции к англизации текстов K-pop, включая другие примеры, найдете в полной версии статьи.
Время чтения: 7 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как английский вытесняет корейский в K-pop музыке: анализ данных и визуализация - Системный Блокъ
Как международная популярность корейских поп-групп повлияла на тексты их песен? Как часто исполнители используют английские слова? Как отличаются песни о любви у мужских и женских групп? Этими вопросами задались студенты-востоковеды из Высшей школы экономики.…
❤21🔥15👍5👀3🙈1
Как сделать свой DH-проект: от идеи к реализации
Проекты в области Digital Humanities могут отличаться друг от друга по форме, содержанию, посылу и множеству других пунктов, но главное, что эти исследования или веб-инструменты решают задачи из сферы гуманитарных наук с использованием цифровых технологий. Так что мы сделали целую страницу (и уже чуть-чуть вам о ней рассказывали!), чтобы стало яснее, как сделать что-то подобное самостоятельно.
К какому бы результату вы ни стремились — от графика с таймлайном жизни русских писателей XVIII века до цифровой выставки о наследии Сибири, одно из ключевых решений — визуальное оформление проекта.
Мы поговорили о визуальном решении с создателями виртуального музея Sakharov.space:
Ключевые шаги на других этапах создания DH-проекта мы обсудили с командами цифрового архива «Прожито» @prozhito, корпуса почтовых открыток «Пишу тебе» @pishuteberu и семантического издания Чехова Chekhov.Digital. Переходите к нашему гайду, чтобы прочитать их комментарии.
🤖 «Системный Блокъ» @sysblok
Проекты в области Digital Humanities могут отличаться друг от друга по форме, содержанию, посылу и множеству других пунктов, но главное, что эти исследования или веб-инструменты решают задачи из сферы гуманитарных наук с использованием цифровых технологий. Так что мы сделали целую страницу (и уже чуть-чуть вам о ней рассказывали!), чтобы стало яснее, как сделать что-то подобное самостоятельно.
К какому бы результату вы ни стремились — от графика с таймлайном жизни русских писателей XVIII века до цифровой выставки о наследии Сибири, одно из ключевых решений — визуальное оформление проекта.
Мы поговорили о визуальном решении с создателями виртуального музея Sakharov.space:
Что самое важное в визуальном представлении проекта, основанном на данных из гуманитарных наук?
Найти центральную метафору, которая станет стержнем проекта. Для Sakharov.space это была лестница как символ пути и восхождения. Второе — трансформировать огромный массив данных в живую историю. Сотни фото, документов, аудио и видео мы уместили в нарратив с разной глубиной погружения — от семи минут через видео до часа в архивах.
Можно ли сделать дизайн проекта одновременно эффектным и эффективным?
Да! Мы создали 3D-скульптуру Сахарова по архивным фото и оживили ее, как в старом кино. Результат: 1,5 миллиона визитов, среднее время на сайте – 15 минут. Более половины посетителей составила молодежь до 35 лет — ключевой KPI клиента.
Ключевые шаги на других этапах создания DH-проекта мы обсудили с командами цифрового архива «Прожито» @prozhito, корпуса почтовых открыток «Пишу тебе» @pishuteberu и семантического издания Чехова Chekhov.Digital. Переходите к нашему гайду, чтобы прочитать их комментарии.
🤖 «Системный Блокъ» @sysblok
Системный Блокъ
Создание DH-проекта: руководство для новичков
Как создать свой собственный цифровой гуманитарный проект, от идеи до реализации. В гайде разбираем каждый шаг процесса, проблемы и способы их решения.
❤25🔥17👍4
За пределами видимости: как женские имена остаются в тени школьной программы
8 марта — не про букеты и шоколад, а в первую очередь про права женщин. Например, право быть услышанной. В школьной программе по литературе женщинам отведено всего 2% — и мы решили проверить, всегда ли так было. Рассказываем, почему вы не помните писательниц из школы (и дело не в вашей памяти)
Как менялась школьная программа?
В зависимости от эпохи в школьную программу входили разные женщины-писательницы. Например, женская часть программы 1932 года сегодня вряд ли будет восприниматься как “классика”: там есть комедии императрицы Екатерины II и стихи малоизвестных ныне поэтесс Павловой и Соловьевой. В программах 30 годов находим и первое, хотя и кратковременное, появление Анны Ахматовой, чье имя вернется в школу только спустя полвека.
Ближе к середине XX века на первый план выходят незнакомые современному читателю имена и непривычные жанры: на первый план выходят фольклорные исполнительницы Марфа Крюкова и Ирина Федосова, в список также попадает Маргарита Алигер с поэмой «Зоя» о Зое Космодемьянской. В дальнейшем наблюдается настоящий «расцвет» женской литературы в программе, хотя и с четкой идеологической направленностью: в 1970–1980 школьники проходят три повести Марии Прилежаевой о Ленине и стихотворение Веры Инбер, посвященное его смерти.
С 1980–1990 годы в списки триумфально возвращается Анна Ахматова и программа значительно меняется. В 1991 году включают больше десятка женщин, хотя в последующие годы стабильно остаются только Ахматова и Цветаева. Затем в 2023 году обязательными авторками становятся еще несколько женщин, среди которых Юнна Мориц, единственная наша современница в школьной программе, со стихотворениями «Большой секрет для маленькой компании» и «Ёжик резиновый».
Что мы узнали?
Женщин в русской литературе заметно меньше, чем мужчин, но школьная программа усиливает этот разрыв в 2–4 раза, создавая впечатление, будто писательниц почти нет, хотя это не соответствует действительности.
В полной статье предполагаем, с чем это может быть связано, а также раскрываем детали исследования.
🤖 «Системный Блокъ» @sysblok
8 марта — не про букеты и шоколад, а в первую очередь про права женщин. Например, право быть услышанной. В школьной программе по литературе женщинам отведено всего 2% — и мы решили проверить, всегда ли так было. Рассказываем, почему вы не помните писательниц из школы (и дело не в вашей памяти)
Как менялась школьная программа?
В зависимости от эпохи в школьную программу входили разные женщины-писательницы. Например, женская часть программы 1932 года сегодня вряд ли будет восприниматься как “классика”: там есть комедии императрицы Екатерины II и стихи малоизвестных ныне поэтесс Павловой и Соловьевой. В программах 30 годов находим и первое, хотя и кратковременное, появление Анны Ахматовой, чье имя вернется в школу только спустя полвека.
Ближе к середине XX века на первый план выходят незнакомые современному читателю имена и непривычные жанры: на первый план выходят фольклорные исполнительницы Марфа Крюкова и Ирина Федосова, в список также попадает Маргарита Алигер с поэмой «Зоя» о Зое Космодемьянской. В дальнейшем наблюдается настоящий «расцвет» женской литературы в программе, хотя и с четкой идеологической направленностью: в 1970–1980 школьники проходят три повести Марии Прилежаевой о Ленине и стихотворение Веры Инбер, посвященное его смерти.
С 1980–1990 годы в списки триумфально возвращается Анна Ахматова и программа значительно меняется. В 1991 году включают больше десятка женщин, хотя в последующие годы стабильно остаются только Ахматова и Цветаева. Затем в 2023 году обязательными авторками становятся еще несколько женщин, среди которых Юнна Мориц, единственная наша современница в школьной программе, со стихотворениями «Большой секрет для маленькой компании» и «Ёжик резиновый».
Что мы узнали?
Женщин в русской литературе заметно меньше, чем мужчин, но школьная программа усиливает этот разрыв в 2–4 раза, создавая впечатление, будто писательниц почти нет, хотя это не соответствует действительности.
В полной статье предполагаем, с чем это может быть связано, а также раскрываем детали исследования.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Классное чтение: женщины-писательницы - Системный Блокъ Кто, кроме Ахматовой: как женщины-авторы представлены в школьной программе…
Кто из женщин-авторов входит в школьную программу по литературе, кроме Анны Ахматовой и Марины Цветаевой? Очевидно, что женщин в литературе мало, но неужели настолько мало? И было ли так всегда? Кого из писательниц и поэтесс проходили школьники предыдущих…
❤55🥰19❤🔥9😢5👍3
Как нас обманывают двойные оси
Вы когда-нибудь видели график, на котором слева — ось выручки в миллионах рублей, а справа — количества клиентов? Или, например, температура в градусах и осадки в миллиметрах? Это график с двойными осями Y — он позволяет сравнивать два показателя, но часто приводит нас к неверным выводам.
В новом материале рассказываем о проблемах, которые возникают при использовании двойных осей и о том, как их избежать.
Так, графики с двойными осями могут использоваться, чтобы создать у читателя иллюзию корреляции — взаимосвязи между показателями. Например, график может иллюстрировать корреляцию между популярностью имени Stevie и стоимостью акций Amazon. Человеческое сознание автоматически сравнивает формы линий. Мы видим на графике «одинаковый рост», отмечаем синхронность линий, и нам кажется, что они связаны.
Однако на самом деле это просто иллюзия. Независимый масштаб двух осей делает сравнение кривых некорректным, нарушаются принципы графического восприятия. Так люди считывают зависимость показателей, которой на самом деле нет.
Чтобы узнать об альтернативных способах представления информации, читайте полную версию статьи.
🤖 «Системный Блокъ» @sysblok
Вы когда-нибудь видели график, на котором слева — ось выручки в миллионах рублей, а справа — количества клиентов? Или, например, температура в градусах и осадки в миллиметрах? Это график с двойными осями Y — он позволяет сравнивать два показателя, но часто приводит нас к неверным выводам.
В новом материале рассказываем о проблемах, которые возникают при использовании двойных осей и о том, как их избежать.
Так, графики с двойными осями могут использоваться, чтобы создать у читателя иллюзию корреляции — взаимосвязи между показателями. Например, график может иллюстрировать корреляцию между популярностью имени Stevie и стоимостью акций Amazon. Человеческое сознание автоматически сравнивает формы линий. Мы видим на графике «одинаковый рост», отмечаем синхронность линий, и нам кажется, что они связаны.
Однако на самом деле это просто иллюзия. Независимый масштаб двух осей делает сравнение кривых некорректным, нарушаются принципы графического восприятия. Так люди считывают зависимость показателей, которой на самом деле нет.
Чтобы узнать об альтернативных способах представления информации, читайте полную версию статьи.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🔥19😈7🙈3
Конфликт Пентагона и Anthropic, протест против OpenAI, увольнение главы разработки Qwen
Рассказываем, что произошло в мире ИИ за последнее время.
Пентагон против Anthropic
Ранее мы писали о конфликте Министерства обороны США с компанией Anthropic. Камнем преткновения стали два вопроса: применение ИИ для массовой слежки за гражданами США и автономное управление оружием.
26 февраля Anthropic заявила о готовности к сотрудничеству с государством в оборонной сфере, однако обозначила жесткие ограничения: массовая слежка за американскими гражданами неприемлема (при этом слежка за иностранными гражданами допустима), а текущие ИИ-системы еще недостаточно надежны для автономного управления оружием. Пентагон предложил формальный компромисс без изменений по сути, однако Anthropic на него не согласилась.
На следующий день президент Трамп поручил федеральным ведомствам прекратить использование продуктов Anthropic. Вслед за этим глава Пентагона Хегсет инициировал процедуру признания Anthropic «ненадежным поставщиком», фактически отрезав компанию от сотрудничества с любой организацией, связанной с Министерством обороны.
В тот же день о партнерстве с Пентагоном объявила OpenAI. По словам ее гендиректора Сэма Альтмана, договор включал ровно те ограничения, которых добивалась Anthropic. Однако сторонние юристы указали, что соглашение допускает использование ИИ фактически в «любых законных целях», а что считать законным — во многом определяет сам Пентагон.
Расхождение между публичными заявлениями Альтмана и реальным содержанием договора вызвало волну отмены подписок на ChatGPT и переход пользователей на Claude, который на некоторое время поднялся до второго места в американском App Store.
4 марта в сеть утекло внутреннее сообщение гендиректора Anthropic Дарио Амодеи сотрудникам компании. В нем он назвал публичные заявления OpenAI «откровенной ложью», но на следующий день Амодеи принес публичные извинения, заявив, что компания не причастна к утечке, а само письмо было написано после срыва переговоров с Пентагоном — в состоянии аффекта. По его словам, текст не отражает его взвешенной позиции по текущему положению дел.
Глава команды Qwen покинул Alibaba
Линь Цзюньян, технический руководитель команды Qwen с 2023 года, разрабатывающей одну из самых популярных открытых LLM, объявил об уходе. Вместе с ним ушли руководитель направления дообучения Юй Бовэнь и еще несколько участников команды.
Qwen — семейство языковых и мультимодальных моделей холдинга Alibaba (владелец AliExpress, Taobao и других крупных маркетплейсов), одно из самых популярных в мире с открытыми весами. Модели Qwen используются как в американских, так и в российских компаниях, например, в Яндексе и Т-Банке.
Официальные причины ухода главы компании не названы, однако несколько источников указывают на реструктуризацию: из автономного стартапа Qwen превратился в подразделение под прямым управлением Tongyi Lab.
Реакция сообщества оказалась бурной, коллеги называли уход «концом эпохи». Акции Alibaba в Гонконге упали на 5,3%.
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за последнее время.
Пентагон против Anthropic
Ранее мы писали о конфликте Министерства обороны США с компанией Anthropic. Камнем преткновения стали два вопроса: применение ИИ для массовой слежки за гражданами США и автономное управление оружием.
26 февраля Anthropic заявила о готовности к сотрудничеству с государством в оборонной сфере, однако обозначила жесткие ограничения: массовая слежка за американскими гражданами неприемлема (при этом слежка за иностранными гражданами допустима), а текущие ИИ-системы еще недостаточно надежны для автономного управления оружием. Пентагон предложил формальный компромисс без изменений по сути, однако Anthropic на него не согласилась.
На следующий день президент Трамп поручил федеральным ведомствам прекратить использование продуктов Anthropic. Вслед за этим глава Пентагона Хегсет инициировал процедуру признания Anthropic «ненадежным поставщиком», фактически отрезав компанию от сотрудничества с любой организацией, связанной с Министерством обороны.
В тот же день о партнерстве с Пентагоном объявила OpenAI. По словам ее гендиректора Сэма Альтмана, договор включал ровно те ограничения, которых добивалась Anthropic. Однако сторонние юристы указали, что соглашение допускает использование ИИ фактически в «любых законных целях», а что считать законным — во многом определяет сам Пентагон.
Расхождение между публичными заявлениями Альтмана и реальным содержанием договора вызвало волну отмены подписок на ChatGPT и переход пользователей на Claude, который на некоторое время поднялся до второго места в американском App Store.
4 марта в сеть утекло внутреннее сообщение гендиректора Anthropic Дарио Амодеи сотрудникам компании. В нем он назвал публичные заявления OpenAI «откровенной ложью», но на следующий день Амодеи принес публичные извинения, заявив, что компания не причастна к утечке, а само письмо было написано после срыва переговоров с Пентагоном — в состоянии аффекта. По его словам, текст не отражает его взвешенной позиции по текущему положению дел.
Почему это важно?
Исход конфликта — первый публичный ответ на вопрос, который раньше обсуждался лишь в академических кругах: что происходит, когда принципы ответственной разработки ИИ сталкиваются с государственной властью? Отныне любое разногласие с Пентагоном грозит не просто потерей контракта, а попыткой уничтожить компанию.
Глава команды Qwen покинул Alibaba
Линь Цзюньян, технический руководитель команды Qwen с 2023 года, разрабатывающей одну из самых популярных открытых LLM, объявил об уходе. Вместе с ним ушли руководитель направления дообучения Юй Бовэнь и еще несколько участников команды.
Qwen — семейство языковых и мультимодальных моделей холдинга Alibaba (владелец AliExpress, Taobao и других крупных маркетплейсов), одно из самых популярных в мире с открытыми весами. Модели Qwen используются как в американских, так и в российских компаниях, например, в Яндексе и Т-Банке.
Официальные причины ухода главы компании не названы, однако несколько источников указывают на реструктуризацию: из автономного стартапа Qwen превратился в подразделение под прямым управлением Tongyi Lab.
Реакция сообщества оказалась бурной, коллеги называли уход «концом эпохи». Акции Alibaba в Гонконге упали на 5,3%.
Почему это важно?
Успех Qwen во многом строился на модели «стартапа внутри корпорации»: автономная команда, короткие циклы разработки, быстрый выход в открытый доступ. Корпоративная реорганизация нередко подавляет именно ту культуру, которая и обеспечивала успех проекта.
Если реструктуризация приведет к тому, что модели Qwen перестанут выходить в открытый доступ, это существенно замедлит развитие open-source моделей в целом.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15👍7🔥5👻3🎃3
От формулы к черному ящику: мы перестали понимать мир?
Используя в вычислениях ту или иную формулу, мы часто не понимаем ее смысла. Да и зачем, если все формулы уже выведены и готовы к использованию? С развитием нейросетей мы шагнули еще дальше от понимания вычислительного процесса, променяв осмысление на эффективность и скорость. Нейросети выдают пользователю результат, основываясь на закономерностях, которые часто не может сформулировать вообще никто, включая и тех, кто нейросети обучал. «Это прогресс или капитуляция перед сложностью мира?» — об этом рассуждает в своем блоге Дмитрий Пронин.
«Как?» и «почему?»
На протяжении истории человечеству часто приходилось отказываться от привычного понимания мира и двигаться в сторону всё более сложных абстракций. Так, в античности придумали иррациональные числа для описания длины квадрата и идею нуля как мысленного эквивалента «ничего», а для торговли понадобились отрицательные числа. Эти абстракции были сложны для восприятия, но они предлагали объяснение тому, что раньше было непонятным.
«Как?» без «почему?»
В дальнейшем получили развитие численные методы. Когда точной формулы нет, можно найти приблизительный ответ через серию вычислений и перебор вариантов. Численные методы уже не позволяли сформулировать универсальный закон через компактное уравнение, но зато позволяли подобрать примерные закономерности для очень сложных систем. Появление компьютеров сделало их применение намного эффективнее: машины быстро выполняют вычисления, которые хорошо поддаются алгоритмизации.
Правильные ответы без «как?» и «почему?»
Следующим шагом стали статистические методы и выросшее из них машинное обучение. Они позволили нам предсказывать закономерности, которые проявляются на больших массивах наблюдений. Эти методы эффективно работают с такими материалами, как изображения и естественный язык. Но понимания стало еще меньше: теперь мы не понимаем не только почему система ведет себя так или иначе, как это было при использовании численных решений без аналитической формулы, но и на какой закономерности строится решение.
🙈 Мы совсем перестали понимать мир?
Численные и вероятностные подходы — это не замена теории и не отказ от научной строгости. Скорее, они закрывают практические потребности там, где создать стройную теорию (пока) не получилось, но есть много данных для выведения закономерностей. Например, анализ текстов или картинок. Подробнее о том, как наука работает с такими задачами, читайте в блоге Дмитрия Пронина.
🤖 «Системный Блокъ» @sysblok
Используя в вычислениях ту или иную формулу, мы часто не понимаем ее смысла. Да и зачем, если все формулы уже выведены и готовы к использованию? С развитием нейросетей мы шагнули еще дальше от понимания вычислительного процесса, променяв осмысление на эффективность и скорость. Нейросети выдают пользователю результат, основываясь на закономерностях, которые часто не может сформулировать вообще никто, включая и тех, кто нейросети обучал. «Это прогресс или капитуляция перед сложностью мира?» — об этом рассуждает в своем блоге Дмитрий Пронин.
«Как?» и «почему?»
На протяжении истории человечеству часто приходилось отказываться от привычного понимания мира и двигаться в сторону всё более сложных абстракций. Так, в античности придумали иррациональные числа для описания длины квадрата и идею нуля как мысленного эквивалента «ничего», а для торговли понадобились отрицательные числа. Эти абстракции были сложны для восприятия, но они предлагали объяснение тому, что раньше было непонятным.
«Как?» без «почему?»
В дальнейшем получили развитие численные методы. Когда точной формулы нет, можно найти приблизительный ответ через серию вычислений и перебор вариантов. Численные методы уже не позволяли сформулировать универсальный закон через компактное уравнение, но зато позволяли подобрать примерные закономерности для очень сложных систем. Появление компьютеров сделало их применение намного эффективнее: машины быстро выполняют вычисления, которые хорошо поддаются алгоритмизации.
Правильные ответы без «как?» и «почему?»
Следующим шагом стали статистические методы и выросшее из них машинное обучение. Они позволили нам предсказывать закономерности, которые проявляются на больших массивах наблюдений. Эти методы эффективно работают с такими материалами, как изображения и естественный язык. Но понимания стало еще меньше: теперь мы не понимаем не только почему система ведет себя так или иначе, как это было при использовании численных решений без аналитической формулы, но и на какой закономерности строится решение.
🙈 Мы совсем перестали понимать мир?
Численные и вероятностные подходы — это не замена теории и не отказ от научной строгости. Скорее, они закрывают практические потребности там, где создать стройную теорию (пока) не получилось, но есть много данных для выведения закономерностей. Например, анализ текстов или картинок. Подробнее о том, как наука работает с такими задачами, читайте в блоге Дмитрия Пронина.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
От формулы к черному ящику: как компьютеры и ИИ «хакнули» правила реальности, которые не понимает наука - Системный Блокъ
Когда-то физика была честной игрой: если ты знаешь массу и высоту, ты знаешь будущее падающего камня. Формула описывала все множество ситуаций. Формула давала универсальное понимание. Но чем глубже мы заходим в дебри сложных систем — от турбулентности воздуха…
❤33👾9🦄4👏3👍2
Цифровой алкотестер: как нейросеть вычисляет опьянение по голосу
Пара фраз — и машина поймет: за руль нельзя. Ученые уже учат нейросети отличать пьяную речь по нескольким фразам. Звучит как фантастика? Уже нет. Разбираемся, как это работает и при чем тут немецкие скороговорки.
🍾 Как речь выдает опьянение
Машины, которые определяют опьянение и блокируют запуск, — это уже не фантастика, а сегодняшний день. С 2019 года в Евросоюзе все новые автомобили выпускаются с расчетом на установку «алкозамка».
Что, если машина сможет определять опьянение без всякой трубки, просто слушая голос? Алкоголь неизбежно меняет речь, ведь говорение — это сложнейшая работа сотни мышц, синхронизированных мозгом. Голос меняется — это заметно даже на слух, а уж алгоритмы диагностики давно это умеют. Осталось перенести эту технологию в автомобиль.
🍾 Корпус пьяной речи
Еще в 2011 году на научном конкурсе Interspeech 2011: Speaker State Challenge исследователи задумались об алгоритме, который был бы способен претворить эту идею в жизнь, и создали датасет Alcohol Language Corpus (ALC). Ученые зафиксировали, что у выпивших (особенно женщин) часто повышалась тональность голоса. Но обобщить другие акустические особенности тогда не удалось.
Позже итальянские ученые продолжили исследования, применив нейросети. Они использовали тот же датасет ALC, сосредоточившись на скороговорках, которые оказались особенно чувствительны к алкоголю. Затем они перешли к созданию модели, способной игнорировать уникальность каждого голоса.
🍾 Как устроен нейросетевой алкотестер
DANN — это архитектура нейросети, которая учится выделять инвариантные признаки, то есть такие, которые не зависят от особенностей данных. Например, такая модель будет игнорировать разные стили речи и индивидуальные черты говорящих — вместо этого она сосредоточится именно на том, чтобы выявить факт употребления алкоголя.
• Один блок извлекает из входных аудиозаписей общие признаки опьянения (тон, ритм).
• Второй блок классифицирует речь как трезвую или нетрезвую.
• Третий блок (контролер) пытается угадать личность говорящего. Если это удается, первый блок «штрафуется», чтобы алгоритм отфильтровывал индивидуальные особенности и фокусировался только на изменениях от алкоголя.
Модель обучили на 75% данных ALC и протестировали на оставшихся записях. Она показала точность почти 71% на новых голосах, став важным шагом к созданию универсального голосового алкотестера.
О том, как формировался корпус пьяной речи и других деталях исследований, читайте в полной статье.
🤖 «Системный Блокъ» @sysblok
Пара фраз — и машина поймет: за руль нельзя. Ученые уже учат нейросети отличать пьяную речь по нескольким фразам. Звучит как фантастика? Уже нет. Разбираемся, как это работает и при чем тут немецкие скороговорки.
🍾 Как речь выдает опьянение
Машины, которые определяют опьянение и блокируют запуск, — это уже не фантастика, а сегодняшний день. С 2019 года в Евросоюзе все новые автомобили выпускаются с расчетом на установку «алкозамка».
Что, если машина сможет определять опьянение без всякой трубки, просто слушая голос? Алкоголь неизбежно меняет речь, ведь говорение — это сложнейшая работа сотни мышц, синхронизированных мозгом. Голос меняется — это заметно даже на слух, а уж алгоритмы диагностики давно это умеют. Осталось перенести эту технологию в автомобиль.
🍾 Корпус пьяной речи
Еще в 2011 году на научном конкурсе Interspeech 2011: Speaker State Challenge исследователи задумались об алгоритме, который был бы способен претворить эту идею в жизнь, и создали датасет Alcohol Language Corpus (ALC). Ученые зафиксировали, что у выпивших (особенно женщин) часто повышалась тональность голоса. Но обобщить другие акустические особенности тогда не удалось.
Позже итальянские ученые продолжили исследования, применив нейросети. Они использовали тот же датасет ALC, сосредоточившись на скороговорках, которые оказались особенно чувствительны к алкоголю. Затем они перешли к созданию модели, способной игнорировать уникальность каждого голоса.
🍾 Как устроен нейросетевой алкотестер
DANN — это архитектура нейросети, которая учится выделять инвариантные признаки, то есть такие, которые не зависят от особенностей данных. Например, такая модель будет игнорировать разные стили речи и индивидуальные черты говорящих — вместо этого она сосредоточится именно на том, чтобы выявить факт употребления алкоголя.
• Один блок извлекает из входных аудиозаписей общие признаки опьянения (тон, ритм).
• Второй блок классифицирует речь как трезвую или нетрезвую.
• Третий блок (контролер) пытается угадать личность говорящего. Если это удается, первый блок «штрафуется», чтобы алгоритм отфильтровывал индивидуальные особенности и фокусировался только на изменениях от алкоголя.
Модель обучили на 75% данных ALC и протестировали на оставшихся записях. Она показала точность почти 71% на новых голосах, став важным шагом к созданию универсального голосового алкотестера.
О том, как формировался корпус пьяной речи и других деталях исследований, читайте в полной статье.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Нейросеть-алкотестер: как ваша речь может выдать вас с головой - Системный Блокъ Голосовой алкотестер: как нейросети используют…
Алкотестер в каждой машине — звучит слишком хорошо, чтобы быть правдой? А если алкотестер — это ваш собственный голос? Достаточно сказать пару фраз, чтобы машина определила, что садиться за руль сейчас нельзя, и тем самым спасла жизнь вам или кому-то еще…
🍾24🔥13❤5🙈5👏3
Пьющих просьба не беспокоить: особый язык объявлений о сдаче квартир
На сайтах с недвижимостью на страницах объявлений обычно есть раздел, где владельцы в свободной форме описывают жилье и указывают требования к арендаторам: от конкретных («без животных») до абстрактных («только адекватным»). Мы обработали 15 тыс. объявлений с помощью LLM, чтобы выяснить, какие условия встречаются чаще всего, а какие способны удивить.
Что анализировали?
Мы нашли открытый датасет Avito Demand Prediction Challenge с Kaggle и отобрали 14 557 объявлений по фильтрам: «Квартиры, Сдам, На длительный срок». Главное — там была колонка description с нужным текстом.
Что получили?
Мы задали модели промпт с инструкцией извлечь данные по пунктам: национальность, качества характера, состав жильцов, можно ли с детьми или с животными. Проверив результаты вручную, мы убедились, что модель хорошо показала себя по первым двум пунктам, по остальным — средние результаты.
Ожидаемо, про национальность/гражданство/происхождение жильцов чаще всего писали, что ищут русских (450 упоминаний), славян (241), граждан РФ (51) или российских (14) граждан, местных (5), с пропиской (13), русскоязычных (2) или даже православных (2). Типичны запреты для «кавказцев и азиатов». Изредка встречаются объявления «для любых» (7) или «нерусских» (5).
Модель выделила массу распространенных требований:
• Объективные: чистоплотность (120), отсутствие вредных привычек (88), аккуратность (74), не курить (22).
• Абстрактные: порядочность (754), добросовестность (16) и многие другие.
• Были и совсем смешные формулировки. Например, модель выделила дословно фразу «пьющих просьба не беспокоить…», будто жильцы не должны беспокоить каких-то других пьющих.
По другим основным параметрам можно заметить, что мужчинам-одиночкам, людям с маленькими детьми и животными сложнее снять квартиру, чем семейным парам и женщинам без детей и животных.
О том, влияет ли на ваши шансы штамп в паспорте и можно ли с животными, если их «немного», читайте в полной статье.
🤖 «Системный Блокъ» @sysblok
На сайтах с недвижимостью на страницах объявлений обычно есть раздел, где владельцы в свободной форме описывают жилье и указывают требования к арендаторам: от конкретных («без животных») до абстрактных («только адекватным»). Мы обработали 15 тыс. объявлений с помощью LLM, чтобы выяснить, какие условия встречаются чаще всего, а какие способны удивить.
Что анализировали?
Мы нашли открытый датасет Avito Demand Prediction Challenge с Kaggle и отобрали 14 557 объявлений по фильтрам: «Квартиры, Сдам, На длительный срок». Главное — там была колонка description с нужным текстом.
Что получили?
Мы задали модели промпт с инструкцией извлечь данные по пунктам: национальность, качества характера, состав жильцов, можно ли с детьми или с животными. Проверив результаты вручную, мы убедились, что модель хорошо показала себя по первым двум пунктам, по остальным — средние результаты.
Ожидаемо, про национальность/гражданство/происхождение жильцов чаще всего писали, что ищут русских (450 упоминаний), славян (241), граждан РФ (51) или российских (14) граждан, местных (5), с пропиской (13), русскоязычных (2) или даже православных (2). Типичны запреты для «кавказцев и азиатов». Изредка встречаются объявления «для любых» (7) или «нерусских» (5).
Модель выделила массу распространенных требований:
• Объективные: чистоплотность (120), отсутствие вредных привычек (88), аккуратность (74), не курить (22).
• Абстрактные: порядочность (754), добросовестность (16) и многие другие.
• Были и совсем смешные формулировки. Например, модель выделила дословно фразу «пьющих просьба не беспокоить…», будто жильцы не должны беспокоить каких-то других пьющих.
По другим основным параметрам можно заметить, что мужчинам-одиночкам, людям с маленькими детьми и животными сложнее снять квартиру, чем семейным парам и женщинам без детей и животных.
О том, влияет ли на ваши шансы штамп в паспорте и можно ли с животными, если их «немного», читайте в полной статье.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Пьющих просьба не беспокоить: анализируем язык объявлений о сдаче квартир с помощью LLM - Системный Блокъ Как LLM анализирует объявления…
Что нужно человеку, чтобы снять квартиру в России? Каждый, кто читал объявления на популярных сайтах, знает, что нужно не только заплатить за аренду, но и соответствовать требованиям арендодателя. Чтобы узнать, какие требования оказались самыми распространенными…
🔥27😁18👍7👀5🤯3
Спроектировать свёклу на компьютере: как геномная селекция создает завтрашний урожай 🤩 на стыке биологии и информатики
Если ваше представление о селекции — это школьные таблицы со скрещиванием гороха, то у нас для вас новости. Сегодня селекционеры работают не с конкретными растениями или животными, а с компьютерными моделями и генетическими картами. В новом материале разбираемся, как технологии помогли селекционерам перейти от интуитивного отбора к эре предсказательного моделирования и автоматизированного создания новых сортов и пород.
Первые селекционеры
История селекции начинается с древности — тогда это было делом интуиции. Древний человек отбирал самого послушного волчонка, самое плодовитое растение или овцу с самой густой шерстью. Это была селекция на глазок: медленная и неточная, методом проб и ошибок. Чтобы увидеть результат, приходилось ждать годы — до нового урожая или следующего поколения животных. В таком виде селекция существовала тысячелетиями, однако такой подход не позволял отбирать сложные признаки, которые невозможно определить «на глаз»: как предсказать, какое растение переживет засуху или у какого животного будет самое нежное мясо?
Научный прорыв
Революция в биологии случилась благодаря точным вычислениям. В середине XIX века монах-садовод Грегор Мендель, скрещивая горох, открыл универсальные законы, объясняющие принципы наследования. Он показал, что признаки наследуются не случайно, а по четким правилам, которые можно описать формулами. Согласно Менделю, невидимые наследственные факторы, которые мы называем генами, передаются от родителей потомкам, определяя конкретные черты организма.
Стоит заметить, что понятие гена как элементарной единицы наследственности было введено в науку значительно позже открытий Менделя. Это сделал в начале XX века Вильгельм Йоханнсен, предложивший три фундаментальных термина: «ген», «генотип» (совокупность всех генов организма) и «фенотип» (совокупность всех его наблюдаемых признаков).
В XX веке абстрактный ген превратился в реальный объект для изучения. Ученые доказали, что гены расположены в хромосомах (Томас Морган), выяснили, что носителем наследственной информации является ДНК (Освальд Эвери), а затем расшифровали ее двойную спиральную структуру (Джеймс Уотсон и Фрэнсис Крик).
Чтение генетической инструкции
Следующий прорыв произошел на рубеже XX–XXI веков благодаря геномной революции — переходу от изучения отдельных генов к анализу полных геномов. Ее основой стало секвенирование — технология прочтения последовательности нуклеотидов (A, T, G, C) в ДНК.
Но как быть, если признак контролируется не одним геном или несколькими генами, а сотнями тысяч одновременно? В этом селекционерам помогает геномная селекция (Genomic Selection, GS). Ее ключевая идея в том, что влияние на сложный признак (вроде урожайности) распределено по всему геному. Поэтому вместо поиска отдельных генов метод одновременно анализирует множество молекулярных маркеров, равномерно покрывающих все хромосомы.
Этот метод, впервые предложенный в 2001 году, активно используется до сих пор и постоянно совершенствуется с развитием алгоритмов искусственного интеллекта.
Современная селекция завершила переход от интуиции к точному инжинирингу. Теперь новые сорта и породы проектируются цифровыми методами (геномная селекция), создаются инструментами генного редактирования (CRISPR) и выращиваются с помощью роботизированных систем. Завтрашний урожай рождается сегодня на стыке биологии, информатики и робототехники.
В полной версии статьи предлагаем разобраться в механизмах селекции, узнать о новейших методах в этой области и наконец понять, почему отправной точкой для научных открытий стал именно горох.
🤖 «Системный Блокъ» @sysblok
Если ваше представление о селекции — это школьные таблицы со скрещиванием гороха, то у нас для вас новости. Сегодня селекционеры работают не с конкретными растениями или животными, а с компьютерными моделями и генетическими картами. В новом материале разбираемся, как технологии помогли селекционерам перейти от интуитивного отбора к эре предсказательного моделирования и автоматизированного создания новых сортов и пород.
Первые селекционеры
История селекции начинается с древности — тогда это было делом интуиции. Древний человек отбирал самого послушного волчонка, самое плодовитое растение или овцу с самой густой шерстью. Это была селекция на глазок: медленная и неточная, методом проб и ошибок. Чтобы увидеть результат, приходилось ждать годы — до нового урожая или следующего поколения животных. В таком виде селекция существовала тысячелетиями, однако такой подход не позволял отбирать сложные признаки, которые невозможно определить «на глаз»: как предсказать, какое растение переживет засуху или у какого животного будет самое нежное мясо?
Научный прорыв
Революция в биологии случилась благодаря точным вычислениям. В середине XIX века монах-садовод Грегор Мендель, скрещивая горох, открыл универсальные законы, объясняющие принципы наследования. Он показал, что признаки наследуются не случайно, а по четким правилам, которые можно описать формулами. Согласно Менделю, невидимые наследственные факторы, которые мы называем генами, передаются от родителей потомкам, определяя конкретные черты организма.
Стоит заметить, что понятие гена как элементарной единицы наследственности было введено в науку значительно позже открытий Менделя. Это сделал в начале XX века Вильгельм Йоханнсен, предложивший три фундаментальных термина: «ген», «генотип» (совокупность всех генов организма) и «фенотип» (совокупность всех его наблюдаемых признаков).
В XX веке абстрактный ген превратился в реальный объект для изучения. Ученые доказали, что гены расположены в хромосомах (Томас Морган), выяснили, что носителем наследственной информации является ДНК (Освальд Эвери), а затем расшифровали ее двойную спиральную структуру (Джеймс Уотсон и Фрэнсис Крик).
Чтение генетической инструкции
Следующий прорыв произошел на рубеже XX–XXI веков благодаря геномной революции — переходу от изучения отдельных генов к анализу полных геномов. Ее основой стало секвенирование — технология прочтения последовательности нуклеотидов (A, T, G, C) в ДНК.
Но как быть, если признак контролируется не одним геном или несколькими генами, а сотнями тысяч одновременно? В этом селекционерам помогает геномная селекция (Genomic Selection, GS). Ее ключевая идея в том, что влияние на сложный признак (вроде урожайности) распределено по всему геному. Поэтому вместо поиска отдельных генов метод одновременно анализирует множество молекулярных маркеров, равномерно покрывающих все хромосомы.
Этот метод, впервые предложенный в 2001 году, активно используется до сих пор и постоянно совершенствуется с развитием алгоритмов искусственного интеллекта.
Современная селекция завершила переход от интуиции к точному инжинирингу. Теперь новые сорта и породы проектируются цифровыми методами (геномная селекция), создаются инструментами генного редактирования (CRISPR) и выращиваются с помощью роботизированных систем. Завтрашний урожай рождается сегодня на стыке биологии, информатики и робототехники.
В полной версии статьи предлагаем разобраться в механизмах селекции, узнать о новейших методах в этой области и наконец понять, почему отправной точкой для научных открытий стал именно горох.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Феномика, ГМО и роботы: как завтрашний урожай проектируется уже сегодня - Системный Блокъ Как технологии изменили селекцию: от…
Что общего между ДНК-маркерами, прогностическими моделями и дронами с мультиспектральными камерами? Все это — инструменты селекции, которая за последние два века превратилась из творческого процесса в точную науку. Разбираемся, как технологии помогли селекционерам…
❤17👾9👨💻3
Как пользоваться NotebookLM от Google
Подготовиться к экзамену, изучить новую тему, создать базу знаний… Если вам становится не по себе от этого списка — открывайте гайд «Системного Блока», где мы рассказываем про NotebookLM — ИИ-инструмент, который поможет вам в решении рабочих, учебных и исследовательских задач.
Еще один блокнот — или нечто большее?
Google описывает NotebookLM как «ИИ-помощник в исследованиях». Как начать им пользоваться? Для каждого нового проекта нужно создать блокнот, в который загружаются статьи, отчеты, заметки, видео. Теперь вы можете задавать вопросы к этим материалам, и все ответы будут генерироваться на их основе. Основное взаимодействие происходит через чат, как и в других ИИ-ассистентах.
NotebookLM работает на языковых моделях Google — Gemini Pro и Gemini Pro Flash. В основе лежит RAG-архитектура (Retrieval-Augmented Generation) — технология, которая сначала извлекает релевантные фрагменты из ваших документов, а затем генерирует ответ на их основе. Подробнее о RAG мы рассказывали в глоссарии.
Дополнительные функции NotebookLM
• генерация подкастов по вашим материалам
• создание mind maps (интеллект-карт)
• формирование карточек для запоминания
• сохранение важных ответов в виде заметок, которые можно объединять
Поддерживаемые форматы
NotebookLM работает с PDF, Google Docs, презентациями, аудио-, видео- и текстовыми файлами, веб-ссылками (включая транскрипты видео с YouTube).
Кому это будет полезно
NotebookLM пригодится всем, кто работает с большими объёмами информации:
• исследователям и аспирантам
для анализа научной литературы
• преподавателям
для подготовки учебных материалов и курсов
• студентам
для работы с лекциями и подготовки к экзаменам
• журналистам
для обработки интервью, документов и справочных материалов
• информационным работникам
• аналитикам, консультантам, всем, кто ежедневно работает с документами
В гайде мы даем пошаговую инструкцию для эффективной работы NotebookLM и разбираем задачу поиска информации в исследовательской литературе.
🤖 «Системный Блокъ» @sysblok
Подготовиться к экзамену, изучить новую тему, создать базу знаний… Если вам становится не по себе от этого списка — открывайте гайд «Системного Блока», где мы рассказываем про NotebookLM — ИИ-инструмент, который поможет вам в решении рабочих, учебных и исследовательских задач.
Еще один блокнот — или нечто большее?
Google описывает NotebookLM как «ИИ-помощник в исследованиях». Как начать им пользоваться? Для каждого нового проекта нужно создать блокнот, в который загружаются статьи, отчеты, заметки, видео. Теперь вы можете задавать вопросы к этим материалам, и все ответы будут генерироваться на их основе. Основное взаимодействие происходит через чат, как и в других ИИ-ассистентах.
NotebookLM работает на языковых моделях Google — Gemini Pro и Gemini Pro Flash. В основе лежит RAG-архитектура (Retrieval-Augmented Generation) — технология, которая сначала извлекает релевантные фрагменты из ваших документов, а затем генерирует ответ на их основе. Подробнее о RAG мы рассказывали в глоссарии.
Дополнительные функции NotebookLM
• генерация подкастов по вашим материалам
• создание mind maps (интеллект-карт)
• формирование карточек для запоминания
• сохранение важных ответов в виде заметок, которые можно объединять
Поддерживаемые форматы
NotebookLM работает с PDF, Google Docs, презентациями, аудио-, видео- и текстовыми файлами, веб-ссылками (включая транскрипты видео с YouTube).
Кому это будет полезно
NotebookLM пригодится всем, кто работает с большими объёмами информации:
• исследователям и аспирантам
для анализа научной литературы
• преподавателям
для подготовки учебных материалов и курсов
• студентам
для работы с лекциями и подготовки к экзаменам
• журналистам
для обработки интервью, документов и справочных материалов
• информационным работникам
• аналитикам, консультантам, всем, кто ежедневно работает с документами
В гайде мы даем пошаговую инструкцию для эффективной работы NotebookLM и разбираем задачу поиска информации в исследовательской литературе.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Как пользоваться NotebookLM от Google - Системный Блокъ Как пользоваться NotebookLM от Google
Главная проблема ChatGPT и других ИИ-инструментов — галлюцинации. Модель может выдумать несуществующее исследование или сослаться на фантомную статью. NotebookLM от Google поможет решить эту проблему: он отвечает строго по вашим загруженным документам, тем…
❤32🔥15👨💻12🙏1