сразу две новости из России, посвященные машинному переводу, за один день:
1) коллеги из AIRI(Илья, привет!) , ИТМО и ИСП РАН сделали модель для оцифровки и перевода древнеегипетских иероглифов (надеюсь, перевод там не как на картинке к посту)
2) коллеги из Сургута (!) предложили метрику качества машинного перевода, которая дает классификацию ошибок (оставим в стороне тот факт, что такого рода метрик уже есть вагон)
@valuableai
1) коллеги из AIRI
2) коллеги из Сургута (!) предложили метрику качества машинного перевода, которая дает классификацию ошибок (оставим в стороне тот факт, что такого рода метрик уже есть вагон)
@valuableai
👀7🏆5❤2🥴2🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
пришла новость, что стартап 1X выпустил робота NEO; это уже полноценный робот помощник, который может и убраться, и по дому помочь (на видео); продается это за 20000 долларов либо сдается в аренду за 500 долларов в день
важно отметить, что тут честно заявили, что робот дистанционно управляется человеком; в этот раз прямо заявили, что этот шахматист - не механический(ради интереса посмотрел статью про это в Грокипедии - вполне неплохо)
тут стоит отметить, что только на прошлой неделе была новость про робот от китайских разработчиков, который, правда, пока только танцевать умеет, зато и стоит меньше полутора тысяч долларов; ну и не будем забывать про Илона, нашего, Маска, который через год обещает сделать таки механического шахматиста, в смысле - гуманоидного робота с ИИ; ждем массовой роботизации в ближайшие годы, так или иначе
@valuableai
важно отметить, что тут честно заявили, что робот дистанционно управляется человеком; в этот раз прямо заявили, что этот шахматист - не механический
тут стоит отметить, что только на прошлой неделе была новость про робот от китайских разработчиков, который, правда, пока только танцевать умеет, зато и стоит меньше полутора тысяч долларов; ну и не будем забывать про Илона, нашего, Маска, который через год обещает сделать таки механического шахматиста, в смысле - гуманоидного робота с ИИ; ждем массовой роботизации в ближайшие годы, так или иначе
@valuableai
👍3🔥3🤔2
шутки про вайб-кодеров никогда не надоедают, всех с рабочей субботой!
утащил из дружеского чата
@valuableai
@valuableai
😁10👍2
что-то набралось новостей про беспилотный транспорт в Москве, решил сделать подборку:
в Москве запустили первый беспилотный трамвай с пассажирами, обещают за 5 лет 2/3 трамваев сделать беспилотными
в Москве же уже больше года по МЦК ездит беспилотная Ласточка, правда, пока в кабине есть машинист для страховки, в будущем году обещают пустить уже без машиниста
к запуску беспилотного поезда метро еще готовятся, хотят первые поезда пустить до конца года
беспилотные автобусы пока только в планах на 2027 год
про беспилотное такси новостей не было, но учитывая новый закон, думаю, что также могут появиться в 2027 году
@valuableai
в Москве запустили первый беспилотный трамвай с пассажирами, обещают за 5 лет 2/3 трамваев сделать беспилотными
в Москве же уже больше года по МЦК ездит беспилотная Ласточка, правда, пока в кабине есть машинист для страховки, в будущем году обещают пустить уже без машиниста
к запуску беспилотного поезда метро еще готовятся, хотят первые поезда пустить до конца года
беспилотные автобусы пока только в планах на 2027 год
про беспилотное такси новостей не было, но учитывая новый закон, думаю, что также могут появиться в 2027 году
@valuableai
🔥12❤3👏3🎉3👍1
недавно обсуждали статистические закономерности в пении птиц, а тут подъехало подтверждение статистичности человеческой речи
коллеги из Еврейского университета Иерусалима провели масштабный анализ записей речи на 48 языках из 27 языковых семей; они смогли выделить характерные для всех языков интонационные единицы, длиной 1.6-1.7 секунды; первая картинка показывает усредненную картинку, а вторая и третья - в разбивке по каждому языку; данные, кстати, тоже доступны
P.S. интересно, что у коллег на всех картинках (и в таблице) русский язык идет на первом месте
@valuableai
коллеги из Еврейского университета Иерусалима провели масштабный анализ записей речи на 48 языках из 27 языковых семей; они смогли выделить характерные для всех языков интонационные единицы, длиной 1.6-1.7 секунды; первая картинка показывает усредненную картинку, а вторая и третья - в разбивке по каждому языку; данные, кстати, тоже доступны
P.S. интересно, что у коллег на всех картинках (и в таблице) русский язык идет на первом месте
@valuableai
❤7🔥3👍2😘1
за последнее время попалось две новости про "креативность" языковых моделей; я лично не ожидаю креативности от нейросетей, на мой взгляд - это что-то вроде калейдоскопа (как на первой картинке, там психоделия, я предупредил ) - т.е. узоры получаются в бесконечной вариации, но из заранее заданных кусочков
но тем не менее группа под руководством того самого Мэннинга предложила т.н. Verbalized Sampling; это их способ повышения креативности сети, для этого нужен вот такой промт:
на втором видео пример использования
а еще недавно один гражданин из Google провел расследование, почему LLM-ки все время предлагают одни и те же имена героев, если их попросить написать фантастический рассказ; оказалось, ноги растут из единственного датасета на Kaggle; интересно, как это стыкуется с первой новостью?
@valuableai
но тем не менее группа под руководством того самого Мэннинга предложила т.н. Verbalized Sampling; это их способ повышения креативности сети, для этого нужен вот такой промт:
<instruction>
Generate 5 responses to the user query, each within a separate <response> tag. Each <response> must include a <text> and a numeric <probability>.
Randomly sample the responses from the full distribution.
</instruction>
на втором видео пример использования
а еще недавно один гражданин из Google провел расследование, почему LLM-ки все время предлагают одни и те же имена героев, если их попросить написать фантастический рассказ; оказалось, ноги растут из единственного датасета на Kaggle; интересно, как это стыкуется с первой новостью?
@valuableai
👍12🤔3
произошла интересная история: один математик вел сайт с задачами Эрдеша и их решениями; исследователи из OpenAI взяли эти задачи и решили некоторые из них; причем часть решенных задач не имели решений
проблема была только в том, что эти задачи не имели известных этому математику решений, а GPT-5 эти решения видела в обучающем датасете и просто их воспроизвела; в этой связи хочется спросить, может быть, Теренс Тао был не так уж и неправ? к тому же тест Гёделя уже существует, посмотрим, когда и с помощью чего получится его пройти
@valuableai
проблема была только в том, что эти задачи не имели известных этому математику решений, а GPT-5 эти решения видела в обучающем датасете и просто их воспроизвела; в этой связи хочется спросить, может быть, Теренс Тао был не так уж и неправ? к тому же тест Гёделя уже существует, посмотрим, когда и с помощью чего получится его пройти
@valuableai
👍5❤1
Google опубликовали отчет, суть которого сводится в расхожему мнению: немного хороших данных для обучения LLM лучше, чем много низкого качества; собственно, обучение, например, LoRA основано на этом же предположении
в отчете они немного говорят о методологии - т.е. берут LLM и прямо спрашивают, хороший ли это кусок данных или нет; потом делают кластеризацию и из тех кластеров, где данные с разными метками, выбирают сэмплы для ручной разметки; опять же ничего нового, обычный active learning (в один шаг), но если вдруг кто не знал, пользуйтесь
@valuableai
в отчете они немного говорят о методологии - т.е. берут LLM и прямо спрашивают, хороший ли это кусок данных или нет; потом делают кластеризацию и из тех кластеров, где данные с разными метками, выбирают сэмплы для ручной разметки; опять же ничего нового, обычный active learning (в один шаг), но если вдруг кто не знал, пользуйтесь
@valuableai
🔥13👍4
выбор лучшей статьи на EMNLP вызвал бурную дискуссию в локальном чатике, интересно, что думает сообщество канала?
я считаю, что премия дана за то, что сделана открытая реализация алгоритма, аналогичного тем, которые в проде используют Яндекс, Google и прочие "большие" поисковики
за фото спасибо Александру Панченко
@valuableai
я считаю, что премия дана за то, что сделана открытая реализация алгоритма, аналогичного тем, которые в проде используют Яндекс, Google и прочие "большие" поисковики
@valuableai
👍12
всем привет, новый выпуск капитанского мостика, в этот раз мы как обычно с Димой Колодезевым
ИИ-саммари:
В этом подкасте Валентин Малых и Дмитрий Колодезев обсуждают новости из мира технологий, в частности, события на конференции EMNLP в Китае. Они анализируют тренды в производстве, влияние ИИ на различные сегменты рынка и необходимость прокладывания новых маршрутов для связи. Также рассматриваются новые технологии, такие как термодинамическое железо, и их потенциал в снижении потребления энергии. В этом разговоре обсуждаются проблемы энергопотребления дата-центров, будущее термодинамических вычислений, применение вероятностного программирования, эффективность централизованного планирования, сравнение потребления энергии мозгом и компьютерами, развитие робототехники, будущее передачи энергии и слияние технологий Google и Apple.
ссылки:
ODS VK Video
ODS YouTube
мой дзен
@valuableai
ИИ-саммари:
В этом подкасте Валентин Малых и Дмитрий Колодезев обсуждают новости из мира технологий, в частности, события на конференции EMNLP в Китае. Они анализируют тренды в производстве, влияние ИИ на различные сегменты рынка и необходимость прокладывания новых маршрутов для связи. Также рассматриваются новые технологии, такие как термодинамическое железо, и их потенциал в снижении потребления энергии. В этом разговоре обсуждаются проблемы энергопотребления дата-центров, будущее термодинамических вычислений, применение вероятностного программирования, эффективность централизованного планирования, сравнение потребления энергии мозгом и компьютерами, развитие робототехники, будущее передачи энергии и слияние технологий Google и Apple.
ссылки:
ODS VK Video
ODS YouTube
мой дзен
@valuableai
🔥12👍3
недавно говорили про ценности, вот теперь работа про то, как LLM может следовать каким-то культурным нормам
на первой картинке кратко поясняется, что такое таароф - форма вежливости в Иране; на второй показывается, что модели по умолчанию не умеют следовать правилам вежливости, принятым в иранском обществе
зимой обсуждали аналогичное про DeepSeek, который игнорирует табу американского общества; резюмируя, можно ожидать, что модели все равно будут затачиваться под ценности конкретного общества, а не быть исключительно в контексте западных ценностей
P.S. вот пример от человека, который не связан с этим нашим эйай
P.P.S. за наводку на статью спасибо Ане Дружкиной
@valuableai
на первой картинке кратко поясняется, что такое таароф - форма вежливости в Иране; на второй показывается, что модели по умолчанию не умеют следовать правилам вежливости, принятым в иранском обществе
зимой обсуждали аналогичное про DeepSeek, который игнорирует табу американского общества; резюмируя, можно ожидать, что модели все равно будут затачиваться под ценности конкретного общества, а не быть исключительно в контексте западных ценностей
P.S. вот пример от человека, который не связан с этим нашим эйай
@valuableai
🙏3💯2👍1😁1
всем привет, мы открыли подачу заявок на Премию имени Владимира Иосифовича Левенштейна за 2026 год; премия вручается за вклад в развитие русскоязычного NLP-сообщества, как научный, так и в виде open source; если знаете, кому это релевантно, - перешлите или заполните форму за него
ссылка на подачу заявок, заявки принимаются до 31 декабря
на фотографии - Наталья Валентиновна Лукашевич, первый лауреат премии,и я
@valuableai
ссылка на подачу заявок, заявки принимаются до 31 декабря
на фотографии - Наталья Валентиновна Лукашевич, первый лауреат премии,
@valuableai
🔥31👍4🎉2❤1
я летом то ли пропустил, то ли не придал значения новости про инноваторов из Builder.ai; они сделали стартап по автоматическому написанию кода, но за ИИ код писали 700 инженеров из Индии; кстати, эти люди шли проторенной самим Amazon дорогой, там 1000 асессоров из Индии распознавали продукты в супермаркете
кстати, после случая с Amazon появился неполиткорректный мем "AI = Artificial Indian" (осуждаем, конечно)
@valuableai
@valuableai
😁18🔥6❤2
This media is not supported in your browser
VIEW IN TELEGRAM
недавно обсуждали робота-агитатора, который должен заменить мигрантов, а тут подоспела новость - в московских школах стали появляться роботы-уборщики, слава богу, не такие, как в США
честно признаюсь, новость решил запостить только после того, как увидел заглавное видео
@valuableai
@valuableai
😁4🔥3👍1
меня тут попросили сделать пост-визитку для канала, чтобы людям было удобно, раз просили - делаем
мой канал посвящен ИИ, я основном разбираю текущие новости, показывая их взаимосвязи, но иногда и статьи, которые меня заинтересовали
есть постоянная рубрика "два мира - два Шапиро" про сравнение подходов к ИИ в разных странах
еще мы совместно с Дмитрием Колодезевым по воскресеньям выпускаем подкаст "Капитанский мостик", где обсуждаем новости из мира ИИ голосом (размещаем в ВК, на ютубе и подкастных площадках)
в общем, подписывайтесь, будет интересно!
@valuableai
мой канал посвящен ИИ, я основном разбираю текущие новости, показывая их взаимосвязи, но иногда и статьи, которые меня заинтересовали
есть постоянная рубрика "два мира - два Шапиро" про сравнение подходов к ИИ в разных странах
еще мы совместно с Дмитрием Колодезевым по воскресеньям выпускаем подкаст "Капитанский мостик", где обсуждаем новости из мира ИИ голосом (размещаем в ВК, на ютубе и подкастных площадках)
в общем, подписывайтесь, будет интересно!
@valuableai
👍26🔥10