Как мы учили нейросеть разбираться в сложных документах: задача семантического поиска
Привет! Меня зовут Павел Яковлев, я инженер по разработке ПО искусственного интеллекта в YADRO. В команде GenAI мы занимаемся умными продуктами на основе корпоративных баз данных.
В проектах мы часто используем современные генеративные модели и энкодеры. В статье расскажу, как мы в компании разрабатываем и оптимизируем семантический поиск по сложным документам: PDF, HTML и DOCX.
Читать далее
#search #семантический_поиск #нейросети #информационный_поиск #эмбеддинги #cross_encoder #bi_encoder #генеративные_модели #энкодеры | @habr_ai
Привет! Меня зовут Павел Яковлев, я инженер по разработке ПО искусственного интеллекта в YADRO. В команде GenAI мы занимаемся умными продуктами на основе корпоративных баз данных.
В проектах мы часто используем современные генеративные модели и энкодеры. В статье расскажу, как мы в компании разрабатываем и оптимизируем семантический поиск по сложным документам: PDF, HTML и DOCX.
Читать далее
#search #семантический_поиск #нейросети #информационный_поиск #эмбеддинги #cross_encoder #bi_encoder #генеративные_модели #энкодеры | @habr_ai
Хабр
Как мы учили нейросеть разбираться в сложных документах: задача семантического поиска
Привет! Меня зовут Павел Яковлев, я инженер по разработке ПО искусственного интеллекта в YADRO . В команде GenAI мы занимаемся умными продуктами на основе корпоративных баз данных. В проектах мы часто...