[上海] 医药独角兽迅猛上升中 欢迎 Python 搜索推荐大牛来投
职位描述:
负责 AI 项目数据处理以及搜索、推荐相关的工程实现;
任职要求:
1 、熟练使用 Python+ElasticSearch 进行搜索推荐工程开发,理解检索原理,一年以上相关工作经历;
2 、熟练使用 pandas 进行数据处理和分析;
3 、有数据 ETL 、网络接口开发和部署经验;
4 、熟练使用 linux 、docker 、git ;
加分项:
有 nlp 算法经验优先;
坐标 @ 上海,匹配的候选人请联系 微信 @ lechengxi , 备注:v2ex
#熟练 #数据处理 #搜索 #使用 #网络接口 #AI #Python #ElasticSearch #pandas #ETL
职位描述:
负责 AI 项目数据处理以及搜索、推荐相关的工程实现;
任职要求:
1 、熟练使用 Python+ElasticSearch 进行搜索推荐工程开发,理解检索原理,一年以上相关工作经历;
2 、熟练使用 pandas 进行数据处理和分析;
3 、有数据 ETL 、网络接口开发和部署经验;
4 、熟练使用 linux 、docker 、git ;
加分项:
有 nlp 算法经验优先;
坐标 @ 上海,匹配的候选人请联系 微信 @ lechengxi , 备注:v2ex
#熟练 #数据处理 #搜索 #使用 #网络接口 #AI #Python #ElasticSearch #pandas #ETL
遇到一个 graylog 日志收集问题,收不到其他服务器的日志,只能收到当前机器的服务日志
docker-compose 配置如下
mongo:
image: mongo:4.4.15
networks:
- graylog
elasticsearch:
image: docker.elastic.co/elasticsearch/elasticsearch-oss:7.10.2
environment:
- http.host=0.0.0.0
- transport.host=localhost
- network.host=0.0.0.0
- "ES_JAVA_OPTS=-Dlog4j2.formatMsgNoLookups=true -Xms512m -Xmx512m"
- GRAYLOG_ROOT_TIMEZONE=Asia/Shanghai
ulimits:
memlock:
soft: -1
hard: -1
deploy:
resources:
limits:
memory: 2g
networks:
- graylog
graylog:
image: graylog/graylog:4.2-jre11
# network_mode: "host"
# volumes:
# - /data/graylog:/usr/share/graylog/data/journal
environment:
- GRAYLOG_PASSWORD_SECRET=somepasswordpepper
- GRAYLOG_ROOT_PASSWORD_SHA2=8f39e5e09d40e5743f0898ca26ef28f2c9193916a86480b7c0ec27148c7bb8e3
- GRAYLOG_HTTP_EXTERNAL_URI=http://xxxx:9000/ # 这里注意要改 ip
- GRAYLOG_ROOT_TIMEZONE=Asia/Shanghai # 设置时区
entrypoint: /usr/bin/tini -- wait-for-it elasticsearch:9200 -- /docker-entrypoint.sh
networks:
- graylog
privileged: true
restart: always
depends_on:
- mongo
- elasticsearch
ports:
- 9000:9000
- 1514:1514
- 1514:1514/udp
- 12201:12201
- 12201:12201/udp
- 12203:12203/udp
volumes:
- "/etc/localtime:/etc/localtime"
#graylog #elasticsearch #GRAYLOG #host #0.0 #1514 #12201 #docker #mongo #image
docker-compose 配置如下
mongo:
image: mongo:4.4.15
networks:
- graylog
elasticsearch:
image: docker.elastic.co/elasticsearch/elasticsearch-oss:7.10.2
environment:
- http.host=0.0.0.0
- transport.host=localhost
- network.host=0.0.0.0
- "ES_JAVA_OPTS=-Dlog4j2.formatMsgNoLookups=true -Xms512m -Xmx512m"
- GRAYLOG_ROOT_TIMEZONE=Asia/Shanghai
ulimits:
memlock:
soft: -1
hard: -1
deploy:
resources:
limits:
memory: 2g
networks:
- graylog
graylog:
image: graylog/graylog:4.2-jre11
# network_mode: "host"
# volumes:
# - /data/graylog:/usr/share/graylog/data/journal
environment:
- GRAYLOG_PASSWORD_SECRET=somepasswordpepper
- GRAYLOG_ROOT_PASSWORD_SHA2=8f39e5e09d40e5743f0898ca26ef28f2c9193916a86480b7c0ec27148c7bb8e3
- GRAYLOG_HTTP_EXTERNAL_URI=http://xxxx:9000/ # 这里注意要改 ip
- GRAYLOG_ROOT_TIMEZONE=Asia/Shanghai # 设置时区
entrypoint: /usr/bin/tini -- wait-for-it elasticsearch:9200 -- /docker-entrypoint.sh
networks:
- graylog
privileged: true
restart: always
depends_on:
- mongo
- elasticsearch
ports:
- 9000:9000
- 1514:1514
- 1514:1514/udp
- 12201:12201
- 12201:12201/udp
- 12203:12203/udp
volumes:
- "/etc/localtime:/etc/localtime"
#graylog #elasticsearch #GRAYLOG #host #0.0 #1514 #12201 #docker #mongo #image
请教下后端搜索功能的“相关搜索”是怎么实现的
[]( https://imgse.com/i/xW5dnU)
基础的搜索功能可以用 elasticsearch 实现,但是像相关搜索的功能 elasticsearch 是不是没有,es 有类似的近义词词典,但还是差了点。或者是 neo4j 可以实现么?
#xW5dnU #jpg #https #com #elasticsearch #搜索 #近义词 #s1 #ax1x #2022
[]( https://imgse.com/i/xW5dnU)
基础的搜索功能可以用 elasticsearch 实现,但是像相关搜索的功能 elasticsearch 是不是没有,es 有类似的近义词词典,但还是差了点。或者是 neo4j 可以实现么?
#xW5dnU #jpg #https #com #elasticsearch #搜索 #近义词 #s1 #ax1x #2022
双十一了,大家推荐几本有深度的技术书籍呗
[elasticsearch]
不知道有没有写真正的线上搜索调优的,比如淘宝商品搜索。中文搜索场景下会遇到各种纠错、拼音、模糊、乱序,要保证各种 case 都能搜到,而且不误触,真的是太难了。另外,搜索中还需要结合用户画像做推荐。不知道有没有讲这种案例的书籍。
[golang]
想研究研究调度器、内存模型。线上死锁、协程泄露问题排查
还有 golang 高性能的网络编程
[other]
其他有深度的书籍也可以推荐,比如 java11 以后的一些 jvm 调优啊。。。
#调优 #golang #搜索 #书籍 #误触 #死锁 #有没有 #乱序 #elasticsearch #中文搜索
[elasticsearch]
不知道有没有写真正的线上搜索调优的,比如淘宝商品搜索。中文搜索场景下会遇到各种纠错、拼音、模糊、乱序,要保证各种 case 都能搜到,而且不误触,真的是太难了。另外,搜索中还需要结合用户画像做推荐。不知道有没有讲这种案例的书籍。
[golang]
想研究研究调度器、内存模型。线上死锁、协程泄露问题排查
还有 golang 高性能的网络编程
[other]
其他有深度的书籍也可以推荐,比如 java11 以后的一些 jvm 调优啊。。。
#调优 #golang #搜索 #书籍 #误触 #死锁 #有没有 #乱序 #elasticsearch #中文搜索
100G 8000 万条信息全文检索, Elasticsearch 是最优选择吗?
数据存 MongoDB ,Elasticsearch 只存索引结果=最优选择
还是数据做双写

#MongoDB #Elasticsearch #只存 #双写 #https #ldbbs #ldmnq #com #bbs #topic
数据存 MongoDB ,Elasticsearch 只存索引结果=最优选择
还是数据做双写

#MongoDB #Elasticsearch #只存 #双写 #https #ldbbs #ldmnq #com #bbs #topic