招聘人数:1-3人
到岗时间:不限
年龄要求:不限
性别要求:不限
婚况要求:不限
岗位职责:1、负责整个主题爬虫系统架构和数据存储设计,应对各种互联网爬虫规则;2、把握网络爬虫的核心技术研究方向,例如信息抽取、数据聚类、重组、搜索;3、分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进;4、负责爬虫调度的日常维护,以及采集数据的质量监控。 任职要求:1、掌握Python、Shell等脚本语言,有1年以上Python开发经验;2、熟悉搜索引擎的工作原理,熟悉Lucene、Nutch、Heritrix、larbin、HtmlParse、Scrapy等开源工具;3、有网页爬虫、分布式、多线程开发技术;4、有很强的分析和解决问题的能力;5、强烈的责任心和良好的团队合作能力;
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。