招聘人数:若干
到岗时间:不限
年龄要求:不限
性别要求:不限
婚况要求:不限
1.负责分布式网络爬虫系统的架构设计与开发(如抓取调度,多样化抓取,页面解析和结构化抽取,海量数据存储和读取等)2.负责爬虫核心算法的策略优化研究,提升爬虫抓取效率和质量(如调权调度、分析预测、质量判断、封禁与反封禁研究等)3.负责HTTP、AJAX等各类网络请求分析,探索和研究高效的数据抓取解决方案任职要求:1、本科及以上学历,良好的代码能力,扎实的数据结构和算法功底,有快速迭代、逐步优化的工程项目经验2、有良好逻辑思维能力、沟通能力、团队合作精神、学习能力,抗压能力,对挑战性问题充满激情3、熟悉linux和Java开发,熟悉shell/perl/python等脚本语言,熟练掌握正则表达式4、精通一种开源爬虫框架,如scrapy、webmagic、nutch、heritrix等,有开发爬虫框架经验优先;熟悉反爬虫、验证码识别技术者优先5、有多线程、网络数据处理经验优先(如HTTP协议,AJAX,爬虫开发,浏览器内核开发,Web服务开发等)6、有大规模分布式海量数据处理经验优先(如Hadoop/Hbase/Spark/Strom/Flink等)
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。