招聘人数:1-3人
到岗时间:不限
年龄要求:不限
性别要求:不限
婚况要求:不限
职位职责: 负责内容相关的数据抓取和清洗工作; 推进抓取架构的完善,不断提升系统的准确性、实时性; 配合后端完成运营平台的相关开发。 负责记录的定向爬取、深度提取和挖掘。设计爬虫策略和防屏蔽规则提升抓取效率和质量;职位要求: 有python研发经验,2年以上数据抓取工作经验;熟悉linux开发环境;有扎实的算法和数据结构能力; 熟悉爬虫原理,熟悉常见的反爬虫技术,有爬虫相关项目开发经验者优先; 掌握http协议,熟悉html、dom、xpath等常见的数据抽取技术; 精通任意一种开源爬虫框架,比如scrapy、nutch等等,有开发爬虫框架经验优先;熟悉验证码识别技术者优先;有大规模数据处理、数据挖掘、信息提取等经验者优先;承担较大的工作压力,具有良好的沟通和团队协作能力;有一定的数据基础,工作条理清楚,善于学习。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。