招聘人数:若干
到岗时间:不限
年龄要求:不限
性别要求:不限
婚况要求:不限
1、 负责设计和开发网络爬虫应用,对指定的多个网站进行网页抓取、数据提取,包括调度、抓取、入库等内容;破解反爬策略;2、 对抓取数据进行去重、分类、垃圾过滤、信息抽取;3、网络爬虫架构设计、功能开发及优化。
【任职要求】:
1、计算机或相关专业本科以上学历,3年以上java实际项目爬虫开发经验;2、熟悉搜索引擎和网络爬虫相关技术,能独立实施完成网络爬虫应用;3、理解 HTTP 协议,熟悉 HTML、DOM、XPath,多线程底层原理。能处理多线程高并发; 4、有丰富的应对反爬虫的经验,例如合理使用IP 池、验证码识别技术等;5、熟悉网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、Jsoup、XPath、CSS等网页信息抽取技术;6、善于总结,积极主动学习新技术,热爱爬虫工作,直面困难敢于承担责任,有较强的沟通的能力和理解能力,有较强的抗压能力。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。