到岗时间:不限
年龄要求:不限
性别要求:不限
婚况要求:不限
1.负责开发网络/App爬虫系统,完成数据采集与爬取、解析处理、入库等数据日常工作;2.解决常见反爬虫问题3.进行业务相关网页的协议分析与模拟
技能要求:1.熟练掌握一种或多种开源爬虫框架,如scrapy2.至少熟练掌握java/python/js/go其中一种或多种3.精通网页抓取原理及技术,对HTTP协议及HTML有深入的了解。熟悉基于Cookie或JWT的网站登录原理,熟悉基于正则表达式、XPath、CSS等网页信息4.善于独立分析并解决核心问题,如爬虫策略、防屏蔽规则、数据破解策略、App爬取、死链检测、验证码识别技术等5.能独立搭建爬虫框架优先考虑6.有丰富反爬经验优先考虑7.有破解js版本验证码经验者优先考虑8.有自然语言处理,机器学习背景者优先考虑
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。