到岗时间:不限
年龄要求:不限
性别要求:不限
婚况要求:不限
岗位职责:1、负责设计和开发分布式的网络爬虫应用,进行互联网相关信息的抓取和分析,参与架构设计和系统规划;2、负责互联网资源的特征挖掘和爬虫核心算法的策略优化,主要对网页特征、站点结构、资源变化趋势等进行数据分析和特征建模,提升抓取效率和质量;3、反爬策略的设计及优化、爬虫系统研发过程跟进、代码review;4、团队相关业务系统的java研发相关工作;岗位任职条件:1. 精通java,2年 以上java爬虫项目经验,熟悉常用爬虫框架任一种,如Scrapy、Tornado、Django、Flask、JSpider框架;熟悉java web,spring mvc,mybatis框架,mysql,mongodb数据库;2.熟悉HTML/javascript/CSS/xpath/url/Ajax/xml等web技知识,熟悉HttpClient、jsoup、WebDriver、phantomjs等工具;3.熟悉linux系统,熟悉redis,nosql等,熟悉Internet基本协议(如TCP/IP. HTTP等)4.熟悉搜索引擎和个性化相关的机器学习算法相关技术,精通主流分词算法、分类、提取摘要、大规模网页聚类、索引、检索等5.有布式爬虫架构、数据分析、数据挖掘相关经验者优先;6.具有很强的分析和解决问题的能力,攻克难题的强烈兴趣,善于学习。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。