数据采集架构师(北京, 初创公司)

Job Description: (This job is in Beijing at a fast growing China start-up)

职位描述:

• 职称:数据采集架构师
• 产业:大数据挖掘服务(娱乐产业)
• 地点:北京
• 公司:国内领先的娱乐大数据服务提供商,核心团队来自于顶级学府,技术团队精干,公司前景甚佳

工作职责:

• 负责数据采集整体技术架构设计,抓取大规模文本(新闻,博客,论坛,微博等)、图像、视频数据

• 提高网页抓取的效率和质量,进一步解决系统的网页排重、垃圾控制、资源划分等问题

• 参与爬虫核心算法和策略优化研究,熟悉采集系统的调度策略及演进方式,保证数据采集的及时性,全面性,不断提高爬虫智能性

• 负责网页信息抽取等核心算法的研究和优化


职位要求:

• 计算机相关专业本科以上学历,精通数据结构和数据算法

• 对搜索引擎爬虫系统有深入研究和丰富的经验,有海量数据处理的丰富经验

• 2年以上大规模网页爬虫开发经验,熟悉JS,ajax,网页消重

• 熟悉浏览器内核者优先

• 有知名互联网公司工作经验者优先


Apply Now

[GARD]

Follow Us to Prepare for Your Next Career Move

Popular Posts on www.MichelleYouBiz.com

Staff Java Developer/Software Engineer (Backend) - Remote - US Jobs at a large tech company

Let's Connect and Grow Together - A New Step in Executive Search & Recruiting for Tech Companies

Android Developer/Programmer (J2EE/J2ME) - LA Area

Archive of Jobs by Labels (3/3) for Michelle You's Recruiting Business

Network Architect (Cisco routing, Switching, Checkpoint, firewalls, Security, Riverbed, H1B) in New York

Archived Old Jobs Posted by Michelle You International Headhunting Firm

All Labels on www.MichelleYouBiz.com Sorted Alphabetically

Show more