整数智能信息技术(杭州)有限责任公司

其他企业 信息传输、软件和信息技术服务业 50-200人 浙江省杭州市萧山区

招聘信息

  • 爬虫工程师

    面议 浙江省杭州市萧山区 全职 不限 2人 2025-07-31

    收藏

    2024-09-30 09:26:05

    职位描述

    【你需要参与】

    • 负责设计和开发网络爬虫系统,进行多平台的信息抓取和分析
    • 根据网页特性设计独特的爬虫策略和防屏蔽规则,不断优化提升数据抓取的效率和质量
    • 完成并管理数据的清洗、结构化、入库、统计分析等全流程
    • 具有分布式爬取经验,能够保证项目的正常运行,实时解决出现的问题,确保项目的平稳、高质量运行

    【我们对你的要求】

    • 精通至少一个爬虫框架(如Scrapy)或有相关实现,熟悉多线程,分布式爬虫的设计和实现,能处理大规模数据获取和处理的技术挑战
    • 熟练掌握基于正则表达式、XPath、CSS等网页信息抽取技术
    • 熟悉了解HTML、CSS、JavaScript,熟练掌握JS逆向、断点调试、HOOK等技能
    • 熟悉常见的反爬机制,验证码识别
    • 掌握熟练至少一种SQL语言,了解数据库优化策略,设计过千万级的表结构为加分项

    职位类别:计算机软、硬件/互联网/IT

    专业要求:理学,工学,理学

单位简介

  • 整数智能成立于西子湖畔,愿景是「成为AI企业的数据专家」,为人工智能领域的企业及科研院所提供一站式的数据服务,包含数据标注管理平台部署(本地部署/混合云部署/SaaS)、数据采集、数据标注等
  • 公司自研的数据标注管理平台,申请知识产权数十项,涵盖数据采集、数据标注、流程管理、众包管理、AI辅助标注等多项功能,可以完成对图像、文本、音频、视频、3D点云数据的高效处理,服务领域包括无人驾驶、安防、医疗、金融保险、智慧城市、智能客服、智慧工厂等多种场景
  • 整数科技已经服务了包括腾讯、百度、阿里、科大讯飞、美团、字节跳动等TOP科技企业,以及包括清华大学、北京大学、浙江大学、香港中文大学、之江实验室、Stanford、UIUC等国内外顶级的AI科研机构,总计服务客户超150家,未来2年,我们将服务1000+以上的泛AI领域的企业与高校科研机构
  • 整数科技是AIIA中国人工智能产业发展联盟、AIITA浙江省人工智能技术产业技术联盟成员,负责参与多项人工智能领域的标准与白皮书制定。公司也曾受CCTV中央电视台财经频道、浙江卫视、苏州卫视等媒体报道

联系方式

  • 联系人:俞佳吉
  • 联系电话:
  • 电子邮箱:yjj@molardata.com
  • 传真:

公司地址

  • 地址:浙江省杭州市萧山区
  • 邮编:

请稍候...