整数智能信息技术(杭州)有限责任公司

其他企业 信息传输、软件和信息技术服务业 50-200人 浙江省杭州市萧山区

招聘信息

  • 爬虫工程师

    面议 浙江省杭州市萧山区 全职 本科及以上 2人 2025-11-30

    收藏

    2025-10-11 10:05:38

    职位描述

    【岗位描述】

    • 负责设计和开发网络爬虫系统,进行多平台的信息抓取和分析

    • 根据网页特性设计独特的爬虫策略和防屏蔽规则,不断优化提升数据抓取的效率和质量

    • 完成并管理数据的清洗、结构化、入库、统计分析等全流程

    • 具有分布式爬取经验,能够保证项目的正常运行,实时解决出现的问题,确保项目的平稳、高质量运行


    【任职要求】

    • 精通至少一个爬虫框架(如Scrapy)或有相关实现,熟悉多线程,分布式爬虫的设计和实现,能处理大规模数据获取和处理的技术挑战

    • 熟练掌握基于正则表达式、XPath、CSS等网页信息抽取技术

    • 熟悉了解HTML、CSS、JavaScript,熟练掌握JS逆向、断点调试、HOOK等技能

    • 熟悉常见的反爬机制,验证码识别

    • 掌握熟练至少一种SQL语言,了解数据库优化策略,设计过千万级的表结构为加分项

    职位类别:计算机软、硬件/互联网/IT

    专业要求:不限

单位简介

  • 整数智能成立于西子湖畔,愿景是「成为AI企业的数据专家」,为人工智能领域的企业及科研院所提供一站式的数据服务,包含数据标注管理平台部署(本地部署/混合云部署/SaaS)、数据采集、数据标注等
  • 公司自研的数据标注管理平台,申请知识产权数十项,涵盖数据采集、数据标注、流程管理、众包管理、AI辅助标注等多项功能,可以完成对图像、文本、音频、视频、3D点云数据的高效处理,服务领域包括无人驾驶、安防、医疗、金融保险、智慧城市、智能客服、智慧工厂等多种场景
  • 整数科技已经服务了包括腾讯、百度、阿里、科大讯飞、美团、字节跳动等TOP科技企业,以及包括清华大学、北京大学、浙江大学、香港中文大学、之江实验室、Stanford、UIUC等国内外顶级的AI科研机构,总计服务客户超150家,未来2年,我们将服务1000+以上的泛AI领域的企业与高校科研机构
  • 整数科技是AIIA中国人工智能产业发展联盟、AIITA浙江省人工智能技术产业技术联盟成员,负责参与多项人工智能领域的标准与白皮书制定。公司也曾受CCTV中央电视台财经频道、浙江卫视、苏州卫视等媒体报道

请稍候...