返回 职位详情 登录/注册
大数据开发
1.3-2.3万元/月
定位 上海徐汇区阿里巴巴徐汇滨江园
更新 2025-12-14 06:23:49 浏览 560
职位详情
数据开发 3-5年 Hive · 要求数据开发经验 · maxcompute · Kafka原理/源码 · 医疗 · 大数据引擎开发经验 · AI算法 · 实时数仓开发经验 · 数据平台开发经验 · Python
要有医疗行业经验
本科中级17K内,高级18-23(最好硕士)
学信网可查本科学历

岗位:高级大数据*1薪资18-23K

1、负责结构化与非结构化数据库的搭建与日常维护;
2、开展数据清洗、特征工程及数据质量管控工作;
3、整合来自化合物、生物活性、ADMET等多渠道数据资源;
4、协同AI算法团队完成高质量数据交付,并参与代码版本管理与维护;
5、参与制定数据管理标准及信息安全规范。

职位要求
1、计算机、信息科学或生物信息学等相关专业本科及以上学历;
2、精通Python、SQL、Pandas,掌握MapReduce或Spark,具备常见大数据任务开发能力;
3、五年以上大数据开发经验,能独立承担中小型项目的数据流程设计、编码实现与测试,熟悉数据预处理全流程,为AI算法团队提供高质量数据支持并维护相关代码;
4、熟悉常用数据工具(如Kafka),具备数据导入导出实施能力;
5、有科研数据标注经历者优先,熟悉化学或药物领域数据库(如ChEMBL、PubChem)者优先;
6、具备与AI算法项目协作的数据pipeline开发与交付经验者优先;
7、思维条理清晰,学习能力强,具有良好的团队合作意识。

中级大数据*1薪资14-17K

职位描述
1、参与结构化与非结构化数据库的建设与运维;
2、执行数据清洗、特征提取及质量核查;
3、汇总整理化合物、生物活性、ADMET等多源类型数据;
4、协助AI算法团队完成数据准备工作及版本控制;
5、参与数据标准与安全管理制度的建立。

职位要求
1、计算机、信息科学或相关专业本科及以上学历;
2、熟练使用Python、SQL、Pandas,了解Spark或类似框架;
3、三年以上大数据开发经验,具备独立完成数据处理流程设计、编码与测试的能力,能为算法团队提供稳定数据支持;
4、掌握常用数据处理工具(如Kafka),可完成数据接入与输出操作;
5、有科研数据标注经验者优先,了解化学或药学相关数据库(如ChEMBL、PubChem)者优先;
6、有与AI算法团队协作进行数据流程开发和交付经验者优先;
7、逻辑清晰,具备较强的学习能力和团队协作精神。
公司信息
北京汉克时代科技有限公司
明细
忠县人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!