Salary
核心职责
- 数据基建:构建、开发和维护高效可拓展的训练数据管道,设计分布式数据存储与调度系统。
- 数据采集:开发高效数据采集工具,为预训练、微调和对齐阶段提供高质量数据支持。
- 数据质量管理:制定数据质量标准,实施数据验证和清洗流程,确保数据的准确性和完整性。
- 模型迭代支持:与研究、工程团队密切合作,开发合成数据工具,拓展数据规模与多样性。
任职要求
- 来自计算机科学、数据科学等相关领域,具备模型训练数据处理、增强经验。
- 熟练掌握Python/SQL,熟悉大数据处理框架。
- 熟悉大模型数据工作流程,如预训练语料构建、SFT/RLHF数据标注、评估数据集设计等。
- 有开源项目贡献和经历,积极参与技术社区者优先。
- 对实现前沿AI解决方案充满热情,具备自驱力与团队协作精神,能适应快节奏的挑战。
Application
Send your resume and transcript (Optional) to
hr@wizardquant.com with the subject line: Name + position applied for + year of graduation +your graduate school/major. You can also apply online below.