职位描述
核心目标: 研发前沿算法,为医疗文本(尤其病历)的深度理解与智能应用提供核心模型能力。
岗位职责:
1、核心算法研发与优化:负责电子病历相关的NLP算法研发,包括医学实体识别、关系抽取、文本分类(质控规则判定)、语义相似度计算等,持续提升模型在医疗专业场景下的准确率与鲁棒性。
2、大模型与知识增强技术:
l对通用大语言模型进行领域适配(Domain Adaptation)与高效微调(如LoRA, QLoRA),使其掌握医疗专业知识与病历书写规范。
l 深入研究与优化检索增强生成技术,负责RAG系统中核心算法组件的研发,包括但不限于:嵌入模型训练与优化,以提升医学概念的表征能力;检索排序算法优化,以提升病历段落检索的精准度;探索重排序、HyDE等技术在提升答案质量上的应用。
3、知识体系建设:结合规则与深度学习算法,从海量病历与非结构化文献中抽取知识,构建与迭代医疗知识图谱,并研究基于图谱的推理与问答技术。
4、全链路效果提升:从数据构造、模型训练、评估到上线,对算法效果全流程负责。设计科学的实验,分析模型误差,提出并实施有效的改进方案。
5、技术前瞻与赋能:跟踪NLP与医疗AI前沿技术,进行原型验证,撰写技术专利与论文,并为团队进行技术分享。
任职要求:
1、学历专业:计算机科学、人工智能、生物医学信息学等相关专业,硕士及以上学历优先。
2、技术基础:
l 扎实的机器学习/深度学习基础,精通NLP核心任务及Transformer系列模型原理。
l 熟练掌握Python及PyTorch/TensorFlow框架,有使用Hugging Face生态进行模型训练与微调的丰富经验。
l 深入理解RAG技术架构及其核心算法组件(检索器、嵌入模型、重排器),有实际项目优化经验者优先。
l 熟悉常用的数据挖掘和机器学习库。
3、经验与能力:
l 具备医疗NLP项目经验者优先,熟悉电子病历数据结构、医学术语体系及临床逻辑。
l 出色的逻辑思维和问题拆解能力,能从复杂的业务问题中抽象出核心算法挑战。
l 良好的团队协作和沟通能力,能清晰阐述算法方案与价值。
4、重大加分项:
l 在知识图谱构建、信息检索、大模型微调等任一方向有深入研究或项目成果。
l熟悉多模态模型或强化学习在NLP中的应用。