书生浦语全链路介绍

yuooo / 2024-11-26 / 原文


模型性能天梯图

  • 推理能力:综合推理能力领先社区开源模型
  • 支持100万字上下文(短期记忆):相较于gpt4o是100倍的量级
  • 自主规划和搜索完成复杂任务:通过信息搜索和整合,针对复杂问题撰写专业回答,效率提升60倍

核心技术思想在于:数据迭代反馈,仍然是数据质量驱动的模型性能,对于数据质量提升采取了两种方法:

  • 半格式化数据,相似度对齐
  • 人类满意的数据筛选、排序

全链路开源

开源数据处理工具箱

浦语开源了label-llm,能够对nlp任务的数据进行很方便的标注,label-U也支持视频标注

预训练框架

微调框架

支持市面上很多开源模型,任务类型包括多模态微调、对齐等等,支持QLora和Lora两种微调,全量参数微调也支持
微调评测:在训练过程中进行显存回收,不要再训练过程中占用显存

OpenCompass评测体系

评测体系完善、唯一Meta官方推荐
支持高质量评测集、支持能力分析、支持高效评测,全栈式评测工具

LMDeploy部署框架

支持更多国产大模型