AI开发AI训练模型书生大模型
AI训练模型

书生大模型

missing
missing

书生通用大模型体系由上海人工智能实验室打造,专注通用与多模态大模型研发,已开源书生·浦语千亿语言大模型、书生·多模态200亿参数模型及书生·天际3D场景模型,配套训练框架、高效推理引擎、评测体系与海量中文数据集,面向科研与企业提供全链路开源社区,支持零门槛在线试用、云端微调、一键部署,推动大模型技术普惠。

主要功能

  • 模型仓库:提供浦语、多模态、天际三大系列模型权重与配置文件,支持Git直接下载。
  • 在线体验:浏览器即可对话、图像生成、3D场景重建,无需本地算力。
  • 训练框架:InternLM-Train 高效并行训练,支持千卡规模;内置数据清洗、混合精度、断点续训。
  • 推理加速:LMDeploy 引擎实现 3-5 倍速度提升,支持 INT4/8 量化、KV-Cache 复用。
  • 微调平台:OpenCompass 提供 LoRA、QLoRA、全参微调模板,一键提交云端任务。
  • 评测体系:覆盖 C-Eval、CMMLU、MMBench 等 50+ 中文基准,自动输出雷达图。
  • 数据资源:开源 1.2TB 高质量中文预训练语料、400 万图文对、百万级 3D 场景。
  • 社区协作:论坛、Issue、PR 全流程托管,定期举办训练营与黑客松,模型贡献者可获官方算力券。

应用场景

高校师生可在线体验大模型能力,快速完成课程作业与论文实验;中小企业借助云端微调,低成本打造专属客服、文案、质检模型;开发者下载框架与权重,本地部署离线推理,满足隐私合规;AR/VR 团队利用天际 3D 模型,加速元宇宙场景构建;政府与研究机构通过评测体系,横向对比模型效果,指导招标与科研方向。

优势特点

全链路开源:从数据、训练到评测完全公开,透明可信。中文原生:语料、基准、示例均以中文为核心,贴合本土需求。性能领先:多项中文权威榜第一,推理速度超越同级开源模型。易用低门槛:网页体验、Colab 教程、一键脚本,新手十分钟上手。社区活跃:官方周更技术直播,贡献者名单上链致谢,算力激励持续加码。