市大数据公司成功部署DeepSeek大模型,为城市赋能添翼
2月13日凌晨,市大数据公司传来喜讯,成功完成DeepSeek系列大模型的本地化全流程部署与调试,成为我市首个实现七百亿参数大模型(DeepSeek-R1-70B)自主化落地的单位。这一成果的取得,离不开市数管局、市国资委的大力支持协调,是公司研发攻坚小组连续辛勤付出的结果,展示了国有企业的技术力量和攻坚克难的战斗力。
在项目启动之初,市政府主要领导亲自部署,公司充分发挥技术、人才和团队优势,组建了一支具备分布式训练框架、模型压缩及推理优化等领域专业知识和实践经验的十余人攻坚小组,迅速响应,加快大模型的本地化部署,积极探索deepseek+场景。
去年12月DeepSeek-V3开源模型发布后,公司精心谋划,安排研发团队基于Transformer-XL架构,完成了R1-7B轻量级模型的本地化适配工作。节后首日,又成功实现了低延迟推理验证。为突破算力瓶颈,在市数管局的协调支持下,团队采用Ollama框架与Open WebUI构建混合架构,并通过INT4量化技术,将R1-70B模型参数压缩至4-bit精度。在此基础上,团队在保障模型性能97%以上的基础上,显著降低了显存占用(降低60%),并将单卡推理效率提升了3倍。经过3个昼夜的连续奋战,该模型于2月13日凌晨5点正式上线。
上线后,攻坚小组基于混合精度训练(AMP)技术,于2月16日发布了FP16半精度版本的R1-70B模型。结合动态梯度裁剪与自适应学习率策略,该模型在政务知识问答基准测试中的表现显著提升:准确率(Accuracy)达到92.7%,精确率(Precision)突破89.5%,较初始版本提升了15个百分点。
目前,该模型已率先应用于政务服务领域,依托市数管局政务服务“云窗口2.0”,实现政策咨询、企业服务等场景的秒级响应,为企业和群众提供更加便捷、精准、高效的服务。
下一步,公司将在相关主管部门安排下,以DeepSeek系列模型适配上线为契机,持续推动DeepSeek全系列模型在就业创业、智能制造、医疗健康、社会治理等领域的广泛应用,协助开展DeepSeek大模型应用培训和技术推广,让各部门深入了解大模型的功能和应用场景,掌握利用大模型提升工作效率和服务质量,为全市产业转型升级和城市治理能力提升提供高效、安全的技术支撑,推动全市经济社会高质量发展。