近期,国产开源大模型DeepSeek火爆问世。凭借强大的推理能力以及创新的训练流程,DeepSeek迅速从众多大模型中脱颖而出,取得广泛应用。但随着用户激增,海量的线上请求导致用户在实际应用DeepSeek时存在服务响应慢等现象。而采用本地化方案部署DeepSeek,不仅庞大的模型参数对用户IT设施的显存、内存提出了极高的要求,同时模型配置及代码编写还存在较高的技术门槛。因此,基于云服务一站式部署DeepSeek等大模型成为用户数智化转型的有效手段。
作为中国移动“算龙头”,移动云近年来致力于加快计算底座、平台能力及产品应用的智能化重构,以充分释放AI在技术能力、经济效益上的规模效应。面向AI大模型研发、部署、应用全流程,移动云打造出包括算力、数据、模型、工具等能力在内的一站式智算服务平台——大云震泽智算平台。而在DeepSeek上线后,移动云快速完成全面接入,并针对DeepSeek-R1模型打造了定制算力方案,旨在以全面、强大的智算服务,满足用户部署、应用DeepSeek时的多样化需求。
澎湃算力,为大模型训推提速增质
大模型通常由深度神经网络构建而成,结构复杂并拥有千亿、万亿参数,因此需要海量智算算力对其进行训推。目前,移动云不仅能够提供高达28.6EFlops的智算算力,还以自研加速套件全面提速了智算中心算效,因此能够为用户提供卓越的算力资源服务。而在DeepSeek等通用大模型陆续落地应用之际,移动云为满足用户部署、应用、推理等实际需求,通过深度集成融合DeepSeek等大模型,对智算平台进行了全面升级。
性能方面,移动云通过全面集成国产主流智算芯片,使智算平台能够根据用户需求匹配最佳算力方案,同时凭借AI原生存储产品,该平台能够以百GB/s级吞吐能力支持千亿参数模型秒级加载,助力用户“全速”开启实时推理。成本方面,移动云通过专家平行、预测解码、MLA数据并行等先进技术自研了震泽推理引擎,全面提升了智算平台推理效能,并对国产芯片在DeepSeek-R1上的推理成本进行深度优化,成本压降超13%。基于此,移动云能够以高性价比算力与开发环境为用户大模型训推提速增质。
丰富工具,打通应用落地全环节
随着技术的迭代、发展,大模型以其高度智能化的内容生成、数据分析、智能决策等能力取得广泛应用,用户对各类AI应用的使用需求也不断提升,但传统行业用户在模型部署、应用开发、功能优化等方面存在严重的技术“瓶颈”。为此,移动云以智算平台提供了数据处理、模型开发、模型训练、模型推理等一站式服务,助力用户打通AI应用落地的全环节。同时,移动云还通过深度融合,对DeepSeek进行精细微调并保持迭代跟进,因此移动云智算平台还具备卓越的DeepSeek深度优化与服务能力。
目前,移动云智算平台已接入包括DeepSeek在内的多款通用大模型,用户可直接调用并在线体验,或通过平台提供的智能体编排工具进行智能体开发,同时用户还可将DeepSeek部署至智算平台进行推理使用或对部分蒸馏模型进行微调。此外,通过复现DeepSeek-R1模型推理能力,智算平台中的代码大模型服务还具备深度思考与逻辑分析能力,能够通过自然语言理解能力自动化完成代码编写、项目测试等工作,大幅降低用户AI应用开发难度,加速AI应用落地进程。
多元化部署,深度对接实际业务场景
当前,政务、金融、教育、医疗等行业与领域对大模型服务的使用需求日趋提升,数字政务、智慧教育、科技研发、医疗影像等各类业务场景对IT基础设施的部署方式也提出了多元化要求。而移动云智算平台能够以公有云、私有云、专属云、边缘云等多种交付方式深度对接用户实际业务场景。以移动云智算一体机服务为例,该服务采用本地化部署,能够以私有化AI平台为用户提供独享的计算、存储、网络资源以及DeepSeek等大模型、智能体及丰富工具,因此能够充分满足用户AI应用部署、推理以及数据不出场、安全合规等多重需求。
此前,为助力国内某985高校打造“AI+教育”创新实践,移动云一方面以智算一体机为该高校实现了DeepSeek私有化部署,在确保校内数据安全的同时为该校教学、学习提供了有力支持。另一方面,移动云针对该校科研需求,以公有云+配套服务助力其搭建了私有大模型训推环境,为该校科研提供了灵活、高效的算力支持。
在DeepSeek加速推动大模型商业化、普惠化发展之际,千行百业对智算算力及模型服务的需求也不断提升。而移动云也将深化自身“连接+算力+能力”服务体系,不断完善、升级智算平台服务,从而为用户提供更加高效、精准的AI解决方案。