6月13日,GTIC 2023全球汽车芯片创新峰会将与上海国际低碳智慧出行展览会同期举办,首批演讲嘉宾已公布,欢迎报名。
GPU的应用是检验技术创新的试金石。
作者 | ZeR0
编辑 | 莫颖
新东西6月1日报道GPU赛道越来越热闹了,今天国内GPU市场又增添了一位新选手——全功能GPU独角兽公司摩尔线程针对游戏、视频场景设计的MTT S70显卡正式开售,售价2499元。
生成式AI大爆发之后,国内市场对于国产GPU产品的渴求也愈发强烈,而此时摩尔线程针对数字办公、娱乐创作、AI与云计算、元宇宙四大应用场景发布了19款GPU新品或技术更新,商业化进程已初见成效。
游戏与创作方面,摩尔纹推出全新MTT S70显卡,成为首家可支持DirectX 11游戏的国产GPU公司。基于DirectX 11社区版驱动,用户可以畅玩《原神》、《DOTA2》等3A级游戏。此外,摩尔纹还发布了首款基于国产GPU的智能终端产品“智娱魔方”,集游戏与生成式AI应用于一体。其GPU物理引擎AlphaCore也全新升级,开放测试下载。
针对国内数字办公,摩尔定律GPU新增OpenGL4.0、Vulkan1.3支持,DKMS技术可快速适配各类CPU+操作系统版本组合,并推出云桌面产品MT vGPU 2.1、MCCX VDI云桌面一体机。
在AI与云计算领域,Moore Threads启动MUSA社区开发者计划,发布完全兼容CUDA的MUSA Toolkit 1.0软件工具包及代码移植工具MUSIFY,并开源MT PyTorch,支持大模型推理和典型NLP语言模型的训练。
元宇宙方面,摩尔线程宣布升级MTVERSE元宇宙平台,可支持云端实时渲染;AIGC内容创作平台摩比马良内测上线;并在现场演示了升级版DIGITALME数字人解决方案能力。
在本次夏季发布会的线上直播中,摩尔线程还展示了“AIGC生成”能力,摩尔线程创始人兼首席执行官张建中的2D数字人替身全程出现。
▲摩尔线程创始人兼CEO张建中的2D数字人形象主持线上发布会
发布会结束后,张建中与新东西等媒体进行了深入交流,进一步解读了对新产品和技术升级的思考。谈及产品定位时,他表示不缺钱的发烧友一定会买4090这样的旗舰产品。而考虑到市场需求,摩尔线程会先从主流产品入手,在刚性应用场景下做到符合用户需求的性能和体验。提供更高性价比的更好解决方案,是摩尔线程的机会。“人工智能+3D图形+云原生+云算力,这是我们的目标。”张建中说。
01.
游戏:国内首家支持DX11
整个产品支持AI学习和应用开发
张建中介绍,自摩尔纹发布首款游戏显卡MTT S80以来,半年来其显卡Windows驱动已完成5次升级,支持游戏超过60款、支持主板超过50款、显示器超过30款,兼容性大幅提升;游戏性能平均提升50%左右,《英雄联盟》、《穿越火线》等主流网游在其游戏显卡上表现更为出色。
在此基础上,Moore's Threads发布了一款新的游戏显卡MTT S70,其配置相比S80略低一些,价格也比较便宜。
MTT S70搭载摩尔定律第二款全功能GPU芯片“春晓”,内含3584个MUSA计算核心,在1.6G主频下可提供11.2T FP32算力,配备7GB高速GDDR6显存,理论带宽392GB/s,最高支持4通道8K30帧超高清显示输出,并支持剑影、OBS等视频剪辑、直播软件实现硬件加速编解码。
值得一提的是,昨日发布的Windows驱动版本v221.31已经实现了对MTT S70游戏显卡的支持,即将于6月下旬发布的DirectX 11社区版驱动也将支持MTT S70、S80用户体验《原神》、《DOTA2》等3A级游戏。
Moore Thread是第一款支持DirectX 11游戏的国产GPU,张建中告诉核心事物,要支持DirectX 11,GPU架构首先要硬件级支持,而对主流游戏进行逐一适配则需要巨大的软件工作。
同时,Moore Threads在“Mocha Players”社区发起了“Alpha Action”,呼吁更多玩家使用DirectX 11社区版驱动并提供反馈,以加速驱动的迭代速度。
摩尔线程推出了一款开箱即用的整机产品——“智娱魔方”。“智娱魔方”搭载了MTT S80、MTT S70两款全功能GPU显卡,预装精选游戏中心和PES系统管理中心,不仅可以玩游戏,还支持生成式AI方面的学习和应用开发。摩尔线程还将开放Ubuntu驱动下载供用户使用。
Moore's Threads还升级了自研的下一代GPU多平台物理引擎AlphaCore。
基于该引擎开发的实时流体模拟工具Catalyst FX新版可以在不改变原有工作流程的情况下直接在Houdini中制作流体效果,相比原生PyroFX性能提升5-10倍;相比传统Houdini Vellume制作流程,基于摩尔定律GPU加速的柔性体模拟工具VeraFiber可将解决效率提升至之前的3-5倍。
AlphaCore还对DirectX 11的ComputeShader计算版本进行了深度优化,在流体力学模拟方面,Catalyst FX在MTT S80上的实际运行性能达到了市面主流高端显卡的两倍以上。
Catalyst FX 和 VeraFiber 已经完成了 Houdini 插件接口的开发,Houdini 插件 Beta 版将于 6 月 6 日开放下载。
值得一提的是,Catalyst FX Houdini插件目前已交付给国内知名电影后期特效制作公司MOREVFX。AlphaCore还与网易游戏投资的CG动画制作团队DOVFX进行联合开发,成功将VeraFiber运用到游戏CG作品中复杂角色的布料、头发模拟中。
02.
国内数字化办公:国内近百款应用加速发展
推出GPU云桌面一体机
在国内数字办公领域,摩尔纹希望提供广泛的兼容性和全新的解决方案,推动国产PC产品从“能用”走向“好用”。
摩尔线程目前已完成10余家ODM、18家OEM的产品导入,联合推出30余款PC机型,服务于电信、金融、能源等数字经济重点行业。张建中表示,流畅、速度更快、体验更好是本土化数字办公应用的主要诉求。
针对国产软件普遍关注的图形效果问题,摩尔线程GPU增加了对OpenGL4.0、Vulkan1.3全功能的支持,并通过了100%的接口兼容性测试,可实现更高效的图形渲染。借助Tessellation等全新图形特性,摩尔线程GPU还能为应用程序提供更加精细的几何纹理效果。
▲打开和关闭Tessellation的效果对比
由于国内办公生态发展迅速,各种CPU、操作系统版本的组合多达上百种,为保证用户在使用不同办公应用时能长期稳定运行,适配难度和复杂度极高。针对此,摩尔线程的驱动软件加入了DKMS技术支持,可快速适配不同操作系统的内核,提升开发效率数十倍。
摩尔线程近期已成功适配麒麟、统芯、openKylin、深度、宁思、中科方德、普华等国产操作系统,并率先完成与统芯及麒麟OS的全面兼容性认证,成为国内首家通过统芯UHQL质量认证的GPU公司。
通过持续的驱动优化,摩尔线程GPU整体性能较发布初期提升一倍以上,其GPU硬件产品已为国内近百款应用加速,包括办公、视频会议、音视频、浏览器、视频编辑、设计、GIS等软件。
张建中表示,目前,基于国家国产平台,与国内外同类代表产品相比,摩尔线程全功能GPU在各项标准评测项目中性能提升了2-3倍。
随着企业对云计算的需求日益增长,传统CPU云桌面解决方案已无法满足新型办公、富媒体应用的需求。对此,中国信息通信研究院、中国移动云、中国电信研究院、摩尔线程联合发布了《新型GPU云桌面发展白皮书》,明确了云桌面场景的体验标准。
基于此标准,在视频播放、网页浏览、办公、教育软件四大主要场景下,搭载Moore Thread MTTS2000 GPU的单台服务器可同时支持40个以上高清用户,相比传统仅有CPU的解决方案,性能提升近5倍,整体TCO降低60%以上。
在vGPU创新方面,摩尔定律推出了云桌面产品MT vGPU 2.1、MCCX VDI云桌面一体机。
MT vGPU 2.1云桌面产品新增对Moore’s Threads MTT S3000显卡的支持,单卡并发虚拟机数达到28个,并发性能较之前提升40%,支持4K画质,增加对Windows Server版本的支持,扩展硬件能力和应用支持范围,增加GPU超分辨率技术、支持SRIOV。
在不改变硬件资源的情况下,超级分段技术可以使虚拟机数量增加一倍,从而大幅降低客户成本。SRIOV技术可以提供更好的QoS、隔离性和安全性,保护客户数据不受侵犯。
摩尔线程MCCX VDI云桌面一体机主要应用于教育办公场景,是包括服务器、瘦终端、软件在内的端到端交付解决方案,并专门推出了教育改革专用版和办公体验增强版。教育改革专用版可有效加速19款教改软件,办公体验增强版针对WPS、PDF阅读器、视频会议、解压软件等60余款办公软件进行定制优化。
目前,摩尔线程已适配天翼云电脑、移动云电脑等10余家客户的产品,并与深信服、新华三信息、华云、酷栈、听语科技等完成产品导入,基于摩尔线程vGPU的云桌面产品及解决方案将在各行业落地。
03.
AI+云计算:兼容CUDA
零成本完成 CUDA 代码迁移
GPU的应用创新离不开广大开发者的贡献和支持,Moore Threads去年发布了MUSA元计算统一系统架构,包括统一的编程模型、软件运行时、驱动框架、指令集架构和芯片架构。
昨日,Moore Threads 宣布了围绕 MUSA 架构的一系列技术更新,包括推出 MUSA 社区开发者计划、推出 MUSA Toolkit 1.0 软件工具包及“MUSIFY”代码移植工具、开源 MT PyTorch。
MooreThread启动MUSA社区开发者计划后,将为合作伙伴及开发者提供全套MUSA开发工具、编程指南、系列教程、开源框架和模型库等资源;同时联合第三方社区共同推动新算法模型、计算系统和平台的发展。
为了充分发挥Moore Threads GPU的计算能力,Moore Threads推出了MUSA Toolkit 1.0软件工具包,包含MUSA驱动、运行库、编译器、AI加速库、数学库、通信库等工具。
由于MUSA在架构上兼容CUDA,其代码移植工具MUSIFY可快速将现有CUDA程序迁移至MUSA,零成本完成CUDA代码自动化移植,用户可在短时间内完成热点分析和针对性优化,大大缩短迁移优化周期。
此外,Moore Threads将开源MT PyTorch,支持多种模型推理,覆盖CV、NLP、语音等多个领域,可运行ChatGLM、Stable Diffusion、LLaMA等典型的大模型分布式多卡推理。
通过使用数据并行、模型并行、ZERO等分布式训练技术,MT PyTorch还可以完成简单基础模型和典型Transformer结构的NLP语言模型训练。
基于MUSA,开发者可以重用PyTorch开源社区的大量模型算子,降低开发成本。
04.
元界:AI绘画平台内测开启
生成看起来真实的数字人物
结合图形渲染、物理仿真、AI训练与推理等能力,摩尔线程持续完善元宇宙应用中的人、场景、内容等核心要素,带来一系列重大升级,更好地赋能数字城市、数字教育、数字医疗、数字能源、数字办公等行业。
张建中宣布摩尔线程升级MTVERSE元宇宙平台及DIGITALME数字人解决方案,并宣布旗下AIGC内容创作平台MoBiMaLiang内测上线。
MTVERSE元宇宙平台提供可扩展的性能、基于云端的实时渲染和模拟以及AI驱动的多样化计算支持。
领先的第三方IDC服务商世纪互联在云端率先部署摩尔线程千大卡GPU算力集群,并成功将MTVERSE平台与虚幻引擎、云端渲染流式技术结合,为51WORLD的51Meet元宇宙高精度开放平台提供算力加速。
据悉,这也是首个实现国内闭环的元宇宙应用,在多人并发的情况下,用户可以享受低延迟、高保真的沉浸式元宇宙体验。此外,咪咕元宇宙、智汇云洲视频孪生、看景三维重建等都在陆续更新中。
摩尔线程推出的软硬件一体化AIGC内容创作平台MoBiMaLiang已启动内测。
平台提供多种接入方式,包括通过Web、小程序登录,以及通过丰富的API进行远程调用。适合需要完整解决方案的用户。
Moore Threads提供私有部署能力,包括GPU集群、异构算力调度平台、API接口、以及类似Mobi Maliang的示例应用程序等。
张建中告诉新东西,AIGC内容创作平台是摩尔线程向用户提供的增值服务,摩尔线程不考虑从中盈利,而是希望将产品能力展示给更多的开发者,让开发者可以利用这些软件技术和硬件产品方案来发展自己的业务。
此外,针对数字人生成应用,Moore Threads打造的DIGITALME数字人解决方案进一步升级,包括2D、3D。
DIGITALME包括“女娲”数字人生成器、“画皮”表情驱动引擎、“随影”动作驱动引擎和“随答”对话系统。其中,“随答”迎来两项主要能力的升级:一是通过语音与人自然交互,实现“会听会说”的功能;二是基于大语言模型的智能问答,实现“会思考会说话”的功能。
摩尔线程还在发布会上展示了基于DIGITALME技术平台的两款数字人产品解决方案——2D播报型数字人、3D交互型数字人,并表示期待与各行业合作伙伴共同打造具有多重身份和功能的数字人,广泛应用于直播、社交、影视动画、办公、娱乐等场景。
▲基于DIGITALME平台,利用真人图像和声音生成数字人
05.
结论:GPU研发与应用是一项长期的事业
GPU的应用是检验技术创新的试金石。从新产品发布和技术更新的节奏来看,摩尔线程并没有走埋头苦干、准备大动作的路线,而是选择了更加务实的边实践边积累经验、不断迭代优化产品的做法。通过与广泛的生态伙伴合作,用越来越多的商业应用来验证其软硬件产品的稳定性、可靠性和易用性。
张建中表示,通过将更多有特色的自研技术融入GPU,并投入大量资金用于国内众多游戏应用程序、游戏引擎、操作系统和办公软件的适配和支持,摩尔纹正在构建差异化的竞争壁垒,并以更低的价格为用户提供不逊于专业高端显卡的体验。
在张建中看来,AIGC、数字人、元宇宙3D图像生成、自动驾驶、机器人、数字孪生等都和“AI+图形+元宇宙”的应用场景有关,而这些应用的发展都离不开GPU,GPU已经成为所有科研公司的“基础设施”,是企业研发过程中必不可少的硬件,这也是他鼓励开发者多去探索的综合应用方向。
他认为,相比专用芯片,GPU的多功能性可以帮助释放众多开发者的创造力,一块功能齐全的GPU可以兼顾大模型、虚拟数字人、3D图形渲染、工业数字孪生等对图形和AI计算有很高要求的多模态任务的开发,成为各行各业的创新引擎。
“我们的策略是通过持续快速的元计算创新和生态系统合作伙伴的支持,为客户提供更高效、可靠、易用的GPU解决方案。”张建中期待与各界合作伙伴一道,将创新成果应用到实际场景中,推动GPU在数字经济时代的广泛应用。
推荐材料