阿里云基于EGS平台推出了GPU云服务器,在提供GPU加速能力的同时,保留了与普通ECS实例一致的使用体验。您在创建ECS实例时,选择企业级异构计算规格即可。下面是阿里云GPU云服务器的一些常见问题及官方资料解答汇总,以供大家参考和了解阿里云GPU云服务器。
阿里云GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。作为阿里云弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。产品详情链接:https://www.aliyun.com/product/ecs/gpu
名词 | 说明 |
---|---|
GPU | 图形处理器(Graphics P*essing Unit)。相比CPU具有众多计算单元和更多的流水线,适合用于大规模并行计算等场景。 |
EGS | 弹性GPU服务(Elastic GPU Service)。阿里云弹性计算和GPU高速的并行异构的加速器的组合服务,兼具弹性计算的特点和GPU的加速能力。 |
CUDA | NVIDIA推出的通用并行计算架构,帮助您使用NVIDIA GPU解决复杂的计算问题。 |
cuDNN | NVIDIA推出的用于深度神经网络的GPU加速库。 |
AIACC-Training | 阿里云自研的AI加速器,可以显著提升训练性能。 |
AIACC-Inference | 阿里云自研的AI加速器,可以显著提升推理性能。 |
FastGPU | 阿里云推出的人工智能计算任务构建工具,提供便捷的接口和命令行,供您在阿里云IaaS资源上构建人工智能计算任务。 |
cGPU | 隔离GPU资源,实现多个容器共用一张显卡。 |
阿里云GPU云服务器是基于GPU与CPU应用的计算服务器。GPU在执行复杂的数学和几何计算方面有着独特的优势,特别是在浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。GPU的功能特性如下:
下表为您介绍GPU云服务器与自建GPU服务器的区别。
对比项 | GPU云服务器 | GPU自建服务器 | 对比项 |
---|---|---|---|
灵活性 | 能够快速开通一台或多台GPU云服务器实例。 实例规格(vCPU和内存)支持灵活变更,并且支持在线升降配。 带宽升降自由。 |
服务器购买周期长。 服务器规格固定,无法灵活变更。 带宽一次性购买,无法自由升降。 |
灵活性 |
易用性 | Web在线管理,简单方便。 内置主流的操作系统,Windows正版激活,且支持在线更换操作系统。 GPU驱动可以在购买时一并安装,方便快捷。 |
没有在线管理工具,维护困难。 需用户自备操作系统,自行安装及更换。 GPU驱动需要自行购买安装。 |
易用性 |
容灾备份 | 三副本数据设计,单份损坏可在短时间内快速恢复。 硬件故障事故中可快速自动恢复。 |
用户自行搭建,使用普通存储设备,价格高昂。 数据损坏需用户修复。 |
容灾备份 |
安全性 | 能够有效阻止MAC欺骗和ARP攻击。 并防护DDoS攻击,可进行流量清洗和黑洞。 享有端口入侵扫描、挂马扫描、漏洞扫描等附加服务。 |
很难阻止MAC欺骗和ARP攻击。 清洗和黑洞设备需要另外购买,价格昂贵。 普遍存在漏洞挂马和端口扫描等问题。 |
安全性 |
成本 | 支持包年包月及按量付费两种购买方式,可灵活选择适合您业务场景的付费方式。 按需购买,无需一次性大量投入。 |
无法按需购买,必须为业务峰值满配。 一次性投入巨大,闲置浪费严重。 |
成本 |
首次购买GPU云服务器如下配置包月4折,半年3.5折,1/2年3折,限1次,限1-3台(折扣不含带宽,系统盘,数据盘):
(1)gn6v(8核32G/32核128G/64核256G/82核336G)
(2)gn6i(4核15G/8核31G/16核62G/24核93G/40核155G/48核186G/96核372G)
(3)vgn6i、vgn6i-vws(4核32G/10核46G)
活动直达:点此进入阿里云服务器新人特惠活动,GPU新用户专享包年低至3折起。
1、高弹性
提供系列化的规格族,分钟级创建GPU实例,支持水平扩容和垂直变配。
2、高性能高安全性
支持GPUDirect,GPU之间点对点通信。GPU可以直接通过NVLink总线互联通信,具备高带宽低时延的特点,无需CPU干预。多租户间弹性GPU安全隔离 ,并通过Hypervisor授权和管理。允许灵活配置多块GPU实现互相高速通信的同时,还具备隔离带来的安全性。
3、易部署
和阿里云生态深度融合,您可以轻松搭配其他阿里云产品构建应用,例如搭配OSS、NAS等产品满足存储要求,搭配EMR进行深度学习数据预处理等。支持云原生(阿里云Kubernetes),交付更加便捷。
4、易监控
提供全面的GPU监控数据,包括GPU、实例和分组维度,免去您的运维压力。
GPU云服务器的计费相关功能和云服务器ECS一致,其中,计算资源(vCPU和内存)、镜像、块存储、公网带宽以及快照等资源涉及计费。常见的计费方式如下所示:
一台GPU实例包括计算资源(vCPU和内存)、镜像、块存储等资源,其中涉及计费的GPU资源如下表所示。
计费项 | 计费说明 | 计费方式 | 转换计费方式 | 计费标准 |
---|---|---|---|---|
计算资源(vCPU和内存) | 即实例规格涉及的计算资源费用(包括vCPU和内存)。 | 包年包月 按量付费 按量付费+预留实例券 抢占式实例 按量付费+节省计划 |
包年包月转按量付费 按量付费转包年包月 |
实例规格计费 |
镜像 | 根据镜像类型以及使用情况决定是否收费。例如,公共镜像、自定义镜像、共享镜像或镜像市场镜像的计费情况也有所区别。 | 包年包月 按量付费 按量付费+预留实例券 |
不支持 | 镜像计费 |
块存储 | 云盘:根据单价、云盘容量和使用时长收取费用,并且创建云盘的方式不同会影响支持的计费方式。 本地盘:与特定实例规格绑定的本地盘,不支持单独购买,且费用已计入实例规格费用。 |
包年包月 按量付费 存储容量单位包 按量付费+节省计划 |
转换云盘计费方式 包年包月转按量付费 按量付费转包年包月 |
块存储计费 |
公网带宽 | 使用固定公网IP访问公网时,仅收取公网出网带宽费用。 使用弹性公网IP(EIP)或NAT网关访问公网时,弹性公网IP(EIP)和NAT网关是需要独立购买。 |
按固定带宽计费 按使用流量计费 |
转换公网带宽计费方式 | 公网带宽计费 |
快照 | 快照的计费项目包括快照、快照复制以及快照极速可用。计费时会按快照容量和存储时长收取费用。 | 快照的计费项目包括快照、快照复制以及快照极速可用。计费时会按快照容量和存储时长收取费用。 | 不支持 | 快照计费 |
1、直播实时视频转码
阿里云异构GPU和FPGA服务器重点支持2019年天猫双11狂欢夜直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务天猫双11狂欢夜当天直播业务4K、2K、1080P等各个分辨率的转码。其中FPGA H.265高清编码、720P节省带宽21.6?GPU云服务器支持高并发实时视频流5000路以上,并逐步上升到峰值6200路每分钟,且顺利度过流量洪峰。异构GPU云服务器还参与实时家居渲染图片生成等业务,首次提供了大量算力强劲的ebmgn6v裸金属实例,支持淘宝渲染方提升几十倍的渲染性能,第一次实现秒级实时渲染,完成总计超过5000张大型家居渲染图。异构FPGA图片转码业务则以3K+片的超大集群,为淘宝图片空间提供高达数百万QPS的处理能力,承担了双十一淘宝图片85?流量,预计节省计算成本3亿。
2、AI训练
gn6v和gn6e具有优异的通用GPU计算加速能力,适合为深度学习提供加速引擎。
gn6v和gn6e实例分别配备具有16 GB显存和32 GB显存的NVIDIA V100 GPU计算卡,单节点可提供高达1000TFLOPS的混合精度计算能力。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。
3、AI推理
gn6i具有优异的AI推理能力。
gn6i实例基于配备NVIDIA Tesla T4 GPU计算卡,单精度浮点计算能力最高可达8.1 TFLOPS,int8定点运算处理能力最高可达130 TOPS,支持混合精度,满足了深度学习(尤其是推理)场景下的算力需求。同时单卡功耗仅75 W,具有极高的性能功耗比。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化您的部署操作。
4、云游戏、云网吧和云端图形工作站
vgn6i和gn6i均采用基于Turing架构的NVIDIA Tesla T4 GPU加速器,具有极佳的图形计算能力。vgn6i提供分片虚拟化后的虚拟GPU,支持T4 GPU计算能力的1/2、1/4、1/8,并提供极佳的3D图像渲染能力,适用于云游戏、云网吧等场景。vgn6i和gn6i实例可以结合云桌面产品提供云端图形工作站服务,应用于影视动画设计、工业设计、医疗成像、高性能计算的结果呈现等场景。
GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的使用限制。使用云服务器ECS有下列限制:
1、GPU计算型
2、GPU虚拟化型
3、异构服务型