Offir Remez和他的Lucid Hydra并联技术
- 来源:微型计算机 smarty:if $article.tag?>
- 关键字:技术,Offir Remez smarty:/if?>
- 发布时间:2010-09-21 16:36
SLI和CrossFireX技术,就像掉在牛顿头上的那个苹果一样,砸出了Offir Remez的疯狂创意“能不能做一块芯片,主板只需安装上它,就可以使来自不同厂商的不同款式显卡实现并联工作?”
Lucid Hydra一个发烧友的疯狂创意!
频繁的更换配件、挑战极限超频甚至自己动手改造硬件……他们对新技术、新产品的追求永远没有终点,他们会为了测试里每一分成绩的提高而不停淘神费力,他们舍得为游戏里每1帧效果的提高而付出数倍代价。这,就是PC发烧友么?错,甚少在Offir Remez面前,他们不算是真正的发烧友!
Offir Remez是谁?如他自己所说,首先,他是一个父亲,他和他儿子都是游戏玩家。其次,他还是行业内新兴名企——以色列LucidLogix公司的创始人之一,目前任公司总裁兼主管商业开发的副总裁。这两个看似有点不靠谱的关系,恰恰被“发烧友”一词联系起来,因为Offir Remez和他的儿子就是一对游戏发烧友父子。这位来自以色列的“老牌”游戏发烧友有过和我们一样的经历——为了更好的游戏体验,在交替取得性能第一的AMD和NVIDIA产品之间频繁地更换显卡。直到NVIDIA和AMD各自的显卡互联技术(SLI/CrossFireX)出现之后,Offir Remez有了他的新玩法。他要做一种独立于显卡厂商的第三方芯片,主板只需安装上它,就可以使来自不同厂商的不同款式显卡实现并联工作。很快,Offir Remez便与合伙人一同创办了LucidLogix公司,致力于显卡并联项目的开发。有趣的是,由于其Lucid Hydra技术在显卡扩展性方面独辟蹊径,并且其并联后的效率出色,LucidLogix公司还得到了业界巨头英特尔公司的投资。
支持任意模式多显卡并联的Lucid Hydra
相比早期的Hydra 100系列芯片,Hydra 200系列芯片的工艺由130nm提升至65nm;对PCI-E接口标准的支持也从PCI-E 1.1升级到PCI-E 2.0。和SLI和CrossFireX技术比起来,LucidHydra技术最大的特点之一就是不对组建多卡系统的显示卡做任何要求。既不要求一定要使用同一家显示芯片商的产品,也不对产品间的性能差距做具体要求。Hydra系列芯片可以根据组建多卡系统显卡的具体情况,工作在三种不同的工作模式。一、A-Mode:类似CrossFireX,能让两(多)片使用AMD显示芯片制造的显卡,工作在并联模式下提升效能。而且相比CrossFireX而言,它对显示芯片的要求更少,即使是高端的Radeon HD 5870和低端的Radeon HD 5550都能一起工作在并联模式下。二、N-Mode:类似SLI,效果和A-Mode类似。三、X-Mode:它能让使用不同显示芯片厂商制造的芯片生产的显卡和平共处,让它们工作在混合并联的模式下,提高显示系统性能。只是不同规格的Hydra芯片能提供的多卡组建规格有所不同,以Hydra 200系列芯片为例,目前Hydra 200系列芯片共有3个型号:DS-LT22114;DS-LT22102和DSLT24102。三款型号的区别主要在于通信通道数及分配方式的不同(具体规格和划分方式详见下方示意图)。不同的通道数量和不同的分配方式就决定的多卡系统的组建规格。除此之外,在工作原理和模式上它们都是一样的。
Lucid Hydra是如何让“冤家”聚头的?
通过上诉介绍,玩家肯定对Lucid Hydra技术独特的X-Mode兴趣浓厚,那它是如何绕开NVIDIA和AMD实现这个“冤家”聚头功能的呢?要想解读这个问题,先要了解一下GPU的架构和图形处理过程。GPU处理3D图形与制作动画片一样,把一个动作分解成若干幅图片,当这些图片连续播放机看到画面里面的人物动作起来。在计算机图形处理中,每一幅图片叫做“帧”。
从下图可以看到,CPU画完的一帧画稿A送到GPU的几何处理器,几何处理器负责处理多边形并依据这一帧中物体的实际位置处理前后关系,物体移动导致的遮挡以及光照阴影等。几何处理后的B送到像素处理器,在这里根据物质的质地进行纹理处理,添加阴影,光照效果和色调变化。经过处理的这一帧放到帧缓冲,然后送到显示器显示出画面C。
简单了解GPU架构和图形处理过程后就很容易了解多GPU技术,从软件技术上看,目前主流的多GPU技术原理基本相同,包括CrossFireX/SLI/LucidHydra都采用了交替帧渲染和分割帧渲染技术。
交替帧渲染(Alternate Frame Rendering)就是让每个GPU处理不同的帧,比如GPU(A)处理第N帧,GPU(B)处理N+1帧,然后GPU(A)再处理N+2帧。依此类推,其优点是当游戏画面变化较快或者说是两帧画面大部分不相同时,渲染效率极高。如果两帧画面大体不变,只是某一景物发生变化,两块显卡此时就会重复渲染大量相同数据从而使得双卡互连系统效率降低。
分割帧渲染(Scissor Frame/ SplitFrame Rendering)就是把一帧画面分成两部分,分别交由两块显卡独立渲染。由于游戏画面复杂多变,如果平均分割画面一定会造成两块显卡负载不同从而影响效率。因此分割帧渲染需要良好的性能缩放比率和动态负载平衡技术,使得驱动程序最大限度的平均分配负载,以达到性能提升的最大化。
既然技术原理上大家都相同,那Lu c i d Hy d r a又是如何区别于SLI和CrossFireX实现混合并联的呢?其实,从硬件上讲,实现上述的技术必须有专用硬件支持,最基本的硬件支持就是帧交替或分割处理的硬件以及两个GPU之间的通信联系。NVIDIA的SLI采用MIO模块通过桥接使两个GPU相互联系。AMD的CrossFireX采用CrossFireX引擎通过桥接使两个GPU相互联系。而Hydra芯片没有使用类似于NVIDIA和AMD的引擎(MIO模块)加桥的封闭式硬件结构。Hydra芯片自身就能完成帧交替或分割处理,同时通过PCI-E总线连接两个(或2个以上)GPU,完成通信功能。
从Hydra芯片框图看到,它植入了一颗RISC处理器,由RISC处理器执行帧交替或帧分割处理,RISC处理器通过RISC的DMA(直接内存访问)和GPU的DMA交换数据。从硬件设备角度看,Lucid的Hydra首先打破了AMD卡和NVIDIA显卡的深沟壁垒,使多GPU通用化。从硬件原理看,Lucid的Hydra应当有更优秀的性能。
但是显卡并联技术的实现还离不开软件的支持,而Lucid自己并不针对一家的显卡,因此其Hydra需要面对的是两家显卡的驱动和各种游戏引擎进行在开发。所以它配套软件开发的难度比NVIDIA和AMD都大。
主板专家答疑Lucid Hydra技术应用作为独立于显卡厂商的第三方显卡并联方案,Lucid Hydra的其实际效率如何?能否支持双核心显卡并联?对主板的设计有什么特殊要求,会增加多少功耗、多少成本?它会得到业界认同么?为了解答这些疑问,我们特意采访了第一个将Lucid Hydra技术实用化的主板厂商——微星科技的技术部顾问崔庆礼老师。
MC:我们注意到,在组建不同的并联模式时,厂商还是会推荐用户使用一些特定显卡组合。这是否说明Hydra芯片还是要求两块显卡在计算能力上尽可能一样?如两片显卡在运算能力上差别较大的话?是否会对性能提升造成影响?
崔:Hydra芯片设计的本意,或者从硬件来说不存在这个问题,两块显卡计算能力差距只能影响到联合后的性能,当一片计算能力很强的显卡和一片很差的显卡联合,总的性能与强的显卡比较提高很少,与差的显卡比较提高很多。但是目前由于Hydra驱动还不完善,两块显卡差距很大,会影响联合后的总性能,所以目前建议采用差距较小的显卡联合。
MC:到现在,Hydra芯片自第一代产品有哪些技术突破?可以支持双核心显卡并联吗?在X-Mode下可以开启NVIDIA显卡的物理加速功能吗?
崔:到目前为止技术的突破是可以支持DX11,三种联合模式基本可以运行, 支持的游戏增加很多。双核心的显卡目前还不能支持, 因为双核心的显卡已经采用了SLI或CrossFireX技术,Hydra不可能在SLI或CrossFireX基础上再次做交替帧渲染或分割帧渲染。
在X-MODE下,如果NVIDIA显卡做主卡,可以支持NVIDIA显卡的物理加速。同理,如果AMD显卡做主卡也可以支持AMD显卡的特有技术。
MC:在主板上集成Hydra芯片对主板的设计有何特殊要求?主板的工作功耗会增加多少?是否需要安装特别的散热设备?同类主板在加装Hydra芯片后,成本会高出多少?
崔:没有特殊要求,Hydra芯片功耗很低,只有6W。采用被动散热片即可。因为目前还没有大规模投入生产,成本相对高一点。
MC:Lucid Hydra目前是否得到了板卡厂商的认同?你们预计未来该芯片产品会得到怎样的发展?
崔:微星是首家与Luc id合作的主板厂商,开发出的支持Lucid Hydra技术的主板已有有多款,Big Bang XPower,BigBang Fuzio n,Big Bang Trinergy,P55A Fuzion和870A Fuzion-H等。另,据报道华硕也开发出一种集成Hydra芯片的主板。相信随着驱动的进步,这种通用式的多GPU平台肯定会得到游戏玩家的青睐,因为在激烈的游戏战中,快0.1秒就可能赢得胜利。提升游戏效果和流畅度仍然是显卡发展的主要动力。
……
Lucid Hydra一个发烧友的疯狂创意!
频繁的更换配件、挑战极限超频甚至自己动手改造硬件……他们对新技术、新产品的追求永远没有终点,他们会为了测试里每一分成绩的提高而不停淘神费力,他们舍得为游戏里每1帧效果的提高而付出数倍代价。这,就是PC发烧友么?错,甚少在Offir Remez面前,他们不算是真正的发烧友!
Offir Remez是谁?如他自己所说,首先,他是一个父亲,他和他儿子都是游戏玩家。其次,他还是行业内新兴名企——以色列LucidLogix公司的创始人之一,目前任公司总裁兼主管商业开发的副总裁。这两个看似有点不靠谱的关系,恰恰被“发烧友”一词联系起来,因为Offir Remez和他的儿子就是一对游戏发烧友父子。这位来自以色列的“老牌”游戏发烧友有过和我们一样的经历——为了更好的游戏体验,在交替取得性能第一的AMD和NVIDIA产品之间频繁地更换显卡。直到NVIDIA和AMD各自的显卡互联技术(SLI/CrossFireX)出现之后,Offir Remez有了他的新玩法。他要做一种独立于显卡厂商的第三方芯片,主板只需安装上它,就可以使来自不同厂商的不同款式显卡实现并联工作。很快,Offir Remez便与合伙人一同创办了LucidLogix公司,致力于显卡并联项目的开发。有趣的是,由于其Lucid Hydra技术在显卡扩展性方面独辟蹊径,并且其并联后的效率出色,LucidLogix公司还得到了业界巨头英特尔公司的投资。
支持任意模式多显卡并联的Lucid Hydra
相比早期的Hydra 100系列芯片,Hydra 200系列芯片的工艺由130nm提升至65nm;对PCI-E接口标准的支持也从PCI-E 1.1升级到PCI-E 2.0。和SLI和CrossFireX技术比起来,LucidHydra技术最大的特点之一就是不对组建多卡系统的显示卡做任何要求。既不要求一定要使用同一家显示芯片商的产品,也不对产品间的性能差距做具体要求。Hydra系列芯片可以根据组建多卡系统显卡的具体情况,工作在三种不同的工作模式。一、A-Mode:类似CrossFireX,能让两(多)片使用AMD显示芯片制造的显卡,工作在并联模式下提升效能。而且相比CrossFireX而言,它对显示芯片的要求更少,即使是高端的Radeon HD 5870和低端的Radeon HD 5550都能一起工作在并联模式下。二、N-Mode:类似SLI,效果和A-Mode类似。三、X-Mode:它能让使用不同显示芯片厂商制造的芯片生产的显卡和平共处,让它们工作在混合并联的模式下,提高显示系统性能。只是不同规格的Hydra芯片能提供的多卡组建规格有所不同,以Hydra 200系列芯片为例,目前Hydra 200系列芯片共有3个型号:DS-LT22114;DS-LT22102和DSLT24102。三款型号的区别主要在于通信通道数及分配方式的不同(具体规格和划分方式详见下方示意图)。不同的通道数量和不同的分配方式就决定的多卡系统的组建规格。除此之外,在工作原理和模式上它们都是一样的。
Lucid Hydra是如何让“冤家”聚头的?
通过上诉介绍,玩家肯定对Lucid Hydra技术独特的X-Mode兴趣浓厚,那它是如何绕开NVIDIA和AMD实现这个“冤家”聚头功能的呢?要想解读这个问题,先要了解一下GPU的架构和图形处理过程。GPU处理3D图形与制作动画片一样,把一个动作分解成若干幅图片,当这些图片连续播放机看到画面里面的人物动作起来。在计算机图形处理中,每一幅图片叫做“帧”。
从下图可以看到,CPU画完的一帧画稿A送到GPU的几何处理器,几何处理器负责处理多边形并依据这一帧中物体的实际位置处理前后关系,物体移动导致的遮挡以及光照阴影等。几何处理后的B送到像素处理器,在这里根据物质的质地进行纹理处理,添加阴影,光照效果和色调变化。经过处理的这一帧放到帧缓冲,然后送到显示器显示出画面C。
简单了解GPU架构和图形处理过程后就很容易了解多GPU技术,从软件技术上看,目前主流的多GPU技术原理基本相同,包括CrossFireX/SLI/LucidHydra都采用了交替帧渲染和分割帧渲染技术。
交替帧渲染(Alternate Frame Rendering)就是让每个GPU处理不同的帧,比如GPU(A)处理第N帧,GPU(B)处理N+1帧,然后GPU(A)再处理N+2帧。依此类推,其优点是当游戏画面变化较快或者说是两帧画面大部分不相同时,渲染效率极高。如果两帧画面大体不变,只是某一景物发生变化,两块显卡此时就会重复渲染大量相同数据从而使得双卡互连系统效率降低。
分割帧渲染(Scissor Frame/ SplitFrame Rendering)就是把一帧画面分成两部分,分别交由两块显卡独立渲染。由于游戏画面复杂多变,如果平均分割画面一定会造成两块显卡负载不同从而影响效率。因此分割帧渲染需要良好的性能缩放比率和动态负载平衡技术,使得驱动程序最大限度的平均分配负载,以达到性能提升的最大化。
既然技术原理上大家都相同,那Lu c i d Hy d r a又是如何区别于SLI和CrossFireX实现混合并联的呢?其实,从硬件上讲,实现上述的技术必须有专用硬件支持,最基本的硬件支持就是帧交替或分割处理的硬件以及两个GPU之间的通信联系。NVIDIA的SLI采用MIO模块通过桥接使两个GPU相互联系。AMD的CrossFireX采用CrossFireX引擎通过桥接使两个GPU相互联系。而Hydra芯片没有使用类似于NVIDIA和AMD的引擎(MIO模块)加桥的封闭式硬件结构。Hydra芯片自身就能完成帧交替或分割处理,同时通过PCI-E总线连接两个(或2个以上)GPU,完成通信功能。
从Hydra芯片框图看到,它植入了一颗RISC处理器,由RISC处理器执行帧交替或帧分割处理,RISC处理器通过RISC的DMA(直接内存访问)和GPU的DMA交换数据。从硬件设备角度看,Lucid的Hydra首先打破了AMD卡和NVIDIA显卡的深沟壁垒,使多GPU通用化。从硬件原理看,Lucid的Hydra应当有更优秀的性能。
但是显卡并联技术的实现还离不开软件的支持,而Lucid自己并不针对一家的显卡,因此其Hydra需要面对的是两家显卡的驱动和各种游戏引擎进行在开发。所以它配套软件开发的难度比NVIDIA和AMD都大。
主板专家答疑Lucid Hydra技术应用作为独立于显卡厂商的第三方显卡并联方案,Lucid Hydra的其实际效率如何?能否支持双核心显卡并联?对主板的设计有什么特殊要求,会增加多少功耗、多少成本?它会得到业界认同么?为了解答这些疑问,我们特意采访了第一个将Lucid Hydra技术实用化的主板厂商——微星科技的技术部顾问崔庆礼老师。
MC:我们注意到,在组建不同的并联模式时,厂商还是会推荐用户使用一些特定显卡组合。这是否说明Hydra芯片还是要求两块显卡在计算能力上尽可能一样?如两片显卡在运算能力上差别较大的话?是否会对性能提升造成影响?
崔:Hydra芯片设计的本意,或者从硬件来说不存在这个问题,两块显卡计算能力差距只能影响到联合后的性能,当一片计算能力很强的显卡和一片很差的显卡联合,总的性能与强的显卡比较提高很少,与差的显卡比较提高很多。但是目前由于Hydra驱动还不完善,两块显卡差距很大,会影响联合后的总性能,所以目前建议采用差距较小的显卡联合。
MC:到现在,Hydra芯片自第一代产品有哪些技术突破?可以支持双核心显卡并联吗?在X-Mode下可以开启NVIDIA显卡的物理加速功能吗?
崔:到目前为止技术的突破是可以支持DX11,三种联合模式基本可以运行, 支持的游戏增加很多。双核心的显卡目前还不能支持, 因为双核心的显卡已经采用了SLI或CrossFireX技术,Hydra不可能在SLI或CrossFireX基础上再次做交替帧渲染或分割帧渲染。
在X-MODE下,如果NVIDIA显卡做主卡,可以支持NVIDIA显卡的物理加速。同理,如果AMD显卡做主卡也可以支持AMD显卡的特有技术。
MC:在主板上集成Hydra芯片对主板的设计有何特殊要求?主板的工作功耗会增加多少?是否需要安装特别的散热设备?同类主板在加装Hydra芯片后,成本会高出多少?
崔:没有特殊要求,Hydra芯片功耗很低,只有6W。采用被动散热片即可。因为目前还没有大规模投入生产,成本相对高一点。
MC:Lucid Hydra目前是否得到了板卡厂商的认同?你们预计未来该芯片产品会得到怎样的发展?
崔:微星是首家与Luc id合作的主板厂商,开发出的支持Lucid Hydra技术的主板已有有多款,Big Bang XPower,BigBang Fuzio n,Big Bang Trinergy,P55A Fuzion和870A Fuzion-H等。另,据报道华硕也开发出一种集成Hydra芯片的主板。相信随着驱动的进步,这种通用式的多GPU平台肯定会得到游戏玩家的青睐,因为在激烈的游戏战中,快0.1秒就可能赢得胜利。提升游戏效果和流畅度仍然是显卡发展的主要动力。
关注读览天下微信,
100万篇深度好文,
等你来看……