K8S 加 SLIM 这个架构解释一下吧。我以前接触过 K8S, 总觉得它就是个虚拟机,是一个,就是我当时记得它实际上 Ansible 就是一个相当于说这个叫什么? Linux from scratch 一样的,从源头去去编译出来的一个 Linux 的操作系统,或者说一台虚拟机吧。那 Slurm 是什么我忘掉了。它这个虚拟机,这个 K8S 到底是什么目的?是做什么用的?
我现在越听越糊涂了。我的感觉是,这套架构似乎效率并不高吧。比如说,我记得以前我们学习过,像华为 384 这种超节点,以及那个英伟达 NVR 64。就 64 个节点的这种 64 张显卡这种节点。它的核心是什么意思?核心就是说,整个这所有的资源,通通它就是在同一台电脑里面。什么意思呢?就是说这么多的显卡全部集成在一起,然后呢,它才能够说是就是说它才能够这个训练模型的时候才效率最高,而不是说使用这种分布式的这种多台英伟达的这种六十四四个节点去做分布式的并行处理。为什么这样说呢?我的感觉是说这个再怎么样,它分布式的话,它是有一个操作系统级的这种就是网络通讯的这样一个 overhead。 远远比不上是一台,就是相当于说那个那个华为的超级三三八零三八四,它三八三百八十四个显卡,对这一台电脑来说都是外设,就是说都是通过总线连接的这个显卡。就是它一台集节点上的这个硬件而已。它这个就说是在本机连接,而不是说在远端的另一台服务器这种两个操作系统之间用特别的这种分布式运算的软件,在操作系统层级上进行的通讯,这个操作系统都有这种网络通讯的开销,再去分布式的这种多个 CPU 再去分布资源。因为在这个训练过程中,其实大部分的计算的任务都是在显卡上。那么这个操作系统或者说是 CPU 内存仅仅是这个任务分发或者是最后的这个任务收集的这一些工作。其实最理想的是 NVR 64,就是英伟达的 NVR 64,它就是所有的任务都是在一台,就是 64 个显卡就是一台电脑。那一台这个它去直接就把这个一个大模型等于是,因为这个你去进行这个专家训练时候它有大量的这种数据对齐的工作吧,这是我的理解,就是说你现在专家跟专家之间实际上是最后模型之间是要要数据需要通讯的,就是,甚至于说是 64 个节点的 64,不叫 64 个节点,64 张显卡的数据都要互相交换的。而这种交换,你是在同一台这个电脑上,或者同一台这个这个超级超级服务器上,英伟达有自己的 NVR, 就是 PCI, 就是叫做它的这种 NVLink 就是说显卡跟显卡之间间直接就数据就交换了,而用不着说采用这种 K8S 这种,服务器与服务器之间的操作系统与操作系统之间,通过网络进行传统的分布式的数据交换,所以我才感觉它这个它这个这个硬件实际上是比较落后的,为什么呢?因为这个数据交换是瓶颈啊。而你这个服务器与服务器之间的交换,你就算你的网络再快的话,也比不上你这种在同一个服,这个服务器,或者说是硬件总线之间进行的这种这种速度来得快,而且因为你那个分布式实际上是操作系统层级的软件式的通讯,因为它这种是透过了操作系统,然后透过了这种靠软件去做这种事情,而不是说像 NV NVLink 那种是,这种显卡就直接走总线的,我走它那个 NVLink 这种 NVIDIA 这种总线,或者是华为自己的那种总线设计的。