1. <dd id="erndk"></dd>
                1. Slurm的NODE配置

                  互聯網 2022/5/2 11:12:37

                  Slurm節點管理的配置在/etc/slurm.conf文件中指定,更改節點配置(例如添加節點、更改處理器數量等)需要重新啟動slurmctld守護進程和slurmd守護進程。所有slurmd守護進程必須知道系統中的每個節點,才能轉發消息以支持分層通信。注冊到系統的節點的資源少于配置的資源(例如…


                      Slurm節點管理的配置在/etc/slurm.conf文件中指定,更改節點配置(例如添加節點、更改處理器數量等)需要重新啟動slurmctld守護進程和slurmd守護進程。所有slurmd守護進程必須知道系統中的每個節點,才能轉發消息以支持分層通信。注冊到系統的節點的資源少于配置的資源(例如內存太少)的節點將被置于“DOWN”狀態,以避免在它們上調度作業,節點注冊時檢查的資源有:CPU、RealMemory和TmpDisk。

                   

                  節點配置參數

                  NodeName
                  Slurm用來指定節點的名稱。通常這是“/bin/hostname -s”返回的字符串?;蛲ㄟ^/etc/hosts或DNS與主機關聯的任何有效域名。多個節點名可以用逗號分隔(例如:"alpha,beta,gamma"),或使用一個簡單的節點范圍(例如“linux[000-100]”)。

                  Boards
                  節點中的主板數量。當指定Boards時,應指定SocketsPerBoard、CoresPerSocket和ThreadsPerCore。默認值為1。

                  CoresPerSocket
                  單個物理處理器Socket中的核心數(例如:“2”)。CoresPerSocket描述的是物理核,而不是每個Socket的邏輯處理器。

                  CPUs
                  節點上邏輯處理器的數量(例如:“2”)。當希望只調度超線程節點上的核心時,這很有用。如果省略了CPUs,則其默認值將被設置為Boards、Sockets、CoresPerSocket和ThreadsPerCore的乘積。

                  Features
                  與節點關聯的某些特征。所需的特性可能包含一個數字組件,例如,表示處理器速度,缺省情況下,節點沒有特性。

                  Gres
                  通用資源規范的逗號分隔列表。格式為:“<name>[:<type>][:no_consume]:<number>[K|M|G],默認情況下,節點沒有通用資源。
                  (例如“Gres=gpu:tesla:1,bandwidth:lustre:no_consume:4G”)。

                  RealMemory
                  節點實際內存的大小,以megabytes為單位。(例如“2048”)。默認值為1。如果在SelectTypeParameters中將Memory設置為可消耗的資源。

                  Reason
                  標識節點處于“DOWN”、“DRAINED”、“DRAINING”、“FAIL”或“FAILING”狀態的原因。

                  Sockets
                  節點上的物理處理器sockets/chips的數量(例如:“2”)。如果Sockets被省略,將從CPU、CoresPerSocket和ThreadsPerCore中進行推斷。

                  SocketsPerBoard
                  主板上的物理處理器sockets/chips的數量。Sockets和SocketsPerBoard是互斥的。默認值為1。

                  State
                  節點狀態??山邮艿闹禐镃LOUD、DOWN、DRAIN、FAIL、FAILING、FUTURE和UNKNOWN,默認值為UNKNOWN。

                  ThreadsPerCore
                  單個物理核中的邏輯線程數(例如:“2”)。如果系統為每個核配置了多個線程,默認值為1。

                  TmpDisk
                  TmpFS中臨時磁盤存儲的總大小,以megabytes為單位。(例如“16384”)。TmpFS(表示“臨時文件系統”)標識作業應該用于臨時存儲的位置。默認值為0。

                   

                  隨時隨地學軟件編程-關注百度小程序和微信小程序
                  關于找一找教程網

                  本站文章僅代表作者觀點,不代表本站立場,所有文章非營利性免費分享。
                  本站提供了軟件編程、網站開發技術、服務器運維、人工智能等等IT技術文章,希望廣大程序員努力學習,讓我們用科技改變世界。
                  [Slurm的NODE配置]http://www.yachtsalesaustralia.com/tech/detail-318722.html

                  贊(0)
                  關注微信小程序
                  程序員編程王-隨時隨地學編程

                  掃描二維碼或查找【程序員編程王】

                  可以隨時隨地學編程啦!

                  技術文章導航 更多>
                  国产在线拍揄自揄视频菠萝

                        1. <dd id="erndk"></dd>