User Tools

Site Tools


cluster:184

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
cluster:184 [2019/09/12 12:02]
hmeij07
cluster:184 [2019/09/13 17:17]
hmeij07
Line 18: Line 18:
   * CPU model/type determines dpfp/cycle; silver 16, gold 32.   * CPU model/type determines dpfp/cycle; silver 16, gold 32.
  
-Criteria for selection (points of discussion raised at last meeting): +Criteria for selection (points of discussion raised at last meeting 08/27/2019): 
-  - Continue with current work load, just more of it (RXT2080ti/RXT4000+  - Continue with current work load, just more of it (RTX2080ti/RTX4000
-  - Do above, but beginners level intro Deep Learning (T4) +  - Do above, and enable beginners level intro into Deep Learning (T4) 
-  - Do above, but invest for future expansion into complex Deep Learning (RXT6000)+  - Do above, but invest for future expansion into complex Deep Learning (RTX6000)
  
-//**Pick your option and put it in the shopping cart**//  8-)+//**Pick your option and put it in the shopping cart**//  8-)\\ 
 +Table best read from the bottom up to assess differences.
  
 ^  Options  ^^^^^^^^^^^  Notes  ^ ^  Options  ^^^^^^^^^^^  Notes  ^
Line 31: Line 32:
 |  Cpus  |  12  |  8  |  18  |  14  |  10  |  34  |  26  |  16  |  16  |  12  | total| |  Cpus  |  12  |  8  |  18  |  14  |  10  |  34  |  26  |  16  |  16  |  12  | total|
 |  Cores  |  96  |  64  |  180  |  140  |  100  |  272  |  208  |  192  |  128  |  72  | physical| |  Cores  |  96  |  64  |  180  |  140  |  100  |  272  |  208  |  192  |  128  |  72  | physical|
-|  Tflops  |  3.2  |  2.2  |  13.8  |  10.7  |  7.7  |  9.2  |  7  |  13.  4.3  |  2.5  | cpu dpfp|+|  Tflops  |  3.2  |  2.2  |  13.8  |  10.7  |  7.7  |  9.2  |  7  |  6.  4.3  |  2.5  | cpu dpfp|
 |  Gpus  |  48  |  16  |  36  |  28  |  20  |  34  |  26  |  16  |  28  |  60  | total| |  Gpus  |  48  |  16  |  36  |  28  |  20  |  34  |  26  |  16  |  28  |  60  | total|
 |  Cores  |  209  |  74  |  157  |  72  |  92  |  75  |  67  |  74  |  72  |  138  | cuda K| |  Cores  |  209  |  74  |  157  |  72  |  92  |  75  |  67  |  74  |  72  |  138  | cuda K|
Line 39: Line 40:
 |  $/TFlop  |  138  |  348  |  188  |  423  |  295  |  402  |  466  |  361  |  433  |  232  | gpu dp+sp| |  $/TFlop  |  138  |  348  |  188  |  423  |  295  |  402  |  466  |  361  |  433  |  232  | gpu dp+sp|
 ^ Per Node  ^^^^^^^^^^^^ ^ Per Node  ^^^^^^^^^^^^
-|  Chassis  |  2U(12)  |  2U(8)  |  2U(18)  |  2U(14)  |  2U(10)  |  1U(16)  |  1U(13)  |  4U(32)  |   1U(8) |  4U(24)  | rails?|+|  Chassis  |  2U(12)  |  2U(8)  |  2U(18)  |  2U(14)  |  2U(10)  |  1U(17)  |  1U(13)  |  4U(32)  |   1U(8) |  4U(24)  | rails?|
 |  CPU  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  | total| |  CPU  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  | total|
 |    |  4208  |  4208  |  5115  |  5115  |  5115  |  4208  |  4208  |  4214  |  4208  |  4208  | model| |    |  4208  |  4208  |  5115  |  5115  |  5115  |  4208  |  4208  |  4214  |  4208  |  4208  | model|
-|    |  silver  |  silver  |  gold  |  gold  |  gold  |  silver  |  silver  |  gold   silver  |  silver  | type|+|    |  silver  |  silver  |  gold  |  gold  |  gold  |  silver  |  silver  |  silver   silver  |  silver  | type|
 |    |  2x8  |  2x8  |  2x10  |  2x10  |  2x10  |  2x8  |  2x8  |  2x12  |  2x8  |  2x8  | physical| |    |  2x8  |  2x8  |  2x10  |  2x10  |  2x10  |  2x8  |  2x8  |  2x12  |  2x8  |  2x8  | physical|
 |    |  2.1  |  2.1  |  2.4  |  2.4  |  2.4  |  2.1  |  2.1  |  2.2  |  2.1  |  2.1  | Ghz| |    |  2.1  |  2.1  |  2.4  |  2.4  |  2.4  |  2.1  |  2.1  |  2.2  |  2.1  |  2.1  | Ghz|
Line 56: Line 57:
 |    |  250  |  295  |  250  |  70  |  295  |  160  |  70  |  295  |  70  |  160  | Watts| |    |  250  |  295  |  250  |  70  |  295  |  160  |  70  |  295  |  70  |  160  | Watts|
 |  Power  |  2200  |  1600  |  1600  |  1600  |  1600  |  1600  |  1600  |  2200  |  1600  |  2000  | Watts| |  Power  |  2200  |  1600  |  1600  |  1600  |  1600  |  1600  |  1600  |  2200  |  1600  |  2000  | Watts|
-|    |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  2+2 | redundant|+|    |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  1+1  |  2+2  | redundant|
 |  CentOS7  |  n+n  |  n+n  |  y+?  |  y+?  |  y+?  |  y+y  |  y+y  |  y+y  |  n+n  |  n+n  | +cuda?| |  CentOS7  |  n+n  |  n+n  |  y+?  |  y+?  |  y+?  |  y+y  |  y+y  |  y+y  |  n+n  |  n+n  | +cuda?|
-|  Nics  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  2 | gigabit|+|  Nics  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  |  2  | gigabit|
 |  Warranty  |  3  |  3  |  3  |  3  |  3  |  3  |  3  |  3  |  3  |  3  | standard| |  Warranty  |  3  |  3  |  3  |  3  |  3  |  3  |  3  |  3  |  3  |  3  | standard|
-|    |  -3  |  -6  |  -1  |  -1  |  -5.5  |  0  |  +1.6  |  0  |  +1.5  |  -1  | diff|+|    |  -3  |  -6  |  -1  |  -1  |  -5.5  |  0  |  +1.6  |  0  |  +1.5  |  -1  |  Δ  |
  
   * #1/#2 All GPU warranty requests will be filled by GPU maker.   * #1/#2 All GPU warranty requests will be filled by GPU maker.
 +  * #7 up to 4 GPUs per node. Filling rack leaving 1U open between nodes, count=15
   * #8 fills intended rack with AC in rack. GPU Tower/4U rack mount.   * #8 fills intended rack with AC in rack. GPU Tower/4U rack mount.
-  * #8 includes NVLink connector (bridge kit). Allows up to 4 GPUs per node with no cooling issues.+  * #8 includes NVLink connector (bridge kit). Up to 4 GPUs per node.
   * Tariffs may affect all quotes when executed.   * Tariffs may affect all quotes when executed.
   * S&H included (or estimated)   * S&H included (or estimated)
 +  * More than 4-6 nodes would be lots of work if Warewulf/CentOS7 imaging is not working.
  
 +On the question of active versus passive cooling:
  
  
cluster/184.txt · Last modified: 2020/01/03 13:22 by hmeij07