Bitcoin Forum
May 26, 2024, 12:31:20 AM *
News: Latest Bitcoin Core release: 27.0 [Torrent]
 
   Home   Help Search Login Register More  
Pages: [1]
  Print  
Author Topic: Сирена на фатальный рост температуры или  (Read 1176 times)
Port (OP)
Jr. Member
*
Offline Offline

Activity: 58
Merit: 10


View Profile
February 02, 2014, 08:21:17 PM
 #1

Сирена на фатальный рост температуры или вентиляторов

У Cgminer есть свой API. Кто-нить пробовал практически или хотя бы теоретически рассмотреть возможность подачи сирены при случаях:

1) фатальный рост температуры GPU
2) отказ одного из вентиляторов видеокарт

Действительно, если откажет внешняя система охлаждения (например, большой бытовой вентилятор, охлаждающий ферму), то вся ферма, начиная с видеокарт, накроется медным тазом, и никто вовремя этого не заметит.
Или, если откажет один из вентиляторов видекарты, то такой же финал ждет эту видеокарту.

Вот и подумалось: если вместо системного динамика приспособить, например, паровозный ревун  Grin , то эти фатальные события могут быть сразу предотвращены своевременным обесточиванием фермы, углекислотным огнетушителем и т.д.

Дело осталось за малым: написать соотв. утилитку для API Cgminer.
ri
Full Member
***
Offline Offline

Activity: 140
Merit: 118


View Profile
February 10, 2014, 12:52:07 AM
 #2

Действительно, если откажет внешняя система охлаждения (например, большой бытовой вентилятор, охлаждающий ферму), то вся ферма, начиная с видеокарт, накроется медным тазом, и никто вовремя этого не заметит.
Или, если откажет один из вентиляторов видекарты, то такой же финал ждет эту видеокарту.

Вообще-то ничего подобного не произойдет, по крайней мере, при правильных (или даже дефолтовых) опциях cgminer.

Code:
$ cgminer --help |grep temp
--auto-fan          Automatically adjust all GPU fan speeds to maintain a target temperature
--auto-gpu          Automatically adjust all GPU engine clock speeds to maintain a target temperature
--gpu-reorder       Attempt to reorder GPU devices according to PCI Bus ID
--no-restart        Do not attempt to restart GPUs that hang
--temp-cutoff <arg> Temperature where a device will be automatically disabled, one value or comma separated list (default: 95)
--temp-hysteresis <arg> Set how much the temperature can fluctuate outside limits when automanaging speeds (default: 3)
--temp-overheat <arg> Overheat temperature when automatically managing fan and GPU speeds, one value or comma separated list (default: 85)
--temp-target <arg> Target temperature when automatically managing fan and GPU speeds, one value or comma separated list (default: 75)

И зачем тут сирена?
sibout
Full Member
***
Offline Offline

Activity: 176
Merit: 104

Bounty hunter, crypto investor and enthusiast


View Profile
February 10, 2014, 03:22:25 PM
 #3

Дело осталось за малым: написать соотв. утилитку для API Cgminer.
Скидываешь состояние cgminer-а в лог и парсишь.

Port (OP)
Jr. Member
*
Offline Offline

Activity: 58
Merit: 10


View Profile
February 12, 2014, 01:22:57 PM
 #4

ri:

- а можно о действиях этих опций поподробнее?  Kiss
ri
Full Member
***
Offline Offline

Activity: 140
Merit: 118


View Profile
February 12, 2014, 07:09:00 PM
 #5

ri:

- а можно о действиях этих опций поподробнее?  Kiss

Ну, у меня, например, на 1 карту 7950 cgminer запускается с такими опциями (остальные опускаю, т.к. они не имеют отношения к теме):

Code:
--gpu-engine 300-1200 --gpu-memclock 1575 --gpu-fan 0-100 --auto-fan --auto-gpu

Сразу после запуска (пока карта холодная) частота ядра устанавливается в 1200 MHz. cgminer отслеживает температуру с тем, чтобы она находилась в пределах 75+-3 градуса (т.е. значение опции --temp-target плюс-минут значение опции --temp-hysteresis - поскольку у меня они не заданы, то используются дефолтовые значения 75 и 3 соответственно). Таким образом, при приближении к 78 градусам (75+3) вентиляторы карты раскручиваются до максимума, если этого недостаточно (у меня нет дополнительных средств охлаждения, так что как правило, это и происходит), то cgminer начинает плавно (с шагом 5-10MHz) снижать частоту ядра, чтобы не выходить за означенные пределы. Например, в текущий момент у меня температура ядра 77 при частоте 1050. Если каким-то образом ухудшить теплоотвод (например, поставить на место боковую крышку системника), то частота еще снизится. Если наоборот, улучшить теплоотвод (опять снять крышку), то по достижении 72 градусов (75-3) частота начинает повышаться - пока не достигнет установленного максимума (1200) или порога в 78 градусов.

Что касается опций --temp-overheat и --temp-cutoff - на своем опыте пояснить не могу, т.к. пока не было ситуаций, чтобы они сработали, но по идее оно должно работать так: при достижении температуры --temp-overheat (по умолчанию 85) частота ядра сразу сбрасывается до минимального значения. Если после этого температура снизилась, то cgminer опять начинает плавно ее повышать - до значения, при котором температура ядра будет в диапазоне, заданном --temp-target и --temp-hysteresis. Если же температура продолжает расти и достигает значения --temp-cutoff (95 по умолчанию), то майнинг на этой карте прекращается до тех пор, пока не будет запущен вручную (ну или если используется api - то через него).

Что касается конкретных значений - тут ничего не могу порекомендовать, по идее это зависит от чипа видеокарты, сам искал эту инфу на сайте amd для 7950, но, увы, не нашел. Посему пользую значения по умолчанию.
Port (OP)
Jr. Member
*
Offline Offline

Activity: 58
Merit: 10


View Profile
February 13, 2014, 07:02:44 PM
 #6

Да, полезное исследование, спасибо! Smiley
Вопросик - в тексте не раз упоминается 75 град - откуда cgminer занает об этой частоте, как к ней привязывается?
Ведь в строке запуска такого значения вроде не видно.
ri
Full Member
***
Offline Offline

Activity: 140
Merit: 118


View Profile
February 13, 2014, 09:26:20 PM
 #7

Да, полезное исследование, спасибо! Smiley
Вопросик - в тексте не раз упоминается 75 град - откуда cgminer занает об этой частоте, как к ней привязывается?
Ведь в строке запуска такого значения вроде не видно.

Это значение по умолчанию. Его можно переназначить опцией --temp-target. Например, если запускать cgminer так:

Code:
cgminer --scrypt -I 13 --gpu-engine 300-1200 --gpu-fan 0-100 --auto-fan --auto-gpu --temp-target 50  --temp-hysteresis 5 --url stratum-tcp://pool.net:666 --user worker.1 --pass password1

То он будет управлять скоростью вентилятора и частотой чипа так, чтобы температура чипа находилась в пределах 45-55 градусов (т.е. отклонение от 50 градусов не более, чем на 5).
aistto
Legendary
*
Offline Offline

Activity: 1001
Merit: 1005


View Profile
February 18, 2014, 01:21:54 PM
 #8

Если же температура продолжает расти и достигает значения --temp-cutoff (95 по умолчанию), то майнинг на этой карте прекращается до тех пор, пока не будет запущен вручную (ну или если используется api - то через него).
как при этом помечается карта dead/sick/off ?
ri
Full Member
***
Offline Offline

Activity: 140
Merit: 118


View Profile
February 19, 2014, 09:05:48 AM
 #9

Любопытства ради затестил - запустил cgminer с параметром --temp-cutoff 65

В результате по факту достижения 65 градусов в логе увидел:

Code:
 [2014-02-19 12:01:21] Hit thermal cutoff limit on GPU 0, disabling!

В таблице устройств никак не отмечает этот факт, кроме как нулевым хешрейтом ну и соответственно низкой температурой чипа:

Code:
 GPU 0:  40.0C 1076RPM |  0.000/89.97Kh/s | A:256 R:0 HW:0 WU: 90.7/m I:16
Pages: [1]
  Print  
 
Jump to:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.19 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!