Kringel
Jr. Member
Offline
Activity: 151
Merit: 7
|
|
June 04, 2021, 02:01:12 PM Last edit: June 04, 2021, 08:49:29 PM by Kringel |
|
Немножко реакции: накатил пока на три рига, всё работает ) Даже без замены хэлпера.
Риги смешанные? На чисто зеленом риге у меня тоже все нормально, а вот на смешанном зеленая карта не мониторится. Но у меня карта древняя, может в этом проблема, а не в программе. Риги гомогенные, полностью на 1070. UPD: На 1080 тоже всё нормально.
|
|
|
|
Nel67
Jr. Member
Offline
Activity: 114
Merit: 2
|
|
June 05, 2021, 05:01:57 AM |
|
Для информации,мониторинг заработал после завершения принудительно процесса NvidiaGPUGetDataHost в диспетчере задач и запуска заново проги.Предложенный файл менял.
|
|
|
|
Kringel
Jr. Member
Offline
Activity: 151
Merit: 7
|
|
June 05, 2021, 06:17:56 AM Last edit: June 05, 2021, 04:48:43 PM by Kringel |
|
Для информации,мониторинг заработал после завершения принудительно процесса NvidiaGPUGetDataHost в диспетчере задач и запуска заново проги.Предложенный файл менял.
Да, на одном из ригов столкнулся с оставшимся висеть процессом NvidiaGPUGetDataHost.exe после выхода из предыдущей версии форкфикса для обновления на 38-й. Поскольку обновляю его всегда вручную путём удаления всех файлов и папок кроме папки config и последующим копированием на это место новых файлов, получил сообщение о невозможности удалить файл, открытый этим самым NvidiaGPUGetDataHost. Завершил его принудительно и дальше сделал всё как обычно. UPD: А вот на гетерогенном риге начались проблемы. Четыре GTX 1070 и одна маленькая GTX 650 для монитора, которая в майнинге не участвует. NvidiaGPUGetDataHost (исходный, из архива с 38-й версией) густо сыплет в системный лог серии ошибок: "devCount: 5" -> "nvmlDeviceGetPowerUsage error: NotSupported" (6 раз) -> "Too many errors. Restart". После закрытия форкфикса процесс NvidiaGPUGetDataHost.exe остаётся в памяти. Также не знаю, есть ли связь с новой версией, но тирекс 0.20.4 периодически стал отказываться запускаться на этом риге с сообщением "Can't start miner, memory tweaks won't work because: can't get busid". Возможно, это случается после переключения на другой майнер, возможно, на gminer (это не точно). Эта же версия тирекса с FF 37.1 с тем же драйвером (457.51) работала безупречно. UPD2: После замены на отладочный всё то же самое, только ошибки теперь в другом логе: [2021-06-05 19:02:30] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-05 19:02:30] [INFO] [NvidiaGPUGetDataHost] NVIDIA devices: 5 [2021-06-05 19:02:34] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:02:34] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:02:39] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:02:40] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:02:45] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:02:45] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:02:50] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:02:50] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:02:55] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:02:56] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:03:01] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:03:01] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:03:02] [INFO] [NvidiaGPUGetDataHost] Too many errors. Restarting [2021-06-05 19:03:56] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-05 19:03:56] [INFO] [NvidiaGPUGetDataHost] NVIDIA devices: 5 [2021-06-05 19:04:01] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:04:01] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:04:06] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:04:06] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:04:11] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:04:12] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:04:17] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:04:17] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:04:22] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:04:22] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:04:27] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetPowerUsage error: NotSupported [2021-06-05 19:04:28] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetUtilizationRates error: NotSupported [2021-06-05 19:04:28] [INFO] [NvidiaGPUGetDataHost] Too many errors. Restarting [2021-06-05 19:04:29] [INFO] [NvidiaGPUGetDataHost] Start ... UPD3: Откатился на 37.1. Оказывается, тут NvidiaGPUGetDataHost тоже заваливает журнал Windows сообщениями "nvmlDeviceGetPowerUsage error: NotSupported" раз в секунду, но при этом без рестартов после очередных шести попыток. В отличие от 38-й версии, процесс NvidiaGPUGetDataHost.exe завершается после закрытия форкфикса (без рестартов не теряется актуальный ProcessID, надо полагать).
|
|
|
|
angelbbs (OP)
|
|
June 06, 2021, 08:32:32 AM |
|
Для информации,мониторинг заработал после завершения принудительно процесса NvidiaGPUGetDataHost в диспетчере задач и запуска заново проги.Предложенный файл менял.
Да, на одном из ригов столкнулся с оставшимся висеть процессом NvidiaGPUGetDataHost.exe после выхода из предыдущей версии форкфикса для обновления на 38-й. Поскольку обновляю его всегда вручную путём удаления всех файлов и папок кроме папки config и последующим копированием на это место новых файлов, получил сообщение о невозможности удалить файл, открытый этим самым NvidiaGPUGetDataHost. Завершил его принудительно и дальше сделал всё как обычно. UPD: А вот на гетерогенном риге начались проблемы. Четыре GTX 1070 и одна маленькая GTX 650 для монитора, которая в майнинге не участвует. NvidiaGPUGetDataHost (исходный, из архива с 38-й версией) густо сыплет в системный лог серии ошибок: "devCount: 5" -> "nvmlDeviceGetPowerUsage error: NotSupported" (6 раз) -> "Too many errors. Restart". После закрытия форкфикса процесс NvidiaGPUGetDataHost.exe остаётся в памяти. Также не знаю, есть ли связь с новой версией, но тирекс 0.20.4 периодически стал отказываться запускаться на этом риге с сообщением "Can't start miner, memory tweaks won't work because: can't get busid". Возможно, это случается после переключения на другой майнер, возможно, на gminer (это не точно). Эта же версия тирекса с FF 37.1 с тем же драйвером (457.51) работала безупречно. UPD2: После замены на отладочный всё то же самое, только ошибки теперь в другом логе: UPD3: Откатился на 37.1. Оказывается, тут NvidiaGPUGetDataHost тоже заваливает журнал Windows сообщениями "nvmlDeviceGetPowerUsage error: NotSupported" раз в секунду, но при этом без рестартов после очередных шести попыток. В отличие от 38-й версии, процесс NvidiaGPUGetDataHost.exe завершается после закрытия форкфикса (без рестартов не теряется актуальный ProcessID, надо полагать). Пробуйте https://mark.nl.tab.digital/s/HWjQQR3NfPNdaQj
|
|
|
|
Dmitry75
Jr. Member
Offline
Activity: 159
Merit: 7
|
|
June 06, 2021, 04:03:54 PM |
|
А можно ссылку на видео об использовании fork fix`a с afterburner`ом? Хотелось бы попробовать посмотреть разными проигрывателями, а то из форка оно открывается все мигающее и ничего не рассмотреть там толком.
Видео лежит в папке Help Спасибо. Не все проигрывалки его нормально показывают, кстати.
|
|
|
|
Kringel
Jr. Member
Offline
Activity: 151
Merit: 7
|
|
June 06, 2021, 09:04:29 PM |
|
С этой версией в логе пока всё чисто: [2021-06-06 23:57:01] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-06 23:57:01] [INFO] [NvidiaGPUGetDataHost] NVIDIA devices: 5 Мониторинг работает, процесс NvidiaGPUGetDataHost.exe завершается вместе с форкфиксом.
|
|
|
|
Galust
Jr. Member
Offline
Activity: 32
Merit: 1
|
|
June 07, 2021, 11:10:24 PM |
|
Здравствуйте. Не успел прочитать все посты, может кто то уже указал что не открывается меню где копировать бенч марк с одного устройства на другой и тд Получилось что нет доступа к многим функциям
|
|
|
|
Kringel
Jr. Member
Offline
Activity: 151
Merit: 7
|
|
June 08, 2021, 02:45:44 AM |
|
Давно хотел посмотреть, как работает опция рестарта драйвера при потере CUDA GPU. На этом же риге с дополнительной немайнинговой карточкой наконец-то смоделировалась подходящая ситуация и, похоже, опция не очень работает. На ходу прямо под форкфиксом с включенной опцией сломать одну из карт пока не удалось (но, вероятно, удастся), а при уже подвисшей карточке программа на старте ругается, что один из GPU сдох, но ничего не предпринимает. Опцию рестарта драйвера только включил; без неё при умирании карточки перестаёт совпадать нумерация карт в форкфиксе (в нём она не меняется, будто ничего не произошло) и в майнерах. В результате, к примеру, тирекс больше не может стартовать, т.к. не может применить на 650 memtweak, предназначенный для 1070, а нбмайнер выругивается на четвёртую карту (которая в форкфиксе при этом пятая и отключена), но работает на трёх. Журнал NvidiaGPUGetDataHost (эти пары строк добаляются каждые несколько секунд): [2021-06-08 05:16:34] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:16:34] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized [2021-06-08 05:16:43] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:16:43] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized [2021-06-08 05:16:50] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:16:50] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized [2021-06-08 05:16:56] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:16:56] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized [2021-06-08 05:17:02] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:17:02] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized [2021-06-08 05:17:08] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:17:08] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized [2021-06-08 05:17:14] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:17:14] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized [2021-06-08 05:17:20] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:17:20] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized [2021-06-08 05:17:26] [INFO] [NvidiaGPUGetDataHost] Start [2021-06-08 05:17:26] [INFO] [NvidiaGPUGetDataHost] nvmlDeviceGetCount error: Uninitialized Журнал старта собственно клиента: [2021-06-08 05:16:31] [INFO] [NICEHASH] Starting up NiceHashMiner Legacy Fork Fix: Build date 06/06/2021 11:29:08 [2021-06-08 05:16:31] [INFO] [NICEHASH] Selected language: English [2021-06-08 05:16:31] [INFO] [NICEHASH] Critical error: missing language [2021-06-08 05:16:31] [INFO] [NICEHASH] WMI service seems to be running, ManagementObjectSearcher returned success. [2021-06-08 05:16:31] [INFO] [NICEHASH] Start Form_Main [2021-06-08 05:16:31] [INFO] [NICEHASH] Start InitializeComponent [2021-06-08 05:16:31] [INFO] [NICEHASH] Start InitLocalization [2021-06-08 05:16:32] [INFO] [SystemSpecs] FreePhysicalMemory = 13966388 [2021-06-08 05:16:32] [INFO] [SystemSpecs] FreeSpaceInPagingFiles = 50331648 [2021-06-08 05:16:32] [INFO] [SystemSpecs] FreeVirtualMemory = 58458796 [2021-06-08 05:16:32] [INFO] [SystemSpecs] LargeSystemCache = 0 [2021-06-08 05:16:32] [INFO] [SystemSpecs] MaxNumberOfProcesses = 4294967295 [2021-06-08 05:16:32] [INFO] [SystemSpecs] MaxProcessMemorySize = 137438953344 [2021-06-08 05:16:32] [INFO] [SystemSpecs] NumberOfLicensedUsers = 0 [2021-06-08 05:16:32] [INFO] [SystemSpecs] NumberOfProcesses = 129 [2021-06-08 05:16:32] [INFO] [SystemSpecs] NumberOfUsers = 2 [2021-06-08 05:16:32] [INFO] [SystemSpecs] OperatingSystemSKU = 4 [2021-06-08 05:16:32] [INFO] [SystemSpecs] SizeStoredInPagingFiles = 50331648 [2021-06-08 05:16:32] [INFO] [SystemSpecs] SuiteMask = 272 [2021-06-08 05:16:32] [INFO] [SystemSpecs] TotalSwapSpaceSize = 0 [2021-06-08 05:16:32] [INFO] [SystemSpecs] TotalVirtualMemorySize = 66980824 [2021-06-08 05:16:32] [INFO] [SystemSpecs] TotalVisibleMemorySize = 16649176 [2021-06-08 05:16:32] [INFO] [SystemSpecs] ProcessorCount = 32 [2021-06-08 05:16:32] [INFO] [NICEHASH] Start query RAM [2021-06-08 05:16:32] [INFO] [NICEHASH] Total RAM: 16258MB [2021-06-08 05:16:32] [INFO] [NICEHASH] Page File Size: 49152MB [2021-06-08 05:16:32] [INFO] [Windows Defender] expired [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ccminer [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_hsrneoscrypt [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_CryptoDredge [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_trex [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_NBMiner [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_miniZ [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_Kawpowminer [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_TTMiner [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ZEnemy [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ccminer_CryptoNight [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ethminer_OCL [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ethminer_CUDA [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_mkxminer [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_teamredminer [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_lolMiner [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_lolMinerBEAM [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_cpuminer_opt [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_nheqminer_CPU [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_nheqminer_CUDA [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_eqm_CUDA [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ClaymoreZcash [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ClaymoreNeoscrypt [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ClaymoreCryptoNight [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_XmrigAMD [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_XmrigNVIDIA [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_WildRig [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_SRBMiner [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_OptiminerZcash [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_excavator [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_ClaymoreDual [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_Phoenix [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_EWBF [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_Nanominer [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_GMiner [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_Bminer [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_Xmrig [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_CastXMR [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_lyclMiner [2021-06-08 05:16:32] [INFO] [ExtraLaunchParameters] Creating internal params config MinerOptionPackage_dstm [2021-06-08 05:16:32] [INFO] [ComputeDeviceManager.Query] QueryVideoControllers: Win32_VideoController detected: Name NVIDIA GeForce GTX 1070 Description NVIDIA GeForce GTX 1070 Manufacturer ASUS (1043) PNPDeviceID PCI\VEN_10DE&DEV_1B81&SUBSYS_85DB1043&REV_A1\4&2BFC19AD&0&000B DeviceID VideoController2 DriverVersion 27.21.14.5751 Status OK InfSection Section094 AdapterRAM 4293918720 Win32_VideoController detected: Name NVIDIA GeForce GTX 1070 Description NVIDIA GeForce GTX 1070 Manufacturer ASUS (1043) PNPDeviceID PCI\VEN_10DE&DEV_1B81&SUBSYS_85A01043&REV_A1\4&384B6BB9&0&0019 DeviceID VideoController3 DriverVersion 27.21.14.5751 Status OK InfSection Section094 AdapterRAM 4293918720 Win32_VideoController detected: Name NVIDIA GeForce GTX 650 Description NVIDIA GeForce GTX 650 Manufacturer Gigabyte (1458) PNPDeviceID PCI\VEN_10DE&DEV_0FC6&SUBSYS_35681458&REV_A1\4&2A522381&0&0019 DeviceID VideoController4 DriverVersion 27.21.14.5751 Status OK InfSection Section004 AdapterRAM 1073741824 Win32_VideoController detected: Name NVIDIA GeForce GTX 1070 Description NVIDIA GeForce GTX 1070 Manufacturer ASUS (1043) PNPDeviceID PCI\VEN_10DE&DEV_1B81&SUBSYS_85DC1043&REV_A1\4&1E02D175&0&000B DeviceID VideoController5 DriverVersion 27.21.14.5751 Status OK InfSection Section094 AdapterRAM 4293918720 Win32_VideoController detected: Name NVIDIA GeForce GTX 1070 Description NVIDIA GeForce GTX 1070 Manufacturer ASUS (1043) PNPDeviceID PCI\VEN_10DE&DEV_1B81&SUBSYS_85A01043&REV_A1\6&1FE67AA1&0&00180209 DeviceID VideoController6 DriverVersion 27.21.14.5751 Status OK InfSection Section094 AdapterRAM 4293918720
[2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] HasNvidiaVideoController: True [2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] Adding NVML to PATH='C:\Program Files\NVIDIA Corporation\NVSMI' [2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] NVSMI Error: GPUIsLost [2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] QueryCudaDevices START [2021-06-08 05:16:33] [INFO] [NVAPI] Found handle for busid 66 [2021-06-08 05:16:33] [INFO] [NVAPI] Bus ID get failed with status: NVIDIA_DEVICE_NOT_FOUND [2021-06-08 05:16:33] [INFO] [NVAPI] Found handle for busid 9 [2021-06-08 05:16:33] [INFO] [NVAPI] Found handle for busid 10 [2021-06-08 05:16:33] [INFO] [NVAPI] Found handle for busid 65 [2021-06-08 05:16:33] [INFO] [NVML] System.Exception: NVML init failed with code GPUIsLost в NiceHashMiner.Devices.ComputeDeviceManager.Query.Nvidia.QueryCudaDevices() в D:\NiceHashMinerLegacy\NiceHashMinerLegacy\NiceHashMiner\Devices\ComputeDeviceManager.cs:строка 959 [2021-06-08 05:16:33] [INFO] [GPU MEMORY: ] 8589934592 bytes - GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [GPU MEMORY: ] 8589934592 bytes - GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [GPU MEMORY: ] 8589934592 bytes - GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [GPU MEMORY: ] 1073741824 bytes - GeForce GTX 650 [2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] CudaDevicesDetection: ADDED device: ID: 0 pciBusID: 9 NAME: GeForce GTX 1070 MANUFACTURER: ASUS (1043) VENDOR: ASUS UUID: GPU-3bb7ad41-fa5e-913c-e21a-b2ac589b7309 Monitor: 0 MEMORY: 8589934592 ETHEREUM: YES ADDED device: ID: 1 pciBusID: 10 NAME: GeForce GTX 1070 MANUFACTURER: ASUS (1043) VENDOR: ASUS UUID: GPU-1a24743d-6f1c-707f-57af-ff286eedd4bd Monitor: 0 MEMORY: 8589934592 ETHEREUM: YES ADDED device: ID: 2 pciBusID: 65 NAME: GeForce GTX 1070 MANUFACTURER: ASUS (1043) VENDOR: ASUS UUID: GPU-51be13ca-8b7f-6194-a948-c742dfd1cb8f Monitor: 0 MEMORY: 8589934592 ETHEREUM: YES ADDED device: ID: 3 pciBusID: 66 NAME: GeForce GTX 650 MANUFACTURER: Gigabyte (1458) VENDOR: Gigabyte UUID: GPU-38e35ef4-5685-9d0f-d3ed-162c4bcb67e2 Monitor: 0 MEMORY: 1073741824 ETHEREUM: NO
[2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] QueryCudaDevices END [2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] Skipping AMD device detection, settings set to disabled [2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] Cuda NVIDIA/CUDA device count BAD!!! [2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] AMD GPU device count GOOD [2021-06-08 05:16:33] [INFO] [NVIDIA driver] [2021-06-08 05:16:33] [INFO] [QueryDevices] ID: 0 BusID: 9 IDByBus: -1 Index: 0 lolMinerBusID:-1 GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [QueryDevices] ID: 1 BusID: 10 IDByBus: -1 Index: 1 lolMinerBusID:-1 GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [QueryDevices] ID: 2 BusID: 65 IDByBus: -1 Index: 2 lolMinerBusID:-1 GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [QueryDevices] ID: 3 BusID: 66 IDByBus: -1 Index: 3 lolMinerBusID:-1 GeForce GTX 650 [2021-06-08 05:16:33] [INFO] [ComputeDeviceManager.Query] virtual memory size GOOD [2021-06-08 05:16:33] [INFO] [GPU MEMORY: ] 8589934592 bytes - GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [GPU MEMORY: ] 8589934592 bytes - GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [GPU MEMORY: ] 8589934592 bytes - GeForce GTX 1070 [2021-06-08 05:16:33] [INFO] [GPU MEMORY: ] 1073741824 bytes - GeForce GTX 650 [2021-06-08 05:16:33] [INFO] [NICEHASH] Setting environment variables [2021-06-08 05:16:33] [INFO] [NvidiaGPUGetDataHost] Starting OK [2021-06-08 05:16:34] [INFO] [NICEHASH] Trying to enable/disable Windows error reporting [2021-06-08 05:16:34] [INFO] [NICEHASH] Current DontShowUI value: 1 [2021-06-08 05:16:34] [INFO] [GITHUB] Check new version [2021-06-08 05:16:34] [INFO] [GITHUB] Current version: 38 [2021-06-08 05:16:34] [INFO] [GITHUB] Current build: 20210606.112908 [2021-06-08 05:16:35] [INFO] [GITLAB] Fork_Fix_38 [2021-06-08 05:16:36] [INFO] [GITHUB] GITHUB Version: 38 [2021-06-08 05:16:36] [INFO] [GITHUB] GITHUB Build: 20210531.064908 [2021-06-08 05:16:36] [INFO] [GITLAB] GITLAB Version: 38 [2021-06-08 05:16:36] [INFO] [NHSMA] Try initialize SMA [2021-06-08 05:16:36] [INFO] [SOCKET] Using previous SMA [2021-06-08 05:16:36] [INFO] [SOCKET-address:] wss://nhmws.nicehash.com/v3/nhml [2021-06-08 05:16:36] [INFO] [SOCKET] Connecting [2021-06-08 05:16:36] [INFO] [SOCKET] 06/08/2021 05:16:36|Warn |Logger.set_Output:181|The current output action has been changed. [2021-06-08 05:16:36] [INFO] [SOCKET] 06/08/2021 05:16:36|Debug|WebSocket.sendHttpRequest:2056|A request to the server: GET /v3/nhml HTTP/1.1 User-Agent: websocket-sharp/1.0 Host: nhmws.nicehash.com Upgrade: websocket Connection: Upgrade Sec-WebSocket-Key: IGwAekd6dnjaPXQMb4bCuQ== Sec-WebSocket-Version: 13 [2021-06-08 05:16:36] [INFO] [SOCKET] 06/08/2021 05:16:36|Debug|WebSocket.sendHttpRequest:2058|A response to this request: HTTP/1.1 101 Switching Protocols Date: Tue, 08 Jun 2021 02:16:36 GMT Connection: upgrade Upgrade: websocket Sec-WebSocket-Accept: pXLZh3ydyQnNNCEc8O5QRLXKNy0= CF-Cache-Status: DYNAMIC cf-request-id: 0a8b016164000023139c969000000001 Expect-CT: max-age=604800, report-uri="https://report-uri.cloudflare.com/cdn-cgi/beacon/expect-ct" Strict-Transport-Security: max-age=15552000; includeSubDomains Server: cloudflare CF-RAY: 65be9e7bdbb72313-KBP alt-svc: h3-27=":443"; ma=86400, h3-28=":443"; ma=86400, h3-29=":443"; ma=86400, h3=":443"; ma=86400 [2021-06-08 05:16:36] [INFO] [SOCKETNEW] Sending data: {"method":"login","version":"NHM/3.0.5.6","protocol":3,"btc":"---","worker":"R3","group":"","rig":"0-lNjZO3--OVSCdCUUKIis-g"} [2021-06-08 05:16:37] [INFO] [NVAPI] Bus ID get failed with status: NVIDIA_DEVICE_NOT_FOUND [2021-06-08 05:16:37] [INFO] [NVAPI] Found handle for busid 9 [2021-06-08 05:16:37] [INFO] [NVAPI] Bus ID get failed with status: NVIDIA_DEVICE_NOT_FOUND [2021-06-08 05:16:37] [INFO] [NVAPI] Found handle for busid 10 [2021-06-08 05:16:37] [INFO] [NVAPI] Bus ID get failed with status: NVIDIA_DEVICE_NOT_FOUND [2021-06-08 05:16:37] [INFO] [NVAPI] Found handle for busid 65 [2021-06-08 05:16:37] [INFO] [NVAPI] Found handle for busid 66
|
|
|
|
angelbbs (OP)
|
|
June 08, 2021, 04:24:45 AM |
|
Давно хотел посмотреть, как работает опция рестарта драйвера при потере CUDA GPU. На этом же риге с дополнительной немайнинговой карточкой наконец-то смоделировалась подходящая ситуация и, похоже, опция не очень работает. На ходу прямо под форкфиксом с включенной опцией сломать одну из карт пока не удалось (но, вероятно, удастся), а при уже подвисшей карточке программа на старте ругается, что один из GPU сдох, но ничего не предпринимает.
Опцию рестарта драйвера только включил; без неё при умирании карточки перестаёт совпадать нумерация карт в форкфиксе (в нём она не меняется, будто ничего не произошло) и в майнерах. В результате, к примеру, тирекс больше не может стартовать, т.к. не может применить на 650 memtweak, предназначенный для 1070, а нбмайнер выругивается на четвёртую карту (которая в форкфиксе при этом пятая и отключена), но работает на трёх.
Добавил рестарт драйвера или системы при запуске программы, при включенной опции https://mark.nl.tab.digital/s/7tBFXz4rBPG7KE6
|
|
|
|
Kringel
Jr. Member
Offline
Activity: 151
Merit: 7
|
|
June 08, 2021, 06:26:35 AM |
|
Спасибо. Заменил, понаблюдаю (подвисание карты там вызывается внешним событием (кратковременным пропаданием инета, как ни странно), поэтому время тестирования не вполне детерминировано).
|
|
|
|
niask
Jr. Member
Offline
Activity: 58
Merit: 1
|
|
June 08, 2021, 05:13:43 PM |
|
Добрый день. На 38-й версии вот такое окно появляется при запуске: пока "Продолжить" не нажму - загрузка программы не идёт, если нажать - всё ок, но в настройках поломаны вкладки. В 37.1 такая же ошибка была, но там хотя бы загрузка сама дальше шла без нажатия на кнопку... ОС: Win7x64 со всеми обновлениями.
|
|
|
|
angelbbs (OP)
|
|
June 08, 2021, 07:06:47 PM Last edit: June 08, 2021, 08:00:40 PM by angelbbs |
|
Добрый день. На 38-й версии вот такое окно появляется при запуске: пока "Продолжить" не нажму - загрузка программы не идёт, если нажать - всё ок, но в настройках поломаны вкладки. В 37.1 такая же ошибка была, но там хотя бы загрузка сама дальше шла без нажатия на кнопку... ОС: Win7x64 со всеми обновлениями. Всё, что в окне, где написано "Подробная информация.." скопируйте и пришлите мне. upd: Подсказали, что это происходит при классической теме windows 7. Исправлено https://mark.nl.tab.digital/s/7tBFXz4rBPG7KE6
|
|
|
|
kansv
Newbie
Offline
Activity: 16
Merit: 0
|
|
June 08, 2021, 07:26:33 PM |
|
Вышеуказанная проблема возникает при использовании Классической темы оформления Windows.
|
|
|
|
angelbbs (OP)
|
|
June 08, 2021, 07:35:58 PM |
|
Вышеуказанная проблема возникает при использовании Классической темы оформления Windows.
О как! Спасибо, поправлю
|
|
|
|
Kringel
Jr. Member
Offline
Activity: 151
Merit: 7
|
|
June 08, 2021, 08:34:19 PM Last edit: June 08, 2021, 09:01:10 PM by Kringel |
|
Не, не получается у неё самолечение при потере GPU, скорее наоборот. Сначала фиксируются множественные ошибки "[NVAPI] Tach get failed with status: NVIDIA_DEVICE_NOT_FOUND", потом перезапускается NvidiaGPUGetDataHost и теряется отображённый файл для доступа к нему, затем и вовсе проскакивают какие-то исключения по выходу индекса за пределы массива; доступ к данным с майнера тоже теряется. В итоге получаем форкфикс со сломанным мониторингом, слепо перезапускающий в цикле майнер, который и не прочь был бы работать на оставшихся картах. Логи: https://www.mediafire.com/file/9x2gw3cgxx41y3q/NHMLFF.GPU_LOSS.zip/fileПерезапуска драйвера не происходит. Точнее, иногда вроде бы происходит, но очень не сразу (примерно через час плюс-минус час, точнее не скажу). Толку от перезапуска драйвера, как оказалось, всё равно нет, т.к. карту он к жизни не возвращает, разве что синхронизирует список карт в форкфиксе с новой реальностью (вроде бы).
|
|
|
|
angelbbs (OP)
|
|
June 08, 2021, 09:54:34 PM Last edit: June 08, 2021, 10:11:09 PM by angelbbs |
|
Не, не получается у неё самолечение при потере GPU, скорее наоборот. Сначала фиксируются множественные ошибки "[NVAPI] Tach get failed with status: NVIDIA_DEVICE_NOT_FOUND", потом перезапускается NvidiaGPUGetDataHost и теряется отображённый файл для доступа к нему, затем и вовсе проскакивают какие-то исключения по выходу индекса за пределы массива; доступ к данным с майнера тоже теряется. В итоге получаем форкфикс со сломанным мониторингом, слепо перезапускающий в цикле майнер, который и не прочь был бы работать на оставшихся картах. Логи: https://www.mediafire.com/file/9x2gw3cgxx41y3q/NHMLFF.GPU_LOSS.zip/fileПерезапуска драйвера не происходит. Точнее, иногда вроде бы происходит, но очень не сразу (примерно через час плюс-минус час, точнее не скажу). Толку от перезапуска драйвера, как оказалось, всё равно нет, т.к. карту он к жизни не возвращает, разве что синхронизирует список карт в форкфиксе с новой реальностью (вроде бы). Если карта дохлая, то какие претензии к программе? Судя по логам, карту вытащили из райзера или pci-e на ходу. Сложно ожидать адекватной реакции программы в таком случае.
|
|
|
|
Kringel
Jr. Member
Offline
Activity: 151
Merit: 7
|
|
June 08, 2021, 11:44:50 PM |
|
Если карта дохлая, то какие претензии к программе? Судя по логам, карту вытащили из райзера или pci-e на ходу. Сложно ожидать адекватной реакции программы в таком случае.
Программа попытками улучшить ситуацию окончательно закапывает себя в яму, при этом все вокруг продолжают работать (Afterburner, LibreHardwareMonitor, майнеры, в конце концов). Кроме того, ошибка NVIDIA_DEVICE_NOT_FOUND не трактуется как потеря GPU с ожидаемым исходя из выставленных настроек действием, вместо этого начинается что-то непонятное. А карта нормальная, просто у той конфигурации (Threadripper со своими фактически двумя процессорами и несколькими PCIE контроллерами, несколько 1070 плюс одна недокарта) на днях обнаружилась интересная особенность: стоит пропасть на какое-то время интернету при работающем trex или nbminer (под другими не проверял) – почти гарантированно отлетает первая карта (лечится только перезагрузкой), не имеет значения какой именно экземпляр 1070 на её место воткнуть или какой райзер с каким кабелем использовать. Пока с инетом было всё в порядке, оно работало неделями или месяцами, не требуя внимания. Подумал, что опция рестарта драйвера при потере карты не просто так добавлена, затестировал, вот ) Наверное, ситуация полечится обновленим видеодрайвера на свежий (но подтекающий) или избавлением от 650.
|
|
|
|
angelbbs (OP)
|
|
June 09, 2021, 02:31:08 AM |
|
Если карта дохлая, то какие претензии к программе? Судя по логам, карту вытащили из райзера или pci-e на ходу. Сложно ожидать адекватной реакции программы в таком случае.
Программа попытками улучшить ситуацию окончательно закапывает себя в яму, при этом все вокруг продолжают работать (Afterburner, LibreHardwareMonitor, майнеры, в конце концов). Кроме того, ошибка NVIDIA_DEVICE_NOT_FOUND не трактуется как потеря GPU с ожидаемым исходя из выставленных настроек действием, вместо этого начинается что-то непонятное. Ну не надо сказки рассказывать, ничего там работать не может. Ошибка [NVAPI] Tach get failed with status: NVIDIA_DEVICE_NOT_FOUND генерится драйвером. Программа просто транслирует ошибку драйвера в лог.
|
|
|
|
Kringel
Jr. Member
Offline
Activity: 151
Merit: 7
|
|
June 09, 2021, 03:34:09 AM |
|
Программа попытками улучшить ситуацию окончательно закапывает себя в яму, при этом все вокруг продолжают работать (Afterburner, LibreHardwareMonitor, майнеры, в конце концов). Кроме того, ошибка NVIDIA_DEVICE_NOT_FOUND не трактуется как потеря GPU с ожидаемым исходя из выставленных настроек действием, вместо этого начинается что-то непонятное.
Ну не надо сказки рассказывать, ничего там работать не может. Ошибка [NVAPI] Tach get failed with status: NVIDIA_DEVICE_NOT_FOUND генерится драйвером. Программа просто транслирует ошибку драйвера в лог. О, вот оно как. Мне что, видео снимать, как LHM продолжает работать, просто переставая обновлять данные по выпавшей карте, как Afterburner продолжает работать, просто показывая сломавшуюся карту в списке как пустое место, как майнеры продолжают работу после рестарта, просто не видя эту карту? Да и сам форкфикс, если его перезапустить с рестартом драйвера, забывает про эту карту и вполне снова работает. Давайте может вы мне не будете сказки рассказывать, что с этой ситуацией невозможно справиться, сохранив какую-то функциональность и минимизировав ущерб? И что единственный выход для программы при такой ошибке – это красиво развалиться в несколько этапов на части? Подумал, что опция рестарта драйвера при потере карты не просто так добавлена, затестировал, вот
Я уже понял, что предположение было ошибочным. Ну починю как обычно, снаружи, не впервой.
|
|
|
|
niask
Jr. Member
Offline
Activity: 58
Merit: 1
|
|
June 10, 2021, 02:12:12 PM |
|
Спасибо, теперь всё хорошо.
|
|
|
|
|