needbmw (OP)
Legendary
Offline
Activity: 1302
Merit: 1008
|
|
September 27, 2013, 06:58:58 PM |
|
Кто может прояснить суть strange решений или HW ошибок, более-менее развернуто? Мне интересно, как в целом эта ситуация алгоритмически обрабатывается: чипу дается второй шанс на выполнение задания, или задание вообще вылетает?
а вот хобот её знает. я переделал подсчет HW ошибок (теперь считает всё), и их реально очень много, почти 80%. вопрос почему.
|
NO PSAKING!
|
|
|
HappyS
Legendary
Offline
Activity: 1568
Merit: 1008
|
|
September 27, 2013, 07:14:13 PM |
|
Выложил. http://mirrors.linuxoid.in/misc/asic/metabank.asic.rpi.2013.09.26.01.img.xzПроверьте кто-то на "чистовом" запуске - работу веб-морды, доступ по ssh и тому подобное. Вроде все работает, но мало ли. Раскатать сейчас образ на чистую флешку, загрузить с нее ASIC и выполнить "обычные пользовательские действия по настройке" сейчас нет возможности. И да, раз уж такое дело пошло - нам бы выпилиться в отдельную тему... Респект тебе. Залил на флешку - зашел на веб морду вбил пул и заебись. Никакой ебли. Спасибо. А как запускать то, автостарт есть? да вообще вроде ничего не надо кроме как пул настроить.
|
Нам нужны ботинки для гольфа, иначе мы отсюда не выберемся. 13H5Cu9ixeud7kiD52mDXrR7NWgc2PERdJ
|
|
|
alpet
Legendary
Offline
Activity: 1912
Merit: 1020
|
|
September 27, 2013, 07:18:16 PM |
|
а вот хобот её знает. я переделал подсчет HW ошибок (теперь считает всё), и их реально очень много, почти 80%. вопрос почему.
Обновишь на github? У меня пока подозрение падает, что число таких решений зависит от частоты опроса чипов. Если она слишком чрезмерная, то счет или сбивается, или ещё что-то происходит. Например, в своем форке я добавил между опросом каждого чипа паузу в 500 мкс, и HW упало с 50% к 34% примерно. Сейчас порядка 5Гх выигрываю на устройстве с вольтмодом, только из-за более частого внеочередного опроса "хороших" чипов. Думаю из-за HW просто не получается все опросы за 480 мс своевременно провести, поэтому готовых чипов (у которых job_switched != 0) к моменту опроса довольно большое количество. А с таким флагом надо думать, если чип ждет ещё сколько-то мс, он может и второе задание решить - запросто опять переключит буфера. Так что гипотеза сейчас такая, свести время опроса каждого чипа к оптимуму, чтобы успевать и не торопить одновременно )
|
|
|
|
Integ
Legendary
Offline
Activity: 1036
Merit: 1010
!
|
|
September 27, 2013, 07:20:14 PM Last edit: September 27, 2013, 07:31:39 PM by Integ |
|
Залил еще на один майнер сборку от willrain и провел пару экспериментов.
В этом майнере чип 8_4 вечно болтался около 0.5Гх или вообще выпадал. Так он и повел себя с bfg. Я стал наблюдать и вот оно долгожданное - chip 8:4 reinit to 54... Дальше самое интересное - чип заработал как подорванный, 2.7Гх стабильно и ни одного hw больше уже полчаса как.
Собственно эксперимент - на другом аппарате с 11 платами, который сыпал 60% и выше hw на первых слотах, я стал последовательно вынимать платки второго ряда. С каждой вынутой % HW уменьшался, но не напротив убранных, что могло бы говорить о перегреве, а "в целом по больнице". Когда осталось 8 плат первого ряда, статистика позеленела. Также в этом майнере есть "веселый" чип 9_3, который также быстро скатился на 0.2Гх и был переинициализирован. Дальше стабильная работа на 2.8Гх, правда, в отличие от 8_4, редкие HW проскакивают. Перед реинитом их было больше 90%, сейчас около 10%.
А теперь ложка дегтя - хотя форк bfg от needbmw и не течет, хешрейт за сутки просаживается где-то 0.7-1Гх на плату. Перезапуск решает проблему.
Мораль - автоподнималку надо настроить хотя бы на 2Гх. Я бы настроил вообще на 2.4.
|
Если Вы давно собирались отправить мне деньги, но боялись предложить - у Вас есть шанс сделать это! - гокс кинул меня на 31248 сатоши! 1NiWhDiKGfyWj4EoJXDLm1J3SXsZSjUCjB (получено, спасибо! )))
|
|
|
needbmw (OP)
Legendary
Offline
Activity: 1302
Merit: 1008
|
|
September 27, 2013, 07:29:29 PM |
|
а вот хобот её знает. я переделал подсчет HW ошибок (теперь считает всё), и их реально очень много, почти 80%. вопрос почему.
Обновишь на github? не, ни к чему это, экспериментальная очень сборка получается. посмотри нашу дискуссию с bee7 на 21 странице, просто раньше счетчик HW инкрементировался если не было найдено ни одного живого нонса в буфере, а сейчас я его инкременирую для каждого плохого nonce.
|
NO PSAKING!
|
|
|
Grumlin
Legendary
Offline
Activity: 2893
Merit: 1158
|
|
September 27, 2013, 07:36:01 PM |
|
Залил еще на один майнер сборку от willrain и провел пару экспериментов.
В этом майнере чип 8_4 вечно болтался около 0.5Гх или вообще выпадал. Так он и повел себя с bfg. Я стал наблюдать и вот оно долгожданное - chip 8:4 reinit to 54... Дальше самое интересное - чип заработал как подорванный, 2.7Гх стабильно и ни одного hw больше уже полчаса как.
Собственно эксперимент - на другом аппарате с 11 платами, который сыпал 60% и выше hw на первых слотах, я стал последовательно вынимать платки второго ряда. С каждой вынутой % HW уменьшался, но не напротив убранных, что могло бы говорить о перегреве, а "в целом по больнице". Когда осталось 8 плат первого ряда, статистика позеленела. Также в этом майнере есть "веселый" чип 9_3, который также быстро скатился на 0.2Гх и был переинициализирован. Дальше стабильная работа на 2.8Гх, правда, в отличие от 8_4, редкие HW проскакивают. Перед реинитом их было больше 90%, сейчас около 10%.
А теперь ложка дегтя - хотя форк bfg от needbmw и не течет, хешрейт за сутки просаживается где-то 0.7-1Гх на плату. Перезапуск решает проблему.
Мораль - автоподнималку надо настроить хотя бы на 2Гх. Я бы настроил вообще на 2.4.
вот, меняй наздоровье, как изменить исходники, сделай make, и всё зы. я себе сделал 110, посчитал 1.54 гх нормой
|
|
|
|
alpet
Legendary
Offline
Activity: 1912
Merit: 1020
|
|
September 27, 2013, 07:37:50 PM |
|
needbmw Правильно я понял, что нужно инкрементировать счетчик ошибок, если found < 3 в конце проверки?
Похоже на 15 платах стабилизировался хэш-рейт, без вольтмода плавает 315-318Гх... надо ещё поколдовать задержки.
|
|
|
|
needbmw (OP)
Legendary
Offline
Activity: 1302
Merit: 1008
|
|
September 27, 2013, 07:45:02 PM |
|
needbmw Правильно я понял, что нужно инкрементировать счетчик ошибок, если found < 3 в конце проверки?
я инкрементирую, если possible nonce был считан из буфера, но не подошел ни под одну проверку. но это пока просто чтобы понять с чем имеем дело, может и не надо так считать.
|
NO PSAKING!
|
|
|
willrain
|
|
September 27, 2013, 08:29:59 PM |
|
HappyS, ага... Только это, там с того же дня второй вариант валяется. В принципе, ничего серьезного - убрана ошибка с подгрузкой модулей, чисто косметика. Если все работает - то качать не обязательно.
|
|
|
|
Integ
Legendary
Offline
Activity: 1036
Merit: 1010
!
|
|
September 28, 2013, 12:48:15 AM Last edit: September 28, 2013, 02:27:43 AM by Integ |
|
если после реинита хэшрейт этого чипа не поднимется, попробуй уменьшить частоту его генератора (53, 52 бита), иногда это дает положительный результат. можешь попробовать и увеличить до 55 и даже 56, но скорее всего это ни к чему хорошему не приведет.
подскажи, где что менять индивидуально для чипа.
|
Если Вы давно собирались отправить мне деньги, но боялись предложить - у Вас есть шанс сделать это! - гокс кинул меня на 31248 сатоши! 1NiWhDiKGfyWj4EoJXDLm1J3SXsZSjUCjB (получено, спасибо! )))
|
|
|
bee7
|
|
September 28, 2013, 04:17:22 AM |
|
Кто может прояснить суть strange решений или HW ошибок, более-менее развернуто? Мне интересно, как в целом эта ситуация алгоритмически обрабатывается: чипу дается второй шанс на выполнение задания, или задание вообще вылетает?
а вот хобот её знает. я переделал подсчет HW ошибок (теперь считает всё), и их реально очень много, почти 80%. вопрос почему. Эти то не учитываете как ошибки? if ((pn & 0xFFC00000) == 0xDF800000) continue;
|
|
|
|
needbmw (OP)
Legendary
Offline
Activity: 1302
Merit: 1008
|
|
September 28, 2013, 04:33:42 AM |
|
если после реинита хэшрейт этого чипа не поднимется, попробуй уменьшить частоту его генератора (53, 52 бита), иногда это дает положительный результат. можешь попробовать и увеличить до 55 и даже 56, но скорее всего это ни к чему хорошему не приведет.
подскажи, где что менять индивидуально для чипа. давно уже с командной строки задаются - реализована опция командной строки --bitfury-clockbits для настройки фиксированных индивидуальных клок-битов без перекомпиляции.
формат: --bitfury-clockbits={global},{slot1}:{chip1}:{bits1},{slot2}:{chip2}:{bits2},... примеры: --bitfury-clockbits=54 - всем чипам установить 54 бита --bitfury-clockbits=54,0:4:53,1:2:52 - всем чипам 54, кроме слот 0 чип 4 53 бита, и слот 1 чип 2 52 бита и т.д., если опущен первый глобальный параметр он принимает значение 54 по умолчанию.
|
NO PSAKING!
|
|
|
needbmw (OP)
Legendary
Offline
Activity: 1302
Merit: 1008
|
|
September 28, 2013, 04:48:44 AM |
|
Эти то не учитываете как ошибки? if ((pn & 0xFFC00000) == 0xDF800000) continue; я сейчас вообще полностью изменил процесс обработки possible nonce. хуже не стало, стало ли лучше - разбираюсь.. с HW ошибками странная картина - их количество пляшет от запуска к запуску, и хэшрейт немного тоже. т.е. запускаю, 5-10 минут поработало, HW > 80% -> перезагружаю, поработало, HW<30% и хэшрейт подрастает на 1-2Гх/c. почему так пока непонятно
|
NO PSAKING!
|
|
|
Integ
Legendary
Offline
Activity: 1036
Merit: 1010
!
|
|
September 28, 2013, 07:48:28 AM |
|
давно уже с командной строки задаются - реализована опция командной строки --bitfury-clockbits для настройки фиксированных индивидуальных клок-битов без перекомпиляции.
формат: --bitfury-clockbits={global},{slot1}:{chip1}:{bits1},{slot2}:{chip2}:{bits2},... примеры: --bitfury-clockbits=54 - всем чипам установить 54 бита --bitfury-clockbits=54,0:4:53,1:2:52 - всем чипам 54, кроме слот 0 чип 4 53 бита, и слот 1 чип 2 52 бита и т.д., если опущен первый глобальный параметр он принимает значение 54 по умолчанию. О, спс, я это пропустил, буду пробовать. Если не вручную, а в автозагрузку, куда пихать?
|
Если Вы давно собирались отправить мне деньги, но боялись предложить - у Вас есть шанс сделать это! - гокс кинул меня на 31248 сатоши! 1NiWhDiKGfyWj4EoJXDLm1J3SXsZSjUCjB (получено, спасибо! )))
|
|
|
Integ
Legendary
Offline
Activity: 1036
Merit: 1010
!
|
|
September 28, 2013, 07:56:38 AM |
|
блин, не запустишь это из командной строки, только как параметр при рестарте cgminer, видимо?
|
Если Вы давно собирались отправить мне деньги, но боялись предложить - у Вас есть шанс сделать это! - гокс кинул меня на 31248 сатоши! 1NiWhDiKGfyWj4EoJXDLm1J3SXsZSjUCjB (получено, спасибо! )))
|
|
|
willrain
|
|
September 28, 2013, 07:58:22 AM |
|
А ты на ходу хотел, что ли? Можно и при ручном запуске, и правкой стартовых скриптов
|
|
|
|
Integ
Legendary
Offline
Activity: 1036
Merit: 1010
!
|
|
September 28, 2013, 08:01:50 AM Last edit: September 28, 2013, 08:19:17 AM by Integ |
|
А ты на ходу хотел, что ли? Можно и при ручном запуске, и правкой стартовых скриптов
да, на ходу, рестарт цг не тот эффект
|
Если Вы давно собирались отправить мне деньги, но боялись предложить - у Вас есть шанс сделать это! - гокс кинул меня на 31248 сатоши! 1NiWhDiKGfyWj4EoJXDLm1J3SXsZSjUCjB (получено, спасибо! )))
|
|
|
alpet
Legendary
Offline
Activity: 1912
Merit: 1020
|
|
September 28, 2013, 08:40:44 AM |
|
На ходу вроде через API можно менять.
|
|
|
|
Integ
Legendary
Offline
Activity: 1036
Merit: 1010
!
|
|
September 28, 2013, 09:18:07 AM |
|
клок 53 и 55 для слабых чипов (=< 2Гх) особого эффекта не дало, 55 оказалось даже предпочтительнее. Но, конечно, править каждый раз конфиг и рестартить это не вариант. Нужна возможность менять клок "на лету".
|
Если Вы давно собирались отправить мне деньги, но боялись предложить - у Вас есть шанс сделать это! - гокс кинул меня на 31248 сатоши! 1NiWhDiKGfyWj4EoJXDLm1J3SXsZSjUCjB (получено, спасибо! )))
|
|
|
alpet
Legendary
Offline
Activity: 1912
Merit: 1020
|
|
September 28, 2013, 09:26:50 AM |
|
клок 53 и 55 для слабых чипов (=< 2Гх) особого эффекта не дало, 55 оказалось даже предпочтительнее. Но, конечно, править каждый раз конфиг и рестартить это не вариант. Нужна возможность менять клок "на лету".
Когда-то я тоже так думал, что возможности для оперативного вмешательства нужны. Сделал автоподбор брутфорсом даже. Но сейчас, все идет к тому, что каждый чип надо на другой частоте гонять часами, и собирать статистику производительности. Только тогда переключение может оказаться оправданным...
|
|
|
|
|