Bitcoin Forum
June 24, 2024, 04:38:50 PM *
News: Latest Bitcoin Core release: 27.0 [Torrent]
 
   Home   Help Search Login Register More  
Pages: « 1 2 3 [4] 5 »  All
  Print  
Author Topic: /идейка/ эмулятор CPU на GPGPU  (Read 7519 times)
SHawk
Sr. Member
****
Offline Offline

Activity: 658
Merit: 250


View Profile
October 10, 2012, 05:23:42 PM
 #61


вообще насчет общего случая и речи не было - а в SHA точно приводит тк там выбран такой метод реализации
насчет общего случая - вопрос интересный, IMHO скорее всего тоже, но проверять лень Wink
а в SHA совершенно точно информация теряется - что облегчает перебор


Че ты юлишь? Все твои утверждения в форуме прописаны и разобраны мной на цитаты. Перечитай.
Когда ты говорил "она не будет криптографической" - ты о SHA, что ли, говорил или, все же, о другой какой-то функции?

а ты богатый? Wink
Да.

намекну немного - в SHA нелинейность достигается функциями с потерей информации,

Засунь свои намеки себе в то место, которым ты думаешь ("чуешь")...
Мне твои намеки не нужны - я знаю, что такое нелинейность и чем она достигается. Ты же, явно, не знаешь, что и демонстрируешь своим бредом.


Поэтому ни один хоть немного умный человек ни в каком бреду не рискнет утверждать, что у функции SHA из 2**160 выходных значений есть недостижимые.

ну во-первых для одинарной SHA это еще надо проверять,
а во-вторых там двойная - а вот у двойной такие комбинации будут уже наверняка!  (хоть и не 100% конечно)

Как этого можно не понимать?..

Ты опять думаешь своей "Ж".
"а во-вторых там двойная" - это ты что имел ввиду?
Двойная функция SHA256 используется для... угадай чего?
Одинарная функция SHA1 используется для... еще раз угадай?
А теперь угадай, о каком из вариантов ты говорил, когда вопрошал "Кстати, в биткойне если допустим тупо перебрать все эти 160 бит(для ускоренных алгоритмов это возможно), то это приведет к взлому кошелька(или платежа?)"?


PS  кстати теоретически для любого кода можно построить полную таблицу, и ломать за 1 такт.

Спорим на щелбан, что это невозможно?
Хотя, да, спорить ты трусишь...
1. Во всей вселенной нет возможности сохранить 2**160 состояний.
2. Среди 2**160 состояний ты за один такт НИЧЕГО НЕ НАЙДЕШЬ!
tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 10, 2012, 05:55:17 PM
 #62

Когда ты говорил "она не будет криптографической" - ты о SHA, что ли, говорил или, все же, о другой какой-то функции?

да не применить тут другие!  Специфика биткойна панимаешь такая...

Ну то есть попутать биты или еще чего такого конечно возможно - но проблема в том что эту функцию
должны знать все, а это экв ключу.  То есть такие функции в применениях как в биткойне вообще ломаются
за 1 раз без всякого перебора...


Спорим на щелбан, что это невозможно?
Хотя, да, спорить ты трусишь...
1. Во всей вселенной нет возможности сохранить 2**160 состояний.
2. Среди 2**160 состояний ты за один такт НИЧЕГО НЕ НАЙДЕШЬ!

тут и терабайт нормальной памяти не найдешь, дак и что с того?..

Принцип вполне рабочий.
(если бы думал дальше как математик - многое бы понял.
А физ реализуемость никого не волнует - никто же не собирался так делать.
Принцип выше)

Vladimir
PS  хитрый код можно задать таблицей - самое универсальное.  Но поскольку она известна - ломается сразу.
А если асимметричка - там взломостойкость ниже чем число битов, это неизбежно.
(только XOR не теряет информацию - но он линейный и сразу ломается!..
Больше ты никак не введешь несимметрию, не потеряв информацию и не снизив устойчивость.
По кр мере не на такой простой реализации...)
SHawk
Sr. Member
****
Offline Offline

Activity: 658
Merit: 250


View Profile
October 10, 2012, 06:55:20 PM
 #63


PS  хитрый код можно задать таблицей - самое универсальное.  Но поскольку она известна - ломается сразу.
А если асимметричка - там взломостойкость ниже чем число битов, это неизбежно.
(только XOR не теряет информацию - но он линейный и сразу ломается!..
Больше ты никак не введешь несимметрию, не потеряв информацию и не снизив устойчивость.
По кр мере не на такой простой реализации...)


я не понимаю твоего бреда.

"PS  хитрый код можно задать таблицей - самое универсальное.  Но поскольку она известна - ломается сразу." - ты только что утверждал, что ЛЮБОЙ код (а не только "хитрый") можно задать таблицей. Но что-то ни один общеизвестный криптографический стандарт не "ломается сразу".

"только XOR не теряет информацию" - это неверно.

"Больше ты никак не введешь несимметрию, не потеряв информацию и не снизив устойчивость." - с каких пор мы стали стремиться к "несимметрии" - зачем она нам, я не понимаю...

Почитай на досуге определение термина "асимметричка". Или дай свое определение.

Я тебе еще раз повторяю - существует огромное количество нелинейных функций, не теряющих информацию. И свойства у этих функций самые разные. Такие функции используются повсюду, и в криптографии тоже.

Если ты так уверен в своей позиции - чего ж не споришь?
Только не ной опять про мои деньги, которые тебе не нужны. На щелбан давай поспорим?
naima53
Hero Member
*****
Offline Offline

Activity: 616
Merit: 502



View Profile
October 11, 2012, 02:49:27 PM
 #64

Это конечно все интересно, но моя шапка из фольги краями начала уже проникать в мозг и замыкать  Grin Так вот я начинаю думать что эту тему решили завалить хитрые агенты Инте..ов и АНДов дабы тут не появился какой нибудь гений и не написал код, позволяющий многократно ускорить работу процессоров в прикладных задачах.
 Несколько лет назад мне знакомый передал несколько раровских архивов что бы я попробовал снять с них пароль, на них были важные для него данные. Я примерно знал, как это работает и подумал что если пароли не длинные то чем черт не шутит. Стал искать темы в инете и столкнулся с информацией о Cuda . Переводов почти не было, но это заинтриговало меня. Запустил (уже не помню но не крарк) командный расшифровщик на Нвидии своей и ужаснулся на сколько это быстрее проца! В итоге 2 из 6ти архива открылись с использованием словарей, остальные - забил через неделю подбора. В общем-то так и познакомился с BTC , а вовсе не из за денег, жаль, потому что узнал про него как раз из за того что там началось использование ГПУ, то есть поздно уже было.
 Я понимаю что далеко не все задачи в IBM-PC возможно решать таким гигантским распараллеливанием, но вполне можно многие задачи переложить на ГПУ. Думаю, корпорациям в-общем то не выгодно такой расклад, ведь старое железо получит большое "второе дыхание".

Donate me) 16f6iWHHkVEnDReeBQPT9GwCNwUfPTXrp2
kimmeriets
Legendary
*
Offline Offline

Activity: 1064
Merit: 1000


View Profile
October 12, 2012, 05:15:23 AM
 #65

Слушай, балбес, у меня высшее математическое образование
Перельман, ты?
tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 16, 2012, 01:50:33 PM
 #66



Кстати, а сколько аппаратный майнер занимает лог. элементов(или транзисторов) ?
SHawk
Sr. Member
****
Offline Offline

Activity: 658
Merit: 250


View Profile
October 16, 2012, 05:29:40 PM
 #67



Кстати, а сколько аппаратный майнер занимает лог. элементов(или транзисторов) ?


сделай что-нибудь самостоятельно - ответь на свой вопрос сам:

1. найди на этом форуме или в таблице сравнения оборудования на википедии ту самую ПЛИС фирмы Xilinx, на которой сделано большинство "аппаратных майнеров";
2. сходи на сайт фирмы Xilinx и найди описание этой микросхемы. В нем будет указано количество лог. элементов и условных вентилей (не транзисторов);
3. считай, что ты получил искомое число, т.к. реализация двух конвейеров SHA256 как раз и занимает почти всю микросхему.
tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 20, 2012, 01:02:11 AM
 #68

1. найди на этом форуме или в таблице сравнения оборудования на википедии ту самую ПЛИС фирмы Xilinx, на которой сделано большинство "аппаратных майнеров";
2. сходи на сайт фирмы Xilinx и найди описание этой микросхемы. В нем будет указано количество лог. элементов и условных вентилей (не транзисторов);
3. считай, что ты получил искомое число, т.к. реализация двух конвейеров SHA256 как раз и занимает почти всю микросхему.


1.  Мне в падлу искать по всему интернету где вы (укуренные линуксоиды(tm) Wink ) исходники своих поделок прячите - бывает
   быстрее заново написать, чем что-то найти...   Складывать в одно место(хотя бы ссылки) слабо? Wink

2.  Мне в падлу ковыряться во всяком не документированном Г вроде ксилинкса... 
   (насколько я знаю ни одна из fpga-шных фирм описание внутренней архитектуры кристалла не дает)

   К тому-же если бы ты занимался fpga чуть серьезнее, то знал бы, что ячейки в них бывают разные - иногда
на простой триггер надо 2 ячейки, а иногда там целый чип идет за ячейку(блоки SRAM, АЛУ и тп в новых сериях)...

3.  Судя по аппаратной схеме SHA там надо 256 триггеров на сдвиговый регистр + чуть-чуть логики.
   (итого думаю не более 300 ячеек уровня триггера, а вот сколько это на кремнии х.з.)

Vladimir
PS  да, кстати, еще одна перспективная тема которую можно поднять за счет майнинга - разработка открытых fpga!
Вот такой проект имело бы смысл замутить - тут тираж за счет мелких разработчиков может быть большим...
Есть желание скинуться на такой проект?..
(дальше немного рекламки и китайцы заметят - начнут штамповать на своих фабриках по 10 копеек,
а технологии современные у них есть)
Balthazar
Legendary
*
Offline Offline

Activity: 3108
Merit: 1359



View Profile
October 22, 2012, 06:09:22 PM
 #69

У китайцев давно есть опенсорсные фпга-майнеры.
tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 22, 2012, 07:02:44 PM
 #70

Я имел ввиду не майнеры, а саму fpga матрицу сделать открытой и дешевой.

А уж на готовой матрице не долго сделать хоть майнер хоть что...

То есть майнинг может помоч сделать матрицы дешевыми и открытыми.
SHawk
Sr. Member
****
Offline Offline

Activity: 658
Merit: 250


View Profile
October 26, 2012, 03:30:09 PM
Last edit: October 26, 2012, 03:53:41 PM by SHawk
 #71

я, тут, загорал недельку, так что отсутствовал в теме...

Quote
бывает быстрее заново написать, чем что-то найти

Это ж ты не о себе писал? Сомневаюсь, что ты хоть что-то можешь написать быстрее, чем найти в сети готовое...

Quote
(насколько я знаю ни одна из fpga-шных фирм описание внутренней архитектуры кристалла не дает)

Бред. Все fpga-шные фирмы дают описания на свои чипы.

Quote
К тому-же если бы ты занимался fpga чуть серьезнее, то знал бы, что ячейки в них бывают разные - иногда
на простой триггер надо 2 ячейки, а иногда там целый чип идет за ячейку(блоки SRAM, АЛУ и тп в новых сериях)...

Что значит "чуть серьезнее"? Объясни, плиз.
Я полностью написал майнер под fpga, полностью написал к нему интерфейсную часть для компьютера, полностью написал софт, работающий с сетью.
В результате майню на всем своем. Ты знаешь тех, кто "чуть серьезнее"?

В "fpga" в которых "надо 2 ячейки на триггер" SHA256 не влезет и они, кстати, cpld называются - термин fpga к ним неприменим. Во ВСЕХ пригодных для майнинга fpga полный триггер встроен в каждую ячейку.

Quote
Судя по аппаратной схеме SHA там надо 256 триггеров на сдвиговый регистр + чуть-чуть логики.

Это очень примитивное суждение. При такой реализации SHA будет работать очень медленно и неэффективно. Триггеров, для нормальной работы нужно значительно больше, причем на КАЖДЫЙ такт. Кроме того, логики тоже немало уходит - там полно сумматоров по модулю 2**32, которые и жрут весь временнОй ресурс...

Quote
разработка открытых fpga
Че ты там разрабатывать собрался? Придумаешь свою собственную ячейку 2-И-НЕ-tvv и будешь ее китайцам впаривать?
tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 26, 2012, 06:02:13 PM
 #72

Это ж ты не о себе писал? Сомневаюсь, что ты хоть что-то можешь написать быстрее, чем найти в сети готовое...

зря сомневаешься - разбираться с этими каракулями обычно сложнее чем переписать сразу как надо,
аккуратно написанных проектов единицы.

Я и с математикой особо не церемонюсь - все что надо предпочитаю выводить сам.
(потому и не помню имен тех балбесов чьими именами названы теоремы и функции - а тебя судя по всему это ставит в полный тупик тк ничего кроме названий ты похоже в школе не учил и сути не понимаешь)

Бред. Все fpga-шные фирмы дают описания на свои чипы.

ни одного не видел - секрет фирмы-с...

Что блин меня напрягает - мне конечно пофиг как они свои проблемы решали, но например при отладке хотелось бы осциллом и hex-редактором видеть и понимать какой бит конфигурации чего означает и где может глючить...

Что значит "чуть серьезнее"? Объясни, плиз.
Я полностью написал майнер под fpga, полностью написал к нему интерфейсную часть для компьютера, полностью написал софт, работающий с сетью.
В результате майню на всем своем. Ты знаешь тех, кто "чуть серьезнее"?

VHDL мало чем отличается от любого другого языка - в принципе его можно с равным успехом преподавать даже в школе, вместо бейсика, так что в принципе любой школьник может сделать то-же самое...
(и кстати там синтаксис от Ады взят, то есть я в принципе могу на нем сразу писать даже не читая документации)


В "fpga" в которых "надо 2 ячейки на триггер" SHA256 не влезет и они, кстати, cpld называются - термин fpga к ним неприменим. Во ВСЕХ пригодных для майнинга fpga полный триггер встроен в каждую ячейку.

вот и я про то-же - на каждый элемент там много всякой фигни лишней + коммутатор,
так что КПД использования кремния ниже плинтуса.


Quote
Судя по аппаратной схеме SHA там надо 256 триггеров на сдвиговый регистр + чуть-чуть логики.

Это очень примитивное суждение. При такой реализации SHA будет работать очень медленно и неэффективно. Триггеров, для нормальной работы нужно значительно больше, причем на КАЖДЫЙ такт. Кроме того, логики тоже немало уходит - там полно сумматоров по модулю 2**32, которые и жрут весь временнОй ресурс...

Тюююю...

До тебя еще до сих пор даже не дошло, что может быть 2 формы реализации этой функции - параллельная и последовательная.

Базовая(исходная) именно последовательная, кстати.  Из нее уже оптимизацией получен алгоритм для 32-бит CPU - и кстати далеко не все функции так можно эффективно преобразовать - скорее всего они специально выбирали SHA стандарт из определенного класса функций, который легко оптимизировать под CPU.  Но сути это не меняет - для любой функции всегда есть последовательная схема, а вот оптизированный алгоритм под CPU может существовать не всегда.

Ну дак вот, никакого 32-бит сумматора там нет - там просто несколько лог. элементов, и все.  Никаких 32-бит АЛУ не нужно - в последовательной форме их и нету изначально, это уже потом когда преобразовывали просто воспользовались готовым АЛУ CPU, коли уж оно есть в процессоре, отчего ж не использовать его.


А схема там предельно простая - похожа на CRC схемы, тока в отводках от регистра часть XOR заменена другими для придания нелинейности, вот и все.  И кстати там в вики и аппаратная последовательная схема тоже есть - надо было читать внимательно...


Quote
разработка открытых fpga
Че ты там разрабатывать собрался? Придумаешь свою собственную ячейку 2-И-НЕ-tvv и будешь ее китайцам впаривать?
[/quote]

ну, типа того Wink

Софт потом и опенсорсники допилят, это уже проще, на первое время можно и без этого эту простую схему описать и так в кодах, а софт допиливать потом не спеша.

Главное что продаваться такие чипы будут уже по цене производства, без лишних накруток.

Слабо проект нового fpga чипа разработать?..

Vladimir
naima53
Hero Member
*****
Offline Offline

Activity: 616
Merit: 502



View Profile
October 26, 2012, 07:21:44 PM
 #73

ТВВ, где мой психпортрет?  Grin или это была просто разведка...  Undecided

Donate me) 16f6iWHHkVEnDReeBQPT9GwCNwUfPTXrp2
SHawk
Sr. Member
****
Offline Offline

Activity: 658
Merit: 250


View Profile
October 26, 2012, 09:26:40 PM
 #74

Quote
зря сомневаешься - разбираться с этими каракулями обычно сложнее чем переписать сразу как надо,
аккуратно написанных проектов единицы.

я сомневаюсь не в чьих-то каракулях (которых повидал немало и всегда мог в них разобраться, в отличии от тебя), а сомневаюсь я в твоих способностях что бы то ни было написать самостоятельно...

Quote
Я и с математикой особо не церемонюсь - все что надо предпочитаю выводить сам.

Голословно. Что ты за последний месяц/год вывел сам?

Quote
ни одного не видел - секрет фирмы-с...
то, что ты не умеешь читать даташиты уже давно понятно. Но из этого не следует, что это "секрет фирмы-с" - это только твой "секрет"...

Quote
VHDL мало чем отличается от любого другого языка - в принципе его можно с равным успехом преподавать даже в школе, вместо бейсика, так что в принципе любой школьник может сделать то-же самое...

Спорим, у тебя пальцев на руках больше, чем человек на этом форуме, способных это сделать (включая и ветки на других языках)? Так что свои "в принципе" оставь при себе.

Quote
А схема там предельно простая - похожа на CRC схемы, тока в отводках от регистра часть XOR заменена другими для придания нелинейности, вот и все.

Если ты знаешь одну единственную схему на сдвиговом регистре с обратной связью и отводами, это еще не значит, что весь мир на ней построен. Расширь свой кругозор. Почитай учебники.
SHA НЕ ОПИСЫВАЕТСЯ схемой, которая  "похожа на CRC".

Хоть ты и непроходимый тупица, но попытаюсь тебе втемяшить главное отличие от твоих crc-подобных схем - в "твоих" схемах на каждом такте изменение конкретных бит зависит от малого количества других бит. Например в одноканалке каждый бит зависит только от одного соседнего, и только один (первый или последний) от каких-то нескольких бит (обратной связи). Эти схемы очень легко реализуются на простой логической схемотехнике.
В современных же компьютерных криптоалгоритмах давно ушли от таких схем. Именно для того, чтобы усложнить построение специализированных крипто- акселераторов. В SHA2 - в том числе. В SHA2 есть биты, зависящие одновременно от более чем 60 входных бит даже после всех упрощений и оптимизаций. На обычной логике никакая неимоверная оптимизация эту схему упростить не может. Это принципиально и никак не зависит от твоей личной безграмотности и жопа-чувств. Если вдруг, ты "жопой чуешь", что здесь есть поле для оптимизации - чувствуй это втихаря, или доказывай (аргументируй) свой жопа-бред.

tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 27, 2012, 04:20:20 AM
 #75

Типа для тебя логика с 60 входами диковинка и предел сложности?

А ты хоть знаешь что для АЛУ нужно порядка N**2 элементов?

То есть для логики с 60 входами нужно 60-100 лог. элементов всего,
а для АЛУ 32 бит порядка 1000, причем с гораздо более сложной логикой!

Доходит?..

PS  c VDHL справились вполне так себе весьма средненькие инженеры,
или как ты думаешь почему мне самому не пришлось читать даташиты?..

PPS  счас если дойдут руки до форума по программированию,
можно будет провести натурный эксперимент за сколько школьник освоит VHDL.
Тока я потом за твое ЧСВ не отвечаю Wink
tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 27, 2012, 05:37:29 AM
 #76

Спорим, у тебя пальцев на руках больше, чем человек на этом форуме, способных это сделать (включая и ветки на других языках)? Так что свои "в принципе" оставь при себе.

я даже в своем маленьком городе знаю людей кто знает VHDL больше, чем у тебя всего пальцев, включая 21-й Wink
(а в списке контактов их еще на порядки больше, так что не бином ньютона твой вхдл, уж поверь)

Другое дело что майнингом они не интересуются, это да...

Quote
А схема там предельно простая - похожа на CRC схемы, тока в отводках от регистра часть XOR заменена другими для придания нелинейности, вот и все.

Если ты знаешь одну единственную схему на сдвиговом регистре с обратной связью и отводами, это еще не значит, что весь мир на ней построен. Расширь свой кругозор. Почитай учебники.
SHA НЕ ОПИСЫВАЕТСЯ схемой, которая  "похожа на CRC".

я знаю тока методов описания всяких кодов и их применений гораздо больше, чем ты можешь себе представить...
Даже знаю про "скрытый бит" из FPU DEC, и знаю почему его нет в ЕС ЭВМ(IBM). 
(а ты знаешь?  Особенность схемотехники построения АЛУ - уважающие себя аппаратчики должны знать про эту фичу)
Не считая всяких кодов вроде Фиббоначи из экспериментального многоразрядного ЦАП-а КАМАК,
кодов спутниковой связи, корректоров ошибок...  АКФ, ВКФ, CDMA и много других страшных слов Wink
(кстати умеешь спутниковые модемы настраивать? и знаешь почему qualcomm отымел моторолу по плотности сотовой связи? )


Но с этими кодами ты тут сильно прокололся - задан SHA не алгоритмом, а именно _логической битовой_ функцией!!!
(сюрприз:  и вся математика этих кодов описана именно по этой базе, а не в арифметической форме алгоритма для CPU!
То есть криптоанализ ты похоже даже не знаешь как выглядит, и даже не видел исходных функций для него)

Есть класс арифметических кодов(про которые ты похоже не слышал, а я это прекрасно понимаю) и тп - вот их
может быть и можно задать сразу алгоритмом, хз.  Но не SHA это точно - потому что у него вся база и исходная
математика описана именно в логических битовых функциях!..

То есть совершенно не важно что существует ускоренный алгоритм его расчета на CPU - это побочный отход оптимизации,
и никто сам этот алгоритм ковырять не будет.  Для анализа надо смотреть именно исходную форму(а она побитовая - сюрприз)
этой функции тк под этот класс схем и создавалась вся математика и доказательства его устойчивости...



Хоть ты и непроходимый тупица,
но попытаюсь тебе втемяшить главное отличие от твоих crc-подобных схем - в "твоих" схемах на каждом такте изменение конкретных бит зависит от малого количества других бит. Например в одноканалке каждый бит зависит только от одного соседнего, и только один (первый или последний) от каких-то нескольких бит (обратной связи). Эти схемы очень легко реализуются на простой логической схемотехнике.

как самокритично Wink

А ничего что в аппаратной схеме лог. элемент можно воткнуть хоть перед каждым триггером,
и можно хоть вообще все биты всего 256/512 бит регистра поменять за 1 такт?..   (сюрприз1? Wink )

А ничего что если внимательно посмотреть на схему SHA, там окажеться всего 2 отводки?  (точнее подводки Wink )


Просто в алгоритме для CPU там за один проход пытаются сразу считать несколько битов - коли уж АЛУ CPU универсальное,
то почему бы не использовать все биты и не считать по 32 бита за раз.

То есть, один цикл оптимизированного алгоритма экв.  8-32 тактам последовательной схемы.
(но ковырять сам этот алготм довольно глупо - он уже в другой базе и у него другая математика, исходный битовый проще)


То есть, на каждом бите данных регистр может изменяться всего в паре мест - но после 32 битов эти изменения
распостраняются уже довольно далеко - потому тебе и кажеться что там лавинный эффект очень большой,
хотя этого нет.   (и кстати по секрету скажу что если отводок сделать больше, то взломать его будет легче)


В современных же компьютерных криптоалгоритмах давно ушли от таких схем. Именно для того, чтобы усложнить построение специализированных крипто- акселераторов. В SHA2 - в том числе. В SHA2 есть биты, зависящие одновременно от более чем 60 входных бит даже после всех упрощений и оптимизаций. На обычной логике никакая неимоверная оптимизация эту схему упростить не может. Это принципиально и никак не зависит от твоей личной безграмотности и жопа-чувств. Если вдруг, ты "жопой чуешь", что здесь есть поле для оптимизации - чувствуй это втихаря, или доказывай (аргументируй) свой жопа-бред.

просто ты не понимаешь что один проход алгоритма для CPU экв. 32 проходам битового алгоритма.
(но базовый исходный которым описан SHA - именно битовый, это без вариантов, и вся математика под него)

То есть ты видешь результат от f(f(f(...f(x) ))) (32 раза - иногда в подобных математиках это записывают как 32 степень)
многократного применения этой функции за один вызов подпрограммы оптимизированного под CPU алгоритма, вот и все.
И думаешь что там что-то сложное - нифига просто это экв многократному вызову 1-бит функции, и там всего пара отводок,
ну а входы вообще никого не волнуют - это всего экв. 1 слою элементов от универсального АЛУ, который ты идиот
реализовал в своей fpga, тупо не думая взяв и перенеся преобразованный и оптимизированный алгоритм под CPU с мощным
универсальным АЛУ.  Кстати один тока этот универсальный АЛУ занимает ячеек в десятки раз больше всего ядра
последовательного майнера...

Vladimir
PS  возможно что на старших fpga(где уже есть целые готовые блоки АЛУ, RAM и тп) разницы особой не будет(но в asic
все немного иначе - там никто не заставляет лепить не нужные универсальные блоки), но ты все равно полный лох тк думаешь
что для аппаратного майнера нужна только большая матрица fpga - а это далеко не так тк несколько последовательных
ядер можно всунуть в любую маленькую матрицу, что учитывая халявность старого хлама все равно выгодно,
хоть и не бьет рекорды по пиковой производительности(что и не нужно для майна - важна тока цена 1 MH/s)...
SHawk
Sr. Member
****
Offline Offline

Activity: 658
Merit: 250


View Profile
October 27, 2012, 10:44:10 AM
Last edit: October 27, 2012, 10:58:30 AM by SHawk
 #77

То есть ты видешь результат от f(f(f(...f(x) ))) (32 раза - иногда в подобных математиках это записывают как 32 степень)
многократного применения этой функции за один вызов подпрограммы оптимизированного под CPU алгоритма, вот и все.
И думаешь что там что-то сложное - нифига просто это экв многократному вызову 1-бит функции, и там всего пара отводок,
ну а входы вообще никого не волнуют - это всего экв. 1 слою элементов от универсального АЛУ, который ты идиот
реализовал в своей fpga, тупо не думая взяв и перенеся преобразованный и оптимизированный алгоритм под CPU с мощным
универсальным АЛУ.  Кстати один тока этот универсальный АЛУ занимает ячеек в десятки раз больше всего ядра
последовательного майнера...

Нафига ты пишешь всю эту ахинею? Ты думаешь, что есть люди, программирующие fpga и не понимающие всего этого лучше тебя?
Ты даже "Фиббоначи" неправильно пишешь. Твоя тотальная безграмотность поражает.
То что ты пишешь - общие, смешные слова.
Изначально, на описанную тобой операцию будет уходить 32 такта работы устройства. Именно для того, чтобы делать эту операцию за такт и создают АЛУ. Иначе будет огромный простой всех остальных участков, которым в данный момент не нужно "сложение за 32 такта". Только не гундось о том, что в твоем устройстве такты маленькие - ты этого не добьешься.
Давай проведем эксперимент. Я напишу на VHDL сложение двух 32-битных слов, откомпилирую и опубликую количество ресурсов, потраченное после разводки на эту операцию. А ты выкинешь АЛУ нафиг, извлечешь из своей думалки "ядро последовательного майнера", откомпилируешь (или опубликуешь здесь, если компилировать нечем) и посчитаешь (посчитаем) количество ресурсов, которые уйдут на твою реализацию. Ну и скорость работы (количество тактов) сравним заодно.
И посмеемся/поплачем... Smiley
До этого момента, все сказанное тобой воспринимается как полный бред и мечты не подкрепленные даже попытками сделать что-то на практике или что-то доказать общепринятым научным языком (терминами).


Vladimir
несколько последовательных
ядер можно всунуть в любую маленькую матрицу, что учитывая халявность старого хлама все равно выгодно,
хоть и не бьет рекорды по пиковой производительности(что и не нужно для майна - важна тока цена 1 MH/s)...

Какова у тебя получается цена 1MH/s?
Вот в этом то и проблема - ты ничего в своей жизни не доводил до конца. Иначе ты бы понимал, как глубоко ты заблуждаешься.
Предлагаю еще один спор - спорим, что на "халявном старом хламе" ты (да и никто другой) не соберешь устройство, которое бы по цене 1MH/s превосходило бы показатели того, что уже есть в продаже?
tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 29, 2012, 04:07:45 AM
 #78

Нафига ты пишешь всю эту ахинею? Ты думаешь, что есть люди, программирующие fpga и не понимающие всего этого лучше тебя?

а чтобы ты понял, хоть что-то.  Но я вижу это мало помогает...

В чипах и технологиях ты кстати совсем не разбираешься - чего я тебе и пытаюсь показать на пальцах.

Ты даже "Фиббоначи" неправильно пишешь. Твоя тотальная безграмотность поражает.

забавный ты Wink   Обычно народ к "VDHL" прикапывается - а тебе уже больше не к чему чтоли?..
(вон специально не стал исправлять очепятку - но даже не думал что ты на это попадешься, удивил Wink )

Давай проведем эксперимент. Я напишу на VHDL сложение двух 32-битных слов, откомпилирую и опубликую количество ресурсов, потраченное после разводки на эту операцию. А ты выкинешь АЛУ нафиг, извлечешь из своей думалки "ядро последовательного майнера", откомпилируешь (или опубликуешь здесь, если компилировать нечем) и посчитаешь (посчитаем) количество ресурсов, которые уйдут на твою реализацию. Ну и скорость работы (количество тактов) сравним заодно.
И посмеемся/поплачем... Smiley

а до тебя ведь нифига и не доходит, даже после того как разжевал 2*2...

Ну ладно, OK, похоже и правда придеться проводить натурный эксперимент...

Первый вопрос(на засыпку) - в чем мерить-то будем, умник?
Ты правда думаешь что компилятор тебе покажет информацию о чипе и технологии, а не более высокого уровня?

Вот зачем я тебе 2*2 только объяснял не понимаю, если ты все равно не читаешь...


Какова у тебя получается цена 1MH/s?
Вот в этом то и проблема - ты ничего в своей жизни не доводил до конца. Иначе ты бы понимал, как глубоко ты заблуждаешься.
Предлагаю еще один спор - спорим, что на "халявном старом хламе" ты (да и никто другой) не соберешь устройство, которое бы по цене 1MH/s превосходило бы показатели того, что уже есть в продаже?

хм... Это ты про себя чтоли?  Я думал у тебя этот уродец работает...  Ну да ладно.

Цена MH/s у меня абсолютно круглая - полный 0, поскольку старый хлам бесплатная халява которую лень нести на помойку.

Ты правда думаешь что можно сделать новое дешевле?..


Но главного принципа ты все равно не понял - в новых проектах такой подход будет сильно выгоднее.
(Подскажу - и даже новые чипы с майнерами могут стоить почти 0.   Сможешь теперь дагадаться почему?.. 
Да, и объясни почему заказ чипов в полупроводниковых фирмах может полностью убить прибыль от майнинга...)

Vladimir
PS  в технологиях, маркетинге, схемотехнике и архитектуре чипов ты все-же нифига не понимаешь...
tvv (OP)
Legendary
*
Offline Offline

Activity: 1302
Merit: 1005


View Profile WWW
October 29, 2012, 04:17:05 AM
 #79

Да, кстати, в каком размере fpga нынче 1 ячейка стоит дешевле?..
(этот тот класс на котором ты сделал майнер, или чипы меньшего размера имеют меньшую удельную стоимость?)

То есть удельная стоимость лог. элемента - если цену чипа разделить на число ячеек.
SHawk
Sr. Member
****
Offline Offline

Activity: 658
Merit: 250


View Profile
October 29, 2012, 04:43:36 PM
 #80

Ну ладно, OK, похоже и правда придеться проводить натурный эксперимент...

Первый вопрос(на засыпку) - в чем мерить-то будем, умник?

Да в чем хочешь, умник.

Ты правда думаешь что компилятор тебе покажет информацию о чипе и технологии, а не более высокого уровня?

Напомню - думаешь и предполагаешь здесь ты. Я же знаю, что говорю.


Цена MH/s у меня абсолютно круглая - полный 0, поскольку старый хлам бесплатная халява которую лень нести на помойку.
Ты правда думаешь что можно сделать новое дешевле?..

давай, ты сначала сделаешь или расскажешь, как сделать, а потом цену назовешь.
А то я готов по названой цене купить с миллион майнеров. Продашь? Не? Тогда и не пи...

Pages: « 1 2 3 [4] 5 »  All
  Print  
 
Jump to:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.19 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!