Bitcoin Forum
May 04, 2024, 04:55:50 AM *
News: Latest Bitcoin Core release: 27.0 [Torrent]
 
   Home   Help Search Login Register More  
Pages: [1]
  Print  
Author Topic: Welche Voraussetzung braucht Hardware für optimale Mhash/s?  (Read 5519 times)
realcoin (OP)
Sr. Member
****
Offline Offline

Activity: 364
Merit: 250


View Profile
July 11, 2012, 02:50:07 AM
 #1

Hallo,

ich komme noch überhaupt nicht klar, welche Hardware/GPU/Prozessoren ideal für die Berechnung von BTC sind.
Das liegt daran, weil ich auch noch nicht verstanden habe, was der BTC eigentlich ist, "wie" er berechnet/erzeugt wird.

Ich hab "Mining hardware comparison" gelesen, aber...
https://en.bitcoin.it/wiki/Mining_hardware_comparison

...warum machte eine (Radeon 6870 für 141.- EUR), ca. 300 Mhash/s und eine (Tesla M2050 für 2340.- EUR), nur ca. Mhash/s?  Huh
Warum wird von "Mhash" und nicht von FLOPS;( englisch für Gleitkommaoperationen pro Sekunde)  gesprochen, wenn es um das Maß für die Leistungsfähigkeit von Prozessoren geht?

Die CPU macht sequentiellen Aufgaben.
Eine GPU tut parallelisieren ...
Ich lese auch immer wieder: CPU--> GPU--> FPGA--> ASIC
Aber warum sind dann einzelne Grafikarten so unterschiedlich?

Hier wurde ich auch noch nicht so richtig schlau:
Why a GPU mines faster than a CPU
https://en.bitcoin.it/wiki/Why_a_GPU_mines_faster_than_a_CPU

Xilinx ML605 development kit (375 Mhash/s)
X6500 Rev 2, Spartan-6 LX150-3FGG484C FPGAs (400 Mhash/s)
Wie würde man die Mhash/s eines Copacobana-Rechners ausrechnen?

Kann mir jemand mit dem ganzen Prozessor-Wust, auf die Sprünge helfen?
Danke


I am not "Realcoin REC"! There were no REC when I sign up the forum...
1714798550
Hero Member
*
Offline Offline

Posts: 1714798550

View Profile Personal Message (Offline)

Ignore
1714798550
Reply with quote  #2

1714798550
Report to moderator
1714798550
Hero Member
*
Offline Offline

Posts: 1714798550

View Profile Personal Message (Offline)

Ignore
1714798550
Reply with quote  #2

1714798550
Report to moderator
1714798550
Hero Member
*
Offline Offline

Posts: 1714798550

View Profile Personal Message (Offline)

Ignore
1714798550
Reply with quote  #2

1714798550
Report to moderator
Advertised sites are not endorsed by the Bitcoin Forum. They may be unsafe, untrustworthy, or illegal in your jurisdiction.
1714798550
Hero Member
*
Offline Offline

Posts: 1714798550

View Profile Personal Message (Offline)

Ignore
1714798550
Reply with quote  #2

1714798550
Report to moderator
1714798550
Hero Member
*
Offline Offline

Posts: 1714798550

View Profile Personal Message (Offline)

Ignore
1714798550
Reply with quote  #2

1714798550
Report to moderator
Zwenny
Newbie
*
Offline Offline

Activity: 52
Merit: 0


View Profile
July 11, 2012, 06:47:55 AM
 #2

Hi,

ja, vor diesen Fragen stand jeder einmal...
ATI Grafikkarten sind halt gut im SHA-256 berechnen. Das braucht man für das "Unterzeichnen" des aktuellen "Blocks" mit einem Hashwert.
das Interessante an der Sache: der Hashwert (also hier SHA-256) darf nicht irgendeiner sein, sondern muss, der aktuellen "Schwierigkeit" oder auch difficulty genannt verschieden viele Nullen am anfang stehen haben. Siehe auch den Wikipediaartikel im Absatz Mining: http://de.wikipedia.org/wiki/Bitcoin#Mining

Das ist nämlich ausschlaggebend. Die NVidia Grafikkarten können dafür andere sachen gut... kommt halt auf die Architektur der Karten an.
Aber bevor wir hier ausschweifen kann ich dir nur die Podcasts

a: im Alternativlospodcast von Fefe http://alternativlos.org/16/ da gehts auch um Bitcoin und Elektronisches Geld insgesammt
b: den ChaosRadio Express über elektronisches Geld (und Bitcoin vorallem) http://cre.fm/cre182 und vorallem die ChaosRadio Sendung über Bitocin http://chaosradio.ccc.de/cr169.html

empfehlen (wirklich anhören, als abendlektüre oder bei der Bahnfahrt, sind alle echt interessant)

weiterhin gibt es auch einen ganz guten Wikipedia Artikel, welcher sich auch mit dem Mining beschäftigt: http://de.wikipedia.org/wiki/Bitcoin

sollten dann noch Fragen offen bleiben kannst du gern nocheinmal schreiben.

[EDIT: link korrigiert]
Nachtwind
Hero Member
*****
Offline Offline

Activity: 700
Merit: 507



View Profile
July 12, 2012, 09:11:54 AM
 #3

...warum machte eine (Radeon 6870 für 141.- EUR), ca. 300 Mhash/s und eine (Tesla M2050 für 2340.- EUR), nur ca. Mhash/s?  Huh
Warum wird von "Mhash" und nicht von FLOPS;( englisch für Gleitkommaoperationen pro Sekunde)  gesprochen, wenn es um das Maß für die Leistungsfähigkeit von Prozessoren geht?
Hi,
Wie du schon sagst sind FLOPS eher Leistungswerte für Prozessoren. Bitcoin aber nutzt keine Gleitkommaoperationen sondern vereinfacht ausgedrückt nur SHA256 hash algorithmen, die mit integern arbeiten. Daher sind FLOPS weniger aussagekräftig bei Bitcoin. Mhash hat sich als allgemein gut zu vergleichende Geschwindigkeit angeboten. Mit abstrakten werten wäre das alles ein wenig komplizierter - aber so hat man einen einfachen Weg um seine Systeme vergleichen zu können.
Der Unterschied zwischen NVIDIA und AMD/ATI ist recht simpel erklärt: Nvidia kann einige wenige komplexe aufgaben parallel berechnen, ati viele simple. Für Spiele gleicht sich das aus, aber nicht für Berechnungen. Nvidia kann zwar auch bitcoins "berechnen" aber nunmal nicht so viele nebeneinander - während die "simpleren" ATIs viele kleinere Berechnungen durchführen und damit schneller sind (vereinfacht ausgedrückt).


Die CPU macht sequentiellen Aufgaben.
Eine GPU tut parallelisieren ...
Ich lese auch immer wieder: CPU--> GPU--> FPGA--> ASIC
Aber warum sind dann einzelne Grafikarten so unterschiedlich?
Vereinfacht gesagt:
eine CPU macht tausend andere Dinge neben Bitcoins berechnen und kann nur einige wenige Threads wirklich parallel ausrechnen, diese dafür umso schneller.
eine GPU kann sich schonmal vollständig auf das mining konzentrieren ist aber aufgrund ihrer Architektur nicht dafür gebaut - kann aber wesentlich mehr berechnungen parallel durchführen als eine CPU, jede einzelne dafür langsamer
ein FPGA ist ein Chip, der einzig für Bitcoins genutzt wird. Die ALgorithmen sind so auf den Chip abgestimmt, dass ein maximum an Effizienz erwartet werden kann. Wobei hier der effektivste Chip immernoch S6LX125 ist. Es gibt zwar alternativen (BFL Single) - aber deren Lebensdauer ist unbekannt.. Einzig der Preis im Vergleich zu High End Karten und die vergleichsweise begrenzte Verfügbarkeit haben FPGAs bisher daran gehindert den GPUs den Rang abzulaufen. Man beachte, dass ein einzelner FPGA bei 210Mh kaum 9W Strom benötigt.. eine entsprechende GPU das 10x
ASIC ist die wohl nächste Generation der Miner.. Ungeachtet der Werbeversprechen, die sowieso Unsinn sind, werden irgendwann ASICs existieren. Dieses sind Chips, die quasi um den Algorithmus herum gebaut werden. Also wie ein FPGA nur andersrum ;0)
Die Logikeinheiten eines ASICs sind dann dermaßen optimiert, dass ein maximum an Geschwindigkeit herauskommen kann. Das Problem mit ASICs sind die extremen Entwicklungs und Produktionskosten. Auch die Zukunftstauglichkeit ist so eine Sache. Software für CPU/GPU und auch FPGA lässt sich beliebig verändern - ein ASIC wäre unumprogrammierbar.
Fairerweise soll hier noch die HalbFPGAhalbASIC alternative genannt werden, die wahrscheinlicher kommt: "Hardcopy"s. Das sind FPGAs, die vom Hersteller als ASICs verkauft werden. Hierfür werden Chips ein wenig angepasst, so, dass Leistung und Stromaufnahme sich etwas verbessern. Diesen zwischenschritt kann man in Zukunft am ehesten erwarten.


Hier wurde ich auch noch nicht so richtig schlau:
Why a GPU mines faster than a CPU
https://en.bitcoin.it/wiki/Why_a_GPU_mines_faster_than_a_CPU
Siehe oben. Eine CPU kann maximal (Anzahl Kerne) Optionen parallel berechnen, diese aber dafür sehr schnell. Eine GPU kann mal eben das tausendfache ein wenig langsamer berechnen - in der Summe ist dann aber die GPU schneller.

Xilinx ML605 development kit (375 Mhash/s)
X6500 Rev 2, Spartan-6 LX150-3FGG484C FPGAs (400 Mhash/s)
Wie würde man die Mhash/s eines Copacobana-Rechners ausrechnen?
Naja, ich würde bei so einer Maschine Overhead wie interne kommunikation einfach ignorieren und Anzahl FPGA * Geschiwndigkeit pro FPGA als Maß nehmen. Sollte ungefähr hinkommen.
realcoin (OP)
Sr. Member
****
Offline Offline

Activity: 364
Merit: 250


View Profile
July 12, 2012, 11:51:57 PM
 #4

@Zwenny
Danke.
Die ChaosRadio Sendung hab ich durch, war sehr interessant, obwohl ich schon viel über Fiatmoney und Markt etc wußte.
Die SHA-256-Berechnung des Hash-Wertes muss/möchte ich mir noch genauer anschauen. Und dann Fragen stellen.

Über die FPGAs hab ich mich etwas schlauer gemacht, zB die  Spartan FPGAs von xilinx: http://www.xilinx.com/products/silicon-devices/fpga/spartan-6/index.htm
Viele Frage hat auch der informative deutsche Thread "FPGA-Mining" hier beantwortet:
...
Zusammenfassend kann man sagen das die 3er Spartaner nicht sinnvoll benutzt werden können.
Bleiben also Spartan 6 sowie Virtex 5/6; hier sollte man allerdings darauf achten das möglichst viele Logik-Elemente vorhanden sind, wenn schon dann ein komplett paralleles Design.
...
Sonst hätte ich mir gleich so ein "Xilinx Spartan-3A Starter Kit" http://shop.trenz-electronic.de/catalog/product_info.php?cPath=1_47&products_id=130 bestellt!  Grin
Zu den FGPAs fand ich auch die Themen von ngzhang (FPGA development board "Lancelot" - official discussion thread.) https://bitcointalk.org/index.php?topic=79835.0 interessant, der - glaube - die XC6SLX150-2FGG484I Spartan-6 FPGAs verbaut. Bleibt die Frage, wie ökonomisch das Mining dann damit ist. Orientieren tut er sich wohl am Icarus:  http://en.qi-hardware.com/wiki/Icarus

@Nachtwind
Danke.
Den Unterschied von Asics und FPGAs hab ich nun anfänglich verstanden.
Quote
...Der Unterschied zu PLDs und FPGAs besteht darin, dass die Funktionalität des anwendungsspezifischen ICs vom Hersteller eindeutig festgelegt werden muss und somit fest vorgegeben ist. Die interne Schaltung kann vom Anwender nicht mehr verändert werden...
http://de.wikipedia.org/wiki/Anwendungsspezifische_Integrierte_Schaltung

... der effektivste Chip immernoch S6LX125 ist. Es gibt zwar alternativen (BFL Single) - aber deren Lebensdauer ist unbekannt..
Das ist aber kein Chip, oder?

Frage:
Welche der FGPA Prozessoren kommen denn noch in Frage, oder werden von Leuten in gewissen Mining Projekten verbaut?

Has anyone tried the fpga miner on a Xilinx ml507? (Virtex 5 LX 70)
https://bitcointalk.org/index.php?topic=39536.0

I am not "Realcoin REC"! There were no REC when I sign up the forum...
Nachtwind
Hero Member
*****
Offline Offline

Activity: 700
Merit: 507



View Profile
July 13, 2012, 07:28:22 AM
Last edit: July 13, 2012, 08:34:25 AM by Nachtwind
 #5


... der effektivste Chip immernoch S6LX125 ist. Es gibt zwar alternativen (BFL Single) - aber deren Lebensdauer ist unbekannt..
Das ist aber kein Chip, oder?

S6LX150 ? Spartan 6 LX150 - doch doch, ist ein Chip - nur eben in Kurzfassung geschrieben. Wink


Frage:
Welche der FGPA Prozessoren kommen denn noch in Frage, oder werden von Leuten in gewissen Mining Projekten verbaut?

Has anyone tried the fpga miner on a Xilinx ml507? (Virtex 5 LX 70)
https://bitcointalk.org/index.php?topic=39536.0

Butterflylabs benutzt afaik Stratix Chips in ihrem Design aber die sind afaik die einizigen, die einen grundlegend anderen Chip nutzen.
Das Problem bei den FPGAs ist folgendes - man sollte nach Möglichkeit eine Logikeinheiten Menge haben, die nahe an einem vielfachen von 120000 ist.
Die Zahl kommt daher, dass SHA256 etwa 60000 Logikeinheiten Platz braucht - und Bitcoin macht SHA256(Sha256)), also demnach einen Berechnung, die 120000LUT lang ist.
Der S6LX150 hat 147,443 Einheiten und ist damit recht passend.
Hinzu kommt beim S6, dass er relativ wenig Strom aufnimmt und sehr gut gekühlt werden kann, was nicht bei allen FPGAs der Fall ist. WEnn du dich ein wenig mehr über die Dinger einliesst schau dir die Geschichte der Butterflylabs Singles an - dort stößt du auf genau das Problem, dass das Külen bei denen nicht immer optiomal war...
Hinzu kommt, dass ein einzelner Spartnaer  etwa 150Eur kostet (http://www.digikey.de/product-detail/de/XC6SLX150-3FGG484C/122-1725-ND/2339800) , der XC5VLX155 als erster Virtex5 mit mehr als 120k Logikeinheiten kostet 2000Eur (http://www.digikey.de/product-detail/de/XC5VLX155-1FFG1153C/XC5VLX155-1FFG1153C-ND/1957125).. ist damit etwas unfreundlicher fürs Hobby bei etwa selber Leistung.

Größere Chips gibt es natürlich auch, aber da der nächste wirklich große Sprung erst bei 240000Lut zu erwarten ist (2 hashes pro Takt) - derartige Chips aber unerhört Teuer sind bleiben viele beim etwas behäbigererem aber gut zu benutzenden S6LX150. Eher erwarte ich da, dass es irgendwer schafft die Codes so weit zu verbessern, dass sie weniger als 120k Lut brauchen um einmal durchgerechnet zu werden beziehungsweise anderes berechnen, so, dass das ein wenig effizienter wird - da arbeiten im Forum ja auch einige dran...
realcoin (OP)
Sr. Member
****
Offline Offline

Activity: 364
Merit: 250


View Profile
July 14, 2012, 12:14:24 AM
 #6

S6LX150 ? Spartan 6 LX150 - doch doch, ist ein Chip - nur eben in Kurzfassung geschrieben. Wink
Etwas arg kurz, damit bezeichnet man ja nur grob die Familie nicht den einzelne Prozessor Typ! Wink

Die Mining Board "Icarus" und "ModMiner Quad" haben ja jeweils einen dieser verschiedenen Prozessor Typen verbaut. So weit ich erinnere sind nur der Betriebstemperaturbereich beim teureren Typ größer.

380 Mhash/s Icarus
XILINX - XC6SLX150-2FGG484I - FPGA, SPARTAN-6 LX, 147K, 484FGGBGA   132 EUR
Logikblöcke: 23038
Makrozellen: 147443
Betriebstemperaturbereich: -40°C bis +100°C

800(4x200) Mhash/s ModMiner Quad
XILINX - XC6SLX150-2FGG484C - FPGA, SPARTAN-6 LX, 147K, 484FGGBGA   115 EUR
Logikblöcke: 23038
Makrozellen: 147443
Betriebstemperaturbereich: 0°C bis +85°C


Das Problem bei den FPGAs ist folgendes - man sollte nach Möglichkeit eine Logikeinheiten Menge haben, die nahe an einem vielfachen von 120000 ist.
Die Zahl kommt daher, dass SHA256 etwa 60000 Logikeinheiten Platz braucht - und Bitcoin macht SHA256(Sha256)), also demnach einen Berechnung, die 120000LUT lang ist.
Das verstehe ich nicht. Ich habe nachgeschaut, SHA-2/SHA256, hat:
Quote
Output size (bits): 256
Internal state size (bits): 256
Block size (bits): 512
Max message size (bits): 2hoch64 − 1
Word size (bits): 32
Rounds: 64
Operations: +,and,or,xor,shr,rot
Example Performance (MiB/s):  111
http://en.wikipedia.org/wiki/SHA-2#Examples_of_SHA-2_variants

Wie leiten sich davon die 60000 Logikeinheiten bzw. 120000LUT ab? Trotz Wikipedia komme ich noch nicht ganz mit.
Quote
LUT = Lookup-Tabelle
Eine Tabelle ist leichter anzupassen als eine Transistorschaltung, daher wird die LUT in der programmierbaren Logik, insbesondere FPGAs und bei der Herstellung von ICs nach Kundenwunsch (ASIC), implementiert
Bei FPGAs wird die Tabelle in einem kleinen SRAM-Feld gespeichert. So kann mit einem Speicher von 16×1 Bit jede logische Funktion mit 4 Eingängen realisiert und durch Programmierung geändert werden.
http://de.wikipedia.org/wiki/Lookup-Tabelle#Anwendung_in_Integrierten_Schaltungen
Ist das an Hand der Infos, die ich zitiert habe noch zu erklären?


Der S6LX150 hat 147,443 Einheiten und ist damit recht passend.

Logikblöcke und Makrozellen sind aber nicht das gleiche, oder? Bei dir kommt das so rüber, als ob das für dich das selbe ist? SPARTAN-6 LX haben:
Logikblöcke: 23,038
Makrozellen: 147,443
Wie hast du das gemeint?

Ich hab hier noch selbst etwas gefunden, scheint doch recht kompliziert zu sein:
Quote
Logikblöcke und I/O-Blöcke

Die Hersteller verwenden unterschiedliche Bezeichnungen für die Logikblöcke: Configurable Logic Block (CLB), Logic Module, Logic Cell, Logic Element (LE), Programmable Function Unit (PFU), Core Cell oder Tile. Für die I/O-Blöcke werden folgende Bezeichnungen verwendet: I/O Block (IOB), I/O Module, I/O Cell, I/O Element (IOE), Programmable Input/Output Cells (PIC).
...Die Firma Xilinx hat in jüngster Zeit als neue Maßeinheit Logic Cells vorgeschlagen. Eine Logic Cell besteht dabei aus einer Lookup Table (LUT) mit 4 Eingängen und einem Register. Da nur ein Teil der heute verfügbaren FPGA-Familien auf LUTs basieren, bleibt abzuwarten, ob sich diese Maßeinheit durchsetzt.
http://www.aufzu.de/FPGA/kochbuch/kap2b.html


...der XC5VLX155 als erster Virtex5 mit mehr als 120k Logikeinheiten kostet 2000Eur (http://www.digikey.de/product-detail/de/XC5VLX155-1FFG1153C/XC5VLX155-1FFG1153C-ND/1957125).. ist damit etwas unfreundlicher fürs Hobby bei etwa selber Leistung.
Den VIRTEX-5 LX, XC5VLX155-1FFG1153C finde ich auch für 1100 EUR. Mit Logikblöcken: 24,320... scheint irgendwie nicht der gleiche zu sein, obwohl die Bezeichnung ja stimmt.  Huh
http://de.farnell.com/xilinx/xc5vlx155-1ffg1153c/fpga-virtex-5-lx-155k-1153fbga/dp/1876184?Ntt=XC5VLX155-1FFG1153C

Größere Chips gibt es natürlich auch, aber da der nächste wirklich große Sprung erst bei 240000Lut zu erwarten ist (2 hashes pro Takt) - derartige Chips aber unerhört Teuer sind bleiben viele beim etwas behäbigererem aber gut zu benutzenden S6LX150. Eher erwarte ich da, dass es irgendwer schafft die Codes so weit zu verbessern, dass sie weniger als 120k Lut brauchen um einmal durchgerechnet zu werden beziehungsweise anderes berechnen, so, dass das ein wenig effizienter wird - da arbeiten im Forum ja auch einige dran...
Danke, ist mir alles schon ein wenig klarer geworden und dass es sehr auf das Zusammenspiel von Hardware/Prozessor und Programmierung ankommt.

I am not "Realcoin REC"! There were no REC when I sign up the forum...
Pages: [1]
  Print  
 
Jump to:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.19 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!