Projekt - Sprachmodelle zur Ideenentwicklung bei Bitcoin nutzen

Sprachmodelle zur Ideenentwicklung bei Bitcoin: Ein Test der Kelly-Allokation

Um Sprachmodelle zur Weiterentwicklung und Kritik meiner Bitcoin-Ideen zu nutzen, müssen sie diese erst einmal verstehen. Ein einfacher Rechentest mit der Kelly-Allokation zeigt jedoch: Im Gegensatz zu Excel machen Sprachmodelle häufig Fehler und benötigen intensive menschliche Kontrolle. Dieser Artikel dokumentiert meinen Test verschiedener Modelle.

Warum ich Sprachmodelle testen musste

❶ Die Vision: Ein intelligenter Gesprächspartner
Ich möchte meine Bitcoin-Modelle weiterentwickeln. Ein idealer Partner würde meine Ideen verstehen, Feedback geben, Schwachstellen aufdecken und neue Perspektiven liefern. Sprachmodelle scheinen dafür perfekt – sie können schließlich mit Sprache umgehen.

ⓐ Das Problem: Bevor ein Modell komplexe Ideen kritisieren kann, muss es die Basics verstehen und korrekt anwenden.
➤ Wie beim Programmieren muss man schrittweise prüfen, ob der Computer versteht, was er tun soll.

❷ Der Realitätscheck: Der Taschenrechner vs. das Sprachmodell
Ein Taschenrechner oder Excel berechnet zuverlässig. Einmal eingegebene Formeln liefern stets das gleiche Ergebnis. Sprachmodelle hingegen generieren plausible, aber nicht immer korrekte Antworten.

ⓐ Die Gefahr: Ein Modell, das die Grundrechnungen nicht beherrscht, produziert bei komplexen Themen scheinbar plausible, aber inhaltlich falsche Ergebnisse.
➤ Dies kann zu fatalen Fehlentscheidungen führen, z.B. bei der Berechnung der optimalen Portfolio-Allokation.

Mein Test: Die Kelly-Allokation für Bitcoin

Ich habe verschiedene Sprachmodelle mit ein und derselben Aufgabe konfrontiert: der Berechnung der optimalen Bitcoin-Allokation für 4 und 10 Jahre basierend auf einer Trendfunktion und dem Lindy-Effekt. Hier sind die Annahmen und mein korrektes Basis-Ergebnis (berechnet mit Excel):

Annahmen:
● Startdatum: 03.01.2009
● Aktueller Preis (18.09.2025): 99.400 EUR
● Intercept: -39,23954
● Growth-Exponent: 5,824700561

Korrekte Ergebnisse (Ich + Excel):
● Bitcoin Preis-Trend in EUR
- in 4 Jahren: 355.388
- in 10 Jahren: 1.564.528
● Überlebenswahrscheinlichkeit (Lindy)
- in 4 Jahren: 78,71%
- in 10 Jahren: 54,96%
● Kelly-Allokation
- für 4 Jahre: 70,4%
- für 10 Jahre: 51,9%

Die Ergebnisse der Sprachmodelle im Vergleich

Die Leistungsunterschiede waren enorm:

❶ Gut bis sehr gut: Grok Expert, ChatGPT, LeChat
ⓐ Diese Modelle lieferten nahezu identische oder sehr ähnliche Ergebnisse zu meiner manuellen Berechnung.
ⓑ LeChat rief sogar Python auf, um die Berechnung durchzuführen.
➤ Sie haben die Aufgabe grundsätzlich verstanden und korrekt umgesetzt.

❷ Mangelhaft: Gemini 2.5, Claude
ⓐ Schon bei den Preisschätzungen für Bitcoin gab es deutliche Abweichungen.
ⓑ Die daraus resultierenden Kelly-Allokationen wichen spürbar ab.
➤ Das Verständnis für die numerische Umsetzung der Funktionen war unzureichend.

❸ Katastrophal: DeepSeek
ⓐ Die berechneten Preise (1 Mio. EUR in 4 Jahren, 16 Mio. in 10 Jahren) waren völlig fehlerhaft.
ⓑ Die Kelly-Allokationen waren entsprechend falsch.
➤ Das Modell hat die Aufgabe grundsätzlich verstanden, der Rechenweg war korrekt, aber die Berechnung war dann vollkommen falsch.

Fazit und praktische Konsequenzen

☞ Sprachmodelle verstehen nicht automatisch alles. Ihr Verständnis muss – wie Code – schrittweise validiert werden. Ein Modell, das in einem Bereich brilliert (z.B. Textformatierung), kann in einem anderen (z.B. Mathematik) versagen.

☞ Die Wahl des Modells ist anwendungsabhängig. Für numerische Aufgaben eignen sich andere Modelle als für kreative Textarbeit. Man muss Erfahrungswerte entwickelt, welches Modell welche Aufgabe beherrscht.

☞ Vorsicht vor Instabilität. Ein Modell-Update kann die Leistung in bestimmten Bereichen verschlechtern. Im Gegensatz zu einer Excel-Formel ist das Verhalten eines Sprachmodells nicht stabil vorhersehbar.

☞ Sprachmodelle sind Werkzeuge, keine Wahrheit. Sie können die Ideenfindung unterstützen, ersetzen aber nicht das kritische Denken und die Nachkontrolle des Nutzers. Am liebsten würde mich mich selbst an das Sprachmodell out-sorucen, das spart mir am meisten Arbeit. Mit einem Sprachmodell habe ich keinen 200 IQ Professor sondern eher 10^6 Gymnasiasten der 10 Klasse. Die Durchführung von Aufgaben ist unbegrenzt, dafür muss umso mehr Zeit verwendet werden die richtige Fragestellung zu überlegenen und die Ergebnisse zu überprüfen.

Der verwendete Prompt für die Sprachmodelle:

Quote

<Promt>
Berechne die optimale Kelly-Allokation für Bitcoin für eine Haltedauer von 4 und von 10 Jahren, bei einem Bitcoinpreis von 99400 EUR per 2025-09-18.

Berücksichtige hierbei die hohe erwartete Rendite von Bitcoin gemäß <Bitcoin Preis-Trend-Funktion> sowie die Überlebenswahrscheinlichkeit von Bitcoin bzw. seinem Preistrend gemäß <Lindy-Funktion>.

<Lindy-Funktion>

# Lindy-Effekt Funktion: P(X) = e^(-X/Y)

## Funktionsbeschreibung

**P(X) = e^(-X/Y)**

Diese Funktion modelliert den Lindy-Effekt und berechnet die Überlebenswahrscheinlichkeit eines Objekts/Phänomens für die Zukunft.

## Parameter-Definitionen

### Y (Bisherige Lebensspanne)

- **Was es ist:** Anzahl Jahre, die das Objekt/Phänomen bereits existiert hat
- **Beispiele:**
- Buch ist 50 Jahre im Druck → Y = 50
- Unternehmen existiert seit 25 Jahren → Y = 25
- Technologie wird seit 10 Jahren verwendet → Y = 10

### X (Prognosezeitraum)

- **Was es ist:** Anzahl Jahre in die Zukunft, für die wir die Überlebenswahrscheinlichkeit berechnen wollen
- **Beispiele:**
- Wie wahrscheinlich überlebt es weitere 20 Jahre? → X = 20
- Überlebenschance in 5 Jahren? → X = 5

### P(X) (Überlebenswahrscheinlichkeit)

- **Was es ist:** Wahrscheinlichkeit (zwischen 0 und 1), dass das Objekt nach X Jahren noch existiert
- **Interpretation:**
- P(X) = 0.8 → 80% Chance zu überleben
- P(X) = 0.37 → 37% Chance zu überleben

## Kernprinzip des Lindy-Effekts

- **Größeres Y** (ältere Objekte) → **höhere Überlebenswahrscheinlichkeiten**
- **Erwartungswert:** Ein Y-Jahre altes Objekt hat eine erwartete weitere Lebensdauer von Y Jahren

## Praktische Anwendung

1. **Bestimme Y:** Wie alt ist das Objekt bereits?
1. **Wähle X:** Für welchen Zukunftszeitraum willst du die Prognose?
1. **Berechne:** P(X) = e^(-X/Y)
1. **Interpretiere:** Das Ergebnis ist die Überlebenswahrscheinlichkeit

## Beispielrechnung

**50-Jahre altes Buch, Prognose für weitere 20 Jahre:**

- Y = 50 (bereits 50 Jahre im Druck)
- X = 20 (Prognose für 20 Jahre)
- P(20) = e^(-20/50) = e^(-0.4) ≈ 0.67
- **Ergebnis:** 67% Wahrscheinlichkeit, dass das Buch in 20 Jahren noch gedruckt wird

## Wichtiger Hinweis

Diese Funktion gilt für eine **Momentaufnahme heute**. Wenn das Objekt weitere Jahre überlebt, muss Y entsprechend aktualisiert werden für neue Prognosen.
</Lindy-Funktion>

<Bitcoin Preis-Trend-Funktion>
Die Bitcoin Preis-Trend-Funktion schätzt den Bitcoin Preis-Trend in EUR auf Basis der <Funktionsform> und der <Parameter> zu einem jeweiligen Datum.

<Preisdaten>
Modellierung basierend auf historischen Bitcoin-Preisdaten in EUR
· von 2010-07-16
· bis 2025-09-18
</Preisdaten>

<Funktionsform>
Bitcoin-Preisanalyse: Potenzfunktion als Trendmodell

Geschätzte Trendfunktion
Die zugrundeliegende Modellierung folgt einer Potenzfunktion (Power-Law) mit folgender Form:

```
Trend(t) = exp(intercept) · (Δt)^growth
```
</Funktionsform>

<Parameter>
· Startdatum: 2009-01-03
· Intercept: -39.23953924
· Growth-Exponent: 5.824700561
· Δt: Tage seit Startdatum (t - Start)
</Parameter>

<Beispielrechnung><
Für den 2025-09-18 (Δt = 6102 Tage):
Trend = exp(-39.23953924) · 6102^5.82470056 ≈ 101795
</Beispielrechnung>

<Genauigkeit>

<Abweichungsmessung exp>
ln(beobachteter_Preis / Trendpreis)
Beispiel: ln(0.069588/0.091947) = -0.278624
</Abweichungsmessung exp>

<Abweichungsmessung Tage>
Tage vs. Trend
Berechnung des fiktiven Zeitpunkts, zu dem der Trendpreis dem beobachteten Preis entsprochen hätte:
t_equiv = (beobachteter_Preis / exp(intercept))^(1/growth)
days_vs_trend = t_equiv - Δt

Beispiel:
t_equiv = (99403 / exp(-39.23953924))^(1/5.824700561) ≈ 6077
days_vs_trend = 6077 - 6102 ≈ -24.86
</Abweichungsmessung Tage>

Power-Law zeigt robuste Langfrist-Projektion bei begrenzter Kurzfrist-Präzision.
</Genauigkeit>

</Bitcoin Preis-Trend-Funktion>
</Promt>

Wie sind eure Erfahrungen mit Sprachmodellen?