Bitcoin Forum
February 15, 2026, 11:23:59 PM *
News: Community awards 2025
 
   Home   Help Search Login Register More  
Pages: « 1 [2]  All
  Print  
Author Topic: [Meta] Statistiche utenti sezione italiana  (Read 312 times)
This is a self-moderated topic. If you do not want to be moderated by the person who started this topic, create a new topic.
Italian Panic
Sr. Member
****
Offline Offline

Activity: 622
Merit: 435



View Profile
February 13, 2026, 10:36:41 AM
 #21

Ulteriori progressi:

Ho aggiunto dei valori relativi alla stilometria degli utenti https://en.wikipedia.org/wiki/Stylometry
in questo modo mi creo una base statistica per poter effettuare passaggi successivi di clusterizzazione.

Ho ampliato la base utenti ed ho aggiornato i dati tabellari delle statistiche




Niente male, una volta clusterizzati puoi individuare pattern stilistici, pattern verbali e semantici. Sono in parte quelli che le AI usano per individuare i falsi o copy/paste.

Così potresti anche svelare un dubbio che mi affligge da un decennio: non ho mai creduto che satoshi avesse veramente abbandonato il progetto bitcoin, secondo me ha solo cambiato utente.
Italian Panic
Sr. Member
****
Offline Offline

Activity: 622
Merit: 435



View Profile
February 13, 2026, 10:43:29 AM
 #22

Secondo le tue statistiche ho usato 36,000 parole in italiano e 25,000 in inglese.
Il ratio mi pare basso. Mi sarei aspettato più parole nell'idioma italiano, che ha un vocabolario piuttosto variegato, anche se non siamo al livello della capacità lessicale dell'inglese, che ritengo abbia il numero di lemmi più elevato al mondo, retaggio del dominio dell'impero britannico agli inizi del secolo scorso.
Come si comporta, inoltre, la statistica con gli errori ortografici? Sono un sintomo della mia accidia, che a volte condiziona le mie elucubrazioni su queste pagine.
Credo comunque di aver aumentato il conto con questo post!

In tempi non sospetti ho analizzato l'ampiezza del vocabolario di alcuni scrittori e statisti del 900, tra gli italiani spicca il grande Umberto Eco con un vocabolario di circa 90k parole, in inglese il migliore era Churchill con 65k parole, conta che shakespeare si ferma a non più di 30k.
Un caso emblematico è Hemingway, uno scrittore assoluto ma che usava un vocabolario di non più di 15k parole per scelta. Pochissimi aggettivi, pochissimi giri semantici, lessico molto semplice.
gbianchi (OP)
Legendary
*
Online Online

Activity: 3724
Merit: 3432



View Profile
February 13, 2026, 11:23:49 AM
 #23

Ulteriori progressi:

Ho aggiunto dei valori relativi alla stilometria degli utenti https://en.wikipedia.org/wiki/Stylometry
in questo modo mi creo una base statistica per poter effettuare passaggi successivi di clusterizzazione.

Ho ampliato la base utenti ed ho aggiornato i dati tabellari delle statistiche




Niente male, una volta clusterizzati puoi individuare pattern stilistici, pattern verbali e semantici. Sono in parte quelli che le AI usano per individuare i falsi o copy/paste.

Così potresti anche svelare un dubbio che mi affligge da un decennio: non ho mai creduto che satoshi avesse veramente abbandonato il progetto bitcoin, secondo me ha solo cambiato utente.

Infatti sto implementato la seguente pipline:

credo una matrice di parametri stilometrici + parametri Tfidf ( https://it.wikipedia.org/wiki/Tf-idf )

Formo i cluster con HDBSCAN

Fuori dal cluster aggiungo anche un test sulla coincidenza oraria, mettere anche queste metriche in cluster
sarebbe come  mischiare mele pere e orologi Smiley


GUIDA PER NUOVI UTENTI https://bitcointalk.org/index.php?topic=1241459.0
DO NOT HOLD YOUR BTC ON THIRD PARTY EXCHANGES – BE YOUR OWN BANK https://bitcointalk.org/index.php?topic=945881.0
BITCOIN... WHAT IS IT ? https://bitcointalk.org/index.php?topic=2107660.0
fillippone
Legendary
*
Online Online

Activity: 2800
Merit: 19915


Duelbits.com - Rewarding, beyond limits.


View Profile WWW
February 13, 2026, 12:58:30 PM
 #24

Ulteriori progressi:

<…>

<…>
Così potresti anche svelare un dubbio che mi affligge da un decennio: non ho mai creduto che satoshi avesse veramente abbandonato il progetto bitcoin, secondo me ha solo cambiato utente.

Se scopriamo che Satoshi é ancora sul forum, magari é babo, potrebbe essere una cosa rivoluzionaria.
Sinceramente non credo sia possibile.
Ma sicuramente interessante, vista la quantità di OG e dei loro post.

███████████████████████████
███████▄████████████▄██████
████████▄████████▄████████
███▀█████▀▄███▄▀█████▀███
█████▀█▀▄██▀▀▀██▄▀█▀█████
███████▄███████████▄███████
███████████████████████████
███████▀███████████▀███████
████▄██▄▀██▄▄▄██▀▄██▄████
████▄████▄▀███▀▄████▄████
██▄███▀▀█▀██████▀█▀███▄███
██▀█▀████████████████▀█▀███
███████████████████████████
.
.Duelbits PREDICT..
█████████████████████████
█████████████████████████
███████████▀▀░░░░▀▀██████
██████████░░▄████▄░░████
█████████░░████████░░████
█████████░░████████░░████
█████████▄▀██████▀▄████
████████▀▀░░░▀▀▀▀░░▄█████
██████▀░░░░██▄▄▄▄████████
████▀░░░░▄███████████████
█████▄▄█████████████████
█████████████████████████
█████████████████████████
.
.WHERE EVERYTHING IS A MARKET..
█████
██
██







██
██
██████
Will Bitcoin hit $200,000
before January 1st 2027?

    No @1.15         Yes @6.00    
█████
██
██







██
██
██████

  CHECK MORE > 
gbianchi (OP)
Legendary
*
Online Online

Activity: 3724
Merit: 3432



View Profile
February 14, 2026, 03:16:58 PM
Last edit: February 14, 2026, 11:10:20 PM by gbianchi
Merited by fillippone (3)
 #25

Ecco la prima clusterizzazione HDBSCAN.

Ricordo che i passaggi sono PULIZIA POST -> SILOMETRIA + TF-IDF -> HDBSCAN

Ci sono degli utenti che hanno parametri molto singolari e non riesce a clusterizzarli,
ad esempio Demidof me lo aspettavo, molto originale nel modo di scrivere e nelle frasi usate,
comunque di "isole" ce ne sono diverse, mentre io sono in cluster assieme ad arulbero, fillippone ed altri.





UTENTE                    | HDBSCAN (Identità)
----------------------------------------------------------------------------------------------------------------------------------
*Ace*                     | Cluster 1
Ale88                     | RUMORE (Unico)
Changaa                   | Cluster 3
HostFat                   | RUMORE (Unico)
Italian Panic             | RUMORE (Unico)
MarioV                    | Cluster 0
alexrossi                 | RUMORE (Unico)
arulbero                  | Cluster 0
babo                      | RUMORE (Unico)
banana33                  | Cluster 3
bastisisca                | Cluster 2
bitbollo                  | RUMORE (Unico)
conilmionome              | RUMORE (Unico)
dollyamo                  | Cluster 3
fillippone                | Cluster 0
gbianchi                  | Cluster 0
georgino22222             | RUMORE (Unico)
giammangiato              | Cluster 2
giorgione                 | Cluster 3
lillominato89             | Cluster 1
m4r1o                     | Cluster 3
martinom                  | Cluster 3
paolo.demidov             | RUMORE (Unico)
pewboy                    | Cluster 3
plutosky                  | RUMORE (Unico)
simpic                    | RUMORE (Unico)
ubaldo81                  | Cluster 0
verdinio                  | Cluster 3
xenomorfo                 | RUMORE (Unico)



GUIDA PER NUOVI UTENTI https://bitcointalk.org/index.php?topic=1241459.0
DO NOT HOLD YOUR BTC ON THIRD PARTY EXCHANGES – BE YOUR OWN BANK https://bitcointalk.org/index.php?topic=945881.0
BITCOIN... WHAT IS IT ? https://bitcointalk.org/index.php?topic=2107660.0
fillippone
Legendary
*
Online Online

Activity: 2800
Merit: 19915


Duelbits.com - Rewarding, beyond limits.


View Profile WWW
Today at 10:35:00 AM
 #26

Mi sembrano cluster ancora troppo vaghi: questo vorrebbbe dire che io potrei essere un tuo alt, ma non uno di babo o di *Ace* perché siamo in cluster diversi?
Inoltre se babo é rumore la tesi che sia Satoshi resta valida…

███████████████████████████
███████▄████████████▄██████
████████▄████████▄████████
███▀█████▀▄███▄▀█████▀███
█████▀█▀▄██▀▀▀██▄▀█▀█████
███████▄███████████▄███████
███████████████████████████
███████▀███████████▀███████
████▄██▄▀██▄▄▄██▀▄██▄████
████▄████▄▀███▀▄████▄████
██▄███▀▀█▀██████▀█▀███▄███
██▀█▀████████████████▀█▀███
███████████████████████████
.
.Duelbits PREDICT..
█████████████████████████
█████████████████████████
███████████▀▀░░░░▀▀██████
██████████░░▄████▄░░████
█████████░░████████░░████
█████████░░████████░░████
█████████▄▀██████▀▄████
████████▀▀░░░▀▀▀▀░░▄█████
██████▀░░░░██▄▄▄▄████████
████▀░░░░▄███████████████
█████▄▄█████████████████
█████████████████████████
█████████████████████████
.
.WHERE EVERYTHING IS A MARKET..
█████
██
██







██
██
██████
Will Bitcoin hit $200,000
before January 1st 2027?

    No @1.15         Yes @6.00    
█████
██
██







██
██
██████

  CHECK MORE > 
gbianchi (OP)
Legendary
*
Online Online

Activity: 3724
Merit: 3432



View Profile
Today at 11:18:34 AM
 #27

Mi sembrano cluster ancora troppo vaghi: questo vorrebbbe dire che io potrei essere un tuo alt, ma non uno di babo o di *Ace* perché siamo in cluster diversi?
Inoltre se babo é rumore la tesi che sia Satoshi resta valida…

Si infatti adesso ho scritto una funzione che da la distanza media tra i  parametri.
Per formare il cluster vengono presi in considerazione diversi parametri (25 per TF-IDF e 11 di stilometria)
e calcolo la distanza media dei componenti del gruppo (coesione del gruppo)

Il cluster 1 e' di soli 2 elementi che hanno una coesione alta (quasi 83%)

Anche il cluster 2 e' di 2 elementi e la coesione e' del 70% circa

Ma l'incredibile e' il cluster 3: 8 elementi con una coesione del 82.5!

Noi, (io te e altri), siamo stati clusterizzati ma abbiamo una coesione relativamente bassa, poco piu' del 21%

Gli altri sono relativamente ancor piu' lontani e non sono stati clusterizzati, trattati come isole.

Voglio fare delle funzioni che visualizzano graficamente il tutto.



ANALISI GRUPPI (CLUSTERING)
=================================================================================================================================================
CLUSTER    | N°   | COESIONE TF-IDF+STILE        | SINCRONIA TEMPO
-------------------------------------------------------------------------------------------------------------------------------------------------
GRUPPO 1   | 2    | 82.9%                        | 0.80 (ALTA)
   -> Membri: *Ace*, lillominato89
-------------------------------------------------------------------------------------------------------------------------------------------------
GRUPPO 3   | 8    | 82.5%                        | 0.83 (ALTA)
   -> Membri: Changaa, banana33, dollyamo, giorgione, m4r1o, martinom, pewboy, ve...
-------------------------------------------------------------------------------------------------------------------------------------------------
GRUPPO 2   | 2    | 70.4%                        | 0.81 (ALTA)
   -> Membri: bastisisca, giammangiato
-------------------------------------------------------------------------------------------------------------------------------------------------
GRUPPO 0   | 5    | 21.4%                        | 0.32 (BASSA)
   -> Membri: MarioV, arulbero, fillippone, gbianchi, ubaldo81
-------------------------------------------------------------------------------------------------------------------------------------------------



GUIDA PER NUOVI UTENTI https://bitcointalk.org/index.php?topic=1241459.0
DO NOT HOLD YOUR BTC ON THIRD PARTY EXCHANGES – BE YOUR OWN BANK https://bitcointalk.org/index.php?topic=945881.0
BITCOIN... WHAT IS IT ? https://bitcointalk.org/index.php?topic=2107660.0
gbianchi (OP)
Legendary
*
Online Online

Activity: 3724
Merit: 3432



View Profile
Today at 01:06:31 PM
 #28

In questo grafico ho usato un sistema di visualizzazione che utilizzo per altri progetti.

In pratica si tratta di "collassare" 36 dimensioni (25 + 11) su un grafico per visualizzare
nel modo piu' coerente possibile le "vicinanze".

Io uso il sistema di proiettare N dimensioni  su 3 dimensioni (le massime possibili nel mondo umano)
che pero' a loro volta sono collassate sulle 2 dimensioni del video.

Allora creo una animazione che fa ruotare il 3d per cercare di cogliere il meglio possibile le "vicinanze"

Ecco il risultato:

Da notare in modo visivo in come  demidov e' il pianeta che gira in modo piu' lontano da tutti
come scrittura e stile, ed e' un dato che mi torna assolutamente.

Da notare anche come gli 8 elementi del cluster 3 sono quasi la stessa cosa.



 


GUIDA PER NUOVI UTENTI https://bitcointalk.org/index.php?topic=1241459.0
DO NOT HOLD YOUR BTC ON THIRD PARTY EXCHANGES – BE YOUR OWN BANK https://bitcointalk.org/index.php?topic=945881.0
BITCOIN... WHAT IS IT ? https://bitcointalk.org/index.php?topic=2107660.0
*Ace*
Sr. Member
****
Online Online

Activity: 322
Merit: 655



View Profile
Today at 03:58:59 PM
 #29

Bellissimo sto grafico! Sembra la rotazione dei pianeti attorno alla propria stella!
Però sta correlazione non la sto capendo affatto, tenere conto del testo in una community così ristretta non crea falsi positivi?
Anche la correlazione tra te e fillippone la trovo assurda.
Da quello che vedo sinceramente sembrerebbe che io e bastisisca fossimo più vicini

Pages: « 1 [2]  All
  Print  
 
Jump to:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.19 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!