Title: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on October 29, 2015, 08:52:54 AM Buongiorno,
tempo fa ho stilato una lista di parole da usare per poter rappresentare il seed dei nostri wallet nella nostra lingua. La lista è di 2063 [2041] parole, ne servono 2048. Ho scelto le parole seguende le linee guida del BIP39. Rispetto alla lista inglese le parole sono mediamente più lunghe quindi il seed occuperà più spazio probabilmente. Io l'ho riletta più volte ma sicuramente qualche parola strana mi è sfuggita. C'è bisogno di voi per arrivare ad una lista elegante da usare per la localizzazione dei wallet nella nostra lingua e semplificare la vita ai nuovi utenti. La lista temporanea: http://pastebin.com/zWz1pYip EDIT2: ultima versione dela lista (https://github.com/the9ull/lista-mnemonica-bip39/blob/master/italian.txt). Potreste controllare solo una parte della lista e riportare qui i commenti per quella. EDIT: ho creato un repository git (https://github.com/the9ull/lista-mnemonica-bip39) per tenere traccia delle modifiche e delle motivazioni. Potete anche suggerire i cambiamenti via pull request. Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: leevancleef on October 29, 2015, 11:20:17 AM ottima iniziativa :) ti aiuto volentieri...
se non ho capito male queste sono le linee guida per la scelta delle parole: Quote Wordlist An ideal wordlist has the following characteristics: a) smart selection of words - the wordlist is created in such way that it's enough to type the first four letters to unambiguously identify the word b) similar words avoided - word pairs like "build" and "built", "woman" and "women", or "quick" and "quickly" not only make remembering the sentence difficult, but are also more error prone and more difficult to guess c) sorted wordlists - the wordlist is sorted which allows for more efficient lookup of the code words (i.e. implementations can use binary search instead of linear search) - this also allows trie (a prefix tree) to be used, e.g. for better compression The wordlist can contain native characters, but they must be encoded in UTF-8 using Normalization Form Compatibility Decomposition (NFKD). fonte: https://github.com/bitcoin/bips/blob/master/bip-0039.mediawiki (https://github.com/bitcoin/bips/blob/master/bip-0039.mediawiki) prima considerazione, nella regola a) e' richiesto che le parole siano identificate univocamente delle loro prime 4 lettere... quindi toglierei le parole di 3 lettere che potrebbero creare problemi (non creano problemi solo se si considera lo spazio come 4' carattere) ed ho trovato queste: Quote ago boa cui fez poi c'e' qualche piccolo refuso, qui si puo' scegliere se correggere le parole o eliminarle (per controllare la correttezza delle parole ho usato il vocabolario della treccani (http://www.treccani.it/vocabolario/)): Quote redito > reddito rabbuiare > abbuiare mussulmano > musulmano inspessire > ispessire figliuolo > figliolo forviare > fuorviare (questo e' corretto, ma desueto nella forma riportata nella wordlist... io lo toglierei per evitare problemi) per quanto riguarda le parole simili l'analisi diventa piu' soggettiva; per quel che vale ti dico quelle che mi sono segnato: Quote volenteroso volontario stoppare storpiare smosso smuovere rilevo rilievo reagente reattivo reazione qualunque quantunque oleastro oleoso incisivo inclusivo fastidio fatidico ateneo ateo atlante atleta anomalo anormale infine ci sono le parole che ritengo "problematiche", ma anche qui siamo nel campo del "molto soggettivo"; in ogni caso i criteri che me le hanno fatte scegliere sono: parole desuete, parole che spesso vengono storpiate scrivendole in maniera diversa dalla forma corretta o parole che ne hanno una simile molto piu' usata (e quindi piu' prone ad errori nelle trascrizioni): Quote alcool babbuccia chiacchierare ciliegio deismo eresiarca eureka genziana gramolata granturco immensurabile isomeria mangiucchiare melagrana mnemonica necessita nonnulla panereccio pluviometro piva prognostico rullio runico unigenito snudare spero di essere stato utile :) ciao Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on October 29, 2015, 12:36:14 PM prima considerazione, nella regola a) e' richiesto che le parole siano identificate univocamente delle loro prime 4 lettere... quindi toglierei le parole di 3 lettere che potrebbero creare problemi (non creano problemi solo se si considera lo spazio come 4' carattere) ed ho trovato queste: Quote ago boa cui fez Le ho tenute perché ho visto che anche nella lista inglese (https://raw.githubusercontent.com/trezor/python-mnemonic/master/mnemonic/wordlist/english.txt) ci sono numerose parole con 3 lettere. A breve cerco di integrare i suggerimenti, grazie mille per il contributo :) EDIT: ottimi suggerimenti, ho eliminato tutte le parole a parte genziana. Per quanto riguarda le parole simili ho cercato di includere solo la più comune o la più corta. La nuova lista è qui (https://github.com/the9ull/lista-mnemonica-bip39/blob/master/italian.txt) (2014 parole/2048). Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: leevancleef on October 30, 2015, 11:38:50 AM ... visto che ormai mi sono fatto prendere da questo lavoro, ti propongo anche qualche parola: Quote ancora caglio disegni fausto giostra letizia nonna riga rosa spazio studio tenda torta valore vite voce ovviamente le parole sono compliant (ma per sicurezza ricontrolla) con il paragrafo a) e mi pare che non diano problemi di parole simili... ho anche cercato di sceglierle corte per abbassare un pochino la media. naturalmente sei libero di farne l'uso che credi. ciao Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 05, 2015, 02:01:28 PM Ottimo lavoro! Grazie! Ho aggiunto le parole ad eccezione di *quote* (è presente in english.txt (da qualche parte avevo letto anche questa linea guida, chissà dove)) e *ancora* (c'era già nella lista).
Sarebbe ottimo avere anche la revisione da parte di qualcun altro. Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 05, 2015, 04:27:50 PM https://github.com/bitcoin/bips/blob/master/bip-0039/bip-0039-wordlists.md
Per la lista spagnola si parla del fatto che non ha incomune parole con altre liste, in questo modo è possibile identificarle la lista controllando una sola parola. Non rispettare questa proprietà farebbe saltare anche il vantaggio della lista spagnola. (già la prima parola ábaco è in comune con quella italiana :S) Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: leevancleef on November 05, 2015, 05:20:33 PM ... mi sembra una "regola" difficile da rispettare, soprattutto perche' ci saranno liste compilate in futuro... comunque se ci tieni ho fatto una lista delle parole in comune con gli spagnoli (togliendo gli accenti), ce ne sono ben 52: Quote abaco agosto ateo atomo boa burla caos celebre cemento cripta diadema diario duro elefante enigma epoca farsa fiera foto frase fuga gloria golfo grumo idioma laguna leopardo memoria minuto nausea nube nucleo numero oceano orbita ozono palma patria principe rosa selva sistema sonoro sorpresa teatro tormenta tregua trofeo urbano utopia vampiro video ciao PS: devo passare in rassegna anche tutte le altre lingue a partire dai francesi? Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 07, 2015, 08:22:33 AM ... mi sembra una "regola" difficile da rispettare, soprattutto perche' ci saranno liste compilate in futuro... comunque se ci tieni ho fatto una lista delle parole in comune con gli spagnoli (togliendo gli accenti), ce ne sono ben 52: ciao PS: devo passare in rassegna anche tutte le altre lingue a partire dai francesi? Son d'accordo che sia difficile da rispettare, e i vantaggi non sono così importanti. Per un sw controllare una parola o 100 non fa nessuna differenza. C'è un unico caso problematico, e anche questo può essere in parte risolto quasi sempre, cioè quando tutte le parole del seme sono presenti in due o più liste. Il sw che genera il seme può mitigare questo problema non generando queste combinazioni, ma non può garantire compatibilità con le liste di parole pubblicate in futuro. Pensando a questo problema cercherei di rimuovere il più possibile le parole in comune, certo che ci serviranno un bel po' di parole nuove da inserire :D Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: picchio on November 07, 2015, 10:14:41 AM Io non ho chiaro lo scopo, se ho capito si vuole creare un seme che di fatto è una chiave privata partendo da un insieme finito di parole mischiate casualmente in modo che l'utente possa ricordarle meglio?
Se è cosi' mi pare pericoloso per la sicurezza. Devo non aver capito qualcosa ... Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: leevancleef on November 07, 2015, 10:26:26 AM qui trovi tutti i dettagli della bip-39 (https://github.com/bitcoin/bips/blob/master/bip-0039.mediawiki) Quote BIP: BIP-0039 Title: Mnemonic code for generating deterministic keys [...] Motivation A mnemonic code or sentence is superior for human interaction compared to the handling of raw binary or hexidecimal representations of a wallet seed. The sentence could be written on paper or spoken over the telephone. This guide is meant to be a way to transport computer-generated randomness with a human readable transcription. It's not a way to process user-created sentences (also known as brainwallets) into a wallet seed. ciao Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: picchio on November 07, 2015, 10:31:05 AM qui trovi tutti i dettagli della bip-39 (https://github.com/bitcoin/bips/blob/master/bip-0039.mediawiki) Quote BIP: BIP-0039 Title: Mnemonic code for generating deterministic keys [...] Motivation A mnemonic code or sentence is superior for human interaction compared to the handling of raw binary or hexidecimal representations of a wallet seed. The sentence could be written on paper or spoken over the telephone. This guide is meant to be a way to transport computer-generated randomness with a human readable transcription. It's not a way to process user-created sentences (also known as brainwallets) into a wallet seed. ciao DOve sbaglio? Forse generano frasi lunghissime? Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 07, 2015, 10:37:23 AM A me sembra quanto da me capito ed espresso nel post precedente. Mi pare un pericolo per la sicurezza. Se poi dobbiamo farlo che i primi 4 caratteri che identificano la parola arriviamo ad un insieme di combinazioni piuttosto ridotto rispetto ad una chiave casuale. La lunghezza della frase dipende dalla chiave da rappresentare.DOve sbaglio? Forse generano frasi lunghissime? 128 bit -> 12 parole circa 256 bit -> 24. La lista è di 2048 parole, quindi: log2( 2048^12 ) = 132 bit log2( 2048^24 ) = 264 bit Non si ha perdita di informazione, quindi non cala la sicurezza EDIT: ho tolto le 52 parole della lista spagnola. 1989 sono ora :S Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: picchio on November 07, 2015, 10:44:44 AM A me sembra quanto da me capito ed espresso nel post precedente. Mi pare un pericolo per la sicurezza. Se poi dobbiamo farlo che i primi 4 caratteri che identificano la parola arriviamo ad un insieme di combinazioni piuttosto ridotto rispetto ad una chiave casuale. La lunghezza della frase dipende dalla chiave da rappresentare.DOve sbaglio? Forse generano frasi lunghissime? 128 bit -> 12 parole circa 256 bit -> 24. La lista è di 2048 parole, quindi: log2( 2048^12 ) = 132 bit log2( 2048^24 ) = 264 bit Non si ha perdita di informazione, quindi non cala la sicurezza Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 07, 2015, 10:47:02 AM Grazie, ora mi è piu' chiaro. Non ringraziamenti ma parole da aggiungere alla lista ;P Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: picchio on November 07, 2015, 12:38:12 PM Grazie, ora mi è piu' chiaro. Non ringraziamenti ma parole da aggiungere alla lista ;P grandezza corretto riconosciuta nutrono azione ammirazione cuore edizioni Ciao Picchio Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 07, 2015, 01:07:33 PM Grazie, ora mi è piu' chiaro. Non ringraziamenti ma parole da aggiungere alla lista ;P grandezza corretto riconosciuta nutrono azione ammirazione cuore edizioni Ciao Picchio Per le prime 3 ci sono già altre parole nella lista che con le stesse 4 iniziali, ho aggiunto le altre. Grazie. Io vado in vacanza una settimana. Ci sentiamo dopo il 16. Ciao ciao Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: picchio on November 07, 2015, 01:41:48 PM Grazie, ora mi è piu' chiaro. Non ringraziamenti ma parole da aggiungere alla lista ;P grandezza corretto riconosciuta nutrono azione ammirazione cuore edizioni Ciao Picchio Per le prime 3 ci sono già altre parole nella lista che con le stesse 4 iniziali, ho aggiunto le altre. Grazie. Io vado in vacanza una settimana. Ci sentiamo dopo il 16. Ciao ciao ... governare graduatoria grafite grappolo ... Quindi grandezza non la vedo. Ho la lista errata? Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 07, 2015, 01:59:40 PM ... C'è grano, probabilmente lo stavo caricando proprio mentre tu consultavi la lista :Sgovernare graduatoria grafite grappolo ... Quindi grandezza non la vedo. Ho la lista errata? Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: picchio on November 07, 2015, 02:06:30 PM ... C'è grano, probabilmente lo stavo caricando proprio mentre tu consultavi la lista :Sgovernare graduatoria grafite grappolo ... Quindi grandezza non la vedo. Ho la lista errata? Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: picchio on November 07, 2015, 02:12:45 PM Aggiungo:
grammatica grasso grumo istante isterico macerie Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 07, 2015, 02:21:57 PM Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 18, 2015, 08:33:02 AM Ho copiato da trezor/python-mnemonic (https://github.com/trezor/python-mnemonic/mnemonic) questo script (https://github.com/the9ull/lista-mnemonica-bip39/blob/master/test_similarity.py) per verificare che non ci siano similitudini fra le parole della lista. Il controllo viene fatto solo su parole della stessa lunghezza e si controlla che non ci siano caratteri simili nella stessa posizione mi sembra.
Il test è stato superato. Numero di parole: 2039/2048 Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: picchio on November 18, 2015, 12:51:18 PM abbellire
fecondo glicine inizio musa remare riquadro sedimento slegati stazza suggestivo teca treno Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 18, 2015, 01:06:49 PM +1
Numero di parole: 2050/2048 Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 20, 2015, 10:36:34 AM Su http://badip.uni-graz.at ho trovato una lista (https://raw.githubusercontent.com/the9ull/lista-mnemonica-bip39/master/unigraz.txt) di 14k parole italiane comuni. Quando ho un po' di tempo, con l'aiuto di qualche scriptino, le ordino per lunghezza e verifico quali potrebbero essere inserite (magari per sostituire le parole più lunghe, ad esempio inserendo 89 nuove parole potremmo ridurre la lunghezza massima di una parola a 11 caratteri).
EDIT: ecco la lista ordinata delle parole che potrebbero essere inserite: https://raw.githubusercontent.com/the9ull/lista-mnemonica-bip39/master/unigraz-comp.txt (inserire una parola potrebbe escluderne delle altre) Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on November 24, 2015, 08:15:06 AM Ho iniziato a filtrare la lista: work in progress (https://raw.githubusercontent.com/the9ull/lista-mnemonica-bip39/master/unigraz-comp-filtering.txt)
EDIT: completata EDIT: E qui la lista (https://github.com/the9ull/lista-mnemonica-bip39/blob/master/temp.txt) allo stato attuale. 2048 parole, ordinata Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: agath on March 29, 2016, 11:25:36 PM Oops, sono arrivato a questo thread tramite Google. Nei mesi scorsi ho lavorato alla versione italiana di bip39 da includere in un progetto, l'ho proposta ed è stata approvata:
https://github.com/bitcoin/bips/blob/master/bip-0039/italian.txt Non ero a conoscenza della vostra iniziativa ... :-\ Title: Re: [Aiutatemi] Wordlist italiana per il BIP39 Post by: inaltoasinistra on March 30, 2016, 06:32:34 AM Mannaggia peccato x.x
La cosa importante è avere una lista dai :D Grazie mille! |