Acho que vai ser bem mais de 20%, risquei as palavras iguais e com acento (eu por exemplo não gostaria de usar acentos e palavras com Ç ou duplos "s" que podem gerar typos).. e mesmo assim ficam muito parecidas, como abogado e advogado..
Nao precisa tirar os acentos.
Special Spanish characters like 'ñ', 'ü', 'á', etc... are considered equal to 'n', 'u', 'a', etc... in terms of identifying a word. Therefore, there is no need to use a Spanish keyboard to introduce the passphrase, an application with the Spanish wordlist will be able to identify the words after the first 4 chars have been typed even if the chars with accents have been replaced with the equivalent without accents.
Eu andei olhando as listas, e nao seguem nmenhuma logica.
A palavra 1 em ingles nao precisa ter nenhuma relacao com a palavra 1 em espanhol.
Isso facilita muito o trabalho.
O que eu percebi, é que as pessoas colocam palavras aleatórias mas distribuem bem q quantidade de palavras que começam com a mesma letra.
Acho impossivel fazer sem uma linguagem de programacao. Tentar no excel é loucura. ACho que python é a mais simples por conta do pandas. Posso simplesmente baixar todas as listas de palavras emt odas as linguages e com 1 comando ele compara as 10-20mil palavras se tem alguma igual na minha lsita, por exemplo.
Essa lista que voce passou, com 320mil palavras em portugues, foi feita com python.
Acho que vai ser bem mais de 20%, risquei as palavras iguais e com acento (eu por exemplo não gostaria de usar acentos e palavras com Ç ou duplos "s" que podem gerar typos).. e mesmo assim ficam muito parecidas, como abogado e advogado..
Isso também nao tem problema. Uma vez que voce configura o software para usar uma determinada lingua,ele vai procurar palavras na lista daquele idioma.
Nao pode ter variacao de uma letra dentro da propria lista.
Por exemplo, "Ceu" e "Seu" (exemplo idiota mas foi o que pensei agora kkk)
A word is fully recognizable by typing the first 4 letters (special French characters "é-è" are considered equal to "e", for example "museau" and "musée" can not be together).
Only infinitive verbs, adjectives and nouns.
No pronouns, no adverbs, no prepositions, no conjunctions, no interjections (unless a noun/adjective is also popular than its interjection like "mince;chouette").
No numeral adjectives.
No words in the plural (except invariable words like "univers", or same spelling than singular like "heureux").
No female adjectives (except words with same spelling for male and female adjectives like "magique").
No words with several senses AND different spelling in speaking like "verre-vert", unless a word has a meaning much more popular than another like "perle" and "pairle".
No very similar words with 1 letter of difference.
https://github.com/bitcoin/bips/blob/master/bip-0039/bip-0039-wordlists.md