Bitcoin Forum

Local => Off-Topic (Italiano) => Topic started by: alch1mista on March 05, 2015, 02:18:21 AM



Title: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: alch1mista on March 05, 2015, 02:18:21 AM
Tutti i siti hanno un robots.txt, queste contiene la lista delle pagine di quel sito che non devono essere indicizzate dai motori di ricerca.
Se si cerca il robot.txt del sito di Repubblica e del Corriere si ottiene una lista BELLISSIMA di articoli, verosimilmente quelli su cui ci sono beghe legali e che l'editore, o il capo-redattore, o chi per loro, ha deciso di non far apparire sui motori di ricerca.

Divertitevi con:
http://www.repubblica.it/robots.txt
http://www.corriere.it/robots.txt

Non sorprendentemente, la maggior parte degli articoli parlano di arresti e corruzione con protagonisti politici o dottori, dei quali compare il nome.

Capita anche con i titolari di grosse aziende.


Ma ancora più bello:
http://www.governo.it/robots.txt

Le pagine censurate sono quelle relative a questa legge:

La legge n. 69 del 18 giugno 2009 (“Disposizioni per lo sviluppo economico, la semplificazione, la competitività nonché in materia di processo civile”) impone, all’art. 21, comma 1, che tutte le pubbliche amministrazioni debbano rendere note, attraverso i propri siti internet, alcune informazioni relative ai dirigenti (curriculum vitae, retribuzione, recapiti istituzionali) e i tassi di assenza e di presenza del personale, aggregati per ciascun ufficio dirigenziale.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: acquafredda on March 05, 2015, 08:41:14 AM
bella storia...
ma pensa te


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Gianluca95 on March 07, 2015, 04:24:27 PM
Assurdo, e poi si ostinano a dire a voce alta che siamo in un paese democratico. Il massimo si raggiunge quando si apre il robots.txt del governo e si leggono i decreti che hanno deciso di non pubblicare  ;D


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: lucolo on March 07, 2015, 04:26:50 PM
Non ci avevo mai fatto caso. Che bello... ::)


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: fusioncoins on March 09, 2015, 12:56:53 AM
Probabilmente in certi casi è fatto per tutelare la privacy sui motori di ricerca.
Soprattutto per quanto riguarda l'operazione trasparenza delle Pubbliche Amministrazioni che deve essere bene in vista sul sito.

Nei casi dei quotidiani probabilmente saranno avvocati che avranno diffidato da rendere noto ai motori di ricerca un certo nome.

Anche perchè te magari 20 anni fa hai stuprato una gallina e sei finito su Repubblica e se oggi cerchi lavoro tutti quelli che cercheranno il tuo nome arriveranno alla gallina.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: brutale2 on March 09, 2015, 01:10:24 PM
Cioè fatemi capire, il governo italiano ha fatto una legge sulla trasparenza e poi nasconde le pagine sul suo sito? "disallow - operazione trasparenza" ;D rotolo


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: FaSan on March 09, 2015, 01:13:59 PM
Cioè fatemi capire, il governo italiano ha fatto una legge sulla trasparenza e poi nasconde le pagine sul suo sito? "disallow - operazione trasparenza" ;D rotolo


In realtà protegge solo l' elenco nomi. Le possibilità da come la vedo io, possono essere due. Una per tutelare la privacy dei dirigenti e consulenti, l'altra potrebbe essere che cambiano con una certa frequenta e per evitare disguidi si preferisci non farli indicizzare



FaSan


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: alch1mista on March 09, 2015, 01:19:15 PM
Il punto è che se cerchi il nome di un certo politico, google non ti darà risultati riguardanti l'operazione trasparenza, e dunque della sua presenza/assenza a lavoro, del suo stipendio, etc.

Non lo trovo troppo giusto, è un cavillo che possono permettersi, ma è divertente e sconfortante quanto sia dissonante con la trasparenza per cui è stata fatta la legge.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: fusioncoins on March 09, 2015, 02:13:58 PM
Considera che l'operazione trasparenza tratta al 90% dei dipendenti e non dei politici.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Cash BTC on March 12, 2015, 02:54:39 PM
E ci è voluto fino al 2009 per approvare una legge del genere?!?


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: LastRoby on March 20, 2015, 06:02:11 AM
Hehe interessante..
Grazie x la segnalazione!


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: acquafredda on March 20, 2015, 09:38:46 AM
OT @ alchimista

mi spieghi perché non mi rispondi al pm che ti ho mandato?


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: jkoin on April 08, 2015, 07:32:13 AM
Scusate quello che non capisco perchè questi quotidiani hanno un elenco di pagine che non vogliono far indicizzare? Se vogliono "censurare" quei contenuti non gli verrebbe più semplice eliminare direttamente quegli articoli? Se uno ci arriva navigando "a mano" sono ancora disponibili...


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: fusioncoins on April 08, 2015, 02:30:40 PM
Perchè se cerchi Tizio+Caio su Google per altri motivi (recruiting per esempio) non devono mostrare quel contenuto.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Cash BTC on April 08, 2015, 05:23:33 PM
Scusate quello che non capisco perchè questi quotidiani hanno un elenco di pagine che non vogliono far indicizzare? Se vogliono "censurare"...

Cosa c'entra la censura con l'indicizzazione?!?

Dai... dai... ce la puoi fare: si chiama lingua italiana.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: ReDPoiSoN on April 08, 2015, 05:26:50 PM
Scusate quello che non capisco perchè questi quotidiani hanno un elenco di pagine che non vogliono far indicizzare? Se vogliono "censurare"...

Cosa c'entra la censura con l'indicizzazzione?!?

Dai... dai... ce la puoi fare: si chiama lingua italiana.

La lingua italiana prevede anche che si scriva "indicizzazione"!

http://www.treccani.it/enciclopedia/indicizzazione/

(Senza rancore, te la sei cercata  ;D)


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Cash BTC on April 08, 2015, 06:03:45 PM

La lingua italiana prevede anche che si scriva "indicizzazione"!

http://www.treccani.it/enciclopedia/indicizzazione/

(Senza rancore, te la sei cercata  ;D)

Post corretto.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: jkoin on April 09, 2015, 06:20:39 AM
Perchè se cerchi Tizio+Caio su Google per altri motivi (recruiting per esempio) non devono mostrare quel contenuto.

Si certo quello è chiaro, ma se io avessi spirito censorio e volessi avere la certezza di censurare un certo contenuto mi limiterei a eliminarlo dal mio sito...scrivendolo nel robots.txt lo lascio sotto gli occhi di chi vuole commentare tale file come stiamo facendo qui...


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Cash BTC on April 09, 2015, 03:44:26 PM

Si certo quello è chiaro, ma se io avessi spirito censorio e volessi avere la certezza di censurare un certo contenuto mi limiterei a eliminarlo dal mio sito...scrivendolo nel robots.txt lo lascio sotto gli occhi di chi vuole commentare tale file come stiamo facendo qui...

Continuate a parlare di censura, per me l'indicizzazione con la censura non c'entra niente.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Anon39 on April 09, 2015, 05:05:18 PM

Si certo quello è chiaro, ma se io avessi spirito censorio e volessi avere la certezza di censurare un certo contenuto mi limiterei a eliminarlo dal mio sito...scrivendolo nel robots.txt lo lascio sotto gli occhi di chi vuole commentare tale file come stiamo facendo qui...

Continuate a parlare di censura, per me l'indicizzazione con la censura non c'entra niente.
ah no? e come arrivi a un articolo di un mese o un anno fa se non cercandolo con un motore di ricerca?
eliminare risultati da una ricerca arbitrariamente è proprio censura
anche wikipedia parla con questi termini http://it.wikipedia.org/wiki/Google#Censura


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Cash BTC on April 09, 2015, 05:39:36 PM
ah no? e come arrivi a un articolo di un mese o un anno fa se non cercandolo con un motore di ricerca?
eliminare risultati da una ricerca arbitrariamente è proprio censura
anche wikipedia parla con questi termini http://it.wikipedia.org/wiki/Google#Censura

Censura e' rimuovere un contenuto.

L'indicizzazione e' una questione di efficienza.

Probabilmente, ma sto speculando sulle spalle degli altri e non si dovrebbe mai fare questa cosa ovviamente, per questioni economiche del giornale hanno deciso di non rendere ricercabili dai motori di ricerca quei contenuti.

"Grazie".

PS: tra l'altro il link che ha postato Lei @Anon39 e' inerente alla censura di Google, e la descrizione del suo link è il come Google ha protetto i suoi interessi economici nei confronti della censura attuata dal Governo Cinese: il Governo Cinese ha censurato, Google si protegge.
Google si protegge perche' e' una compagnia privata.
Interessi economici appunto come ho gia' detto.
Questo è l'articolo corretto che Lei avrebbe dovuto postare: http://it.wikipedia.org/wiki/Censura
(NP: non credevo davvero di dover arrivare a spiegare queste cose).

"Grazie 2"


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Anon39 on April 09, 2015, 08:17:55 PM
ah no? e come arrivi a un articolo di un mese o un anno fa se non cercandolo con un motore di ricerca?
eliminare risultati da una ricerca arbitrariamente è proprio censura
anche wikipedia parla con questi termini http://it.wikipedia.org/wiki/Google#Censura

Censura e' rimuovere un contenuto.

L'indicizzazione e' una questione di efficienza.

Probabilmente, ma sto speculando sulle spalle degli altri e non si dovrebbe mai fare questa cosa ovviamente, per questioni economiche del giornale hanno deciso di non rendere ricercabili dai motori di ricerca quei contenuti.

"Grazie".

PS: tra l'altro il link che ha postato Lei @Anon39 e' inerente alla censura di Google, e la descrizione del suo link è il come Google ha protetto i suoi interessi economici nei confronti della censura attuata dal Governo Cinese: il Governo Cinese ha censurato, Google si protegge.
Google si protegge perche' e' una compagnia privata.
Interessi economici appunto come ho gia' detto.
Questo è l'articolo corretto che Lei avrebbe dovuto postare: http://it.wikipedia.org/wiki/Censura
(NP: non credevo davvero di dover arrivare a spiegare queste cose).

"Grazie 2"
ti ringrazi da solo?
cosa c'entra l'efficienza di ricerca? qui si sta dicendo che questi giornali, come dici tu, RIMUOVONO un contenuto dai risultati di una ricerca, e questa è CENSURA, chi cazzo se ne frega del perchè lo fanno.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Cash BTC on April 09, 2015, 08:29:19 PM
...omissis... chi cazzo se ne frega del perchè lo fanno.

Grazie.


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: davvo on April 09, 2015, 10:24:03 PM
...omissis... chi cazzo se ne frega del perchè lo fanno.

Grazie.

Dai... dai... ce la puoi fare. (cit)


Title: Re: I meravigliosi robots.txt di repubblica, corriere e governo.it
Post by: Cash BTC on April 09, 2015, 10:32:56 PM

Dai... dai... ce la puoi fare. (cit)

Certo! Farcela con rispetto non e' facile.

Ma apprezzo la sua citazione.