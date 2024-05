Tantissime pagine sono state rimosse o abbandonate, tanto che un quarto dei siti attivi fra il 2013 e il 2023 non esiste più o non è più accessibile: si parla di “erosione digitale”

Tempi duri per Internet. Secondo un’analisi del Pew Research Center, infatti, un quarto dei siti attivi fra il 2013 e il 2023 non esiste più o non è più accessibile. La cancellazione di queste pagine è attribuita a vari fattori, tra cui la rimozione deliberata dei contenuti, il trasferimento di siti web che interrompe i collegamenti, e l’abbandono di siti web. Un vero e proprio fenomeno di erosione digitale.

La ricerca ha rilevato che circa il 23% delle pagine di notizie contiene almeno un collegamento non funzionante, mentre il 21% delle pagine dei siti web governativi e il 54% delle pagine di Wikipedia contengono riferimenti a contenuti non più esistenti. Questo indica che l’erosione del web non risparmia nemmeno le piattaforme più frequentate e utilizzate per la ricerca di informazioni.

Il fenomeno è particolarmente evidente nei contenuti più vecchi: circa il 38% delle pagine web esistenti nel 2013 non sono più disponibili oggi. Anche le pagine create più recentemente non sono immuni; l’8% delle pagine esistenti nel 2023 è già scomparso. Quando una pagina diventa inaccessibile, gli utenti sono accolti dal familiare messaggio di errore “404 Not Found”, indicando che il contenuto non esiste più sul server host.

Un fenomeno che colpisce anche i social media

Il decadimento digitale non è limitato ai siti web, ma colpisce anche i social media. Circa un quinto dei tweet scompare entro pochi mesi dalla pubblicazione. In particolare, oltre il 40% dei tweet in turco o arabo non è più visibile sul sito entro tre mesi dalla pubblicazione. I tweet provenienti da account con impostazioni predefinite del profilo hanno una maggiore probabilità di scomparire.

Per questa analisi, il Pew Research Center ha raccolto un campione di pagine dal repository web Common Crawl per ogni anno dal 2013 al 2023. Ha poi verificato la disponibilità di queste pagine e l’integrità dei collegamenti. Inoltre ha esaminato la frequenza con cui i post sui social media vengono cancellati o rimossi.

Si è giunti alla conclusione del fatto che l’erosione del web rappresenti un serio problema per la conservazione della conoscenza online. La continua scomparsa di contenuti web potrebbe compromettere la nostra capacità di accedere a informazioni storiche e attuali, riducendo così la ricchezza del nostro archivio digitale collettivo.

Fonte: Pew Research Center

