Проучвания показват, че 25% от уеб страниците, създадени в периода

...
Проучвания показват, че 25% от уеб страниците, създадени в периода
Коментари Харесай

Губим дигиталната си история. Може ли интернет архивът да я спаси?

Проучвания демонстрират, че 25% от уеб страниците, основани в интервала 2013 – 2023 година, са изчезнали. Няколко организации се състезават да спасят предишното на уеб пространството, само че нови опасности заплашват неговото битие, написа BBC.

Възможно е, с помощта на останали елементи от папирус, мозайки и восъчни табли, да разберем с какво са се хранили жителите на Помпей преди 2000 години. Ако разбирате задоволително феодален латински, може да научите и какъв брой добитък е бил отглеждан във фермите в Нортъмбърланд през XI век в Англия – с помощта на Книгата на Страшния съд, най-старият документ, съхраняван в Националния списък на Обединеното кралство. Социалният живот през Викторианския интервал също става ясно посредством писмата и романите, останали от това време.

Но историците от бъдещето може да се затруднят да схванат живота при започване на XXI век. Това се дължи на евентуално истороизтриващата композиция от това по какъв начин живеем животите си цифрово и от неналичието на старания да се архивира международната информация такава, каквато се образува в наши дни.

Въпреки това група от организации се опълчват на силите на цифровия хаос  – доста от тях, ръководени от доброволци с малко институционална поддръжка. Нищо не се свързва повече  със „ отбрана “ от мрежата Internet Archive (букв. „ Интернет Архив “), американско Неправителствени организации, основано в Сан Франциско, чието начало датира от 1996 година като план на интернет пионера Брустър Кал.

Организацията е почнала може би най-амбициозния план за цифрово архивиране на всички времена, събирайки 866 милиарда уеб страници, 44 млн. книги, 10,6 млн. видеоклипове на филми и телевизионни стратегии и други Събрани в шепа центрове за данни, разпръснати по целия свят, сбирките на Архива и няколко сходни групи са единствените неща, които пречат на цялостната цифрова давност да настъпи.

„ Рисковете са доста. Не единствено, че технологиите може да се провалят, това несъмнено се случва. По-важното е, в случай че институциите се провалят или фирмите рухнат “, споделя Марк Грейъм, шеф на машината на Архива Wayback machine - инструмент, който събира и пази копия за идващите генерации.

„ Има многочислени тласъци за стартиране на наличие онлайн, само че малко напън към фирмите да го поддържат в дълготраен проект “, споделя Грейъм.

Въпреки достиженията на Интернет архива досега, други сходни организации са изправени пред финансови закани, механически провокации, хакерски атаки и правни борби от компании, които не харесват концепцията за свободно налични копия на тяхната интелектуална благосъстоятелност. И както демонстрират последните правосъдни загуби, планът за избавяне на интернет може да бъде също толкоз краткотраен, колкото и наличието, което се пробва да отбрани.

Все повече и повече от нашите интелектуални инициативи, от нашето развлечение, вести и диалози съществуват само в цифрова среда “, споделя Грейъм. „ Тази среда по своята същина е нежна "
Да спасяваш историята
Една четвърт от всички уеб страници, които са съществували в някакъв миг сред 2013 и 2023 година сега… към този момент ги няма, сочи скорошно изследване на Pew Research Center, мозъчен концерн, основан във Вашингтон. Изследователите откриват, че колкото по-стара е една уеб страница, толкоз по-голям е казусът: 38% от уеб страниците, които Pew се е опитал да отвори и които са съществували през 2013 година, към този момент не действат. Същото важи и за по-нови изявления. Около 8% от уеб страниците, оповестени в даден миг от 2023 година, са изчезнали до октомври същата година.

Това не е проблем единствено за феновете на историята и интернет фанатиците. Според изследването един на всеки пет държавни уеб страницата съдържа най-малко една развалена връзка.

Pew открива още, че повече от половината публикации в Wikipedia имат неработеща връзка в раздела за препратки, което значи, че доказателствата, подкрепящи информацията в онлайн енциклопедията, постепенно изчезват.

Благодарение на работата на Интернет архива, не всички тези мъртви връзки са изцяло недостъпни. Десетилетия наред планът Wayback Machine на Archive изпраща армии от роботи да пълзят из интернет лабиринтите. Тези системи изтеглят функционални копия на уебсайтовете – постоянно заснемайки едни и същи страници няколко пъти в границите на един ден – и ги вършат обществено налични гратис.

Няколко други организации, огромни и дребни, работят по сходни планове. Библиотеката на Конгреса на Съединени американски щати, да вземем за пример, съхранява държавни уеб страници, уеб сайтове на членове на Конгреса и сбирка от американски новинарски уеб сайтове. Библиотеката също по този начин резервира копие от всеки един туит, изпратен от основаването на Twitter (сега известна като X), до момента в който планът не бе закрит през 2017 година

Други държавни управления имат свои лични начинания. Уеб архивът на Обединеното кралство организира годишно обхождане на уеб страници с домейни.UK, създавайки моментна фотография на английския интернет най-малко един път годишно.

Но обсегът на тези планове не е огромен, до момента в който Интернет архивът се стреми към повсеместен метод. Като се имат поради наличните запаси, би било невероятно да се събере целият интернет. В взаимозависимост от това, което търсите, сбирката на Интернет архива е толкоз подробна, че от време на време може да се усети като цялостен запис на мрежата.
Успехът поражда блаженство
Обществено наличните документи на Архива спомагат за съхраняването на записи за живота ни в актуалната ера. Стана общоприета процедура в Wikipedia да се цитират копия на уеб страници от Wayback Machine, а не самите истински уебстраници.

Организацията, също по този начин, съхранява голяма сбирка от наличие, предхождащо цифровата епоха. Любимият комедиен сериал от 1977 година " Fernwood 2 Night " не е наличен в нито една услуга за стрийминг, само че може да се гледа гратис в Интернет архива. Книги, списания и уеб страници цитират сканирани онлайн копия на книги в Архива, които не са налични във физическите библиотеки.

Сред огромните сбирки, които Wayback Machine избави от цифровото бунище, са и записи на уеб страници, построени на GeoCities, към този момент несъществуваща услуга за личен уеб хостинг. Много преди обществените медии, GeoCities бе измежду първите платформи, които направиха елементарно основаването на личен уеб страница.

Миналата година сайтът за софтуерни вести CNET бе обект на рецензии, откакто изтри десетки хиляди публикации. Тогава от уеб страницата разясниха, че изтритото е непокътнато в Wayback Machine. Много критици обаче бяха на мнение, че компанията приема Интернет архива за даденост, прехвърляйки личните си отговорности.

Важно е да си напомним какво съставлява Интернет Архивът - Неправителствени организации, финансирано от дарения от благотворителни фондации. Това е безконечен план с експоненциално възходящи разноски. Интернет архивът непринудено пое мантията да бъде водеща международна библиотека за нашия цифров живот. Докато мрежата наближава своето четвърто десетилетие, този изцяло всекидневен план се трансформира в главен дирек на интернет.

Но с повишаването на зависимостта ни от Интернет архива, нарастват и заканите, които „ изяждат “ напъните му.
Слабите места на системата
Миналата седмица организацията разгласи огромно партньорство с Гугъл, в което софтуерният колос ще включва връзки към Wayback Machine в резултатите от търсенето – макар че нито една от двете страни не разгласява финансови детайлности за договорката.

Но други скорошни вести демонстрират, че планът е с внимателен темперамент.

Възможните недостатъци се демонстрират в правосъдно дело против Архива от четирима огромни книгоиздатели, които твърдяха, че практиката на сканиране на физически книги и на заемане на цифровите им копия нарушава Закона за авторското право на Съединени американски щати. Преди пандемията Интернет архивът даваше назаем единствено по едно цифрово копие едновременно за всяка физическа книга в своята сбирка. Но по време на затварянето поради ковид, организацията отстрани това ограничаване, позволявайки на настойниците да заемат неограничени цифрови копия на книги.

През 2023 година американски съд постанови, че практиката е противозаконна, а при започване на септември жалбата на НПО-то против това решение бе отхвърлена.

Интернет архивът води и още едно правосъдно дело против музикални лейбъли за дигитализирането на записи, което може да му коства 400 млн. $, в случай че загуби. Това е сума, която може да заплаши оцеляването на НПО-то.

Директорът по библиотечните услуги на Интернет архива Крис Фрийланд счита, че организацията преразглежда мнението на съдилищата по отношение на решението.

Правните борби в съда не са единствените рискове, застрашаващи света на цифровото предпазване.

Уеб архивът на Британската библиотека в Обединеното кралство се сблъска с някои съществени механически провокации, когато хакерска атака смъкна цифровите ѝ системи от онлайн пространството през октомври 2023 година Почти година по-късно английският Уеб списък към момента се бори с следствията - достъпът до огромна част от сбирката му към момента е недосегаем.

През май 2024 година Интернет архивът разгласи, че е в разгара на огромна DDoS офанзива. При DDoS офанзивите злонамерени участници основават автоматизирани системи, с цел да бомбардират уеб сайтове с визити, пробвайки се да ги изтласкат офлайн, като претрупват сървърите им. В случая на Архива, неговият инструмент Wayback Machine стопира да работи в резултат на офанзивата. Това значи, че постоянният барабанен темп на архивиране е бил нарушен за известно време и са вероятни непрекъснати пропуски в историческите записи.

Ако работата на Интернет архива спре и „ тази празнота не бъде неотложно запълнена, тогава огромна част от това, което сега е налично,, ще бъде изложено на риск “, споделя Грейъм. Той е безапелационен, че Интернет архивът няма да се откаже от своите отговорности скоро време, само че за плана е добре пристигнала външна помощ. „ Има благоприятни условия за доста други да допринесат по разнообразни способи “, споделя той.
Споделени отговорности, разграничени цели
Без публични старания за организация на напъните за опазване на интернет страниците, планът е оставен в ръцете на фенове, доброволци и няколко групи неофициални организации, които нормално работят без значение.

„ Има логичност архивният отговор да е децентрализиран “, споделя Мар Хикс, историк на технологиите в Университета на Вирджиния. „ Но един от проблемите са разнообразните цели. “

Хикс показва, че едно от първите неща, които всеки архивист ще вземе поради, когато основава списък, е на какво да даде приоритет. „ И когато е толкоз децентрализирано, целите ще бъдат доста разнообразни “, споделя Хикс. „ Ще има групи, които дават приоритет на опитите да сграбчен всичко – колкото е допустимо повече “, разяснява специалистът пред BBC, добавяйки, че други биха се фокусирали единствено върху избрани области.

Опасенията следователно са, че с децентрализиран метод е допустимо да има припокриване, което значи, че скъпите запаси за архивиране се губят за приемане на дублирани уеб сайтове или даже на основаването на три техни копия – до момента в който някои области, които може да имат историческо значение, се подценяват.

„ Архивистите ще ви кажат, че тези проблеми съществуват от доста дълго време “, споделя Хикс. Но те се утежняват от равнището на нещата, които се създават в нашия цифров свят. Близо милиард имейли се изпращат всеки ден. YouTube оповестява, че всяка минута на платформата се разгласява видео наличие с дълготрайност над 500 часа.

Интернет е „ всъщност пожарен маркуч от информация и материали “, споделя Хикс. „ Няма смисъл да се опитваме да хванем всичко, което излиза от пожарния маркуч. Това няма да има смисъл от позиция на ресурсите. “

„ Ние, като историци, имаме същите проблеми “, споделя Хикс. „ Имаме обилие от документи от предишното. Но имаме единствено избрани документи и гласове на избрани хора и доста от тези гласове, които липсват, са необикновено значими и са изтрити. “

Според Хикс би трябвало да има някакъв приоритет за това какво се избавя от цифровите отпечатъци на нашето потомство. В противоположен случай рискуваме бързо растящите разноски да вземат превес над напъните за избавяне на историята на мрежата – да не приказваме за океаните от цифрови файлове, които живеят офлайн.

" Има вакуум, който малко хора, с изключение на шепа вманиачени архивисти, запълват. Не е ясно чия е отговорността да архивира [интернет] или в чии ползи би служил “, споделя Хикс.

Едно нещо е ясно обаче, счита историкът, всички би трябвало да платим, с цел да подкрепим битката за запазване. „ От доста прагматична позиция, в случай че не платите на тези хора и не се уверите, че тези архиви са финансирани, те няма да съществуват в бъдеще, те ще се скапват и тогава смисълът от събирането им ще изхвърчи през прозореца. Целият смисъл на архива не е, че той просто се събира, а че продължава да съществува за неопределен срок в бъдещето ".
Източник: economic.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР