Wayback Machine

Wayback Machine (з англ. — «Машына часу») — бясплатны анлайн-архіў некамерцыйнай бібліятэкі «Архіў Інтэрнэту». З дапамогай пошукавых робатаў «Wayback Machine» архівуе і робіць агульнадаступнай большую частку «адкрытага» інтэрнэту[2].

Wayback Machine
Выява лагатыпа
Стартавая старонка партала
Стартавая старонка партала
URLweb.archive.org/
Тып сайтавэб-архіў[d]
Мова(-ы)англійская
Мова праграмаванняJava, Python
УладальнікАрхіў Інтэрнэту
Пачатак працы24 кастрычніка 2001
Рэйтынг Alexa173[1]
Лагатып Вікісховішча Медыяфайлы на Вікісховішчы

Сэрвіс быў запушчаны ў 1996 годзе, аднак стаў даступны для грамадскасці толькі ў 2001 годзе.

За першыя 20 гадоў існавання Wayback Machine каталагізаваў і захаваў калекцыю з больш як 286 млрд вэб-старонак. Архіўныя здымкі адлюстроўваюцца ў фармаце HTML, JavaScript і CSS[3]. Дзякуючы захаваным у Wayback Machine дакументам карыстальнікі могуць адсочваць змены, якія адбываюцца на сайтах, і параўноўваць розныя версіі правак[4]. Станам на студзень 2023 года Wayback Machine дае доступ да больш як 767 мільярдаў захаваных вэб-старонак[5].

Стварэнне

Серверы «Архіва Інтэрнэту», 2008 год
Брустэр Кейл у 2009 годзе

У 1989 годзе англійскі навуковец Цім Бернерс-Лі стварыў сусветнае павуцінне — сістэму, якая дазваляе перадаваць даныя праз падключаныя да інтэрнэту камп’ютары. Аднак з распаўсюджваннем сусветнага павуціння былі выяўлены дзве асноўныя праблемы. Першая складалася ў недахопе месца для захоўвання ўсіх даных, праз што многія дакументы і вэб-старонкі выдаляліся. Іншая праблема складалася ў тым, што пасля рэдагавання вэб-старонкі (напрыклад, з юрыдычных прычын) карыстальнікі не маглі паглядзець яе першапачатковую версію. Вырашыць гэтыя недахопы імкнулася амерыканская лічбавая бібліятэка «Архіў Інтэрнэту» — некамерцыйная арганізацыя, створаная праграмістамі Брустэрам Кейлам і Брусам Галіятам[en] у 1996 годзе. Пры супрацоўніцтве з Alexa Internet (даччынай кампаніяй Amazon, якая займаецца вэб-індэксаваннем). «Архіў» ініцыяваў стварэнне і захоўванне копій існых сайтаў для развіцця «ўніверсальнага доступу да ведаў». Арганізацыя давала бясплатны публічны доступ да алічбаваных матэрыялаў, такіх як вэб-старонкі, кнігі, аўдыёзапісы, уключаючы жывыя канцэрты, відэа, выявы і праграмнае забеспячэнне. На 2021 год штаб-кватэра «Архіва Інтэрнэту» знаходзіцца ў Сан-Францыска, у будынку былой хрысціянскай царквы, размешчанай у раёне Рычманд. Журналіст мясцовай радыёстанцыі Kawl[en] у 2019 годзе параўноўваў офіс «Архіва» з рымскім храмам[6][7][8]. Арганізацыя ставіць сабе за мэту выратаваць інтэрнэт ад знікнення[9].

«Wayback Machine» стаў самым вядомым праектам «Архіва». Анлайн-сэрвіс быў названы ў гонар машыны часу з мультсерыяла 1960-х гадоў «Шоу Рокі і Булвінкля». Ён дае доступ да лічбавай калекцыі з больш як 550 млрд вэб-старонак[4][10][11]. Праект Wayback Machine быў задуманы як рашэнне праблемы памылкі 404, якая азначае, што сервер не можа знайсці даныя па запытаным адрасе. Гэта звязана з так званым выміраннем спасылак — нарастаючай недаступнасцю некалі апублікаваных даных. Так, у 1997 годзе сярэдняя працягласць жыцця вэб-старонкі складала 44 дня. У 2003 годзе гэты паказчык склаў 100 дзён.

Праведзены ў 2008 годзе аналіз спасылак на 2700 лічбавых рэсурсах, большасць з якіх не мае друкаваных аналагаў, паказаў, што каля 8 працэнтаў спасылак пераставалі працаваць праз год. Да 2011 года, то бок праз тры гады, 30 працэнтаў спасылак у калекцыі былі непрацуючымі[12]. Дзякуючы інтэграцыі з Alexa, карыстальнік, які сутыкнуўся з паведамленнем пра памылку, мог атрымаць доступ да заархіваванай версіі старонкі праз укаранёную ў браўзер панэль інструментаў. Калі копія недаступнай старонкі прысутнічала ў базе даных Wayback Machine, то загаралася спецыяльная кнопка. Пры гэтым карыстальнікі маглі даць браўзеру дазвол на прагляд і рэгістрацыю актыўнасці — у такім разе ўсе сайты, што карыстальнік наведаў, архіваваліся на партале[13].

Wayback Machine быў запушчаны ў маі 1996 года, аднак стаў даступным для грамадскасці толькі ў 2001 г. — да гэтага ўся запісаная на лічбавых магнітных стужках інфармацыя была адкрыта толькі для абмежаванай колькасці навукоўцаў і даследчыкаў[14]. Да моманту «адкрыцця» архіў утрымліваў звыш 10 млрд заархіваваных старонак[4]. Да снежня 2014 года кіраўніцтва Wayback Machine паведаміла, што захавала 435 млрд вэб-старонак па ўсім свеце[2]. З тэхнічнага пункта гледжання праграмнае забеспячэнне Wayback Machine не з’яўляецца архівам, а хутчэй агульнадаступным інтэрфейсам да абмежаванага падмноства ўсіх сховішчаў[15]. Так, Wayback Machine нельга лічыць пошукавай сістэмай калекцыі арганізацыі, бо яна не ажыццяўляе пошук па базе даных іншай буйной віртуальнай бібліятэкі — Open Library, якая дазваляе карыстальнікам бясплатна атрымліваць доступ да лічбавых копій кніг, якія загружаюцца і архівуюцца ў рамках праекта[16][17].

Характарыстыка

З запускам «Wayback Machine» «Архіў Інтэрнэту» стаў адным з самых папулярных і вядомых анлайн-парталаў і галоўным сэрвісам вэб-архівавання[4][9].

У 1999 годзе «Архіў» пачаў пашыраць калекцыю за межы архіўнага вэб-кантэнту, каб забяспечыць доступ як да алічбаваных, так і першапачаткова лічбавых рэсурсаў, у тым ліку кніг, аўдыя, фільмаў, відарысаў, дакументаў, праграмнага забеспячэння і відэагульняў[7]. Некаторыя сканіраванні выконваюцца пошукавымі робатамі самога архіва, а іншыя — партнёрскімі арганізацыямі. Асобныя базы даных могуць набывацца за кошт ахвяраванняў карыстальнікаў і мэтавых набыццяў[17]. Самі стваральнікі арганізацыі параўноўвалі сваю калекцыю з Александрыйскай бібліятэкай[7].

На 2021 год Wayback Machine змяшчаў звыш 424 млрд вэб-старонак[15] — больш, чым дакументаў у Бібліятэцы Кангрэса[18][7][17].

Зноскі

Літаратура