вторник, 9 марта 2010 г.

Как найти информацию, которая была доступна, а потом исчезла с сайта?

Интернет-аналитика. Поиск и оценка информации в web-ресурсах. Практическое пособиеИнтернет-аналитика. Поиск и оценка информации в web-ресурсах. Практическое пособие

Как найти информацию, которая была доступна, а с течением времени исчезла с сайта?Как найти сайт, который исчез из сети Интернет? Эффективность поиска зависит от того, осталась ли информация в архиве, кеше или другом виде.
В Интернете есть удивительный поисковый ресурс, машина времени для путешествия в прошлое Wayback Machine – архив исчезнувших веб-страниц. http://www.archive.org/web/web.php
В архиве содержится огромное количество веб-страниц, собранных со всего Интернета, включая и русскоязычный, начиная с 1996 года. Любопытно узнать, как выглядела стартовая страница Яндекса или РБК, например, в 1997 году. После закрытия сервиса GeoCities на Yahoo Архив Интернета открыл страницу «GeoCities Special Collection 2009» http://www.archive.org/web/geocities.php, здесь можно получить доступ к сайтам, созданным на бесплатном хостинге GeoCities с 1996 по 2009 год.
Для того, что эффективно использовать поисковый ресурс Архива Интернета, необходимо знать искомый URL. Этот удивительный ресурс позволяет путешествовать по исторической копии сайта как по реальному сайту, правда, с некоторыми ограничениями, поскольку не все страницы сайта могут быть в архиве. Есть также возможность расширенного поиска.
О других вариантах поиска.
Поиск в кеше поисковых систем. Название этой функции поиска может отличаться, как правило, есть в любом крупном поисковике.
У поисковика Яндекс – это «Сохраненная копия», практически с каждым результатом поиска появляется возможность увидеть «сохраненную копию», включая графику. У поисковика Рамблер есть функция «сохраненный текст». Восстанавливается текст найденного Вами документа, сохраненный при индексировании. Правда, сохраненную графику увидеть не получится, потому что HTML-форматирование текста восстанавливается не полностью.
Однако в кеше поисковой системы можно найти лишь ту версию сайта, которая была в последний раз проиндексирована до того, как исчезнуть. Функция «сохраненная копия» в поисковике Google дает возможность увидеть снимок веб-страницы на определенную дату индексирования. Поисковые роботы Google делают снимок экрана каждой просмотренной страницы и сохраняют его в виде резервной копии на случай, если исходная страница недоступна. Google использует данные, сохраненное в кэше для оценки релевантности страницы относительно поискового запроса. При просмотре сохраненной копии страницы наверху указывается, что, возможно, это не самая последняя версия страницы. В сохраненной копии условия поиска выделяются цветом, чтобы легче оценить релевантность страницы. Ссылка "Сохраненная копия" в поисковике Google не отбражается для сайтов, которые еще не были проиндексированы, а также для тех сайтов, владельцы которых запросили Google не сохранять в кэше содержание их сайтов.
У поисковика Mail.ru также есть функция «сохраненный текст», однако она не позволяет получить достаточно информации в отличие от Яндекс, Рамблер и Google.

Комментариев нет:

Отправить комментарий