Видеосамоучитель создания реферата, курсовой, диплома на компьютере - Надежда Баловсяк
Шрифт:
Интервал:
Закладка:
Примечание
В видеоуроке «Урок 9.1. Сканирование текста», который находится на компакт-диске, прилагаемом к книге, показано, как сканировать и распознавать текст с помощью программы FineReader.
Глава 10 Поиск информации в Интернете
• Поиск в Интернете: общие понятия
• Виртуальные библиотеки
• Форматы электронных книг
• Поиск рефератов
• Поиск в библиотеках
Для многих людей на сегодняшний день Интернет стал обязательным источником информации. Если раньше при написании работы, да и просто при необходимости что-то узнать пользовались справочниками, каталогами и журналами, то сейчас такой процесс часто заменяют поиском в Сети. Полностью отказываться от бумажных источников информации, конечно, не стоит: в них есть много не только полезного и интересного, но и того, что невозможно найти в Интернете. Однако написать реферат, а тем более научную работу, не используя Глобальную сеть, в наше время практически невозможно. В Интернете можно найти самые новые материалы по теме исследования: аналитические статьи, публикации в онлайн-изданиях и многое другое, что пригодится в работе или просто может вас заинтересовать.
Первоначальная проблема, возникающая у всех, кто собирается использовать материалы Сети, – как найти необходимую информацию. Казалось бы, в этом нет ничего сложного – запустил поисковую систему, например Rambler, ввел нужное слово или фразу и получил результат. Однако так может рассуждать только человек, который никогда ничего не искал в Интернете. Количество сайтов в виртуальном пространстве достигает миллиардов, и найти среди них именно то, что вам нужно, не так просто. Свои особенности есть и в построении поисковой фразы, и в использовании дополнительных возможностей поисковых машин, и во многих других, менее очевидных, нюансах. По этой причине изучение основ поиска информации в Интернете в наше время просто обязательно.
Чтобы быстро найти нужную информацию, не прилагая при этом особых усилий, нужно хотя бы в общих чертах иметь представление о том, как работают разные виды информационно-поисковых систем и как корректно составлять запросы для них. Результат поиска можно считать успешным лишь в том случае, когда необходимые документы размещены в начале полученного списка....Примечание
Мера соответствия поискового запроса полученному списку ссылок называется релевантностью. Чем больше полученный список ссылок соответствует поисковому запросу, тем более релевантным считается результат.
Известный идеолог веб-маркетинга Джим Стерн писал: «Самая сложная вещь в Интернете – это то, что вы не можете ничего найти. Ищите – и вы станете растерянным, потерянным и расстроенным. Это как доступ в Библиотеку Конгресса без каталога или информация в Желтых страницах без алфавитного указателя. Если вам нечего делать – это еще можно понять, но если вы ищете что-то особенное – это далеко не радостная процедура».
10.1. Поиск в Интернете: общие понятия
В первую очередь определимся со средствами поиска информации в Интернете. По принципу организации и использования их можно разделить на поисковые каталоги (справочники, директории) и поисковые машины.
Каталоги веб-страниц
Поисковые каталоги напоминают систематические каталоги обычных библиотек. Каталоги – это электронные справочники, в которых собраны списки адресов интернет-страниц, сгруппированные по определенным признакам, чаще всего – по тематике. Обычно они многоуровневые, каждая тема в них разбивается на несколько более узких. Верхний уровень представляет собой общую категорию, например «бизнес», «наука», «искусство», а элементы самого низкого уровня – это ссылки на отдельные страницы и серверы вместе с кратким описанием их содержимого.
Процедура поиска нужного сайта в каталогах состоит в последовательном переходе от одного уровня к другому. Таким образом, последовательно уточняя тематику поиска, можно, продвигаясь по каталогу, дойти до самых нижних ступеней иерархии и получить, наконец, нужный список сайтов. Каталоги чаще всего используются в тех случаях, когда необходимо получить набор сайтов по какой-то определенной проблеме. В каталогах отображены самые популярные ресурсы, относящиеся к одной теме, которые, кроме всего прочего, отсортированы в порядке значимости.
Наиболее популярными каталогами считаются следующие: www.maiL.ru (list.mail.ru), каталог поисковой системы «Яндекс» (yaca.Яндекс.ru), weblist.ru, www.vsego.ru, www.myweb.ru. Среди англоязычных ресурсов наиболее популярным является каталог Yahoo! (www.yahoo.com). Самым авторитетным в мире каталогом веб-страниц признан открытый каталог dmoz.org.
Главное преимущество поисковых каталогов заключается в том, что информация в них хранится упорядоченно, в соответствии с элементарной логикой.
...Примечание
С помощью каталога нецелесообразно проводить поиск информации по узконаправленной тематике: в нем может просто не оказаться нужной рубрики, а на просмотр похожих разделов может уйти много времени.
Однако у поисковых каталогов существует множество недостатков. Например, в них могут отсутствовать некоторые ссылки: из-за того, что редакторы создают каталоги вручную, количество ссылок в них ограничено, более того, самые интересные из них могут не попадать в каталог, так как редакторы не успевают их вносить. Как результат – обновление происходит медленно.
Неоднозначность структуры – это еще один явный минус каталожной организации информации (хотя отчасти он нейтрализуется тем, что в каждом крупном каталоге существует своя система поиска).
Поисковые машины
Если вам необходимо получить подборку материалов по более конкретной и специальной информации, лучше воспользоваться поисковыми машинами. Поисковая машина – это комплекс специальных программ для поиска в Сети. Они лишены недостатков, присущих каталогам, и работают немного по-другому. Поиск с помощью поисковых машин происходит намного быстрее, кроме того, такие системы могут искать среди гораздо большего количества сайтов – область поиска в этом случае практически неограниченна.
Принцип действия поисковых машин заключается в постоянном последовательном исследовании всех веб-страниц. Из-за необходимости постоянного обновления информации время от времени машины возвращаются к просмотренным ранее сайтам, чтобы найти и зарегистрировать возникшие там изменения. Вся прочитанная информация индексируется, то есть создается специальная база данных, в которой сохраняются просмотренные поисковиком веб-страницы. Там и осуществляется поиск. Эту базу данных наполняют специальные программы-роботы, которые, просматривая сайты, обращают внимание на некоторые дополнительные элементы. Например, на частоту употребления слова на странице, на его выделение, а также количество ссылок на данный документ на других сайтах. Поисковые машины проводят поиск по заданному пользователем поисковому запросу – специальной фразе или набору слов, которые выражают суть того, что нужно найти.
Кроме этого, с каждой веб-страницей связан набор ключевых слов. Эти слова лучше всего описывают ее содержимое. При поиске информации такие машины в первую очередь анализируют их совпадение со словами из запроса.
Таким образом, поиск с помощью поисковых машин состоит в просмотре базы данных веб-страниц и розыске тех из них, которые соответствуют запросу.
...Примечание
Большинство современных поисковых систем совмещают в себе и тематический каталог, и возможности поисковой машины.
Интерфейс всех поисковых систем примерно одинаковый. Пользователю предлагается ввести запрос в специальное поле, а затем запустить поиск щелчком на кнопке Найти или Поиск. Система произведет поиск и выдаст результаты в окне браузера. Однако, несмотря на общие принципы работы и похожий интерфейс, поисковые машины отличаются между собой целым рядом параметров. Среди них – релевантность результатов, величина и частота обновления баз данных, скорость выдачи результатов и удобство работы.
Наряду с этим существуют и другие различия – языки запроса, зоны поиска, глубина поиска внутри документов, методы определения приоритетов, поэтому применение разных поисковых машин дает различные результаты.
Наиболее популярными поисковыми машинами являются: www.yandex.ru, www.maiL.ru, www.rambLer.ru, www.googLe.com, www.aport.ru, www.yahoo.com, www.Lycos.com.
За время существования поисковых машин выработался определенный стандарт предоставления пользователю страницы с результатами поиска. Поэтому, разобравшись в форме выдачи результатов хотя бы одной поисковой машины, можно уверенно пользоваться остальными.
Страница с результатами поиска, полученными с помощью поисковой машины, содержит следующие элементы: