вторник, 3 августа 2010 г.

Пример по поиску полных текстов

Без предисловий перехожу к сути. В GoogleBooks было представлено в ограниченном доступе издание "Information technology in librarianship: new critical approaches" (Gloria J. Leckie, John Buschman. 2009).

Поиск в Гугле по названию издания результатов не принес: только ссылки на книжные магазины, базы данных, сайты издательств.

При более внимательном рассмотрении было определено, что главы этого издания представляют собой работы разных авторов. Было решено отобрать наиболее желаемые работы и сосредоточить поиск на них.

Таким образом был выявлен полный текст 11-й главы (наиболее необходимой из всего сборника) "Technologies of social regulation" (L. Given, Gloria J. Leckie, G. Campbell). Он был доступен на персональной университетской странице одного из авторов. Поиск производился с помощью Google от названия работы. Кавычки не использовались, фамилии авторов не зайдествовались ввиду предполагаемой высокой степени уникальности названия.

Авторские страницы или разделы сайтов научных и учебных заведений очень часто являются источниками полных текстов для закрытых в базах публикаций.
Возникает вопрос, что выбирать в качестве отправной точки: собственно публикацию, или же страницу ученого, а также нужно ли задействовать расширенный поисковый интерфейс (или поисковые операторы по типу файла или поиск подстроки с фамилией автора публикации в URL-адресе).
Вероятно, стоит провести тестовое исследование.

В параллельном поиске (одновременное использование нескольких окон браузера) было решено "прочесать" все главы.

Поиск первой же главы стал успешным. Запрос к Google был сформулирован как "critical theory of technology an overview feenberg" (без кавычек). Сначала предполагалось заключить название главы в кавычки, т.к. степень уникальность интуитивно оценивалась как низкая. Но вместо этого полное название главы было дополнено фамилией автора (интуитивная степень уникальности высокая). Сайт-источник полного текста особого доверия не вызвал (http://letraslivres.orgfree.com/), однако времени разбираться с его авторитетностью не было. Тем более что найденный текст совпадал с теми фрагментами, которые предоставлял GoogleBooks.

Поиск второй главы успехов не принес. Запрос: "surveillance and technology contexts and distinctions" (фраза в кавычках), переформулировка "surveillance and technology contexts and distinctions gary marx" (без кавычек, дополнено именем и фамилией автора).

Поиск третьей главы принес неожиданные результаты. Запрос в Google был сформулирован сначала без кавычек по неполному названию "cycles of net struggle", затем то же, но в кавычках. В числе первых 10-ти результатов была обнаружены ссылка на сайт scribd.com (электронная библиотека на добровольных началах, сервис для хранения пользовательского контента). Там и был получен полный текст всего сборника (но требовалась учетная запись Facebook).

1 комментарий: