Язык запросов документальной автоматизированной информационно-поисковой системы (АИПС)
Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Язык запросов документальной автоматизированной информационно-поисковой системы (АИПС)





Назначение, структурное построение и конкретные функции информационно-поисковых языков могут стать понятными при анализе устройства и функционирования сложных систем, в рамках которых они создаются. Речь идет об информационно-поисковых системах (ИПС).

Назначение ИПС — отыскивать информацию — явствует уже из их названия. Обычно ИПС является главной частью системы информационного обслуживания (или обеспечения) — сокращенно ИСО — или какой-либо системы управления.- Примерами систем информационного обслуживания являются: система АСИНИТ Всесоюзного научно-технического центра (ВНТИЦ) Государственного комитета СССР по науке и технике; система АССИСТЕНТ Всесоюзного института научной и технической информации (ВИНИТИ) ГКНТ и АН СССР, научно-технические.

Примером систем информационного обеспечения нужд управления в области стандартизации является автоматизированная информационно-управляющая система (АИУС) Госстандарта и входящая в ее состав автоматизированная система научно-технической информации по нормативно-технической документации (АСНТИ по НТД).

В зависимости от характера информация, которая требуется абонентам систем информационного обслуживания, помещается в фонды и поисковые массивы ИПС. Последние разделяются на два основных класса: документальные (или документографические) и фактографические.

В документальных ИПС производится обработка документальных материалов с целью создания их формализованного описания, включающего в число прочих сведений поисковый образ документа (ПОД). Кроме того, в них получают формализованные описания запросы абонентов системы информационного обслуживания, называемые поисковыми предписаниями (ПП). На основе сравнения поисковых образов документов с поисковыми предписаниями документальная ИПС выдает абонентам документы, первоначально помещенные в ее фонд.



В фактографических ИПС имеет место более сложный процесс работы. Первоначально документальные материалы анализируются с целью отбора нужных сведений (или фактов). Отобранные сведения образуют особый фонд. Каждый факт получает в нем свое индивидуальное формализованное описание или поисковый образ. Там же производят формализованное описание информационных запросов абонентов, в результате чего получают поисковые предписания. После сравнения поисковых образов фактов с поисковыми предписаниями фактографическая ИПС выдает абонентам непосредственно факты, а не информационные документы, из которых эти факты были взяты.

Естественно, на практике часто встречаются комбинированные, смешанные ИПС документально-фактографического типа. Для таких ИПС характерно создание поисковых образов документов. В дополнение к ним в состав формализованного описания документов включаются и некоторые (не все) фактографические данные, как правило, стереотипно повторяющегося характера для всех документов, попадающих в фонд ИПС. При сравнении формализованных описаний документов и некоторых фактографических данных с поисковыми предписаниями абоненты в зависимости от их потребностей получают из смешанной документально-фактографической ИПС либо документы, первоначально помещенные в фонд, либо факты из числа тех, которые получили индивидуальное описание.

Сопоставление документальных и фактографических ИПС друг с другом не может и не должно привести к заключению о том, какой тип из них предпочтительней. Лишь конкретный, а не абстрактный анализ возможностей ИПС обоих типов в сочетании с анализом требований абонентов и учетом имеющихся в распоряжении ИПС материальных и интеллектуальных ресурсов может обеспечить правильный выбор в каждом конкретном случае.

Следует отметить (об этом будет подробно рассказано в соответствующих главах), что на практике создание документальных ИПС, как правило, предшествует созданию чисто фактографических систем, для реализации которых требуются существенно большие затраты средств и более высокая профессиональная и информационная квалификация персонала.

В качестве разумного компромисса, в рамках которого осуществляется полноценный поиск документальной информации и частичный поиск фактов определенного характера, широкое распространение на практике получили именно смешанные документально-фактографические системы. В них основной акцент делается на обеспечение выдачи документов, а в меньшей степени — на обеспечение выдачи фактов. Это не означает, что фактография в ИПС смешанного типа является неполноценной.

Будучи не всеобщей и не полной, она, тем не менее, является вполне достаточной основой для успешного решения ряда задач различных систем управления и позволяет систематически проводить статистическую обработку фактографических данных, характеризующих вводимые документы. Именно к этому типу ИПС относится и поисковая система АСНТИ по НТД, входящая в состав АИУС Госстандарта.

Анализ требований к ИПС со стороны системы управления стандартизацией, а также запросов, предъявляемых абонентами, показывает, что функции информационно-поисковой системы по нормативно-технической документации сводятся к следующим трем:

· обеспечивать тематический поиск нормативно-технических документов;

· обеспечивать фактографический поиск, в частности, идентификацию учетно-регистрационных и библиографических данных, относящихся к НТД;

· обеспечивать в результате поиска на основе ссылочных данных комплектование нормативно-технических документов, регламентирующих качество какого-либо объекта стандартизации и его составных частей.

Рассмотрим подробнее эти функции.

Тематический поиск, означает отыскание неизвестных абоненту конкретных нормативно-технических документов, когда абонент в состоянии назвать лишь тематику искомых документов, т. е. одну или несколько тем. Это наиболее трудно выполнимая функция документальной ИПС, так как успех (или неуспех) поиска зависит от целого ряда факторов, многие из которых недетерминированы и потому не всегда с должной определенностью и однозначностью вводятся в поисковую систему.

В первую очередь это касается способов представления тематического содержания поисковых образов документов и запросов, поступающих от абонентов, и способов приведения соответствие поисковых образов документов запросам, в которых одна и та же или близкая тематика описывается и выражена в весьма отличных друг от друга выражениях. Эта проблема решается с помощью информационно-поисковых языков и ряда других средств, о чем речь пойдет ниже. Пока же уместно отметить, что учет всего многообразия способов передачи значений и смысла текстов документов, фактов и запросов является коренной содержательной проблемой информационного поиска, а в еще большей степени — проблемой машинного перевода. Ни в настоящее время, ни в ближайшем будущем еще нельзя рассчитывать на полное разрешение этих проблем, но достигнутые результаты уже сейчас позволяют получать практически приемлемое и удовлетворительное качество информационного поиска.

Для оценки качества работы ИПС в информатике уже давно устоялись две основные предложенные Дж. Перри, А. Кентом и М. Берри в 1955 г., а затем в 1961 использованные С. Клевердоном меры — полнота и точность поиска. Обе эти меры связаны с понятием “релевантности”, т. е. соответствия документа или факта запросу. (Релевантность — это объективная оценка “отношения к делу” того или иного документа или факта).

Полнота поиска по какому-либо запросу определяется отношением числа релевантных документов (фактов), выданных ИПС, к числу релевантных документов, имеющихся в поисковом массиве ИПС:

Р=А/В или Р=(А/В)*100%,

где Р — полнота, в долях единицы или процентах; А — число релевантных документов в выдаче ИПС; В — число релевантных документов в поисковом массиве ИПС.

Точность (или релевантность) поиска по какому-либо запросу определяется отношением числа релевантных документов в выдаче ИПС к общему числу релевантных и нерелевантных документов в выдаче ИПС, т. е. к общему объему выдачи ИПС на данный запрос:

Т= А/С или Т=(А/С)*100%

где Т — точность, в долях единицы или процентах; А — число релевантных документов в выдаче ИПС; С—число релевантных и нерелевантных документов в выдаче ИПС.

Попутно отметим, что наряду с понятием о релевантности как объективной мере точности выдачи ИПС существует понятие о пертинентности. Толкование этого термина, который переводится на русский язык так же, как и релевантность, т. е. “отношение к делу”, в пределах информатики получило характер субъективной меры точности. Иными словами, пертинентность поиска по какому-либо запросу абонента определяется отношением числа документов в выдаче ИПС, которые, по мнению этого абонента, соответствуют теме его запроса, к общему числу документов в выдаче ИПС. Всем лицам, которые пользуются услугами ИПС, надо четко представлять, что релевантность и пертинентность далеко не одно и то же.

Учитывая, что ИПС являются системами коллективного пользования, они не могут быть рассчитаны на удовлетворение сугубо индивидуальных потребностей отдельных лиц; это тем более верно, что абоненты нередко руководствуются в своих оценках точности выдачи не только представлениями об отношении документов к заданной теме, но и об информативной ценности этих документов для себя лично (документы, с которыми абонент уже был знаком ранее, либо документы, содержащие, по его мнению, ошибочную, недостоверную или тривиальную информацию, нередко воспринимаются им как нерелевантные). Вывод отсюда может быть один— настройка и совершенствование ИПС на работу с высокой степенью точности может производиться только на основе определения релевантности как объективной экспертной оценки группы специалистов, а не пертинентности — чьей-либо отдельной, индивидуальной оценки. Это, кстати, не означает, что приоритетным индивидуальным абонентам нельзя обеспечить выдачи с повышенной точностью — просто для этого потребуется более тщательная обработка запросов и неоднократное обращение к массивам ИПС.

Фактографический поиск отдельных учетно-регистрационных и библиографических данных означает отыскание этих данных по их наименованиям. В принципе это достаточно просто выполнимая функция ИПС. В самом деле, для этого достаточно предусмотреть в стереотипном бланке формализованного описания документа (иначе говоря, в формате описания документа) наличие соответствующих позиций (реквизитов) с кодами идентификации этих данных. При получении запроса на выдачу какого-либо отдельного факта или совокупности данных в формате запроса достаточно отметить коды идентификации запрашиваемых данных, чтобы поиск прошел с идеальной (100%) полнотой и точностью.

К числу учетно-регистрационных и библиографических данных, по которым реализуется фактографический поиск в ИПС по стандартизации, относятся:

· даты регистрации и ввода в действие, отмены или замены нормативно-технических документов;

· обозначения и регистрационные номера НТД;

· категории НТД;

· наименования союзных республик, отраслей промышленности и организаций, выпустивших НТД;

· наименование иностранных государств или международных организаций, выпустивших НТД.

Не вдаваясь здесь глубоко в структуру формализованного описания документа, отметим, что формат может иметь как списочное, так и иерархическое построение полей данных с их кодами идентификации.

Поиск фактографических данных может быть выполнен и в том случае, если абонент затребует отыскать данные документов, находящихся в заданном диапазоне некоторых других данных. Таков, например, запрос: “Выдать обозначения отраслевых стандартов Минэлектротехпрома, зарегистрированных в период с января 1977 г. по июль 1978 г.”.

Комплектование нормативно-технических документов в принципе также является логически легко осуществимой функцией ИПС. Как и при фактографическом поиске учетно-регистрационных данных, при проведении поиска для установления состава комплекта нормативно-технических документов, определяющих качество какого-либо заданного по наименованию объекта стандартизации, используются выделенные в формате описания документа реквизиты, в которых указаны обозначения всех нормативно-технических документов, связанных с НТД, непосредственно относящимися к заданному объекту стандартизации.

Последовательно выявляя ссылки первого, второго и т. д. порядка о НТД на заданный объект стандартизации к связанным с ним другими НТД, ИПС составляет полный список комплекта НТД, прекращая работу только после исчерпания всех ссылочных связей.

Следует, однако, сразу предупредить, что при всей принципиальной простоте алгоритма поиска на основе ссылочных данных реализация этого вида поиска на практике представляется в ряде случаев весьма сложной задачей. Дело в том, что качество какой-либо сложной машины, например, морского судна или тепловоза, в значительной степени определяется качеством их составных частей, которое в свою очередь зависит от качества полуфабрикатов и сырья, из которых изготовлены.

Поскольку составные части этих машин, а также полуфабрикаты и сырье выпускаются в соответствии с особыми нормативно-техническими документами, поиск с целью комплектования выливается в многошаговую процедуру, причем с отдалением от заданного объекта на каждый очередной шаг по ссылочным данным, выдача ИПС вырастает на порядок по сравнению с выдачей на предыдущем шаге. В итоге суммарная выдача ИПС составляет многие сотни и тысячи документов, т. е. значительную часть всего поискового фонда. Легко видеть, что такой многошаговый поиск требует больших затрат времени и вызывает длительную загрузку ИПС по единичным запросам. Вместе с тем, актуальность этого вида поиска не вызывает никаких сомнений.

Успешное решение задачи информационного обеспечения программ комплексной стандартизации в значительной степени зависит от мощности вычислительного центра, обслуживающего ИПС по стандартизации. Каких-либо других сложностей принципиального характера в этом деле нет.

Необходимость автоматизации данного вида поиска заключается в том, что системы ручного поиска не могут одновременно обеспечивать высокие показатели полноты, точности и быстродействия, а именно это требуется от системы информационного обеспечения народного хозяйства страны в эпоху научно-технической революции.

В этом смысле механизированные ИПС не имеют большой перспективы. Обычно они реализуются с помощью счетно-перфорационных машин, причем механизированы в них только операции сравнения поисковых образов документов (либо фактов) и поисковых предписаний, а также операции сортировки выдачи в соответствии с принятой классификацией или алфавитом. Примером такой механизированной ИПС может служить система “Орбита” центра научно-технической информации “Поиск”. Однако таким системам присущи серьезные ограничения и по величине поисковых массивов, и по числу форматированных поисковых признаков (наименование данных или реквизитов), и по типу поискового языка, и по быстродействию.

По этой причине широкое распространение получили более сложные и дорогие как в разработке, так и в эксплуатации, но гораздо более эффективные автоматизированные ИПС.

Автоматизированные ИПС опираются на такую технологию обработки документов, в которой автоматически с высоким быстродействием выполняются не только операции сравнения поисковых образов документов и фактов с поисковыми предписаниями, всевозможных сортировок выдачи по практически неограниченному числу форматированных поисковых признаков, но обеспечиваются и иные весьма значительные выгоды и удобства. К их числу относится возможность автоматического построения целого ряда производных информационных поисковых и вспомогательных массивов.

В зависимости от степени механизации и автоматизации технологии работы ИПС подразделяются на следующие типы:

· ИПС ручного поиска (или ИПС ручного обращения);

· механизированные ИПС; автоматизированные ИПС (АИПС);

· системы автоматического индексирования и поиска.

ИПС ручного обращения служили человечеству верой и правдой в течение сотен и тысяч лет. Достаточно сослаться на примеры из древней истории, относящиеся к обеспечению тематического поиска в собрании клинописных документов ассирийского царя Ашурбаннипала или Александрийской библиотеки времен Птоломеев.

Не потеряли своего значения ИПС ручного поиска и в наши дни. При определенных условиях (о них будет сказано в соответствующей главе) они и доныне в состоянии успешно конкурировать с современными автоматизированными поисковыми системами. Кроме того, они все еще распространены во многих крупных фондах, где сложность введения автоматизации определяется в первую очередь громадными объемами фондов. Таковы, например, ИПС тематического поиска в Государственной библиотеке СССР им. В. И. Ленина, обладающей фондами объемом в несколько десятков миллионов единиц хранения, а также во многих других библиотеках и информационных фондах.

Однако комплекс современных требований к полноте, точности и скорости (оперативности) поиска все настоятельней обязывает разрабатывать и внедрять на смену простым по организации системам ручного поиска более совершенные, хотя и более дорогостоящие поисковые системы, работающие по принципу однократного ввода информации в базу данных. Это обеспечивает возможность ускорять поиск информации и сокращать сроки информационного обслуживания абонентов, позволяет синхронно обновлять и корректировать информационные массивы ИПС в процессе их ведения (актуализации). Последнее имеет решающее значение для фонда нормативно-технических документов, в которые вносятся изменения в течение всего времени их действия.

Огромные удобства обеспечивают современные автоматизированные ИПС работникам системы управления, которых они обслуживают, а также персоналу, занятому в технологическом процессе ИПС, в связи с наличием у них выносных пультов с телевизионными экранами (видеотерминальные устройства). На последних высвечивается вводимая с пульта управления информация и выдача ИПС. Система телекоммуникаций позволяет непосредственно связываться с поисковыми массивами ИПС даже весьма удаленным потребителям и поставщикам информации. Выносные устройства делают возможной организацию рассредоточенного (но однократного) ввода данных в ИПС. При этом обеспечивается высокая культура рабочего места и научная организация труда операторов ИПС и ее пользователей. Перфорационный ввод данных, сопровождающийся вибрацией и шумом, уступает место бесшумному электронному вводу.

У работников системы управления зачастую отпадает необходимость ведения документации от руки или с помощью пишущей машинки, что повышает производительность их труда. Авторы данной книги не ставили перед собой задачу подробно раскрывать различные стороны и возможности современных автоматизированных ИПС, базирующихся на мощных электронно-вычислительных машинах (этим вопросам посвящена обширная литература), однако в дальнейшем по необходимости они будут рассмотрены в связи с главной темой книги—информационно-поисковыми языками вообще и ИПЯ по стандартизации в особенности.

Системы автоматического индексирования и поиска представляют собой еще более совершенную систему по сравнению с автоматизированными ИПС. Практически, за исключением первоначального ввода информации и принятия решений по тем случаям, которые не предусмотрены алгоритмами работы ИПС, все операции обычного технологического процесса совершаются автоматически, без вмешательства человека. В будущем представляется возможным создание полностью автоматических ИПС, обладающих системой автоматического ввода информации, располагающей оптическими читающими автоматами и автоматами, распознающими речь.

Однако в настоящее время системы автоматического индексирования и поиска еще не получили широкого распространения ввиду большой сложности математического моделирования информационных процессов, связанных с содержательной обработкой документов и фактов. Существующие системы автоматического индексирования по качеству работы еще уступают автоматизированным ИПС, относящимся к классу человеко-машинных систем, где именно человек принимает на себя основной труд по содержательной обработке информации.

И все-таки не это обстоятельство сдерживает внедрение систем автоматического индексирования и поиска. Возможность массовой обработки информации с помощью одних автоматических устройств — настолько привлекательна в силу особой эффективности технологии, что ради этого стоило бы пойти на известное снижение качества индексирования по сравнению с индексированием руками человека. Кстати сказать, в масштабе крупных информационных систем с большими массивами информации внедрение автоматического индексирования все равно привело бы к повышению среднего уровня качества индексирования по сравнению со средним уровнем индексирования в частично автоматизированных системах.

Дело в том, что подавляющее большинство крупных систем до сих пор не в состоянии равномерно, одинаково глубоко обрабатывать всю поступающую информацию в полном объеме — для этого не хватает ресурсов. Поэтому часть их информационных массивов обрабатывается с высоким уровнем качества и большой глубиной, другая часть, и, к сожалению, как правило, большая, обрабатывается поверхностно и неполно, что в итоге дает худшие усредненные результаты по сравнению с системами автоматического индексирования, которые равномерно обрабатывают весь поступающий информационный поток.

Но для этого требуется наделить ИПС значительными интеллектуальными возможностями. Наибольшие трудности встречают разработчиков именно в сфере информационно-поискового языка.

Из отечественных систем, в которых внедрено автоматическое индексирование документов, наибольший интерес представляет система, созданная в Информэлектро.

В настоящее время систем автоматического индексирования в области стандартизации в строгом смысле слова еще нет. Однако во ВНИИКИ уже создана фундаментальная основа относительно простой системы автоматического индексирования. Речь об этой системе поиска по основам словоформ пойдет ниже, при рассмотрении соответствующего информационно-поискового языка.

Рассмотрев вкратце типологию ИПС в аспектах помещаемой в них информации (документальной или фактографической), выполняемых ими поисковых функций (тематический поиск, поиск фактов на основе идентификации данных, комплектование документации на основе ссылок), режима их работы (ручной, механизированный и автоматический), мы можем перейти к описанию основных логических, а затем и физических структурных составляющих ИПС.

Основными логическими компонентами любой ИПС независимо от степени ее автоматизации являются:

· информационно-поисковый язык, включая правила его построения и ведения (актуализации);

· правила формализованного описания данных, относящихся к документам и запросам;

· правила индексирования сообщений (документов или фактов) и запросов;

· критерий смыслового соответствия и алгоритм поиска.

Нетрудно убедиться, что все эти компоненты находятся в тесной взаимосвязи.

В самом деле, информационно-поисковый язык, предназначенный для описания содержания документов и запросов, пригодный для использования формальных методов поиска, в значительной степени предопределяет характер правил индексирования сообщений и запросов. В свою очередь, правила индексирования ограничивают возможности произвольного трактования и использования языковых средств. ИПС, способствуя повышению степени однозначности описания сообщений и запросов, т. е. индексирования.

В большинстве ИПС правила индексирования документов и запросов различны, хотя и отправляются от одной и той же принципиальной основы. Не вдаваясь раньше времени в-эту тему, отметим только, что использование семантических возможностей ИПЯ в различной степени в сообщениях и запросах (что вытекает из правил их индексирования) способствует существенной экономии живого труда и ресурсов. ИПС. Разумеется, отсюда следует, что правила индексирования сообщений и запросов должны быть строго согласованы друг с другом.

Поскольку в ИПС непрерывно поступают сообщения и, запросы, содержащие новую информацию, в процессе индексирования рано или поздно обнаруживается нехватка языковых средств (как правило, лексических средств, т. е. отдельных слов или словосочетаний). Здесь возникает обратная связь от правил индексирования к ИПЯ, использование которой позволяет вести, совершенствовать, актуализировать словарь системы.

Правила формализованного описания данных, относящихся к документам и фактам или запросам, представляют собой некую разновидность ИПЯ, используемого на входе и выходе ИПС. Словарный состав этого ИПЯ, т. е. список наименований данных, задается обычно форматами документов (фактов) или запросов.

Основной ИПЯ тематического поиска, принятый в ИПС, а в еще большей степени — правила индексирования сообщений и запросов — должны учитывать как формальные ограничения по способам записи, которые задаются форматом, так и семантические возможности, которые заложены в лексических единицах словаря данных, введенных в формат, т. е. в индентификаторы данных формата.

Поскольку различный характер разных данных свидетельствует о их особых содержательных (семантических) ролях при описании сообщений и документов, они выступают в роли искусственных формализованных грамматических средств (позиционная грамматика, т. е. формат, в котором предусмотрена высокая степень дифференциации (различения) данных, привносит в формализованное описание документов и сообщений большую упорядоченность, упрощает поиск нужных данных, хотя и за счет повышения сложности описания, по сравнению с менее дифференцированным по структуре и составу данных форматом). Таковы семантические возможности грамматики ИПЯ описания данных.

Критерий смыслового соответствия — это формула, в соответствии с которой производится логическое и лингвистическое преобразование (развертывание) поискового предписания с тем, чтобы обеспечить нахождение в поисковом массиве поисковых образов документов, содержащих информацию, релевантную поисковому предписанию, независимо от лексического и синтагматического способа ее представления.

Критерий смыслового соответствия (КСС) и алгоритм поиска должны учитывать абсолютно все возможности и особенности, заложенные в основном ИПЯ тематического поиска, ИПЯ описания данных и правилах индексирования сообщений и запросов. Ведь с помощью КСС и алгоритма поиска задается вся процедура приведения в соответствие сходных по значению поисковых образов сообщений (документов или фактов) и поисковых предписаний, отождествления их с заданной степенью точности и выдачи информации из ИПС независимо от лексической и грамматической формы описания понятий, релевантных поисковому предписанию.

Именно КСС и алгоритм поиска (независимо от того, какую работу они предопределяют — ручную или машинную) обеспечивают возможность проведения комбинированного поиска, при котором отыскиваются документы или факты одновременно как по заданной тематике, так и по заданным учетно-регистрационным или библиографическим признакам.

Большинство автоматизированных ИПС помимо алгоритма поиска имеет также набор алгоритмов, определяющих прохождение в ИПС ряда вспомогательных процедур. К их числу относятся алгоритмы ввода информации, создания и корректировки поисковых массивов и машинных массивов словарей и классификаций, используемых в системе, опознания и выдачи для анализа новой лексики из сообщений и запросов, которых еще нет в поисковом словаре, проведения дистрибутивно-статистического анализа применения всех элементов ИПЯ в ИПС, и наконец, организации выдачи ИПС в любой форме, удобной пользователям, в том числе — в виде оригинал-макетов различных указателей, словарей, каталогов и информационных изданий.

Одно перечисление этих алгоритмов, обеспечивающих “сервис” в работе с ИПС и выдаваемой ею информацией, показывает, насколько велики возможности современных автоматизированных ИПС и какие резервы повышения производительности труда информационных работников, а также экономии времени и энергии пользователей раскрываются при широком внедрении АИПС. Однако разработка сервисных алгоритмов и программ — значительно более трудоемкое дело, нежели разработка алгоритмов и программ собственно поиска, и это обстоятельство всегда необходимо учитывать при планировании этапов разработки и внедрения систем информационного обеспечения.

Естественно, что логическая структура ИПС материализуется в определенной физической и организационной структуре.

Физически ИПС состоит из ряда служб и устройств, взаимодействующих друг с другом в рамках общего технологического процесса. Обычно ИПС имеет следующие службы:

· первичной обработки документов;

· аналитико-синтетической обработки документов (это традиционное название;

· правильней было бы назвать ее службой справочной и библиографической обработки документов);

· анализа информации (или экспертизы документов);

· индексирования документов (фактов) и запросов;

· ввода и поиска информации;

· словарно-терминологическую службу (это также установившееся название, правильней было бы называть ее службой лингвистического обеспечения);

· тиражирования;

· информационного обеспечения абонентов;

· управления и совершенствования ИПС.

Независимо от того, совпадает ли в какой-либо реальной ИПС состав структурных звеньев с приведенным выше или не вполне совпадает, совокупный состав функций и задач, который они решают, от этого не меняется. Точно так же в том или ином виде, под тем или иным названием, в ИПС обязательно имеются следующие устройства (независим” от степени их автоматизации): справочно-библиографический аппарат (включая учетно-регистрационный) при фонде вторичных документов типа аннотаций и рефератов; поисковый аппарат; каталог первичных документов (или их микро- и макрокопий) {При этом считается, что в целом фонд первичных документов обслуживается собственной службой}; средства тиражирования выдачи ИПС.

Перечислив службы и устройства ИПС, можно перейти к описанию их состава и технологического взаимодействия.

Служба первичной обработки документов производит анализ поступающих материалов ровно с такой глубиной, которая позволяет точно адресовать их соответствующим службам или их более мелким структурным подразделениям. Одновременно с таким анализом служба первичной обработки документов производит работы учетно-регистрационного характера, в некоторых случаях — первичную классификацию материалов. В ряде ИПС, в основном с ручным поиском, сюда же поступают на первичную обработку запросы. Эта служба ведет регистрационные перечни или журналы учета. Первичные документы в ней не оседают и обратно не возвращаются, за исключением тех случаев, когда первичная регистрация нуждается в подтверждении или отмене по результатам работы службы экспертизы документов.

Служба первичной обработки документов автоматизированной ИПС может начинать заполнение машинно-ориентированных форматов данными из документов.

В АСНТИ по НТД функции этой службы выполняют отделы ВИФС ВНИИКИ, специализированные на регистрации НТД определенных категорий.

Справочно-библиографическая служба в ИПС ручного поиска составляет библиографические описания документов на карточках установленного формата, внося в них предписываемые инструкцией данные — даты издания, выпуска, ввода документа в действие, автора, выпустившую организацию, обозначение и наименование документа, регистрационный и учетный номер. Если поступивший документ был на иностранном языке, то служба библиографической обработки самостоятельно либо вместе со службами реферирования или перевода переводит, по крайней мере, наименование документа на русский язык (не выполняет полный перевод текста). Эта же служба помещает на карточку аннотацию или реферат, если они поступили с документом, или предварительно сама аннотирует или реферирует его. К сожалению, в области нормативно-технической документации реферирование не практикуется. Это усложняет работу службы справочно-библиографической обработки документов, а затем и службы индексирования, затрудняя в то же время работу абонентов с полученными из ИПС материалами — по кратким — “свернутым” вторичным документам типа реферата можно значительно быстрее проанализировать выдачу ИПС, чем по полным текстам документов.

Справочно-библиографическая служба ИПС ручного поиска передает первичный документ вместе с копией законченной библиографической карточки службе индексирования и поиска. Другой экземпляр библиографической карточки поступает в справочно-библиографический аппарат системы, ведущийся в этой службе, где карточки систематизируются по видам документов в хронологическом порядке их поступления. В области нормативно-технической документации справочно-библиографический аппарат систематизируется в каталоге по государственной принадлежности (или принадлежности к международным организациям, выпускающим нормативные документы), а внутри — по категориям НТД в соответствии с рубриками классификаторов государственных стандартов в хронологическом порядке. Такое ведение справочно-библиографического аппарата облегчает подготовку и выпуск периодических и кумулятивных (накопительных) информационных указателей, в которых отражается документальное наполнение фонда системы. Собственно подготовка и выпуск указателей также входят в число обязанностей данной службы.

Справочно-библиографическая служба автоматизированных ИПС имеет возможность часть своих функций передать автоматическим устройствам. Каким образом это достигается? Прежде всего справочно-библиографическая служба работает не с карточками, а с машинно-ориентированными форматами (МОФ), продолжая заполнение их данными вслед за службой первичной обработки документов. После полной обработки документа работниками этой службы в формализованном описании документа на машинно-ориентированном формате оказываются заполненными все необходимые реквизиты, кроме поискового образа документа. Еще более рационально проходит работа в справочно-библиографической службе, оснащенной выносными устройствами ввода-вывода (видеотерминалами), которые позволяют вводить данные (после их визуального контроля на экране телевизионной трубки) непосредственно в ЭВМ, без заполнения МОФ на бумаге, которые в дальнейшем поступают на перфорацию в службу ввода информации. Однако в любом случае справочно-библиографическая служба автоматизированной ИПС избавляется от необходимости вести ручной справочно-библиографический каталог, а также от подготовки информационных указателей. При наличии соответствующего программного обеспечения эти работы быстро и безошибочно осуществляются электронно-вычислительной техникой. Есть в этом случае и еще одна существенная выгода. Дело в том, что на основе справочно-библиографического каталога справочно-библиографическая служба должна либо сама производить поиск документальной информации и фактографических данных по форматированным признакам, либо передавать дубликат каталога в службу информационного обеспечения абонентов для того, чтобы ее работники могли выполнить эту функцию. В автоматизированной же ИПС, в отличие от ручной, нет принципиальной необходимости осуществлять справочно-библиографический идентификационный поиск, включая поиск форматированных учетно-регистрационных данных, отдельно от тематического поиска. Точно так же данная служба может получать готовые оперативные и статистические сводки о состоянии массивов и их пополнении непосредственно от ЭВМ.









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2018 zdamsam.ru Размещенные материалы защищены законодательством РФ.