ГОСТ Р ИСО 22274-2016
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ, БАЗАМИ ЗНАНИЙ И КОНТЕНТОМ
Концептуальные аспекты разработки и интернационализации систем классификации
Systems to manage terminology, knowledge and content. Concept-related aspects for developing and internationalizing classification systems
ОКС 01.020,
35.240.60
Дата введения 2017-09-01
Предисловие
1 ПОДГОТОВЛЕН Автономной некоммерческой организацией "Институт безопасности труда" (АНО "ИБТ") на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 55 "Терминология, элементы данных и документация в бизнес-процессах и электронной торговле"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 30 ноября 2016 г. N 1903-ст
4 Настоящий стандарт идентичен международному стандарту ИСО 22274:2013* "Системы управления терминологией, базами знаний и контентом. Концептуальные аспекты разработки и интернационализации систем классификации" (ISO 22274:2013 "Systems to manage terminology, knowledge and content - Concept-related aspects for developing and internationalizing classification systems", IDT).
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - .
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные и межгосударственные стандарты, сведения о которых приведены в дополнительном приложении ДА
5 ВВЕДЕН ВПЕРВЫЕ
6 ПЕРЕИЗДАНИЕ. Апрель 2020 г.
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
Введение
Классификация предметов и объектов - это широко используемый людьми метод преодоления сложностей окружающего мира. В наши дни роль систем классификации трудно переоценить.
В системах классификации содержимое обрабатываемой информации упорядочивается определенным образом. Такие системы подвержены очень сильному влиянию терминологической основы предметной области, к которой они относятся, и, в свою очередь, могут оказывать воздействие на терминологию конкретных предметных областей. Системы классификации делают соответствующие области знаний доступными для широкой аудитории пользователей, а не только для специалистов, которые непосредственно работают в тех или иных сферах знаний. Классификационные системы обеспечивают формирование терминологической базы и четкую систематизацию знаний.
Во многих случаях системы классификации применяются для структурирования больших объемов данных, получаемых при использовании таких технологий, как углубленный анализ данных (добыча данных) или информационный поиск. Словари, библиотеки, каталоги, равно как и веб-страницы или информационно-поисковые системы, являются примерами совокупностей данных, структурирование которых с помощью систем классификации может обеспечить существенные преимущества.
Системы классификации позволяют людям обмениваться информацией по различным областям знаний, способствуя формированию понятийных систем, которые помогают сводить сложность соответствующих тематических разделов к уровню, доступному для понимания широким кругом пользователей. Такие системы понятий позволяют осуществлять эффективное управление информационными потоками в рамках конкретного приложения или между приложениями, а также обеспечивать взаимодействие со специалистами из разных предметных областей или информационный обмен между людьми с разными уровнями профессиональных знаний.
Если система классификации предназначается для использования несколькими лингвистическими сообществами, она подлежит локализации с учетом конкретных языков, социально-партнерских соглашений и культурологических особенностей общения между сообществами ее пользователей. Для облегчения задачи локализации классификационная система должна проектироваться таким образом, чтобы она была предельно понятна, проста в использовании и обладала целым рядом других нужных свойств.
В настоящем стандарте представлены рекомендации по проектированию систем классификации и выражению их содержательной части таким образом, чтобы она могла легко адаптироваться к различным языковым средам. Настоящий стандарт дополняет уже существующие нормативные документы, такие как руководство ИСО/МЭК Guide 77 [19], а также ИСО 13584 [9], МЭК 61360 [18], ИСО 22745 [15] и ИСО/МЭК 11179 [7].
1 Область применения
Настоящий стандарт устанавливает основные принципы и требования к разработке систем классификации, позволяющие обеспечить их применимость в международном масштабе благодаря учету таких аспектов, как культурологическое и лингвистическое разнообразие и конкретные требования рынка информационных продуктов. Применительно к принципам терминологической работы в данном стандарте излагаются конкретные рекомендации (руководящие указания) по созданию, отработке и использованию классификационных систем для интернациональных сообществ.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты. Для датированных ссылок применяют только указанное издание ссылочного стандарта, для недатированных - последнее издание (включая все изменения).
ISO 1087-1:2000, Terminology work - Vocabulary - Part 1: Theory and application (Терминологическая работа. Словарь. Часть 1. Теория и применение)
________________
Заменен на ISO 1087:2019.
ISO/IEC 6523 (all parts), Information technology - Structure for the identification of organizations and organization parts - Part 1: Identification of organization identification schemes (Все части. Информационная технология. Структура идентификации организаций и частей организаций)
ISO/IEC 15418, Information technology - Automatic identification and data capture techniques - GS1 Application Identifiers and ASC MH10 Data Identifiers and maintenance (Информационная технология. Технологии автоматической идентификации и сбора данных. Идентификаторы приложения GS1 и идентификаторы фактических данных ASC MH10 и их обслуживание)
ISO/IEC 15459-6, Information technology - Automatic identification and data capture techniques - Unique identification - Part 6: Groupings (Информационные технологии. Методы автоматической идентификации и сбора данных. Уникальный идентификатор. Часть 6. Уникальные идентификаторы групп продукции)
ISO/TS 29002-5, Industrial automation systems and integration - Exchange of characteristic data - Part 5: Identification scheme (Промышленные автоматизированные системы и интеграция. Обмен характеристическими данными. Часть 5. Схема идентификации)
3 Термины и определения
В настоящем стандарте применены термины по ИСО 1087-1, а также следующие термины с соответствующими определениями.
3.1 ассоциативная связь (associative relation): Связь между двумя понятиями (3.7), определяемая не тематической иерархией, а практическим опытом.
Пример - Ассоциативная связь существует между понятиями "образование" и "преподавание" или между понятиями "обжиг" и "печь".
[ИСО 1087-1:2000, подпункт 3.2.23, с изменением]
3.2 атрибут (attribute): Элемент данных для машиночитаемого описания свойства (3.25), отношения или класса (3.4).
[ИСО/МЭК Guide 77-2:2008, подраздел 2.2]
Пример - Дата создания класса объект (3.22) в вычислительной системе.
3.3 характеристика (characteristic): Отличительное свойство
Примечание 1 - Характеристика может быть собственной или присвоенной.
Примечание 2 - Характеристика может быть качественной или количественной.
Примечание 3 - Существуют разные классы (3.4) характеристик, такие как:
- физический (например, механические, электрические, химические или биологические характеристики);
- сенсорный (например, характеристики, связанные с запахом, осязанием, вкусом, зрением, слухом);
- поведенческий (например, вежливость, честность, правдивость);
- временной (например, пунктуальность, надежность, доступность);
- эргономический (например, физиологическая характеристика или характеристика безопасности для человека);
- функциональный (например, максимальная скорость воздушного судна).
[ИСО 9000:2005, пункт 3.5.1]
Примечание 4 - Характеристики, применимые к понятиям (3.7), называются признаками (3.12), тогда как характеристики классов (3.4) называются свойствами (3.25).
Пример - На рисунке 1 отображена взаимосвязь элементов: понятие (3.7), особенность (3.12), класс (3.4), атрибут (3.2) и свойство (3.25). Рисунок демонстрирует разделы понятийной системы (3.8), системы классификации (3.6). Класс "Автомобиль" выводится из понятия "Моторизованное средство", а свойство "Цвет" реализует признак "Пигментирование". Класс "Автомобиль" обладает такими атрибутами, как "Предпочтительное название" и "Определение". Понятие "Автомобиль" в рамках данной системы классификации не используется.
Рисунок 1 - Взаимосвязь между элементами "понятие" (3.7), "признак" (3.12), "класс" (3.4), "атрибут" (3.2) и "свойство" (3.25)
3.4 класс (class): Описание совокупности объектов (3.22), обладающих одинаковыми характеристиками (3.3).
Примечание - Характеристики могут порождаться использованием свойств, операций, методов, отношений, семантической структуры и др.
3.5 классификация (classification): Процесс отнесения объектов (3.22) к определенным классам (3.4) в соответствии с критериями.
3.6 система классификации (classification system): Построенный по известному множеству правил систематизированный набор классов (3.4), в которые могут группироваться объекты (3.22).
Примечание - Настоящий стандарт охватывает как системы классификации с детализацией характеристик, так и системы классификации без детализации характеристик классифицируемых объектов.
Пример 1 - Стандартный код ООН для товаров и услуг UNSPSC (United Nations Standard Products and Services Code) относится к системам классификации без детализации характеристик.
Пример 2 - МЭК 61360-4-DB [18] представляет собой систему классификации с детализацией характеристик.
3.7 понятие, концепт (concept): Элемент знаний, созданный уникальным сочетанием характеристик (3.3).
[ИСО 1087-1:2000, пункт 3.2.1]
Примечание - Понятия не обязательно связываются с конкретными языками, однако подвержены влиянию социальной или культурной среды, которое часто ведет к разным принципам их классификации (3.5).
3.8 понятийная система (concept system): Совокупность понятий (3.7), структурированная в соответствии с имеющимися связями между ними.
[ИСО 1087-1:2000, подпункт 3.2.11]
3.9 расширение понятия (extension): Совокупность объектов (3.22), которую охватывает данное понятие (3.7).
[ИСО 1087-1:2000, пункт 3.2.8]
3.10 фасет, аспект (facet): Группа классов (3.4) или понятий (3.7) одной и той же внутренней категории.
[ИСО 25964-2 [16], подраздел 3.32 с изменением]
Пример 1 - Высокоуровневыми категориями, которые могут использоваться для группирования понятий в фасеты, являются: объекты (3.22), материалы, агенты, действия, местоположения и элементы.
Примечание - Фасеты, используемые в системе классификации (3.6), должны отвечать правилам, приведенным в 5.4, тогда как фасеты понятийных систем (3.8) свободны от этих ограничений; но в любом случае должны соблюдаться рекомендации, представленные в 5.3.
Пример 2 - Фасетами системы классификации (3.6) применительно к предметам потребления могут быть функциональное представление, предметно-ориентированное описание, материал изготовления, вопросы технического обслуживания или логистики.
3.11 фасетная система классификации (faceted classification system): Система классификации (3.6), в рамках которой классы (3.4) группируются в исчерпывающие взаимоисключающие фасеты, допускающие комбинирование с целью определения сложных объектов.
Пример - Классы для определения программируемых логических контроллеров могут группироваться в такие фасеты (3.10), как "технология", "программирование", "пакетирование" и "учет сетевых ресурсов".
3.12 особенность (feature): Определенная характеристика (3.3), подходящая для описания и разграничения понятий (3.7) в рамках понятийной системы (3.8).
3.13 общее понятие (general concept): Понятие (3.7), которое соответствует нескольким объектам (3.22), образующим группу по причине наличия общих характеристик (3.3).
Пример - Понятия "планета" или "башня".
[ИСО 1087-1:2000, пункт 3.2.3 с изменением]
3.14 родовое отношение (generic relation): Отношение между двумя понятиями (3.7), при котором содержание (3.15) одного из них включает в себя содержание другого понятия (3.7), но имеется хотя бы одна дополнительная отличительная характеристика (3.3).
[ИСО 1087-1:2000, пункт 3.2.21 с изменением]
3.15 содержание понятия (intension): Набор характеристик (3.3) понятия (3.7).
[ИСО 1087-1:2000, пункт 3.2.9 с изменением]
3.16 интернационализация (internationalization): Технологический процесс, при котором программные продукты и услуги реализуются таким образом, что оказывается возможной и удобной их адаптация к локальным языкам и локальным культурным представлениям.
Примечание - Этап интернационализации является необходимым условием для систематического подхода к локализации (3.21).
3.17 ведущая локаль (leading locale): Локаль (3.20), применительно к которой разработаны продукт или услуга и которая служит отправной точкой для последующей локализации (3.21).
3.18 листовой класс, финальный класс (leaf class): Класс (3.4) в иерархической системе классификации (3.6), который имеет один или несколько подчиняющих классов и не имеет ни одного подчиненного класса.
3.19 уровень (level): Значение количественной величины, отсчитываемое по отношению к некоторому опорному значению.
3.20 локаль, местная специфика (locale): Уникальная комбинация параметров, определяющая языковые, территориальные и другие предпочтительные культурные, административные или технические настройки для конкретного сообщества.
3.21 локализация (localization): Адаптация программного продукта или информационного обмена для некоторого языкового сообщества в соответствии с культурными, лингвистическими, правовыми и технологическими факторами.
[ISO/TR 22134:2007 [14], подраздел 3.7]
3.22 объект (object): Все реальное или вымышленное.
Примечание - Объекты могут быть материальными (например, движущий механизм, лист бумаги, бриллиант), нематериальными (например, коэффициент конвертации, план разработки проекта) или воображаемыми (например, мифическое существо единорог).
[ИСО 1087-1:2000, пункт 3.1.1]
3.23 партитивное отношение (partitive relation): Отношение между двумя понятиями (3.7), при котором одно из понятий образует единое целое, а другое является частью этого целого.
Примечание - Партитивным отношением связаны понятия "неделя" и "день" или "молекула" и "атом".
[ИСО 1087-1:2000, подпункт 3.2.22, с изменением]
3.24 полииерархия (polyhierarchy): Иерархия, в рамках которой имеются элементы, связанные с несколькими родительскими элементами.
3.25 свойство (property): Конкретная характеристика (3.3), подходящая для описания и разграничения объектов (3.22) в рамках класса (3.4).
Пример - Температура окружающей среды может быть свойством класса, содержащего в себе географические пункты.
3.26 терминология (terminology): Совокупность обозначений, принадлежащих к одному специальному языку.
[ИСО 1087-1:2000, пункт 3.5.1]
3.27 область значений (value domain): Набор разрешенных значений.
[ИСО/МЭК 11179-1:2004 [7], подпункт 3.3.38]
3.28 словарь (vocabulary): Терминологический словарь, который содержит обозначения и определения из одной или нескольких конкретных предметных областей.
[ИСО 1087-1:2000, пункт 3.7.2]
4 Связи с другими нормативными документами
Руководящие указания и рекомендации, касающиеся принципов разработки систем классификации и решения других родственных задач, содержатся в следующих документах:
- ИСО 704 [1] определяет важнейшие условия обеспечения высокого качества работы с терминологией;
- ИСО 1087-1 определяет фундаментальные понятия терминологической работы.
- ISO/TS 29002-5 определяет компоненты и синтаксическую структуру идентификаторов элементов концептуального словаря.
- МЭК 61360 [18], ИСО 13584 [9] и ИСО 22745 [15] определяют модели данных, которые могут использоваться для организации хранения, осуществления информационного поиска или сопровождения систем классификации, относящихся к предметной области обработки данных.
- Annex SL, Procedures for the maintenance of the IEC standards in database format, in: ISO/IEC Directives, Supplement: 2012 (Приложение SL, Процедуры сопровождения стандартов IEC, представленных в формате баз данных, - публикация в рамках Директив ISO/IEC, дополнение от 2012 г.), предоставляет описание процедур, применимых к организации сопровождения международных стандартов, содержащих классификационные системы для сферы обработки данных.
5 Фундаментальные принципы разработки систем классификации
5.1 Общие положения
Системы классификации широко применяются для облегчения обработки и интерпретации объектов посредством надлежащего упорядочения знаний в области дискурса и предоставления на этой основе соответствующей информации, необходимой для непротиворечивой характеристики рассматриваемых объектов. Поэтому классификационные системы должны проектироваться особенно внимательно во избежание создания структур, которые не смогут предоставлять запрашиваемую информацию или будут чрезмерно сложны для понимания пользователями. Разработка надежной классификационной иерархии упрощается, если она отражает хорошо проработанную систему понятий, опирающуюся на общепризнанные принципы управления терминологией. При таком отображении понятия, образующие понятийную систему, становятся классами в системе классификации.
Часто классификация производится по принципу подобия, когда схожие элементы объединяются, а несхожие разделяются. Однако сходство элементов может проявляться в самых разных аспектах, и в процессе классификации предметы должны объединяться в функциональном или прагматическом плане с учетом конкретной цели этого процесса. Объекты, подлежащие классификации, могут представлять собой предметы, людей, идеи, услуги и т.п.
5.2 Сферы применения
Системы классификации разрабатываются применительно к множеству предметных областей, к числу которых, в частности, относятся:
- здравоохранение;
- производство;
- сфера обслуживания;
- документы и библиотеки;
- научная сфера;
- розничная торговля.
В представленных ниже примерах 1-8 кратко описываются выборочные классификационные системы по каждой из вышеперечисленных областей.
_______________
Системы Global Medical Device Nomenclature (GMDN), eCl@ss®, Классификационная схема для физики и астрономии [Physics and Astronomy Classifications Scheme® (PACS®)], системы GS1® и GSDN® - это подходящие службы, доступные на коммерческой основе. Информация о них приведена здесь исключительно для удобства пользователей настоящего документа и не может рассматриваться как рекомендация ISO по использованию именно этих услуг.
Пример 1 - Важной системой классификации медицинских изделий является система GMDN (Global Medical Device Nomenclature/Глобальная номенклатура медицинских изделий). Все участники рынка медицинских изделий, такие как производители, регуляционные органы, органы оценки соответствия стандартам, продавцы, владельцы и пользователи, одинаково заинтересованы в получении доступа к средствам их непротиворечивой классификации, включая четкие определения и терминологию. Система GMDN охватывает следующие области:
- изготовление;
- регистрацию;
- сообщения об инцидентах;
- торговлю;
- информацию о номенклатуре, хранении и жизненном цикле изделий.
Пример 2 - Система eCl@ss®[23] является международным промышленным стандартом для классификации изделий, материалов и услуг. Помимо представления возможного варианта уникального описания каждого отдельного продукта, эта система обеспечивает кодирование групп изделий. Покупатели и потребители могут с помощью кодов eCl@ss® легко идентифицировать интересующие их изделия и услуги при работе с базами данных о товарах и услугах, торговыми информационными системами и электронными каталогами.
Пример 3 - Международная стандартная отраслевая классификация ISIC (International Standard Industrial Classification) представляет собой международный классификационный справочник по операциям производственных процессов. Основная цель этого справочника - определение множества категорий производственных операций, которые могут использоваться для сбора и документального представления статистических данных по этим операциям. Со времени появления исходного варианта справочника в 1948 г. ISIC служила для разных стран руководством по разработке национальных систем классификации промышленных операций и стала важным инструментом для сравнения экономических статистических данных на международном уровне.
Пример 4 - Универсальная десятичная классификация (УДК) - это многоязычная классификационная схема для всех областей знаний, которая обеспечивает сложное индексирование и организацию поиска библиографических записей по всем видам информации на любых носителях. Эта система является производной от системы десятичной классификации Дьюи (DDC) и впервые была опубликована (на французском языке) в период между 1904 и 1907 гг.
Пример 5 - Лондонская система классификации исследований в сфере бизнеса LCBS (London Classification of Business Studies) была разработана в результате быстрого расширения сферы образования в области управления после основания двух британских школ бизнеса аспирантского уровня (в Лондоне и Манчестере) в 1965 г. Эта система хорошо себя зарекомендовала на международном уровне и нашла широкое применение во многих библиотеках деловой сферы и в организации информационных служб по всему миру.
Пример 6 - Классификация библиотеки Конгресса LCC (Library of Congress Classification) была впервые разработана в конце 19 - начале 20 столетия для упорядочения книжных собраний Библиотеки Конгресса. В течение 20 столетия система была принята к использованию другими библиотеками, в особенности крупными академическими библиотеками США и научно-исследовательскими библиотеками других стран.
Пример 7 - Система PACS® (Physics and Astronomy Classification Scheme®) - это схема классификации по физике и астрономии, предназначенная для категоризации литературы этих предметных областей и используемая во всем мире издателями журналов, касающихся физики, астрономии и других смежных областей.
Пример 8 - Система GPC (Глобальная классификация продукции) - это стандартная классификационная система компании GS1 [22], охватывающая пользователей более чем в 20 секторах производственной деятельности. В настоящее время классификацией GPC охвачено 36 сегментов категорий изделий. Система GPC является обязательной для глобальной сети синхронизации данных GDSN® (Global Data Synchronisation Network) и полностью согласуется с системой GS1®. Выбор маркеров.
5.3 Общие критерии
5.3.1 Согласованность
Ключевым требованием к системам классификации является обеспечение их согласованности. Классы должны четко отделяться друг от друга, а области их применимости не должны пересекаться. В тех случаях, когда предусматривается использование применительно к системе классификации какого-либо процесса обработки информации, особенно актуально требование четкого структурирования и отсутствия неопределенности. Используемые определения должны однозначно идентифицировать конкретные понятия, которые лежат в основе образования различных классов.
Термины, применяемые для именования классов, равно как и термины, используемые в определениях классов, и любая другая информация системы классификации должны быть полностью совместимы друг с другом. Согласованная терминология создает надежную основу для точно выраженного информационного обмена как между пользователями, так и между прикладными программами.
5.3.2 Понятность
Правила создания классов и формулирования определений должны быть задокументированы и сделаны доступными для пользователей и для поставщиков контента. Четкие определения понятий, фигурирующих в системе классификации, делают ее более широкой и способствуют сведению неопределенностей к минимуму. Подлежат явному определению уровни классификационной системы и их разбиения на отдельные классы. Должны быть четко задокументированы критерии или правила создания новых уровней иерархической структуры и новых классов.
5.3.3 Расширяемость
Под расширяемостью понимается способность системы классификации к восприятию новых классов и их правильному размещению в иерархической структуре. Классы должны создаваться на том уровне или в той позиции иерархии, которая надлежащим образом отражает их отношения с уже существующими классами. Системы классификации должны обладать свойством расширяемости в том смысле, что они должны быть способны реагировать на новые требования или учитывать перспективы развития в рамках рассматриваемой сферы применения.
5.4 Принципы структурирования
5.4.1 Общие положения
Несмотря на то, что в подавляющем большинстве существующих систем классификации используется не какой-то исключительно один из описанных ниже методов, а их комбинация, все же могут быть определены следующие основные принципы построения классификационных систем:
- перечислительный;
- фасетный;
- фасетно-перечислительный (с входным классом).
Никакого общего правила структурирования системы классификации не существует; решение по этому вопросу должно приниматься в каждом конкретном случае в соответствии с требованиями, которые вытекают из предполагаемой сферы применения. Для выбора конкретной структуры необходимо определить:
- принцип структуризации;
- использование свойств (обязательное или факультативное);
- свойства на любом уровне или только на финальном (листовом) уровне.
Кроме того, в течение всего периода использования системы классификации может возникать потребность в изменениях уже существующих структур.
5.4.2 Перечислительные системы классификации
В перечислительных системах классификации предпринимается попытка перечисления всех возможных объектов, принадлежащих определенной области применения. Во многих случаях для такого представления используются иерархические структуры, но иногда перечислительные схемы могут представляться простыми неструктурированными совокупностями объектов.
Примечание 1 - Более подробное рассмотрение перечислительных систем классификации проводится в [26].
При построении иерархических структур используется нисходящий метод, при котором процесс разбиения приводит к созданию ряда классов в порядке их подчиненности. Таким образом, число подклассов любого класса может потребовать ограничения - для удобства их обработки целевой пользовательской аудиторией системы классификации.
Примечание 2 - Последовательная соподчиненность классов порождает иерархическую структуру классификационной системы, в силу чего перечислительные системы классификации называются также иерархическими.
Примечание 3 - В рамках перечислительных систем классификации объект может классифицироваться только в том случае, если он явным образом покрывается областью применимости одного из классов системы. Перечислительные системы классификации могут, следовательно, требовать большего количества классов, чем фасетные системы, так как для каждого класса требуется представление всех возможных сочетаний составляющих характеристик. Кроме того, возможно, что такие составляющие характеристики класса, как "неполный", будут требовать частого повторения. Таким образом, перечислительная система классификации представляет своеобразный компромисс между чрезмерно большим числом ее классов и степенью ее завершенности. Полномасштабная перечислительная система классификации часто бывает очень сложной по своей природе, и принципы ее построения могут не поддаваться определению.
Примечание 4 - Такие системы классификации часто включают в себя общие классы типа "прочие" для объектов, которые не могут быть отнесены ни к какому другому классу с более точным наименованием.
Примечание - Этот рисунок служит только иллюстративным целям и не может претендовать на роль полноценной системы классификации напитков.
Рисунок 2 - Пример перечислительной системы классификации
5.4.3 Фасетные классификационные системы
Фасетные системы классификации позволяют относить объект к множеству классификаций. Объект может характеризоваться любой комбинацией классов из фасетов.
Утверждение "В фасетных системах классификации не существует класса лексического ввода, общего для всех фасетов" следует понимать как указание на то, что такой класс труднодостижим. Однако для конкретной цели вполне возможно наличие "класса лексического ввода", который позволяет реагировать на потребности рынка.
Более подробную информацию о фасетных системах классификации можно найти в работе [26].
Как правило, в фасетных системах классификации для выражения определенного разнообразия объектов требуется меньше классов, чем в перечислительных классификациях, однако некоторые затруднения создает необходимость предотвращения абсурдных комбинаций классов.
Классы внутри фасетов могут образовывать одноуровневые или многоуровневые иерархические структуры.
Преимущество фасетных систем классификации состоит в том, что во многих предметных областях классы фасетной классификации имеют определенные общие типы характеристик. Такие общие характеристики могут группироваться в фасеты. Фасеты должны быть ортогональными, т.е. области их применения не должны пересекаться.
В фасетных системах классификации не требуется наличия вводного класса, общего для всех фасетов, однако такой класс может оказаться необходимым для обеспечения большего удобства использования классификационной системы. Все вместе взятые фасеты образуют систему классификации и таким образом имеют общую область применимости; и наоборот, при удалении любых ее фасетов фасетная классификация должна рассматриваться как несовместимая.
Примечание 1 - Многие объекты современных технологий обладают чрезвычайно большим разнообразием. В таких случаях применение перечислительного метода будет делать системы классификации необычайно громоздкими и неуправляемыми, тогда как фасетный метод классификации помогает сократить масштабы классификационной системы и тем самым сохранить ее удобство для пользователей.
Примечание 2 - Хотя различные фасеты не зависят друг от друга (ортогональны), они принадлежат к одной и той же системе классификации и потому имеют общую область применимости, определяемую этой системой; их раздельное использование может привести к противоречиям.
Пример 1 - Конфигурации современных автомобилей высшего класса насчитывают миллионы вариантов комплектации. Для сохранения удобства систем управления заказами для клиентов используется фасетный метод классификации, при котором покупатель может самостоятельно выбрать различные интересующие его аспекты - такие как цвет, мощность двигателя или дизайн интерьера.
Фасетный метод может быть сведен к свойствам классов в рамках классификационной системы. В таких случаях классы внутри перечислительной структуры могут квалифицироваться по различным наборам свойств.
Пример 2 - Системы классификации промышленных изделий могут включать в себя многочисленные фасеты, образованные родственными наборами характеристик для идентификации, выбора материала изготовления, информации о жизненном цикле и др.
Пример 3 - В нотации классификации двоеточием CC (Colon Classification) используются фасеты. Ниже показано использование фасетов CC на примере классификации сложного объекта, в рамках которой объект "Проектирование подводных лодок США в 20-м веке" сначала должен быть проанализирован программой классификатора по отдельным компонентам: центральное понятие (подводная лодка), процесс (проектирование), место (США), время (20-й век). Затем необходимо обратиться к системе классификации для выявления способа записи каждого из выделенных понятий. Далее найденные элементы нотации должны быть объединены в законченную запись. В результате записи фасетов будут выглядеть следующим образом:
"D5254" | Подводная лодка (буква D обозначает разработку основных классов, 5254 обозначает лодку); |
"4" | Разработка в классе D (проектирование); |
"73" | США; |
"N" | 20-й век. |
Законченная запись вместе со связующими знаками примет вид: "D5254:4.73'N" [26].
Пример 4 - В рамках УДК в настоящее время пересматривается класс 1 "Философия". Одним из пересматриваемых шагов является идентификация фасетов, необходимых для надлежащего выражения содержательной стороны философских знаний.
Идентифицированы следующие фасеты [24]:
Отрасли. Области;
Системы. Школы. Традиции. Периоды. История;
Точки зрения. Позиции. Доктрины. Подходы. Теории. Отношения в философии. Типология систем. Измы;
Темы. Специальные философские дисциплины. Области философского знания. Специализация по философским предметам;
Разработка. Взаимосвязи; Практика. Метод. Аргументация;
Применения. Прикладная философия;
Философы. Пропагандисты. Личность и профессия философа; Источники. Материалы.
Пример 5 - Фасетная система классификации может содержать общие фасеты, которые применимы к любому основному классу системы; примерами могут служить фасеты времени и места.
Примечание - Этот рисунок служит только иллюстративным целям и не может претендовать на роль полноценной системы классификации вин.
Рисунок 3 - Пример фасетной системы классификации
5.4.4 Перечислительные и фасетные системы классификации
Сочетание перечислительного метода классификации с фасетным во многих случаях дает определенные преимущества. На более высоких уровнях системы классификации может использоваться перечислительный метод - для сужения областей применимости отдельных классов до размеров, поддающихся управлению. На более низком уровне используются фасетные методы - для четкого определения характера понятий финальных (листовых) классов системы классификации.
В противоположность чисто фасетным классификационным системам фасеты, которые совместно образуют ветвь системы классификации, имеют общий входной класс.
Пример 1 - На рисунке 4 понятие "Вино" обозначает вводный класс фасетной ветви "Напитки" в системе классификации.
Пример 2 - УДК базируется на перечислительном методе (десятичной классификации Дьюи), но имеет множество фасетов, дополняющих основные структуры.
Примечание - Этот рисунок служит только иллюстративным целям и не может претендовать на роль полноценной системы классификации вин.
Рисунок 4 - Пример перечислительно-фасетной системы классификации
5.4.5 Классы и свойства в рамках систем классификации
Основой всех классов системы классификации являются характеристики, которые могут быть выражены явно или неявно. Явно выраженные характеристики называются свойствами. Таким образом, можно сказать, что система классификации, в которой характеристики не выражаются явно, не имеет детализации свойств (см. рисунок 5).
Пример 1 - ИСО 13584-42:2010 [9] определяет модель данных для классификационных систем с перечислительной структурой, несущей свойства на каждом уровне.
Классы системы классификации могут не иметь явно выраженных определений. Определения классов выражаются, как правило, неструктурированным естественным языком. Если система классификации не имеет свойств, то различия между классами могут выводиться из идентификаторов классов, из местоположения класса в классификационной системе или иногда посредством интерпретации определений классов.
В системах классификации с детализацией характеристик каждый класс сопровождается набором свойств, которые представляются в структурированной форме. Поэтому области применимости классов могут выводиться из их свойств. Благодаря структурированной форме представления эти свойства машиночитаемы, что облегчает их автоматическую обработку как при поиске, так и при каталогизации. Кроме того, системы классификации могут содержать определения классов, выраженные на естественном языке. Такое определение класса должно быть совместимо с его свойствами, то есть свойства класса не должны вступать в противоречие с его определением.
В системах классификации с детализацией свойств эти свойства ассоциируются с некоторыми или со всеми классами. Для обеспечения возможности наследования свойств такие системы классификации структурируются с помощью родовых отношений. Применение механизма наследования делает возможным существенное сокращение числа определений свойств благодаря общности свойств внутри древовидных подструктур иерархии.
Пример 2 - На рисунке 6 проиллюстрирован пример системы классификации без детализации характеристик.
Рисунок 5 - Свойства в рамках систем классификации
Примечание - Этот рисунок служит только иллюстративным целям и не может претендовать на роль полноценной системы классификации вин.
Рисунок 6 - Пример системы классификации без детализации характеристик
Пример 3 - На рисунке 7 показана система классификации, в которой свойство "Объемная доля алкоголя" передается вниз по иерархии подчиненным классам "Алкогольные напитки".
Рисунок 7 - Система классификации с характеристиками, разрешенными для любого класса
Системы классификации, в которых использование свойств ограничивается листовым уровнем, не дают никакого выигрыша от сокращения числа свойств за счет применения механизмов наследования.
Пример 4 - На рисунке 8 отображена система классификации, в которой свойства присваиваются только финальным (листовым) элементам. Это значит, что свойство "Объемное содержание алкоголя" должно быть воспроизведено в классе "Спирты".
Рисунок 8 - Система классификации с характеристиками, разрешенными только на уровне финальных классов
5.4.6 Отношения в системах классификации
Для целей проектирования систем классификации важную роль играют два типа отношений между классами:
- родовые отношения;
- партитивные отношения.
Родовые отношения образуют иерархии классов в результате последовательного формирования схемы соподчинения в направлении от самого общего класса к самому нижнему уровню с максимально детализированными классами. Этот процесс поддерживается механизмом наследования, в рамках которого подчиненные классы всегда наследуют отношения и правила от своего вышестоящего класса. Таким образом, подчиненные классы включаются в состав целевых объектов их непосредственного подчиняющего класса. Один подчиненный класс может принадлежать нескольким подчиняющим классам, и такие ситуации называются "полииерархией". Когда имеет место полииерархия, подчиняющие классы не должны иметь пересекающихся областей применимости, т.е. ни один класс не должен попадать одновременно в области обоих классов и таким образом становиться членом обоих. В противном случае возможно возникновение неопределенности в подчиненных классах в результате наследования противоречивой информации об элементах, которые неоднозначно определены в подчиняющих классах.
Пример 5 - Упрощенный пример полииерархии показан на рисунке 9, где класс "Электродвигатель" является деталью механического оборудования и одновременно - деталью электрического оборудования.
Рисунок 9 - Упрощенный пример полииерархии
Примечание - Иерархия классов может разрабатываться в направлении сверху вниз или снизу вверх. Последовательное соподчинение классов не требует строгой последовательности шагов при построении системы классификации.
Партитивные отношения выражают связи типа "часть - целое", когда подчиненный класс является частью подчиняющего класса. Механизм наследования при таком типе отношений неприменим.
5.5 Требования к описаниям классификационных систем
5.5.1 Общие положения
Системы классификации имеют широкий диапазон возможных применений (см. 5.2). Поэтому применительно к классификационной системе должна предоставляться информация о ее целевом назначении и о любых ограничениях, накладываемых на систему классификации этим целевым использованием. Должна также предоставляться информация о структуре и процедурах сопровождения системы классификации. Различные типы основополагающей информации, необходимой для интернационализации системы классификации, определены в 5.5.2-5.5.5.
Крупномасштабные системы классификации могут разрабатываться или поддерживаться совместными усилиями многих групп специалистов, из разных мест или разных организаций. В таких случаях типы информации, определенные в 5.5.2-5.5.5, могут нуждаться в повторении в рамках каждой из групп, вовлеченных в эту сферу деятельности. Если эти группы отвечают за конкретные множества классов или проявляют интерес к ним, то должна предоставляться информация, касающаяся интерпретации таких классов.
Пример - Примеры описательной информации по существующим системам классификации приведены в приложении A.
5.5.2 Область и цель применения классификационных систем
Описание области применения системы классификации должно указывать соответствующую сферу знаний и уровень специализации, охватываемый этой системой. Должны быть указаны также области знаний, исключенные из системы классификации.
Применительно к своей сфере применения система классификации должна быть исчерпывающей, т.е. в ней должны присутствовать все понятия, относящиеся к рассматриваемой области.
Пример 1 - Типичное описание системы классификации: "Данная система классификации предназначена для охвата всех доступных на рынке товаров и услуг, классификации всей необходимой для этого важной структурной информации и для создания соответствующих групп изделий. Структурированная информация призвана облегчить поиск или классификацию изделий и автоматизировать работу с информационным потоком по возможности от всех бизнес-процессов и с минимальными затратами вычислительных ресурсов. Должна быть также обеспечена возможность классификации, а также поиска и извлечения информации о каждом товаре или услуге, которые могут поставляться на рынок или запрашиваться потребителями в надлежащей логической последовательности и без возникновения неопределенностей".
Цель классификационной системы должна быть четко определена.
Пример 2 - Типичная формулировка целевого назначения: "Настоящая система классификации нацелена на классификацию общих функций хозяйственной деятельности (технологических процессов в подразделениях), таких как исследования, разработки, маркетинг, закупки, продажи, планирование или проектирование, производство, техническое обслуживание, бухгалтерский учет и утилизация отходов. Система классификации ориентирована на операции закупок, статистических оценок и материально-технического обеспечения".
5.5.3 Определяющие региональные условия
В настоящее время подавляющее большинство операций коммерческой, научной, промышленной и исследовательской деятельности в той или иной степени связаны с глобальными интересами, и, следовательно, при их выполнении необходимо принимать в расчет многоязычную и мультикультурную среды. Как правило, системы классификации с самого начала либо разрабатываются для покрытия интернациональных потребностей, либо ориентируются на конкретную региональную среду. Во втором случае эта национальная среда должна быть определена заданием административной информации о классификационной системе - для обеспечения ее правильной интерпретации пользователями или лицами, осуществляющими ее адаптацию к другим региональным условиям.
5.5.4 Определение уровней и назначения системы классификации
Базовая информация о системе классификации должна включать в себя сведения о правилах создания новых классов и новых уровней, а также информацию о смысловом значении уровней классификации.
5.5.5 Прочие требования к описаниям
В дополнение к вышеприведенным требованиям должна предоставляться информация, перечисленная ниже, от а) до е):
а) Лицензирование и авторское право
Такое информационное наполнение (контент) системы классификации, как идентификаторы классов или наименования свойств, предназначено для распространения (т.е. копирования) среди ее пользователей. Кроме того, эти данные часто запрашиваются из внешней среды классификационной системы. Информация, касающаяся условий охраны авторских прав или требований системы лицензирования, которые могут ограничивать использование системы классификации или ее части, подлежит официальному документированию;
b) Идентификатор владельца системы классификации
В административной информации должны содержаться сведения об организации, которой принадлежит система классификации. Эти сведения должны иметь международную регистрацию, подтверждаемую идентификационным кодом, который должен соответствовать требованиям ИСО/МЭК 6523.
Если такой идентификационный код отсутствует, организация-владелец должна обратиться с запросом на регистрацию в ИСО; в противном случае не будет обеспечена уникальность идентификационного кода в международном масштабе, что может отрицательно сказаться на интерпретации системы классификации на международном уровне;
c) Подробные сведения для связи с владельцем системы классификации
Предоставляемая информация о владельце системы классификации должна содержать также данные для контактов (полный почтовый адрес, имя, адрес электронной почты и номер телефона лица, ответственного за контакты). Если у организации-владельца имеется веб-сайт, то должен быть предоставлен соответствующий унифицированный указатель ресурса (URL-адрес);
d) Правила доступа
1) Должна предоставляться информация о способе доступа к системе классификации и к любым приложениям, которые подсоединены к этой системе классификации или используют ее;
2) Если доступ к системе классификации осуществляется через веб-сайт, то должен быть указан сетевой адрес этого сайта в виде унифицированного имени ресурса URN (uniform resource name);
3) В случае использования доступа через узлы, зависящие от конкретного приложения, должна предоставляться надлежащая информация об организации процедур доступа;
4) Если средств, указанных в перечислениях d1)-d3), не существует, то должен быть предоставлен адрес обычной почты;
e) Информация о сопровождении системы классификации
В этом разделе должна быть представлена информация об организации, ответственной за сопровождение системы классификации или ее элементов, включая подробные сведения для установления контактов. Это может быть URN или полный почтовый адрес с указанием контактного лица или пути доступа к интерфейсу электронных служб. Должна быть также предоставлена информация о правилах и механизмах формирования запросов на внесение изменений.
6 Терминологические принципы в системе классификации
6.1 Общие положения
В настоящем разделе излагаются общие принципы терминологической работы, которая может оказаться полезной для создания и сопровождения системы классификации. Принципы терминологической работы, или "терминологические принципы", нацелены на анализ понятий и создание для них непротиворечивых обозначений. В разделе 7 показано, каким образом эти принципы должны реализовываться в системах классификации.
В определенных случаях применение терминологических принципов к системам классификации может оказаться невозможным - как, например, в сформировавшейся системе, эксплуатируемой в течение длительного периода времени и изначально не была смоделирована с использованием концепции понятийной системы. Настройка такой системы классификации на соответствующую систему понятий "задним числом" могла бы негативно сказаться на ее пользователях или потребовать чрезмерно больших трудозатрат. Если не считать этого случая, то настоящий международный стандарт показывает, как разработка новой системы классификации на основе соответствующей понятийной системы может облегчить создание надежной и непротиворечивой иерархической схемы классификации. В любом случае, независимо от того, строится ли система классификации на основе понятийной системы или нет, общие правила из 5.3 должны обязательно применяться в процессе ее разработки.
При использовании терминологических принципов в системах классификации важно проводить четкое различие между понятиями и классами. Согласно ИСО 1087-1 понятие представляет собой элемент знаний, созданный уникальным сочетанием характеристик. Каждый связанный элемент в системе понятий представляет собой одно понятие. Класс в рамках системы классификации группирует сходные объекты по их свойствам.
Классы в системе классификации могут представлять больше одного понятия.
Пример - "Пожарная машина" и "скорая помощь" - это два разных понятия. Однако в системе классификации может возникнуть необходимость создания на их основе одного класса с названием "Emergency vehicles", который включает в себя как пожарные машины, так и машины скорой помощи.
Правильное и аккуратное использование терминологии очень важно для эффективного обмена информацией, стимулирования новых технических решений, поиска новых путей и разработки новых идей. В еще большей мере это относится к контенту и стилю формулировок в системах классификации, которые принимают на себя роль справочно-информационных фондов в рамках конкретных предметных областей. Примерами информации, которая требует стандартизации на содержательном уровне в целях обеспечения ее однозначной интерпретации, являются юридические документы, медицинские карты, каталоги для заказа товаров, технические условия и статистические отчеты.
6.2 Терминологические принципы в применении к определениям
Существуют самые разные способы формулировки определений для понятий; два наиболее распространенных типа определений - интенсиональные и экстенсиональные. ИСО 704 [1] рекомендуются к использованию интенсиональные определения, поскольку они наиболее четко выявляют характеристики понятий в рамках понятийной системы. Интенсиональное определение должно включать в себя указание подчиняющего концепта и отличительные характеристики. Подчиняющий концепт помещает определяемое понятие в отведенную ему позицию в рамках понятийной системы. Благодаря этому использование интенсионального определения для описания классов может способствовать построению хорошо структурированной иерархической системы классификации.
При определении классов системы классификации полезность применения экстенсиональных определений может быть весьма ограниченной. В экстенсиональном определении перечисляются все подчиненные понятия, соответствующие объектам расширения класса. При определении классов экстенсиональное определение должно содержать список всех типов объектов, разрешенных в рамках целевого назначения класса. Этот вид определения должен использоваться только при ограниченном числе подчиненных объектов, подлежащих нумерации; в тех случаях, когда список подчиненных объектов является исчерпывающим по одному из критериев разбиения и подчиненные объекты известны, рекомендуется использовать по возможности интенсиональные определения.
Описание классов с использованием экстенсиональных определений может порождать избыточность, так как в рамках самой классификационной системы допустимые варианты выбора определяются посредством подчиненных классов.
Экстенсиональные определения чаще применяются для описания понятий, которые соответствуют свойствам. Во многих случаях замкнутое множество разрешенных значений той или иной характеристики может быть представлено элементами определения конкретного свойства. Такие совокупности разрешенных значений образуют основу для проверки согласованности значений характеристик, присваиваемых пользователями.
Определения должны отражать отношения между понятиями в рамках системы понятий и быть по возможности максимально краткими и четкими. Отсюда следует, что они должны включать в себя только отличительные характеристики, тогда как дополнительные характеристики могут отражаться, например, в дополнительных примечаниях.
6.3 Терминологические принципы в применении к наименованиям классов
Способ именования классов может существенно влиять на удобство применения системы классификации и на затраты по ее сопровождению. Поэтому при выборе имен классов особенно важно точное использование терминологии. Пользователи должны иметь возможность быстрого отыскания интересующих их классов без необходимости чтения определений классов.
В ISO 704 [1] обращается внимание на то, что при формулировании или выборе подходящих терминов необходимо следовать принципам, приведенным в перечислениях a)-I):
a) Прозрачность
Термин или наименование следует считать прозрачными, когда понятие, которое они обозначают, становятся ясными хотя бы частично, без каких-либо дополнительных определений или пояснений: другими словами, когда смысл термина или наименования может быть выведен из его частей. Чтобы термин или наименование были прозрачными, при их формировании используют некоторую ключевую (обычно разграничивающую) характеристику.
Пример - Английский термин "torque wrench" (динамометрический ключ) более прозрачен, чем термин "monkey wrench" (разводной ключ Монке). Второе название этого инструмента происходит от имени его изобретателя м-ра Монке (Moncke) и со временем превратилось в созвучное сленговое выражение "monkey wrench".
b) Последовательность
Терминология любой предметной области должна быть связанной терминологической системой, которая соответствует рассматриваемой системе понятий.
c) Адекватность
Предлагаемые термины должны отвечать знакомым установившимся смысловым шаблонам, сложившимся внутри языкового сообщества. При формировании новых терминов путаница недопустима.
d) Лингвистическая экономичность
Термин должен быть по возможности предельно лаконичным.
e) Выводимость и сочетаемость
Следует отдавать предпочтение продуктивному формированию терминов, позволяющему получать на его основе производные и сложные слова (в соответствии с превалирующими соглашениями конкретного языка).
f) Лингвистическая корректность
При вводе в обращение новых терминов эти термины должны соответствовать морфологическим, морфосинтаксическим и фонологическим нормам рассматриваемого языка.
g) Предпочтительность терминов родного языка
1) Хотя заимствование из других языков - общепринятая форма создания новых терминов, при этом предпочтение следует отдавать родному языку.
2) Следование определенным принципам и методам терминологической работы при создании и сопровождении системы классификации может способствовать успешному решению целого ряда актуальных проблем, возникающих на этапах накопления и сопровождения ее информационного содержания.
h) Регулирование синонимии
Точно так же, как и в стандартизации терминологии, использование нескольких терминов для представления одного и того же понятия минимизируется, а использования разных наименований для одного и того же класса стараются избегать. Если же какая-то предметная область диктует необходимость применения нескольких наименований для представления одного класса, эта синонимия может быть принята официально, но одно из наименований должно быть определено как предпочтительное. При этом для выяснения того, являются ли определенные имена представлениями одного и того же класса, должна использоваться структурированная система понятий.
Пример - Разные слова, сходные по своему значению, обычно существуют в силу каких-то определенных причин: так, английское слово "feline" (кошка, животное из семейства кошачьих) имеет более строгий смысл, чем слово "cat" (кот), а слова "long" (длинный) и "extended" (удлиненный) являются синонимами только в этом конкретном смысле и не являются синонимами в других случаях употребления: например, "long arm" (ружье с длинным стволом) и "extended arm" (выдвижная рука манипулятора) - это далеко не одно и то же.
i) Выявление дублированных классов
При отображении классов системы классификации на соответствующие им понятия в рамках понятийной системы может оказаться, что несколько классов представляют одно и то же понятие; в этом случае можно определить, действительно ли существует дублирование, и принять надлежащие меры.
j) Обнаружение пересекающихся классов
Класс в системе классификации может охватывать множество понятий, и если какой-то другой класс соответствует одному или нескольким понятиям из этого множества, то такой класс частично перекрывает понятия первого класса. Подобная ситуация может создаваться как намеренно, так и случайно. Корректировку пересечения классов проводят на основе анализа понятий, соответствующих пересекающимся классам.
k) Использование предельно понятных наименований и определений классов
Неоднозначные имена классов и неудачные или неполные определения классов могут приводить к их неверной интерпретации и неправильному использованию, что может быть чревато дорогостоящими неблагоприятными последствиями для пользователей системы классификации. Следование принципам терминологической работы, таким как формулирование определений, отражающих систему понятий, и использование наименований классов, в основе которых лежит контролируемый словарь, способны существенно улучшить практичность системы классификации. Если определенные классы предназначаются для каких-то конкретных приложений, такие сферы применения должны быть указаны явным образом.
l) Отражение сложившейся практики
Определения понятий, относящихся к классам и свойствам, могут все же оказаться неправильными, если они не согласуются с текущей практикой их применения в деловых операциях и в промышленной сфере. Поэтому при разработке определений настоятельно рекомендуется консультирование со специалистами в соответствующих предметных областях.
7 Понятийные системы и системы классификации
7.1 Базовые принципы построения понятийных систем
Системы понятий образуют основу для систематической терминологической работы. Они отражают накопленные знания о понятиях в рамках предметной области и отношения между этими понятиями. Понятийные системы вносят существенный вклад в снятие омонимии понятий и потому могут служить основой для создания систем классификации. Они также предоставляют надежную основу для разработки систем классификации, в которых область применения каждого класса определяется четко и предельно точно. Четко определенные понятия наряду с документированными отношениями между ними являются важным инструментом создания непротиворечивых систем классификации. На рисунке 10 показан случай, когда из единственной понятийной системы выводятся множественные специализированные системы классификации.
Разработка схемы классификации с использованием понятийной системы не является обязательным требованием, однако настоятельно рекомендуется.
В ИСО 704 [1] дается общее описание терминологической работы и излагаются базовые принципы построения понятийных систем.
Примечание - Представления понятийной системы и системы классификации на этом рисунке носят исключительно иллюстративный характер. Присутствующие здесь текстовые фрагменты не играют никакой роли в интерпретации рисунка и могут быть опущены.
Рисунок 10 - Системы классификации для разных целей, выведенные из одной и той же системы понятий
В понятийной системе формализуются представленные ниже отношения между понятиями и определяются характеристики, которые придают различие связанным понятиям (см. ИСО 704 [1]):
- родовые отношения;
- партитивные отношения;
- ассоциативные отношения.
"Родовые отношения" и "партитивные отношения" образуют иерархии понятий, тогда как "ассоциативные отношения" не имеют иерархической структуры. Понятийная система может содержать в себе все три типа отношений; на основе этих отношений и характеристик понятий возможно формулирование их согласованных и строгих определений, а при наличии синонимии - выбор предпочтительного термина для конкретного понятия.
Примечание 1 - Дополнительные правила создания иерархий понятий и классов см. в приложении B.
Характеристики, применимые к понятиям, представляются в форме отличительных признаков.
Пример 1 - Отличительным признаком может служить характеристика СРЕДСТВО ПЕРЕДВИЖЕНИЯ: motor, которое характеризует понятие автомобиль (см. рисунок 11).
Примечание 2 - Отличительные признаки могут выражаться в системе классификации одним или несколькими свойствами (СПОСОБ ПЕРЕДВИЖЕНИЯ), которые относятся к соответствующим классам (одному или нескольким) и к их значениям (motor).
На основе отличительных признаков могут быть введены критерии разбиения, по которым группируются понятия для формирования удобочитаемых структур.
Пример 2 - На рисунке 11 представлен пример системы классификации типов транспортных средств. Эта система классификации используется для разъяснения способа применения систем понятий. Поскольку данный рисунок предназначен только для иллюстративных целей, он не охватывает всю предметную область транспортных средств целиком.
Примечание - На этом рисунке идентификатор понятия выводится из идентификатора подчиняющего концепта, снабженного дополнительным номером, который уникален для данного уровня иерархической структуры.
Рисунок 11 - Понятийная система для типов транспортных средств
Пример 3 - Идентификатор понятия "1.1.1 дорожное транспортное средство" включает в себя: подчиненное понятие "1.1. "колесный транспорт" с номером "1".
В системах понятий подчиненные понятия наследуют характеристики от своих подчиняющих концептов. В рамках понятийных систем возможно введение полииерархии, при которой одно и то же понятие может быть связано с двумя и более подчиняющими концептами. В этом случае подчиняющие концепты должны всегда принадлежать к разным критериальным пространствам разбиения.
Если подчиняющие концепты в полииерархии не принадлежат к разным критериальным пространствам разбиения, то одно понятие наследует два или более свойств, в конечном итоге представляющих конфликтующие характеристики. Впоследствии такие системы понятий подлежат корректировке. Пример неправильно организованной полииерархии показан на рисунке 12.
Рисунок 12 - Пример неправильно организованной полииерархии
7.2 Различия между системами понятий и системами классификации
Понятийные системы и системы классификации отличаются прежде всего по своему целевому назначению. Цель использования системы понятий заключается в обеспечении упрощенного предоставления области знаний об объектах классификации, тогда как система классификации нацелена на разбиение объектов на классы, которые образуют основу для упорядочения физических и нефизических сущностей.
Конкретное целевое назначение системы классификации влияет на решение о расположении и структурировании ее классов. В идеальном случае классификационная система выводится из лежащей в ее основе системы понятий, которая содержит соответствующие концепты, т.е. знания о фактах, которые используются для "настройки" классов системы классификации. Эта система понятий не связана никакими особыми соображениями или ограничениями относительно сферы применения производной системы классификации. Ее роль сводится исключительно к представлению знаний о конкретной предметной области.
В зависимости от целевого назначения, наличия специальных правил, требуемой степени сложности результирующей системы классификации или каких-то иных соображений некоторые классы внутри этой системы могут быть напрямую связаны с конкретными понятиями, тогда как другие могут охватывать сразу несколько понятий или только часть какого-то концепта.
Присваивание значений из системы понятий объектам системы классификации не обусловливается никакими ограничениями, т.e. не существует жестких правил отображения элементов конкретной понятийной системы, таких как понятие или свойство. В подавляющем большинстве случаев понятия отображаются на один или несколько классов, а отличительные признаки - на одно или несколько свойств. Возможны также особые случаи отображения отличительного признака на множество классов. Кроме того, возможны и такие случаи, когда определенные элементы понятийной системы вообще не будут иметь никаких соответствующих им элементов в системе классификации. Отображение элементов системы понятий на элементы системы классификации полностью зависит от целевой области использования и от требуемого уровня детализации классификационной системы, однако при этом во всех случаях конечной целью является четко определенная семантическая структура для объектов, образующих систему классификации. Неясная семантика каких-то частей этой системы служит индикатором того, что отображение понятийной системы на систему классификации нуждается в переработке. Рекомендации, касающиеся этого процесса отображения, приведены в 7.4.1.
В четко определенной системе понятий определения и описания в рамках классификационной системы могут быть выражены гораздо яснее и более осмысленно. Понятийная система обеспечивает основу для четких определений и таким образом способствует предотвращению пересечений, неопределенностей или несоответствий при определении областей применимости классов или дальнейшем разбиении существующих классов на подклассы.
Примечание 1 - Из одной понятийной системы может быть выведено несколько систем классификации, ориентированных на разные пользовательские сообщества, которые отличаются своими требованиями к степени детализации классификационной системы рисунок 10), что является существенным преимуществом использования понятийной системы для моделирования системы классификации.
Примечание 2 - Благодаря прозрачности системы классификации, основанные на использовании понятийной системы, легче поддаются локализации. Наличие точной информации о семантической структуре, характеристиках и применимости классов является необходимым условием успешного проведения локализации системы классификации.
Однако между структурой системы понятий и структурой системы классификации имеются и существенные различия. В системах классификации связанные элементы называются классами. Каждый класс предназначен для группирования множества сходных объектов с целью их отделения от непохожих объектов. В отличие от этого в системах понятий один связанный элемент представляет только одно понятие.
7.3 Возможные трудности в системах классификации, не основанных на использовании системы понятий
В системах классификации отношения между классами не определяются, и отличительные характеристики классов не всегда делаются явными. Это иллюстрирует показанный на рисунке 13 фрагмент системы классификации, которая не основана на системе понятий, а была "сляпана наспех" и потому обладает целым рядом недостатков.
В примере на рисунке 13 явно видно, что при использовании принципов построения понятийных систем рассматриваемая система могла бы иметь более логичную структуру и была бы более удобной для практического применения. В последующих разделах приводятся примеры неудачного проектирования системы классификации, отображенной на рисунке 13, в сопоставлении с системой понятий, представленной на рисунке 11.
На рисунке 11 понятия четко разграничены друг от друга, чего нельзя сказать о классах на рисунке 13. В понятийной системе концепты дорожное транспортное средство, рельсовое транспортное средство, воздушное транспортное средство и водное транспортное средство отличаются друг от друга КАНАЛОМ ТРАНСПОРТИРОВКИ. Ниже дорожного транспортного средства располагаются подчиненные понятия автомобиль и мотоцикл, которые различаются по признаку СРЕДСТВА ПЕРЕДВИЖЕНИЯ. Понятия сельскохозяйственное транспортное средство и подъемник, автомобиль техпомощи и грузовой автомобиль характеризуются по критерию ЦЕЛЕВОГО НАЗНАЧЕНИЯ. Порядок следования классов на рисунке 13 это не проясняет. Пользователям системы классификации проще найти подходящий класс для того или иного продукта, если классы имеют логическую упорядоченность, особенно в тех случаях, когда система классификации содержит большое число классов и подклассов.
По этой причине структура системы классификации, показанной на рисунке 13, подлежит изменению, и в нее полезно ввести дополнительные критерии разбиения.
Структура, представленная на рисунке 13, конфликтует с ключевыми требованиями связности и понятности классификации. Первое требование нарушено в силу того, что классы охватывают пересекающиеся характеристики автомобильной техники. Такие критерии, как целевое назначение, канал транспортировки и тип транспортного средства, перемешаны друг с другом и присутствуют в качестве классов на одном и том же уровне иерархии.
Из-за использования переменных критериев разбиения классов система становится труднообозримой, а это значит, что нарушено и второе ключевое требование, касающееся понятности классификации. Применяя такую систему классификации, пользователи могут сталкиваться с затруднениями в правильной классификации интересующих их объектов; и наоборот, очень трудно понять, в каком классе следует искать тот или иной объект.
На рисунке 14 показана система классификации из рисунка 13 вместе с критериями разбиения классов, использованными на рисунке 11.
Приведенный выше пример свидетельствует о том, что система классификации, не имеющая в своей основе понятийной системы, может привести к созданию классов, которые трудно понять и которые в конечном итоге способны породить ошибочные структуры. Такая система классификации нарушает общие требования связности и понятности (см. 5.3). Присваивание тех или иных свойств тоже затруднено и сопряжено с ошибками, так как неясна область применимости классов.
Подход, позволяющий избежать некоторых из отмеченных выше проблем, представлен на рисунке 15.
Рисунок 13 - Раздел ошибочной системы классификации транспортных средств
Рисунок 14 - Система классификации из рисунка 13 с указанными критериями разбиения классов
Рисунок 15 - Система классификации с четкой структурой
7.4 Использование понятийной системы для построения системы классификации
7.4.1 Рекомендации по созданию системы классификации на основе понятийной системы
В настоящем подразделе приведен ряд рекомендаций относительно того, как следует создавать систему классификации на базе имеющейся понятийной системы. В 7.4.2 содержится описание этого технологического процесса на примере системы понятий, представленной на рисунке 11.
Этот технологический процесс предусматривает обязательное выполнение действий по перечислениям a)-h):
a) Определяются область применения, целевое назначение и целевая группа пользователей создаваемой системы классификации.
b) Определяются понятия, имеющие отношение к предполагаемой области применения системы классификации.
Для обеспечения возможности уточнения понятий и логической связности системы может потребоваться введение понятий, которые не будут порождать классы в системе классификации.
Примечание 1 - Понятийная система может включать в себя концепты, которые не отображаются на классы системы классификации.
c) Анализируются характеристики релевантных понятий.
d) На основе идентифицированных характеристик понятий создается понятийная система, которая должна быть представлена графически соответствующей концептуальной схемой.
e) Составляется систематизированный перечень понятий на основе использования принятой системы обозначений концептов в концептуальной схеме.
f) Систематизированный перечень понятий настраивается на конкретные нужды системы классификации; в ходе такой настройки может оказаться необходимым добавление понятий в сформированный перечень или их удаление (см. таблицу 4); такая настройка может предусматривать:
1) добавление понятий в целях уточнения схемы классификации или для более подробного представления знаний предметной области;
2) добавление какого-либо понятия в нескольких местах во избежание образования структур, содержащих недопустимые полииерархии;
3) удаление некоторых уровней концептуальной схемы, не желательных по причине излишне детализированного разбиения концептов.
Рекомендуется тщательно выверять систематизированный перечень понятий на предмет выявления концептов, для которых не должно быть эквивалентов в системе классификации. Такие концепты подлежат исключению из списка.
g) Для каждого понятия создается класс, который помещается в иерархическую структуру, зеркально отображающую структуру системы понятий.
h) Устанавливаются семантические правила для классов путем определения соответствия между понятиями систематизированного перечня и классами классификационной системы.
Примечание 2 - Для получения оптимального результата может оказаться необходимым изменение результатов предыдущих шагов с учетом исхода более поздних шагов. Простой пример разработки системы классификации на основе понятийной системы приведен на рисунке 11 в 7.4.2. Пример построения системы классификации на базе понятийной системы, содержащей полииерархию, показан в 7.4.3.
7.4.2 Пример построения системы классификации на основе понятийной системы
Формулировка, определяющая область применения, должна четко указывать область, покрываемую системой классификации, и при необходимости уточнения - требуемые исключения. Формулировка, определяющая назначение системы, может содержать сведения о целях системы классификации и о целевых группах ее пользователей.
Понятийная система, представленная концептуальной схемой на рисунке 11, была создана на основе базовых характеристик концептов [7.4.1, перечисление c)].
На основе указанной концептуальной схемы можно построить систематизированный перечень понятий, представленный в таблице 1 [7.4.1, перечисление e)]. Этот перечень может быть положен в основу соответствующей части системы классификации; из него можно вывести нужные родовые отношения посредством нумерации позиций. Например, номер "1.1" означает, что класс колесное транспортное средство является подчиненным по отношению к классу "1 транспортное средство" (родовое отношение).
В процессе уточнения понятий оказалось полезным введение двух понятий: колесное транспортное средство (1.1) и самолет (1.2), которых не было в классификации, показанной на рисунке 13.
В таблицах 2 и 3 приведены два отличных друг от друга представления классов в системе классификации, построенной на основе систематизированного перечня понятий, показанных в таблице 1. В обоих случаях здесь сделаны упрощения по сравнению с исходным перечнем [см. 7.4.1, перечисления e) и f)]:
в таблице 2 характеристики опущены и просто показано дерево классификации, полученное в результате прямого отображения понятий из таблицы 1 на классы;
таблица 3 не содержит эквивалентов понятий колесное транспортное средство и самолет.
Два понятия, колесное транспортное средство и самолет, фигурирующие как классы в исходной классификации на рисунке 13, вносят свой вклад в лучшую обозримость классов в схеме классификации. Однако два этих класса могут оказаться ненужными для целевой группы пользователей данной системы классификации и потому могут быть удалены ради ее упрощения.
Таблица 1 - Систематизированный перечень понятий из понятийной системы на рисунке 11
Обозна- | Понятие | Характеристика | Фасет |
1 | Транспортное средство | ||
1.1 | Колесное транспортное средство | Способ контакта: колеса | |
1.1.1 | Дорожное транспортное средство | Канал транспортировки: дорога | |
1.1.1.1 | Моторизованное транспортное средство | Приводной механизм: двигатель | |
1.1.1.1.1 | Автомобиль | Число колес: три или четыре | |
1.1.1.2 | Мотоцикл | Приводной механизм: ножные педали | |
1.1.2 | Рельсовое транспортное средство | Канал транспортировки: рельсовый путь | |
1.2 | Самолет | Способ контакта с каналом транспортировки: фюзеляж транспортного средства | |
1.2.1 | Воздушное транспортное средство | Канал транспортировки: воздух | |
1.2.2 | Водное транспортное средство | Канал транспортировки: вода | |
1.3 | Сельхозтранспорт | Целевое назначение: сельское хозяйство | Прямое назначение |
1.4 | Подъемник | Целевое назначение: подъем | |
1.5 | Транспорт техпомощи | Целевое назначение: спасение | |
1.5.1 | Скорая помощь | Целевое назначение: перевозка больных или травмированных людей |
Таблица 2 - Система классификации без явных критериев разбиения
Таблица 3 - Система классификации с явными критериями разбиения
7.4.3 Пример системы классификации, созданной на основе понятийной системы с использованием полииерархии
На рисунке 16 показан фрагмент проекта понятийной системы для различных типов вина. Эта система состоит из нескольких полииерархических структур, т.е. в этой системе одно понятие имеет связь с двумя и более подчиняющими концептами. Подчиняющие концепты полииерархии должны всегда принадлежать к разным критериальным пространствам разбиения. Если это условие не выполняется, то одно понятие наследует две и больше противоречивых характеристик.
В системе, показанной на рисунке 16, одно понятие не может иметь родовой связи одновременно с красным вином и с белым вином, т.е. понятия "Бордосское красное вино" не существует.
Рисунок 16 - Фрагмент проектируемой системы понятий для типов вина
В таблице 4 приведен систематизированный перечень, соответствующий понятийной системе, которая представлена на рисунке 16. Понятия с двойными обозначениями, т.е. относящиеся сразу к двум подчиняющим концептам, выделены курсивом.
Таблица 4 - Систематизированный перечень, соответствующий понятийной системе на рисунке 16
Обозначение | Понятие | Фасет |
1 | Вино | |
1.1 | Красное вино | ЦВЕТ |
1.2 | Белое вино | |
1.3 | Французское вино | РЕГИОН |
1.3.1 | Бордосское | |
1.3.2 | Бургундское | |
1.3.3 | Луарское | |
1.4 | Итальянское вино | |
1.5 | Германское вино | |
1.5.1 | Мозельское | |
1.6 | Сладкое вино | СЛАДОСТЬ |
1.7 | Сухое вино | |
1.8 | Мерло | СОРТ ВИНОГРАДА |
1.9 | Шираз | |
1.10 | Рислинг | |
1.1+1.3.1 | Бордосское красное | |
1.2+1.3.1 | Бордосское белое | |
1.1+1.3.2 | Бургундское красное | |
1.2+1.3.2 | Бургундское белое | |
1.2+1.5.1+1.6+1.10 | Сладкий Рислинг | |
1.2+1.5.1+1.7+1.10 | Сухой Рислинг |
В таблице 5 критерий разбиения СЛАДОСТЬ и подчиненные понятия под этим критерием выделены курсивом как намеченные к удалению. Это значит, что система классификации не будет различать характеристику СЛАДОСТЬ.
Таблица 5 показывает окончательный вариант рассматриваемого фрагмента системы классификации. Эта система может использоваться как для организации складского хранения винных запасов, так и для представления во всемирной сети соответствующего ассортимента продукции.
Критерий разбиения подлежит удалению в том случае, если он не нужен в системе классификации по области применения и целевой группе пользователей. В этом случае разработчику системы следует определить, является ли критерий СЛАДОСТЬ обязательным или нет.
Когда система понятий продолжает разрабатываться применительно к другому критерию разбиения (например, по критерию СОРТ ВИНОГРАДА), может возникнуть необходимость в соответствующей реорганизации системы классификации.
Систематизированная система обозначений может быть заменена упрощенными идентификационными номерами.
Таблица 5 - Понятия, отмеченные для исключения (в сравнении с таблицей 4)
Обозначение | Понятие | Фасет |
1 | Вино | |
1.1 | Красное вино | ЦВЕТ |
1.2 | Белое вино | |
Ф | Французское вино | РЕГИОН |
1.3.1 | Бордосское | |
1.3.2 | Бургундское | |
1.3.3 | Луарское | |
1.4 | Итальянское вино | |
1.5 | Германское вино | |
1.5.1 | Мозельское | |
1.6 | Сладкое вино | СЛАДОСТЬ |
1.7 | Сухое вино | |
1.8 | Мерло | СОРТ ВИНОГРАДА |
1.9 | Шираз | |
1.10 | Рислинг | |
1.1+1.3.1 | Бордосское красное | |
1.2+1.3.1 | Бордосское белое | |
1.1+1.3.2 | Бургундское красное | |
1.2+1.3.2 | Бургундское белое | |
1.2+1.5.1+1.10 | Вино Рислинг | |
1.2+1.5.1+1.6+1.10 | Сладкий Рислинг | |
1.2+1.5.1+1.7+1.10 | Сухой Рислинг |
Окончательная система классификации (таблица 6) содержит три классификационных дерева в соответствии с фасетами ЦВЕТ, РЕГИОН и СОРТ ВИНОГРАДА. Классы, принадлежащие к фасетным деревьям, могут свободно комбинироваться для описания типов вин, охватываемых областью применения системы классификации. Кроме того, часто используемые случаи, такие как "Бургундское красное" или "вино Рислинг", включаются в классификацию как предопределенные категории.
Таблица 6 - Окончательная система классификации
Обозначение | Фасет | Класс | Класс | Класс |
1 | Вино | |||
1.1 | ЦВЕТ | Красное вино | ||
1.2 | Белое вино | |||
1.3 | РЕГИОН | Французское вино | ||
1.3.1 | Бордосское | |||
1.1+1.3.1 | Бордосское красное | |||
1.2+1.3.1 | Бордосское белое | |||
1.3.2 | Бургундское | |||
1.1+1.3.2 | Бургундское красное | |||
1.2+1.3.2 | Бургундское белое | |||
1.3.3 | Луарское | |||
1.4 | Итальянское вино | |||
1.5 | Германское вино | |||
1.5.1 | Мозельское | |||
1.8 | СОРТ ВИНОГРАДА | Мерло | ||
1.9 | Шираз | |||
1.10 | Рислинг | |||
1.2+1.5.1+1.10 | Вино "Рислинг" |
8 Требования к интернационализации системы классификации
8.1 Мотивация
Несмотря на использование английского языка в качестве лингва-франка в международной торговле, многие люди в мире владеют им в ограниченной степени. Даже в таких странах, как США, локализация на языки, отличные от английского, признается желательной из-за того, что крупные сегменты населения этих стран не являются англоговорящими.
Кроме того, многие потребители чувствуют себя более комфортно, если они имеют возможность получать самую подробную информацию об интересующих их товарах и услугах на своем родном языке; поэтому локализация способна сделать любой продукт более конкурентоспособным. Два приведенных ниже примера показывают области, в которых усилия по локализации могут оказаться весьма продуктивными.
К ситуациям, в которых должен существовать локализованный контент, относятся:
- информационный обмен с местными властями;
- эксплуатация оборудования местными операторами;
- послепродажная поддержка штатного эксплуатационного персонала;
- обязательные требования;
- требуемая локальная информация в рамках промышленных проектов.
Пример 1 - Для буровой установки нефтехимической отрасли в Бразилии требуется хранить на складе примерно 45000 различных позиций - от обычных унитазов до высокотехнологичного оборудования. Все такие установки нуждаются в постоянном техническом обслуживании, для которого необходима сложная система управления информацией о деталях. В страну регулярно импортируются огромные объемы запасных частей. Каждая поставляемая партия сопровождается товарной накладной и упаковочным реестром, описывающим отгруженные позиции. Бразильским таможенным органам нефтегазовой промышленности крайне нужны детализированные спецификации каждой детали на португальском языке.
Пример 2 - Когда компания, находящаяся в Бразилии, импортирует "фланец корпорации Nylok для шнека V-образного блока срезающих плашек превентора", он описывается в товарной накладной просто как "шнек". Для того чтобы этот модуль соответствовал жестким критериям таможенного досмотра, в накладной должно быть указано более точно, что это блок противовыбросового устройства, которое является частью разведочного оборудования нефтепромысла. Тогда, если эта позиция переведена на португальский язык и классифицируется как "parafuso de nylok de ressalto para bloco de gaveta de corte", импортер получит право на соответствующее налоговое освобождение.
8.2 Многоязыковые среды
8.2.1 Общие положения
Задача активизации системы классификации для многоязыковой среды решается с использованием двух разных методов: интернационализации и локализации.
8.2.2 Интернационализация
Процесс интернационализации системы классификации охватывает планирование и разработку системы классификации, состоящей из двух или большего числа параллельно существующих вариантов, отличающихся по культурологическим особенностям, региону или языку.
Пример - Компания, располагающаяся в Германии и имеющая свои отделения в целом ряде других стран, хочет создать систему классификации, которая будет существовать одновременно на языках всех этих стран, т.е. компания желает изначально разрабатывать эту систему параллельно применительно ко всем целесообразным языкам.
Для системы классификации существуют два типа интернационализации:
- интернационализация контента;
- интернационализация метаданных, модели данных и системного интерфейса. Настоящий стандарт охватывает только интернационализацию контента.
8.2.3 Локализация
Процесс локализации системы классификации охватывает ее адаптацию к требованиям целевого региона, т.е. к языку, культурным особенностям и другим условиям конкретного целевого рынка.
Пример - Компания, находящаяся в Германии, разработала систему классификации на немецком языке и далее хочет сотрудничать с другими компаниями с рабочим английским языком; это значит, что ей нужна система классификации на немецком языке, а в дальнейшем потребуется ее вариант на английском языке.
Для системы классификации существуют два типа локализации:
- локализация контента и
- локализация метаданных, модели данных и системного интерфейса. Настоящий стандарт охватывает только локализацию контента.
8.3 Идентификаторы классов
Системы классификации играют важную роль средства связи для автоматизированного информационного обмена в рамках процессов хозяйственной деятельности. Следовательно, нужны идентификаторы классов, однозначно определяющие каждый из них. Для этого должны использоваться глобально уникальные идентификаторы в соответствии с требованиями международных стандартов.
Примечание - Существует множество широко известных методов формирования и присвоения идентификаторов классам или понятиям. Однако описание таких методов выходит за рамки настоящего стандарта, вследствие чего в дальнейшем они не рассматриваются и не объясняются.
Структура и содержательная часть идентификаторов определяются в следующих стандартах:
- ИСО/МЭК 6523;
- ИСО/МЭК 15418;
- ИСО/МЭК 15459-6;
- ИСО/ТС 29002-5.
9 Аспекты интернационализации
9.1 Общие положения
Инструкции по созданию системы классификации на основе понятийной системы были даны выше, в 7.4.1. Настоящий раздел содержит руководящие указания по созданию параллельных вариантов системы классификации на двух и более языках. Такие параллельные варианты системы классификации могут основываться на параллельных системах понятий.
Интернационализация - это сложный процесс, который в идеальном случае должен осуществляться однократно. Он обеспечивает определенные преимущества в работе, если известны региональные особенности целевой группы пользователей.
9.2 Сопровождение параллельных понятийных систем
При проведении интернационализации понятийной системы необходимо четко осознавать, что для последующих шагов локализации может потребоваться работа с концептами, которые не полностью эквивалентны в рассматриваемых языках, а только в какой-то части пересекаются. Следовательно, процедура интернационализации должна включать в себя операции параллельного сопровождения множественных понятийных систем, которые могут соответствовать друг другу частично или полностью.
Если все понятия на двух или более языках эквивалентны, т.е. эквивалентны соответствующие понятия, выраженные на разных языках, то разноязычные понятийные системы считаются согласованными друг с другом. Понятийные системы могут объединяться, и тогда эквивалентные понятия размещаются в многоязычной понятийной системе в одной и той же позиции.
Однако очень часто понятия и понятийные системы, представленные на разных языках, отличаются друг от друга. Кроме того, понятия могут существовать в моноязычном сообществе или использoваться в разных языковых сообществах с небольшими отличиями. В первом случае необходимо при вводе нового понятия в понятийную систему предлагать для него подходящее обозначение в рассматриваемом языке. Во втором случае должна подробно характеризоваться степень эквивалентности понятий и определяться возможность использования выбранных терминов как эквивалентов друг друга.
Пример - См. в таблице 7 разные интерпретации английских слов "tree", "wood", "woods" и "forest" в разных европейских языках.
9.3 Руководящие указания по созданию интернационализированной системы классификации
Для создания многоязычных систем классификации на основе понятийных систем может быть реализована представленная ниже последовательность шагов, приведенная в перечислениях a)-f).
a) Определяются область применения, целевое назначение и целевая группа пользователей системы классификации.
b) Идентифицируются релевантные понятия обоих языков в рамках предполагаемой области применения создаваемой системы классификации.
Примечание 1 - Для уточнения понятий и обеспечения согласованности системы могут вводиться понятия, которые не порождают классы системы классификации.
c) На основе характеристик концептов создается понятийная система для каждого используемого языка, которая может быть представлена графически соответствующей концептуальной схемой.
d) Понятийные системы каждого языка сравниваются друг с другом с целью выявления упущенных или несогласованных понятий.
1) Если все понятия нужных языков эквивалентны и понятийные системы имеют одинаковую структуру, то становится возможным создание локализованных параллельных вариантов системы классификации.
2) Если понятия и понятийные системы различаются, то может быть рассмотрена возможность использования методов i) и ii) для создания параллельных вариантов системы классификации:
i) если какое-то понятие существует только в одном языке (назовем его языком A), то может быть принято решение о введении в другом языке некоторого заполнителя для будущего понятия вместе с примечанием, отражающим факт его появления по причине отсутствия прямого эквивалента в языке B; дополнительно должно быть дано примечание к классам, выводимым из таких заполнителей, для информирования пользователя о том, что понятия, стоящие за выведенными классами, имеются только в языке A;
ii) если понятия в нужных языках не являются полными эквивалентами, то должны быть подробно описаны различия между понятиями и может быть принято одно из возможных решений, I) или II):
I) если термины, обозначающие два понятия, могут использоваться взамен друг друга, то в обоих языках могут быть созданы соответствующие классы на основе предложенных переводов; при этом должно быть дано примечание, уведомляющее пользователя о том, что исходные понятия не являются полными эквивалентами;
II) если характеристики какого-то понятия, используемого в предполагаемом языке B, отличаются от использования родственного понятия в языке A настолько, что термины, обозначающие понятие, не могут использоваться как эквиваленты, то может быть предложен обратный перевод с языка B на язык A; на основе результатов процесса обратного перевода могут быть идентифицированы новые дополнительные понятия, подлежащие вводу в понятийную систему языка A; при этом должно быть дано примечание к классам, выводимым из таких понятий, для информирования пользователя о том, что понятия, стоящие за выведенными классами, имеются только в языке B.
e) Создается систематизированный перечень понятий на основе двух концептуальных схем, представленных на двух языках.
Примечание 2 - Эти систематизированные перечни могут базироваться на системах обозначений для концептуальных схем.
f) Систематизированный перечень понятий настраивается на конкретные нужды системы классификации:
1) удаляются понятия, которые излишне детализированы для предполагаемой системы классификации.
2) может возникнуть необходимость в удалении понятий, которые были включены в перечень временно - для уточнения целей или соблюдения каких-то формальных правил. Например, в теории терминологии родственные понятия разграничиваются друг от друга, по крайней мере, одной отличительной характеристикой. Если в понятийную систему был введен заполнитель с целью учета этого правила, но в системе классификации пока нет объектов, обладающих указанной единственной отличительной характеристикой, то для такого понятия нет нужды создавать соответствующий класс в системе классификации.
3) удаляются дублирующие понятия, которые содержатся в систематизированном перечне. Такие дубликаты могут появляться при наличии полииерархии по причине того, что какое-то понятие может оказаться подчиняющим концептом для нескольких подчиненных понятий.
4) понятия, содержащиеся в систематизированном перечне, отображаются на классы системы классификации.
10 Аспекты локализации
10.1 Общие положения
Системы классификации часто разрабатываются с ориентацией на определенную национальную среду с учетом местных технических, социальных или культурных особенностей и специфики конкретного региона. Такие регионально-ориентированные системы классификации зачастую трудно применить и использовать за пределами целевого региона. Вследствие культурологических и лингвистических различий регионов смысловое значение классов, созданных для одного из них, может неправильно интерпретироваться в других регионах, приводя к необходимости перепроектирования отдельных частей регионально-ориентированной системы классификации в случае ее локализации применительно к другим специфическим условиям.
10.2 Ведущий регион
Подавляющее большинство видов деятельности и проектов осуществляется с учетом конкретного социокультурного фона, который оказывает большое влияние на способ формирования концепций и структурирования знаний. Для правильной интерпретации определений и толкований всегда необходимо принимать во внимание культурную среду, в которой формируются соответствующие концепты или классы.
Ведущий регион - это географическая и культурная среда, в которой понятие формируется и должным образом понимается. Для решения проблем интерпретации понятий ведущий регион должен служить эталонной средой.
Когда многоязычные системы классификации локализуются применительно к другим регионам, важно знать, какой вариант языка должен служить основой для процесса перевода, т.е. какой язык является первоисточником, породившим впоследствии многоязычную систему. Это нужно для получения уверенности в том, что в качестве исходного языка для дальнейшего перевода не будет взят целевой язык (язык B), на который был сделан перевод с оригинала. Такая ошибка может иногда привести к плохим результатам перевода.
10.3 Региональные имена классов, свойств или значений
Если понятия за пределами системы классификации эквивалентны в разных регионах, то имена классов, свойств и значений могут представляться их переводными эквивалентами в языке каждого региона.
Пример - Многоязычное определение:
английское 10000276 Wine - Still "Includes any products that can be described/observed as an alcoholic beverage made by the fermentation of the juice of the grapes, usually having an alcoholic content by volume of 14% or less";
французское 10000276 Vin - Tranquille "Comprend tous les produits qui peuvent / comme des boissons partir de la fermentation de jus de raisin, ayant generalement une teneur en alcool maximale de 14%";
русское 10000276 вино - спокойное "Включает в себя все продукты, которые могут описываться или рассматриваться как алкогольный напиток, изготовленный путем ферментации сока винограда, обычно с содержанием алкоголя не более 14%".
10.4 Региональная специфика объектов, классов, свойств и областей значений
Во многих регионах могут существовать объекты, которые не были приняты во внимание при построении системы классификации для ведущего региона. Во многих случаях локализации определения рассматриваемых классов нуждаются в расширении посредством добавления примечаний, в которых поясняется, что опущенные объекты включены. Если такой метод неосуществим, то должны быть введены новые классы.
Пример 1 - Может оказаться, что в североамериканскую систему классификации автомобилей не включен класс микроавтомобилей, таких как "Smаrt". При локализации этой системы для использования в Европе может потребоваться добавить в классификацию новые классы или расширить уже существующие.
_______________
Данный продукт имеется в широкой продаже. Информация о нем приведена здесь исключительно для удобства пользователей настоящего документа и не может восприниматься как одобрение этого продукта со стороны ИСО.
Система классификации должна допускать добавление в нее новых классов без изменения существующих классов или иерархических структур классов.
Даже если нужные для определенных целевых регионов классы уже имеются в системе классификации, могут все же потребоваться дополнительные свойства для их описания тем способом, который понятен и важен именно для этих регионов.
Система классификации должна допускать добавление в нее новых свойств для описания новых классов или расширения существующих. В системе классификации, разработанной для конкретного региона, могут быть нужны не все свойства, определенные применительно к ведущему региону или к иным регионам. Например, в ней может использоваться лишь некоторое подмножество свойств, применяемых в рамках другой соответствующей системы классификации.
Система обозначений классов или свойств должна проектироваться таким образом, чтобы в ней оставалось достаточно места для добавления новых классов или свойств без нарушения правил и принципов их компоновки.
Если даже существующие классы и их свойства применимы в региональном контексте, могут потребоваться иные диапазоны значений, единицы измерения или другие оценочные шкалы.
В системе классификации ведущего региона или какого-либо другого централизованного репозитория должны быть доступны разные величины, требуемые для описания свойств классов в различных локализованных вариантах системы классификации. Это необходимо для предотвращения несоответствий - таких как появление разных имен для одной и той же измеряемой величины.
Пример 2 - Примерами могут служить температура в градусах Цельсия или градусах Фаренгейта, длина в метрах или футах, различные типоразмеры для металлургической продукции, всевозможные нормативы и стандарты.
10.5 Различные классификационные критерии
В дополнение к новым классам, новым свойствам и новым областям значений локализация системы классификации может также привести к использованию новых и разнообразных критериев формирования классов. Хотя объекты, подлежащие классификации, могут быть полностью идентичными, для региона может оказаться специфичным иной подход к их группированию в классы.
Пример 1 - В английском языке термин "screw" (винт) обозначает крепежное приспособление с наружной резьбой, вставляемое в отверстия сборных конструкций и ввинчиваемое в предварительно нарезанную внутреннюю резьбу, либо способное формировать ее заново, и подвергаемое затяжке или высвобождению путем вращения его головки. Термин "bolt" (болт) обозначает крепежное приспособление с наружной резьбой, вставляемое в отверстия сборных конструкций, подлежащих стягиванию или высвобождению посредством навинчивания или отвинчивания гайки. Немецкий термин "Schraube" обозначает любые типы крепежных деталей с резьбой и охватывает как винты, так и болты.
Пример 2 - Автомобили для перевозки пассажиров классифицируются во многих странах по-разному, хотя сами объекты классификации могут быть абсолютно одинаковыми. Они могут классифицироваться по размерам, по цене или по какому-либо иному критерию. Классификация по размерам может зависеть от принятых в стране типовых габаритов машин: например, в США к автомобилям средних размеров могут быть отнесены машины длиной более 4,80 м, а в Европе - это обычно машины длиной менее 4,70 м.
В тех случаях, когда используемые понятия берутся из нескольких источников, могут оказаться полезными идентификаторы альтернативных концептов, указывающие на множественные источники понятия.
Пример 3 - Системы единиц измерения обычно поддерживаются многими органами стандартизации: например, Американским национальным институтом стандартов (ANSI), Международной электротехнической комиссией (IEC), Международной организацией по стандартизации (ISO), Системой стандартных продуктов и услуг Организации Объединенных Наций UNSPSC (United Nations Standard Products and Services Code).
10.6 Различия в содержании понятий
В зависимости от языка и региональных культурологических соглашений области применения понятий могут различаться. Такие различия могут влиять на четкость или корректность текстовых частей системы классификации, таких как определения, формулируемые с учетом региональной специфики. Как следствие, такие части могут нуждаться в переработке, которая может оказаться необходимой и применительно к отдельным частям системы классификации для отражения областей применения понятий в различных региональных условиях.
Пример - См. таблицу 7.
Таблица 7 - Культурологические аспекты значений слов
Английс- | Немецкий язык | Датский язык | Француз- | Итальянс- | Испанский язык | Русский язык |
Tree | Baum | Arbre | Albero | Дерево | ||
Wood | Holz | Bois | Legno | Дерево | ||
Madera | Древесина | |||||
Skov | Bosco | Bosque | Деревянная часть | |||
Дрова | ||||||
Woods | Wald | Лес | ||||
Forest | Foresta | Selva | Лес |
10.7 Фирменные товарные знаки
В текстовой части системы классификации могут присутствовать наименования компаний или товарных знаков. Такие наименования могут отличаться в зависимости от региона и потому подлежат локализации.
Необходимо избегать использования наименований компаний или товарных знаков в качестве имен классов или в качестве элементов определений. В случае их появления в примерах следует иметь в виду, что данные, ассоциируемые с такими именами, часто относятся к конкретному региону.
10.8 Прочие культурологические аспекты
10.8.1 Общие положения
Локализация - это нечто большее, чем простое отыскание терминов, эквивалентных текстовому содержанию на целевом языке B. Локализация может требовать также далеко идущих изменений в текстовом и графическом контенте системы классификации. Поэтому особое внимание следует обращать на такие элементы, как:
a) рисунки и числовые данные;
b) формулы;
c) валюты;
d) даты и календари;
e) написание чисел;
f) единицы измерения.
Применительно к программным приложениям приведенные ниже характеристики часто встраиваются в операционную систему и потому не требуют дополнительных операций от разработчиков системы классификации. Тем не менее, имеющиеся различия могут существенно влиять на представление и интерпретацию содержательной информации, вследствие чего следует уделять должное внимание:
- данным по форматированию и отображению информации;
- шрифтовому оформлению;
- типографским соглашениям;
- текстовым расширениям.
10.8.2 Визуальные элементы
Визуальные элементы, такие как рисунки или технические линейные чертежи, могут быть очень эффективными средствами иллюстрирования понятий. Однако для упрощения задач интернационализации и локализации требуется тщательный отбор контента во избежание неправильной интерпретации. Наличие культурологических различий делает особенно острой проблему разработки и реализации международной системы символических обозначений, поскольку то, что кажется значимым и естественным для одной группы пользователей, может быть неоднозначным, непонятным или не обязательным для другой.
Люди интерпретируют визуальные элементы субъективно, основываясь на собственном опыте и обычаях культурной среды. То, как люди собирают, упорядочивают и используют информацию, определяет и то, каким образом они учатся ее обрабатывать.
При разработке визуальных элементов информации, предназначенных для использования в глобальном контексте, должны применяться с особой осторожностью или избегать следующие типы контента:
- буквоподобные фигуры;
- элементы человеческого тела и язык тела;
- юмор, игра слов и сленг;
- этнические, расовые, политические и религиозные элементы содержания;
- гендерные элементы;
- названия животных;
- элементы сексуальных отношений и агрессивных действий;
- региональные особенности, такие как направление чтения, обозначения даты, времени и валют;
- метафоры, мифология и фольклор;
- элементы спортивной тематики или спортивной среды;
- элементы или персонажи из литературных произведений, кинофильмов или телепередач.
Следует избегать включения текста в визуальные элементы, поскольку при локализации текст подлежит переводу с учетом региональной специфики.
Примечание 1 - Наборы пиктограмм и символических обозначений представлены в таких международных стандартах ИСО и МЭК, как МЭК 60417-DB [17], ИСО 7000 [3] и ИСО/МЭК 11581 [8], которые помогают выражению контента с использованием средств и методов, принятых мировым сообществом.
Примечание 2 - Символические представления криволинейных форм или графиков трендов, рассчитанные на чтение слева направо (например, гистограммы и столбчатые диаграммы), могут неправильно интерпретироваться пользовательскими сообществами, в которых действует правило чтения справа налево. Поэтому необходимо использовать представление, нейтральное к направлению чтения, или давать раздельные представления для каждого направления.
Пример - Такие визуальные элементы, как графини либо гистограммы, отображающие тренды или математические функции, почти всегда читаются в строго определенном направлении, тогда как визуальные представления типа круговых диаграмм или моделей данных могут быть инвариантны к направлению чтения. Любые буквенные или численные представления текстовой или числовой информации всегда требуют определенного направления чтения.
10.8.3 Формулы
Математические формулы являются предельно точным представлением понятий математики. В классификации они часто используются для точного определения семантики классов или характеристик. Тем не менее, математическая нотация тоже подвержена культурологическим различиям, требует различных шрифтов, символов, направлений записи или других элементов региональной адаптации.
Пример 1 - Русскоязычная формула:
Пример: 2 - Франкоязычная формула:
Пример: 3 - Арабская формула:
10.8.4 Обозначения валют
Хотя для кодов валют существует международный стандарт ИСО 4217 [2], форматирование их обозначений все же имеет региональные различия, поскольку при форматироваии подлежат учету следующие особенности:
- написание символа;
- местоположение символического обозначения;
- отображение отрицательного значения;
- разделительные знаки.
Пример - В разных странах денежные единицы представляются по-разному:
а) в странах Европы евро представляется символом "€", а швейцарский франк - буквами "CHF";
b) символ валюты может располагаться перед численным значением или после него;
c) существуют разные варианты отображения отрицательных сумм:
1) в Соединенном Королевстве знак "минус" ставится перед символом валюты, за которым следует сумма,
2) в Дании знак "минус" ставится между символом валюты и указываемой суммой,
3) в Голландии знак "минус" ставится после указанной суммы.
10.8.5 Даты и календари
Хотя для форматов представления дат существует международный стандарт ИСО 8601 [4], форматирование дат все же неодинаково в разных странах мира. Всегда указывается число, месяц и год, но порядок их расположения и расположения разделительных знаков может различаться. Различия могут существовать даже между разными регионами одной и той же страны.
В дополнение к форматированию даты необходима еще и настройка на множество календарей. Несмотря на превалирующее использование григорианского (западного) календаря, в некоторых культурах используются и другие календари, например исламский календарь хиджры.
Пример - Полноформатное представление даты "Среда, 7 марта 2001 года" в трех разных регионах:
Таблица 8 - Региональные различия форматов даты
Регион | Полный формат даты |
Англия (американский вариант) | Wednesday, March 07, 2001 |
Испания (испанский вариант) | , 07 de marzo de 2001 |
Япония |
10.8.6 Числовые значения
Числовые значения структурируются в разных культурах по-разному. В процессе локализации должна приниматься во внимание соответствующая региональная специфика.
Пример 1 - Разделительный знак тысяч. В США таким знаком является запятая ",". В Германии в зависимости от длины числового значения разделительный знак тысяч или отсутствует, или в его роли выступает символ точки "." либо знак пробела. Таким образом, число "одна тысяча двадцать пять" может представляться в США как "1,025" а в Германии - как "1.025".
Пример 2 - Десятичный разделитель. В США таким знаком является точка ".", а в Германии - запятая ",". Таким образом, число "одна тысяча двадцать пять и семь десятых" представляется в США как "1,025.7", а в Германии - как "1.025,7".
Пример 3 - Отрицательные числа. Вместо отрицательного знака "-" впереди числа этот знак может появиться после него. Другие случаи обозначения отрицательного числа - это тире, круглые скобки или даже цветовое выделение (например, красный цвет). Отрицательное число "триста пятьдесят шесть" может отображаться следующими способами:
- -356
- 356-
- (356)
Пример 4 - Изменение начертания или полное соответствие. Цифры в разных региональных представлениях могут иметь разное начертание или вообще не иметь взаимно однозначного соответствия. Например, в японском языке количество символов цифр (обозначающих ненулевые числа, оканчивающиеся на "0") превышает количество арабских цифр. В представленном ниже ряду японских цифр последний символ соответствует числу 10:
Пример 5 - Группирование цифр. Количество цифр в отсчитываемых влево от десятичного разделителя группах, отделяемых запятой, тоже может меняться:
- США: 123,456,789
- язык хинди: 12,34,56,789
10.8.7 Единицы измерения
Во всем мире определение размеров предметов производится с помощью различных единиц измерения и измерительных шкал. Региональные условия или требования законодательства могут привести к необходимости использования единиц, отличающихся от применяемых в ведущей локали.
Пример - Использование различных систем единиц измерения:
- международная метрическая система мер (например, метры, литры, граммы);
- имперская (не метрическая) система мер (например, футы, дюймы, фунты).
11 Технологический процесс и вопросы администрирования
Контент любой системы классификации отражает состояние знаний или технического прогресса, достигнутое к моменту ее создания. Так как знания и технологии постоянно развиваются, контент системы классификации должен непрерывно совершенствоваться во избежание пробелов в знаниях и устаревания концепций. Для этого необходимо постоянно вносить текущие изменения, чтобы гарантировать соответствие системы классификации нуждам пользователей по всему миру.
Ответственность за сопровождение системы классификации и управление ею должна быть возложена на специально назначенную для этой цели организацию, которая должна наблюдать за процессом добавления и удалением понятий и классов системы и утверждать терминологию, используемую в соответствующих именах и описаниях.
Когда терминология и понятия из системы классификации используются в процессах хозяйственной деятельности предприятий и организаций, они часто играют стратегическую роль. Поэтому система классификации всегда должна полностью перекрывать соответствующую предметную область, сохраняя надлежащую стабильность, т.е. не должна подвергаться неожиданным резким изменениям.
Вносимые изменения должны тщательно документироваться с сохранением всей предыстории и информации административного характера, показывающей характер каждого изменения, его автора и времени, когда оно было внесено.
Кроме того, все содержимое системы классификации, однажды предоставленное для широкого использования, никогда не должно удаляться, чтобы пользователи имели возможность обращения также и к контенту более ранних версий; при этом информация, утратившая актуальность, должна помечаться как устаревшая.
Таким образом, должны выполняться следующие требования:
- В каждой системе классификации должен указываться адрес, по которому пользователи могут получить доступ к самой последней версии системы классификации и к ее содержимому.
Примечание 1 - Во многих случаях это веб-страница, с которой пользователь может загрузить нужную ему информацию.
- В системе классификации подлежит регистрации вся информация системы управления изменениями; на основе этой информации любой пользователь всегда может однозначно определить предысторию версий и пересмотров классификации, равно как и сведения о текущем состоянии процесса обработки данных, введенных в систему.
- никакие скрытые изменения недопустимы. Любое изменение данных должно регистрироваться.
- процесс запроса изменений и разрешения любых проблем подлежит документированию.
Примечание 2 - Изменения, вносимые в один класс, могут влиять на другие связанные с ним классы. Каким образом это происходит - зависит от стратегии, заложенной в правила, которые установлены организацией, осуществляющей сопровождение системы классификации.
- записи в локализованных версиях системы классификации должны нести информацию об их собственных изменениях отдельно от информации управления изменениями, касающейся записей в среде, ведущей локали. Локализованные экземпляры данных должны содержать ссылку на соответствующий экземпляр данных из ведущего региона - в целях сравнения и обеспечения надлежащего уровня достоверности информации.
- во избежание расхождений между исходной версией системы классификации и ее локализованными вариантами локализованная версия любого контента подлежит обновлению при каждом изменении соответствующего контента исходной версии. Однако из-за больших временных затрат на выполнение таких обновлений могут появляться короткие промежутки времени, когда локализованная и оригинальная версии не будут полностью синхронизированными. Такие периоды должны сводиться к минимуму.
- должен существовать и надлежащим образом поддерживаться архив, в котором пользователи смогут находить замененные версии системы классификации и нужную справочную информацию.
Примечание 3 - Руководящие указания, касающиеся учреждения и регистрации уполномоченных административных органов и процедур по созданию и ведению таких электронных репозиториев, как системы классификации и словари, представлены в приложении H "Директив ИСО/МЭК, часть 1:2012" [20], а также в международных стандартах ИСО 10007 [5] и ИСО 11179-6 [7].
Приложение A
(справочное)
Описательная информация существующих систем классификации
A.1 Общие положения
Настоящее приложение содержит примеры описательной информации (см. раздел 5.5) в рамках систем классификации.
_______________
Системы eCl@ss® и GS1® - это подходящие коммерческие информационные продукты, имеющиеся в продаже. Информация о них приведена здесь исключительно для удобства пользователей настоящего документа и не может восприниматься как их одобрение со стороны ИСО.
A.2 Система eCl@ss®
A.2.1 Общее представление
eCl@ss® - это иерархическая система группирования материалов, изделий и услуг в соответствии с некоторой логической структурой, детализированной до уровня конкретных свойств рассматриваемых продуктов, которые далее могут быть описаны с использованием свойств, удовлетворяющих требованиям стандартов.
Товары и услуги могут распределяться по четырехуровневой числовой структуре классов системы eCl@ss. Поисковые термины и синонимы обеспечивают комфортный поиск товаров и услуг в рамках классификации.
Система eCl@ss® версии 6.2 насчитывает в общей сложности 32832 класса, распределенных по следующим уровням:
Уровень 1: 26 Сегменты;
Уровень 2: 564 Основные группы;
Уровень 3: 4982 Группы;
Уровень 4: 27952 Подгруппы.
А.2.2 Область применения и целевое назначение
Центром внимания в системе eСl@ss® является эффективная поддержка всех процессов хозяйственной деятельности на протяжении всего жизненного цикла продукта. Система предоставляет полное описание продукта и схему классификации, включая иерархию классов для категоризации продукции и четкие многоязычные текстовые определения для классов. Подробное описание категоризированных товаров и услуг обеспечивается стандартными наборами характеристик.
А.2.3 Ведущий регион
Запросы на изменения требуется представлять на английском языке (в его американском варианте) и на соответствующем языке локализованного варианта - предпочтительно на немецком.
В запросах на немецком языке рекомендуется использовать новые правила орфографии.
А.2.4 Определение уровней иерархии и их назначения
Структура классов представляет рынки закупок, товары и услуги. Она образуется четырьмя уровнями иерархии, которые обозначаются восемью цифрами (по две на каждый уровень, например 21-01-02-03). Три первых уровня - сегменты, основные группы и обычные группы - представляют рынки закупок (см. рисунок A.1).
Рисунок A.1 - Структура системы eCl@ss
Четвертый уровень - подгруппы - содержит товары и услуги.
Ключевые слова и синонимы являются эффективным средством для быстрого отыскания нужных классов товаров.
На четвертом уровне могут однозначно описываться товары и услуги по их свойствам (например, по материалу, цвету, штриховому коду). Совокупность всех свойств подгруппы называется набором характеристик.
Свойство может иметь различные значения, которые образуют характеристику (например, свойство: "цвет", значение: "красный"). Совокупность всех значений свойства называется множеством значений. Множество значений открыто; это значит, что оно не должно быть полным.
Элементами структуры eCl@ss являются классы, ключевые слова, синонимы, наборы свойств, характеристики, множества значений и отдельные значения.
Все элементы структуры обладают конкретными атрибутами: например, предпочтительным именем, сокращенным именем и определением.
А.2.5 Прочие описательные требования
Лицензирование и авторское право
Общие правила использования, версия 2.0, по состоянию на 7 июня 2007 г. см. на
http://www.ecIassdownIoad.com/cataIog/conditions.php
Идентификатор владельца системы классификации
eCI@ss e.V. Postfach 10 19 42
50459
Konrad-Adenauer-Ufer 21
50668
Germany
электронная почта: info@ecIass.de
веб-сайт: http://www.ecIass.eu
- Контактные данные владельца системы классификации
Моника Бенке (Monika Benke) eCI@ss e.V.
Postfach 10 19 42
50459
Germany
- Адрес для доступа
http://www.ecIassdownIoad.com
- Сопровождение
http://www.ecIass-serviceportaI.com
А.3 Глобальная классификация товаров (GPC)
А.3.1 Общие положения
GPC представляет собой глобальную многосекторную систему классификации для упорядочения объектов по категориям, которая обеспечивает применительно к универсальному глобальному языку разбиение объектов классификации на 36 сегментов.
- GPC - это способ организации группирования внутренних и внешних данных в информационных системах.
- GPC - это предложенный международной некоммерческой ассоциацией GS1 долгосрочный нормативный документ и обязательная интегрированная методология классификации в глобальной сети синхронизации данных GDSN® (Global Data Synchronisation Network).
- Система GPC уже переведена на множество языков и продолжает охватывать новые языки.
- GPC - это основанная на правилах четырехъярусная система классификации для группирования товаров. Четыре яруса - это сегмент, семейство, класс и блок (с соответствующими атрибутами). Блок включает в себя международные коды маркировки и учета логистических единиц GTIN (Global Trade Item Numbers), объединенные в одну категорию для общего применения.
Пример структуры GPC показан на рисунке A.2.
Рисунок A.2 - Четырехъярусная иерархия классификации молока
Международный код маркировки и учета логистических единиц присваивается каждому отдельному блоку.
А.3.2 Использование атрибутов
При необходимости блок может далее характеризоваться с помощью соответствующих атрибутов, как показано на рисунке A.3.
Рисунок A.3 - Присваивание кода GTIN блоку
Рисунок A.4 - Атрибуты блока GPC
На уровне блоков определяются атрибуты для категорий и для пары значений.
Определение блока, представленного на рисунке: "Включает в себя все продукты, которые могут иметь вкус молока или описываться как сырое молоко, полученное от таких животных, как корова, коза и буйволица, а также растительное молоко, вырабатываемое из фруктов или овощей, такое как кокосовое и миндальное молоко, либо овощные протеины типа соевого молока. Сюда же относятся продукты, химический состав которых изменен с помощью ацидофильных бактерий ..."
GPC насчитывает 36 сегментов, классифицирующих широкий ассортимент продуктов, таких как изделия электронной промышленности, строительные материалы, предметы домашнего обихода и ходовые товары широкого потребления.
В рамках классификации GPC опубликовано свыше 3000 блоков групп товаров и больше 11000 атрибутов этих блоков, что обеспечивает мощное модульное средство комбинирования многих тысяч вариантов категорий товаров.
GPC является частью стандартов GS1® и согласуется с общими спецификациями GS1®.
- Адрес для доступа: http://www.gs1.org/gdsn/gpc
- Сопровождение:
Сопровождение системы GPC осуществляется в рамках глобального процесса управления стандартизацией GSMP GIobaI Standard Management Process), при котором все запросы и требования на разработку новых стандартов GS1® доступны для отслеживания пользователями и направляются в соответствующую группу управления разработкой стандартов (Standard Management Group).
Приложение В
(справочное)
Правила построения иерархических схем понятий и классов
Понятия - это умозрительные или логические представления реальной действительности. В этом смысле все понятия абстрактны и существуют только в воображении, однако они образуют основу мыслительной деятельности человека по классифицированию и познанию объектов умозрительного восприятия. Понятия, или концепты, создаются их характеристиками. "Мысленный образ" реальности классифицируется в соответствии с характеристиками, которые позволяют производить классификацию других объектов или концептов как тех же самых, сходных или отличных.
Построению хорошо структурированной иерархии понятий или классов может помочь следование рекомендациям, изложенным в перечислениях a)-f):
a) Определение корневого концепта иерархии понятий должно охватывать все ее смысловые значения и сохранять достоверность применительно ко всем объектам, которые могут характеризоваться с помощью этой понятийной системы.
b) Идентифицируются и вносятся в список все наиболее важные (общие) понятия, которые совместно образуют корневое понятие. Эти общие понятия размещаются на первом уровне ниже корневого концепта и должны отличаться друг от друга хотя бы одной характеристикой.
c) Повторяется шаг b) для каждого из понятий ниже корневого - для создания третьего уровня иерархии.
d) Повторяется шаг c) для создания последующих уровней со все большей конкретизацией понятий, пока в иерархию не будут добавлены предельно конкретизированные понятия.
e) Как только ключевые понятия идентифицированы и упорядочены, добавляются соответствующие отношения для описания связей между понятиями. Наиболее общие типы таких отношений - это родовые, партитивные и ассоциативные отношения.
f) Ищутся понятия, которые могут быть заимствованы из других предметных областей и модифицированы для выражения опущенных понятий. Таким образом сохраняются результаты разработки и достигается более высокая степень однородности понятийной системы.
По завершении создания понятийной системы на ее основе должна быть построена система классификации со всеми ее классами. Система классификации во многих случаях может быть непосредственно выведена из концептуальной системы посредством создания классов, которые напрямую соответствуют связанным с ними понятиям. Если от какого-то класса не требуется того же уровня конкретности, какой имеет соответствующее ему понятие, этот класс может отображаться на несколько понятий. Если требуется более конкретизированный класс по сравнению с уровнем, доступным в понятийной системе, она подлежит расширению для восприятия связанных понятий.
В подавляющем большинстве случаев система классификации предназначается для непосредственного использования людьми. По соображениям удобства эксплуатации такая система по уровню сложности не должна превышать эксплуатационных возможностей целевого пользовательского сообщества по ее поддержке; в частности, при проектировании системы классификации должны приниматься во внимание ее эргономические аспекты. Для упрощения пользовательских операций совершенно необходимо ограничить число иерархических уровней и число подклассов на класс.
- Должно быть четко определено, в какой ветви и на каком уровне иерархии можно найти определенный класс.
- Понятия и классы должны быть взаимоисключающими и не должны повторяться.
- Число ветвей на любом уровне должно быть ограниченным.
- Число уровней иерархии не должно быть чрезмерно большим.
- Число понятий, присоединяемых к любому классу, должно быть небольшим.
В системах классификации, которые предназначены для использования автоматическими процессами (например, прикладными программами, машинами поиска и т.п.), могут быть реализованы самые разнообразные принципы классификации. Эти системы классификации могут быть более сложными, чем системы, предназначенные для непосредственного использования людьми.
Приложение ДА
(справочное)
Сведения о соответствии ссылочных международных стандартов национальным и межгосударственным стандартам
Таблица ДА.1
Обозначение ссылочного международного стандарта | Степень соответствия | Обозначение и наименование соответствующего межгосударственного и национального стандарта |
ISO 1087-1:2000 | - | * |
ISO/IEC 6523 | - | * |
ISO/IEC 15418 | IDT | ГОСТ ISO/IEC 15418-2014 "Информационные технологии. Технологии автоматической идентификации и сбора данных. Идентификаторы применения GS1 и идентификаторы данных ASC MH 10 и их ведение" |
ISO/IEC 15459-6 | IDT | ГОСТ ISO/IEC 15459-6-2016 "Информационные технологии. Технологии автоматической идентификации и сбора данных. Идентификация уникальная. Часть 6. Группы" |
ISO/TS 29002-5 | IDT | ГОСТ Р 56213.5-2014/ISO/TS 29002-5:2009 "Системы промышленной автоматизации и интеграция. Обмен данными характеристик. Часть 5. Схема идентификации" |
* Соответствующий национальный стандарт отсутствует. До его принятия рекомендуется использовать перевод на русский язык данного международного стандарта. Примечание - В настоящей таблице использовано следующее условное обозначение степени соответствия стандартов: - IDT - идентичные стандарты. |
Библиография
[1] | ISO 704 | Terminology work - Principles and methods (Терминологическая работа. Принципы и методы) |
[2] | ISO 4217 | Codes for the representation of currencies and funds (Коды для представления валют и фондов) |
[3] | ISO 7000 | Graphical symbols for use on equipment - Registered symbols (Графические символы, наносимые на оборудование. Зарегистрированные символы) |
[4] | ISO 8601 | Data elements and interchange formats - Information interchange - Representation of dates and times (Элементы данных и форматы для обмена информацией. Обмен информацией. Представление дат и времени) |
________________ Заменен на ISO 8601-1:2019, ISO 8601-2:2019. | ||
[5] | ISO 10007:2003 | Quality management systems - Guidelines for configuration management (Системы управления качеством. Руководящие указания по управлению конфигурацией) |
________________ Заменен на ISO 10007:2017. | ||
[6] | ISO/IEC TR 11017 | Information technology - Framework for internationalization (Информационные технологии. Основа интернационализации) |
[7] | ISO/IEC 11179 (все части) | Information technology - Metadata registries (MDR) [Информационные технологии. Реестры метаданных (MDR)] |
[8] | ISO/IEC 11581 (все части) | Information technology - User system interface and symbols - Icon symbols and functions (Информационные технологии. Системные интерфейсы пользователя и символы. Символы и функции пиктограмм) |
[9] | ISO 13584 (все части) | Industrial automation systems and integration - Parts library (Системы промышленной автоматизации и интеграция. Библиотека данных на детали) |
[10] | ISO 15031-2 | Road vehicles - Communication between vehicle and external equipment for emissions-related diagnostics - Part 2: Guidance on terms, definitions, abbreviations and acronyms (Транспорт дорожный. Связь между транспортным средством и внешним оборудованием для диагностики выбросов. Часть 2. Руководство по терминам, определениям, сокращениям и акронимам) |
[11] | ISO/IEC 15420 | Information technology - Automatic identification and data capture techniques - EAN/UPC bar code symbology specification (Информационные технологии. Методы автоматической идентификации и сбора данных. Спецификация символики штрихкода EAN/UPC) |
[12] | ISO/TR 19358 | Ergonomics - Construction and application of tests for speech technology (Эргономика. Разработка и применение методов испытаний речевых технологий) |
[13] | ISO/IEC 19501 | Information technology - Open Distributed Processing - Unified Modeling Language (UML) Version 1.4.2 [Информационные технологии. Открытая распределенная обработка. Унифицированный язык моделирования (UML). Версия 1.4.2] |
[14] | ISO/TR 22134 | Practical guidelines for socioterminology (Практическое руководство по социотерминологии) |
________________ Отменен. | ||
[15] | ISO 22745 (все части) | Industrial automation systems and integration - Open technical dictionaries and their application to master data (Промышленные автоматизированные системы и интеграция. Открытые технические словари и их применение к основным данным) |
[16] | ISO 25964-2:2013 | Information and documentation - Thesauri and interoperability with other vocabularies - Part 2: Interoperability with other vocabularies (Информация и документация. Тезаурусы и взаимосвязь с другими словарями. Часть 2. Взаимосвязь с другими словарями) |
[17] | IEC 60417-DB | Graphical symbols for use on equipment - 12-month subscription to online database comprising all parts of IEC 60417 (Графические обозначения,наносимые на оборудование. 12-месячная подписка на интерактивнуюбазу данных, включающую все графические обозначения, опубликованные в IEC 60417) |
[18] | IEC 61360 (all parts) | Standard data element types with associated classification scheme - Part 1: Definitions - Principles and methods (Стандартные типы элементов данных с соответствующей схемой классификации для электрических компонентов) |
[19] | ISO/IEC Guide 77:2008 (all parts) | Guide for specification of product properties and classes (Все части. Руководство по описанию свойств и классов продукции) |
[20] | ISO/IEC Directives, Part 1:2012 | Procedures for the technical work (Директивы ISO/IEC, Часть 1:2012, Процедуры технической работы) |
[21] | CWA 15045:2004 | Multilingual catalogue strategies for eCommerce and eBusiness |
[22] | Общие спецификации GS1 (по состоянию на 2013-01-11); спецификации доступны по адресу: http://www.gs1.org | |
[23] | eCI@ss: (по состоянию на 2013-01-11); адрес доступа: http://www.eclass.eu | |
[24] | GNOLI с.UDC philosophy revision report 1. UDC Consortium. Gruppo di lavoro Italia, 2009 (по состоянию на 2013-01-11); адрес доступа: http://italia.udcc.org/report1.html | |
[25] | DEPALMA D.A., SARGENT В.В., BENINATTO R.S. Can't read, won't buy: Why language matters on global websites. Lowell, MA: Common Sense Advisory, 2006 (по состоянию на 2013-01-11); адрес доступа: http:// www.commonsenseadvisory.com/Portals/_default/Knowledgebase/Articlelmages/060926_R_glo bal_consumer_ Preview.pdf | |
[26] | BATLEY S. Classification in theory and practice. Oxford: Chandos, 2005, 181 p. | |
[27] | GAUS W. Dokumentations- und Ordnungslehre: Theorie und Praxis des Information-Retrieval (Основы документирования и классификации. Теория и практика информационного поиска). Berlin: Springer, Fifth Edition, 2005, 479 p. | |
[28] | HUNTER E.J. Classification made simple: An introduction to knowledge organisation and information retrieval. Farnham: Ashgate, Third Edition, 2009, 163 p. | |
[29] | MAI J.-E. The future of general classification. Philadelphia, PA: Haworth Press, 2003 |
УДК 638:562.014:006.354 | ОКС 01.020, |
Ключевые слова: ассоциативная связь, атрибут, характеристика, класс, классификация, понятие, понятийная система, расширение, фасет, особенность, родовое отношение, локаль |
Электронный текст документа
и сверен по:
, 2020