Проблемы и ошибки        22.06.2019   

Системы кодирования. Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков

  • Классификация и ее виды. Системы кодирования информации

  • Классификацию информации, циркулирующей в организации

  • КЛАССИФИКАЦИЯ


Классификация

  • Классификация - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком

  • Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств.

  • Классификация объектов - то процедура группировки на качественном уровне, направленная на выделение однородных свойств.

  • Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.


Классификация

  • Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.

  • При любой классификации необходимо соблюдать следующие требования:

  • полнота охвата объектов рассматриваемой области;

  • однозначность реквизитов;

  • возможность включения новых объектов.

  • Классификатор - систематизированный свод наименований и кодов классификационных группировок.

  • При классификации широко используются понятия классификационный признак (основание деления) и значение классификационного признака, которые позволяют установить сходство или различие объектов.


  • Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.


Иерархическая система классификации

  • Иерархическая система классификации строится следующим образом:

  • исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;

  • каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;

  • каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень и т.д.

  • Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.


Иерархическая система классификации

  • Достоинства иерархической системы классификации:

  • простота построения;

  • использование независимых классификационных признаков в различных ветвях иерархической структуры. Недостатки иерархической системы классификации;

  • жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;

  • невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.


  • Поставлена задача - создать иерархическую систему классификации для информационного объекта "Факультет", которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин - наличие детей.


Пример иерархической системы классификации

  • Полученная система классификации будет иметь следующие уровни:

  • 0-й уровень. Информационный объект "Факультет";

  • 1-й уровень. Выбирается классификационный признак - название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах;

  • 2-й уровень. Выбирается классификационный признак - возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов;

  • 3-й уровень. Выбирается классификационный признак - пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы - мужчин и женщин;

  • 4-й уровень. Выбирается классификационный признак - наличие детей у женщин: есть, нет.


Пример иерархической системы классификации

  • Созданная иерархическая система классификации имеет глубину классификации, равную четырем


  • Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта


Фасетная система классификации

  • Признаки классификации называются фасетами (facet - рамка). Каждый фасет (Фi ) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке хотя предпочтительнее их упорядочение.


Фасетная система классификации

  • Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты.

  • Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

  • Ks=(Ф1, Ф2,..., Фi,..., Фn),

  • где Фi - i-й фасет;

  • n - количество фасетов.

  • При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись.

  • Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.


Фасетная система классификации

  • Достоинства фасетной системы классификации:

  • возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;

  • возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

  • Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.


  • Используя туже информацию, что и для примера с иерархической классификацией разработаем фасетную систему классификации.

  • Сгруппируем и представим в виде таблицы все классификационные признаки по фасетам:

    • фасет название факультета с пятью названиями факультетов;
    • фасет возраст с тремя возрастными группами;
    • фасет пол с двумя градациями;
    • фасет дети с двумя градациями.

Пример фасетной системы классификации

  • Структурную формулу любого класса можно представить в виде:

    • Ks= (Факультет, Возраст, Пол, Дети)
  • Присваивая конкретные значения каждому фасету, получим следующие классы:

    • К1= (Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети);
    • K2= (Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет);
    • К3= (Математический факультет, возраст до 20 лет, женщина, детей нет) и т.д.

  • Пример фасетной системы классификации для информационного объекта "Факультет"


  • Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов.

  • Особенно широко она используется в библиотечной системе поиска.


Дескрипторная система классификации

  • Суть дескрипторного метода классификации заключается в следующем:

    • отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;
    • выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;
    • создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

  • В качестве объекта классификации рассматривается успеваемость студентов.

    • Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета.
    • Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов.

Пример дескрипторной системы классификации

  • В качестве предметной области выбирается учебная деятельность в высшем учебном заведении.

    • Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие, занятие и т.д.
    • Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся, преподаватель, учитель, педагог, факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

Дескрипторная система классификации

  • Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

    • синонимические указывающие некоторую совокупность ключевых слов как синонимы;
    • родо-видовые , отражающие включение некоторого класса объектов в более представительный класс;
    • ассоциативные , соединяющие дескрипторы, обладающие общими свойствами.
  • Пример

  • Синонимическая связь: студент-учащийся-обучаемый.

  • Родо-видовая связь: университет-факультет-кафедра.

  • Ассоциативная связь: студент-экзамен-профессор-аудитория.


  • КОДИРОВАНИЕ


Система кодирования

  • Система кодирования - совокупность правил кодового обозначения объектов.

  • Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

  • Код строится на базе алфавита, состоящего из букв, цифр и других символов.

  • Код характеризуется:

    • длиной - число позиций в коде;
    • структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака

Система кодирования

  • Процедура присвоения объекту кодового обозначения называется кодированием .

  • Можно выделить две группы методов, используемых в системе кодирования, которые образуют:

    • классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
    • регистрационную систему кодирования, не требующую предварительной классификации объектов.

Система кодирования

  • Система кодирования, использующая разные методы


Классификационное кодирование. Последовательное кодировани.

  • Последовательное кодирование используется для иерархической классификационной структуры.

  • Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры

  • Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.


  • Проведем кодирование информации, классифицированной с помощью иерархической схемы.

  • Количество кодовых группировок будет определяться глубиной классификации и равно 4,

  • Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы.

  • Для большей наглядности выберем десятичную систему счисления -10 арабских цифр.

  • Анализ схемы классификации показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо.


Классификационное кодирование. Пример последовательного кодирования

    • 1-й (старший) разряд выделен для классификационного признака "название факультета" и имеет следующие значения: 1 - коммерческий; 2 - информационные системы; 3 - для следующего названия факультета и т.д.;
    • 2-й разряд выделен для классификационного признака "возраст" и имеет следующие значения: 1 - до 20 лет; 2 - от 20 до 30 лет; 3 - свыше 30 лет;
    • 3-й разряд выделен для классификационного признака "пол" и имеет следующие значения: 1 - мужчины; 2 - женщины;
    • 4-й разряд выделен для классификационного признака "наличие детей у женщин" и имеет следующие значения; 1 - есть дети; 2 - нет детей, 0 - для мужчин, так как подобной информации не требуется.

Классификационное кодирование. Пример последовательного кодирования

  • Принятая система кодирования позволяет легко расшифровать любой код группировки, например:

    • 1310 - студенты коммерческого факультета, свыше 30 лет мужчины;
    • 2221 - студенты факультета информационных систем, от 20 до 30 лет, женщины имеющие детей.

Классификационное кодирование. Параллельное кодирование

  • Параллельное кодирование используется для фасетной системы классификации.

  • Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода.

  • Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.


  • Проведем кодирование информации, классифицированной с помощью фасетной схемы.

  • Количество кодовых группировок определяется количеством фасетов и равно 4.

  • Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4.

  • В отличие от последовательного кодирования для иерархической системы классификации в данном метоле не имеет значения порядок кодировки фасетов.


Классификационное кодирование. Пример параллельного кодирования

  • В общем виде код можно записать как ХХХХ, где Х - значение десятичного разряда.

  • Рассмотрим структуру кода, начиная со старшего разряда:

    • 1-й (старший) разряд выделен для фасета "кол" и имеет следующие значения: 1 - мужчины; 2 - женщины;
    • 2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значения: 1 - есть дети; 2 - нет детей; 0 - для мужчин, так как подобной информации не требуется;
    • 3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 - до 20 лет; 2 - от 20 до 30 лет; 3 - свыше 30 лет;
    • 4-й разряд выделен для фасета "название факультета" и имеет следующие значения 1 - радиотехнический, 2 - машиностроительный, 3 - коммерческий; 4 - информационные системы; 5 - математический и т.д.

Классификационное кодирование. Пример параллельного кодирования

  • Принятая система кодирования позволяет легко расшифровать любой кол группировки, например:

    • 2135 - женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;
    • 1021 - мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.

Регистрационное кодирование

    Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

    Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.



Классификация информации по разным признакам

  • Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям.

  • Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам.

  • Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.


Классификация информации по разным признакам

  • Классификация информации, циркулирующей в организации


Классификация информации по месту возникновения

  • Входная информация - это информация, поступающая в фирму или ее подразделения.

  • Выходная информация - это информация, поступающая из фирмы в другую фирму, организацию (подразделение).

  • Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.

  • Внутренняя информация возникает внутри объекта, внешняя информация - за пределами объекта.


Классификация информации по стадии обработки

  • Первичная информация - это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.

  • Вторичная информация - это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.

  • Промежуточная информация используется в качестве исходных данных для последующих расчетов.

  • Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.


Классификация информации по способу отображения

  • Текстовая информация - это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).

  • Графическая информация - это различного рода графики, диаграммы, схемы, рисунки и т.д.


  • Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.

  • Постоянная (условно-постоянная) информация - это неизменная и многократно используемая в течение длительного периода времени информация.


Классификация информации по стабильности

  • Постоянная информация может:

  • постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т.п.;

  • постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;

  • постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.


Классификация информации по функции управления

  • По функциям управления обычно классифицируют экономическую информацию.

  • Плановая информация - информация о параметрах объекта управления на будущий период.

  • Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко

  • Учетная информация - это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр.


  • Оперативная (текущая) информация - это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности.


Для полной формализации экономической информации недо­статочно простой классификации, поэтому проводят следующую процедуру – кодирование. Кодирование это процесс присвое­ния условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования это совокупность правил обозначения объектов и группировок с использованием кодов. Код – это условное обозна­чение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определен­ном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный .

Код характеризуется следующими параметрами:

· длиной (L );

· основанием кодирования (А );

· структурой кода, под которой понимают распределение зна­ков по признакам и объектам классификации;

· степенью информативности (I ) , рассчитываемой как частное от деления общего количества признаков (R ) на длину кода (L ):

I = R/L;

· коэффициентом избыточности (К изб ), который определяется как отношение максимального количества объектов (Q max ) к фактическому количеству объектов (Q факт ):

Все системы кодирования можно сгруппировать в два под­множества (рис. 2.13): регистрационные и классификационные системы кодирования.

Особенностью регистрационных систем кодирования являет­ся их независимость от применяемых систем классификации. Ре­гистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объек­та и его кода в течение длительного периода времени и защищен­ности кода от помех и ошибок.

Регистрационные коды состоят из двух частей: информаци­онной и контрольной, предназначенной для защиты передавае­мой информации от ошибок. Контрольная часть может рассчи­тываться по различным алгоритмам, в частности, наиболее упот­ребляемыми являются следующие формулы их расчета:

;

где – модуль (простое число, делящееся на единицу и на само себя); информационные разряды, i – номер разряда; – вес информационного разряда.

К регистрационным системам относятся порядковая и серий­ная системы кодирования.

Порядковая система это наиболее простая по своему пост­роению система кодирования, суть использования которой зак­лючается в последовательном присвоении каждому объекту кодируемого множества Мо номера его порядка, т.е. в присвоении цифр натурального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предва­рительной группировки объектов, например, по алфавиту. Как правило, порядковую систему применяют для кодирова­ния малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.

Серийная (серийно-порядковая) система кодирования отлича­ется от порядковой тем, что номенклатура кодируемых объектов (М ) предварительно должна быть разбита на группировки по од­ному признаку, и каждой группировке должна быть отведена се­рия кодовых обозначений, в пределах которой каждому элемен­ту присваивается свой код по порядку.


Серия обозначений для каждой группировки определяется таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.

Классификационные коды используют для отражения классифи­кационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на ЭВМ Отсюда вытекают требования: однозначно­сти отображения классификационных взаимосвязей объектов и их группировок и обеспечения максимальной простоты программи­рования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.

Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе классификации, в результате использова­ния которой коды нижестоящих группировок образуются путем добавления кодов к кодам вышестоящих группировок.

Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы класси­фикации и коды группировок по фасетам формируются незави­симо друг от друга.

Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной системы ко­дирования.

Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, ис­пользуемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе ко­дирования используется так называемое «зависимое» кодирова­ние. Это значит, что классификационные группировки по млад­шим признакам кодируются в зависимости от кода группировки, образованной по старшему признаку. Запас свободных позиций определяется структурой кода.

Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой . Конкретное значение признака, характеризующего объект, определяется позицией и зна­чением определенного числа в структуре кода. Длина кода зави­сит от числа ступеней классификации, от числа классификацион­ных группировок на каждой ступени и от основания кодирования.

Комбинированная система кодирования, обладая всеми пре­имуществами разрядного кода, применяется для кодирования больших номенклатур (перечней) объектов, которые характери­зуются многими соподчиненными или независимыми признака­ми. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.

Код повторения (мнемокод) это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки ин­формации при использовании какой-либо системы.

Для полной формализации экономической информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование. Кодирование - это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов. Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код храктеризуется следующими параметрами:

Длиной (L);

Основанием кодирования (A);

Структурой кода, под которой понимают распределение знаков по
признакам и объектам классификации;

Степенью информативности (I) , рассчитываемой как частное от
деления общего количества признаков(R) к длине кода (L):

I = R/L;

Коэффициентом избыточности (К из б), который определяется как
отношение максимального количества объектов (Qмах) к фактическому
количеству объектов(Qфакт):

Все системы кодирования можно сгруппировать в два подмножества (рис. 4.4): регистрационных и классификационных систем кодирования.

Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации. Регистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объекта и его кода в течение длительного периода времени и защищённости кода от помех и ошибок.

Рис 4.4. Схема классификации систем кодирования Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок. Контрольная часть может рассчитываться по различным алгоритмам, в частности наиболее употребляемыми являются следующие формулы их расчета:

K = M-\ZX { *BJM\,

где M- модуль (простое число, делящееся на единицу и на само себя);

Xi - информационные разряды, i - номер разряда;

Bi - вес информационного разряда.

К регистрационным системам относятся порядковая и серийная системы кодирования.

Порядковая система - это наиболее простая по своему построению система кодирования, суть использования которой заключается в последовательном присвоении каждому объекту кодируемого множества М о номера его порядка, т.е. в присвоении цифр натурального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предварительной группировки объектов, например, по алфавиту.

Как правило, порядковую систему применяют для кодирования малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.

Серийная (серийно-порядковая) система кодирования отличается от порядковой тем, что номенклатура кодируемых объектов М о предварительно должна быть разбита на группировки по одному признаку и каждой группировке должна быть отводена серия кодовых обозначений, в пределах которой каждому элементу присваивается свой код по порядку. Серия обозначений для каждой группировки определяются таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.

Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на ЭВМ, отсюда вытекают требования: однозначности отображения классификационных взаимосвязей объектов и их группировок и обеспечение максимальной простоты программирования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.

Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе классификации, в результате использования которой коды нижестоящих группировок образуются путём добавления кодов к кодам вышестоящих группировок.

Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы классификации, и коды группировок по фасетам формируются независимо друг от друга.

Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной систем кодирования.

Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, используемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе кодирования имеет место так называемое "зависимое" кодирование. Это значит, что классификационные группировки по младшим признакам кодируются в зависимости от кода группировки, образованной по

старшему признаку. Запас свободных позиций определяется структурой кода.

Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой. Конкретное значение признака, характеризующего объект, определяется позицией и значением определенного числа в структуре кода. Длина кода зависит от числа ступеней классификации, от числа классификационных группировок на каждой ступени и от основания кодирования.

Комбинированная система кодирования, обладая всеми преимуществами разрядного кода, применяется для кодирования больших номенклатур (перечней) объектов, которые характеризуются многими соподчиненными или независимыми признаками. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.

Код повторения (мнемокод) - это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки информации при использовании какой-либо системы.

3. Состав и содержание операций проектирования

Классификаторов

Все классификаторы, разрабатываемые и используемые в ЭИС, имеют эталонную и рабочую формы. Эталонная форма классификатора - это официальное издание классификатора на бумажном носителе, удобное для осуществления его ведения. Рабочая форма классификатора - это весь классификатор или его раздел, занесённый на машинный носитель и удобный для обработки информации.

Весь процесс разработки системы классификаторов для ЭИС можно

разбить на четыре этапа (на рис. 4.5 приведена блок-схема процесса

разработки классификатора).

На первом этапе "Разработка ТЗ на проектирование" выполняются две работы. Первая из них связана с определением состава, назначения и сферы действия классификаторов, используемых в системе. Перечень классификаторов определяется на основе анализа

реквизитного состава первичных и результатных документов и выделения всей совокупности реквизитов-признаков.

Далее определяют назначение классификаторов. Каждый классификатор может быть предназначен для однозначной идентификации объекта, передачи информации на расстояние по каналам связи или для поиска и логической обработки первичной информации с целью получения и выдачи результатной информации.

По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.

Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между организациями разных стран мирового сообщества. СМЭС представляет собой множество стандартных решений по классификационным группировкам и кодированию специальной и экономической информации и формированию источников этой информации. В состав СМЭС входят классификации Организации Объединенных наций (ООН) и ее специализированных образований, в том числе:

Международная стандартная отраслевая классификация всех видов
экономической деятельности (МСОК);

Классификация основных продуктов (КОП);

Международная стандартная торговая классификация (МСТК);

Классификация функций органов управления (КФОУ);

Классификация функций правительства;

Классификации продовольственных и сельскохозяйственных
организаций (RAO);

Классификации международной организации труда (МОТ);

Классификации ООН по вопросам образования, науки и культуры
(ЮНЕСКО);

Международная стандартная классификация образования (МСКО).

К числу классификаций, разработанных другими международными организациями, относятся:

Классификация международного энергетического агентства (МЭА);

Классификация Совета таможенного сотрудничества;

Система описания и кодирования товаров;

Классификация Всемирной туристической организации (ВТО);

Классификация деятельности, связанной с туризмом.

К классификациям Европейского сообщества и других международных региональных организаций относят:

Классификацию Европейского сообщества (ЕС);

Общую отраслевую классификацию экономической деятельности в
рамках ЕС (КДЕС) и другие.

Второй класс классификаторов образуют общегосударственные (общесистемные) классификаторы, обязательные для организации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны, состав которых будет рассмотрен в следующем разделе.

Для выполнения процедур обработки информации и передачи ее между организациями внутри отрасли используют отраслевые классификаторы. В пределах отдельных предприятий используют, как правило, локальные классификаторы.

Выполнение работ второго этапа связано с определением состава исходных данных и требований к разрабатываемым классификаторам.

К исходным данным, используемым в процессе проектирования, классификаторов относятся:

Состав задач, для которых разрабатывается классификатор;

Состав объектов классификации и мощность исходного множества;

Состав признаков классификации и число значений каждого
признака;

Наименования отдельных группировок и объектов; динамика процесса изменяемости состава задач, объектов и признаков.


1. Определение состава, назначения и сферы действия классификатора

2. Определение состава исходных данных и тр ебований к классификаторам


Разработка ТЗ на п роектирование

3. Разработка основных принципов построени я классификаторов

4. Разработка методики построения классифи катора


Разработка методи ческих материалов

5. Разработка инструктивных материалов по с бору и обработке данных

6. Сбор и обработка данных


Организация сбора и обработки исходн ых данных


7. Построение эталонной и рабочей формы кл ассификатора и системы ведения


8. Экспериментальная проверка и внесение ко рректив


Составление класс ификатора и систем ы его ведения


9. Утверждение и издание классификатора

Рис. 4.5. Схема процесса разработки классификатора

К требованиям, которым должны удовлетворять разрабатываемые классификаторы, можно отнести:

Полноту охвата объектов и признаков классификации каждым
классификатором,

Согласованность признаков деления множеств объектов с
алгоритмами обработки экономической информации,

Взаимную однозначность наименований объектов и их кодовых
обозначений,

Простоту кодирования и возможность автоматизации классификации
и кодирования,

Возможность увязки с другими классификаторами и системами
обозначений,

Эффективность использования классификатора при обработке
информации.


классификатора. К критериям построения классификатора относятся такие, как:

Критерий отнесения того или иного объекта к конкретному
классифицируемому множеству;

Степень охвата кодируемого множества объектов.

Принципы построения классификатора определяются структурой классификатора, т.е. количеством ветвей, выходящих из каждой классификационной группировки, количеством ступеней и числом уровней классификации. Классификатор считается однородным, если на каждой ступени из каждой классификационной группировки выходит одинаковое количество ветвей.

Кроме того, на этом этапе разрабатывается система взаимодействия классификаторов разных уровней, предназначенных обеспечивать взаимодействие ЭИС с внешней средой. Эта работа представляет собой разработку некоторого транслятора перехода от одного классификатора к другому. Но чтобы его создать, необходимо провести выбор некоторой системы взаимодействия различных классификаторов, ориентированных на некоторую номенклатуру объектов. Существуют следующие системы взаимодействия:

а) система равноправных классификаторов, которая
характеризуется тем, что на каждом уровне управления для целей
обработки информации используется свой локальный классификатор, а
для получения или передачи информации из внешней среды
используется соответствующий транслятор. Недостаток данной системы
заключается в том, что та система, которая имеет на входе наибольшее
количество потоков информации от различных организаций, должна
иметь наибольшее количество трансляторов;

б) система приоритетных классификаторов, применяется для
предприятий одной отрасли. При этой системе на каждом предприятии
этой отрасли и на каждом уровне управления имеются локальные
классификаторы. Обмен информацией осуществляется в терминах
классификатора вышестоящего уровня. Эта система даёт уменьшение
количества трансляторов независимо от числа входных и выходных
потоков. Однако трудности возникают при передаче потоков
информации между предприятиями, относящимися к разным отраслям;

в) система классификаторов-посредников применяется при
межотраслевом управлении. На каждом объекте любого уровня
управления обработка ведётся в терминах своего локального
классификатора, а обмен ведётся в терминах одного классификатора-
посредника. Преимущества такой системы заключаются в
необходимости создания только одного транслятора для каждого
предприятия и в обеспечении возможности централизованного ведения
классификатора-посредника, что дает минимальное количество ошибок
при кодировании информации и обеспечивает информационную
совместимость ЭИС разных уровней;


г) система единого классификатора для обработки информации на всех предприятиях, входящих в состав экономической макросистемы, и для передачи этой информации между ними возможна только гипотетически, но реально ее нельзя осуществить из-за необходимости осуществления кодирования всей информации, существующей в стране, используя очень громоздкие классификаторы.

К факторам, влияющим на выбор способа увязки классификатора, относят следующие:

Объем и характер обрабатываемой информации;

Объем и характер потоков получаемой и передаваемой информации;

Минимум трудовых и стоимостных затрат на разработку и
эксплуатацию системы ведения классификаторов.

На этом же этапе осуществляется разработка методик построения классификаторов, отражающих методы и последовательность выполнения отдельных операций по созданию классификаторов, содержание которых зависит от выбранных критериев и принципов их построения.

Третий этап связан с работами по организации сбора и обработки исходных данных, необходимых для составления классификаторов. К их числу относится разработка инструктивных материалов по сбору и обработке исходных данных:

Определение перечня решаемых задач, использующих
классификаторы;

Выделение классифицируемых объектов;

Определение состава признаков классификации и значений
признаков;

Осуществление лингвистической обработки этих данных (удаление
синонимов, омонимов, полисемии, антонимов и др.);

Согласование используемой терминологии в исходных данных с
гостами.

Другой работой, которую выполняют на этом этапе, является сбор и обработка данных согласно разработанным инструкциям.

На четвертом этапе "Составление классификаторов и системы их ведения" осуществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора.

Эталонный классификатор должен быть согласован, отпечатан типографским способом и распространен всем пользователям для кодирования информации первичных документов.

Рабочие классификаторы наносятся на машинные носители в необходимых разрезах, передаются пользователям и заносятся в файлы справочников баз данных для выполнения процедуры автоматического заполнения машинных форм первичных документов и для декодирования результатной информации, получаемой после ее обработки.


К задачам, решаемым системой ведения классификатора относятся:

Актуализация классификатора, т.е. постоянное пополнение и
изменение объектов классификации и кодирования;

Своевременное оповещение всех пользователей о всех происходящих
изменениях;

Реструктуризация, или пересмотр структуры классификатора, при
котором осуществляется контроль на дублирование объектов
классификации, контроль и выявление тупиковых ветвей, не ведущих к
объекту, оптимизация резервных ветвей по всем уровням иерархии или
по всем аспектам классификации;

К проблемам, связанным с проектированием системы ведения классификаторов, относятся:

Разработка организационной структуры системы ведения, т.е.
службы, которая отвечает за пополнение классификаторов;

Разработка юридических основ внесения изменений в классификатор;

Разработка информационного и программного обеспечения системы.

Все работы по проектированию классификаторов заканчиваются экспериментальной проверкой и внесением корректив, утверждением, изданием и рассылкой классификаторов всем пользователям в функциональные подсистемы.

1.СИСТЕМА КЛАССИФИКАЦИИ

Общие сведения

Важным понятием при работе с информацией является классификация объектов.

Классификация - cистема распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - то процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Пример 2.6. Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:

    информация о преподавателях - в виде информационного объекта "Преподаватель";
    информация о факультетах - в виде информационного объекта "Факультет" и т. п.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.

Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т. п.

Пример 2.7. Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:

    фамилия, имя, отчество;
    год рождения;
    место рождения;
    адрес проживания;
    факультет, где проходит обучение студент, и т. д.

Все перечисленные реквизиты характеризуют свойства информационного объекта "Студент".

Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации , представленной совокупностью реквизитов.

Пример 2.8.

Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию о всех книгах по определенной тематике, об авторах, абонентах и т. д.

Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, о прибыли, заказчиках, видах производимой продукции и т. д.

Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.

При любой классификации желательно, чтобы соблюдались следующие требования:

    полнота охвата объектов рассматриваемой области;
    однозначность реквизитов;
    возможность включения новых объектов.

В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения , статьи затрат и т. д.

Классификатор - систематизированный свод наименований и кодов классификационных группировок.

При классификации широко используются понятияклассификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.

Пример 2.9. В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.

Можно в качестве признаков классификации использовать: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет,

1021 - мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета .

Регистрационное кодирование

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Пример 2.17. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии - серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.

3.КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ПО РАЗНЫМ ПРИЗНАКАМ

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

На рис. 2.8 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.

DIV_ADBLOCK188">

Внутренняя информация возникает внутри объекта, внешняя информация - за пределами объекта.

Пример 2.18. Содержание указа правительства об изменении уровня взимаемых налогов для фирмы является, с одной стороны, внешней информацией, с другой стороны - входной. Сведения фирмы в налоговую инспекцию о размере отчислений в госбюджет являются, с одной стороны, выходной информацией, с другой стороны - внешней по отношению к налоговой инспекции.

Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация - это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.

Вторичная информация - это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.

Промежуточная информация используется в качестве исходных данных для последующих расчетов.

Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.

Пример 2.19. В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество расписанных чашек каждым работником. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это будет, с одной стороны вторичная промежуточная информация, а с другой стороны - результатная. Итоговые данные поступают в бухгалтерию , где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные - результатная информация.

Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.

Текстовая информация - это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).

Графическая информация - это различного рода графики, диаграммы, схемы, рисунки и т. д.

Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т. п.

Постоянная (условно-постоянная) информация - это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:

постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т. п.;

постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль , стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;

постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.

Функция управления. По функциям управления обычно классифицируют экономическую информацию. При этом выделяют следующие группы: плановую, нормативно-справочную, учетную и оперативную (текущую).

Плановая информация - информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.

Пример 2.20. Плановой информацией фирмы могут быть такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т. д.

Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.

Пример 2.21. Нормативно-справочной информацией на предприятии являются:

время, предназначенное для изготовления типовой детали (нормы трудоемкости);

среднедневная оплата рабочего по разряду;

оклад служащего;

адрес поставщика или покупателя и т. д.

Учетная информация - это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета , статистическая информация и информация оперативного учета .

Пример 2.22. Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т. п.

Оперативная (текущая) информация - это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.

Пример 2.23. Оперативной информацией являются:

количество изготовленных деталей за час, смену, день;

количество проданной продукции задень или определенный час;

объем сырья от поставщика на начало рабочего дня и т. д.