Определений термина «данные» в государственных (ГОСТах) и иных стандартах по информационным технологиям насчитано (уже) целых пять, определений «информационной технологии» — четыре. Все они в той или иной степени различаются — и непонятно, какое целесообразнее использовать. Сформулируем унифицированное определение, применимое для всех направлений информационных технологий гармонизации ради и для достижения, как говорится, консенсуса 😳 Редакция от 13.12.2024.
Создан 08.04.2014 18:20:57
ГОСТ 1.1–2002 предлагает заняться унификацией, дабы достичь взаимозаменяемости в угоду системности, поскольку в этом прослеживается целесообразность, а все ради комплексности — для достижения однозначности, поскольку без классификации не достичь никакой систематизации 😂
Прислушаемся к ГОСТу, проанализируем отобранные и приведенные ниже варианты определений термина «данные» и оставим (или сформулируем) наиболее полное из них.
Данные (Data) из ГОСТ 15971–90
Информация, представленная в виде, пригодном для обработки автоматическими средствами при возможном участии человека [из 1 табл. 1 ГОСТ 15971–90]
Данные (Data) из ГОСТ 34.321–96
Информация, представленная в формализованном виде, пригодном для передачи, интерпретации или обработки с участием человека или автоматическими средствами [из 2.7 ГОСТ 34.321–96]
Данные из ГОСТ Р 50922–2006
Факты, понятия или команды, представленные в формализованном виде и позволяющие осуществлять их передачу или обработку как вручную, так и с помощью средств автоматизации [из 4 Приложения А ГОСТ Р 50922–2006]
Данные из ГОСТ Р 52292–2004
Интерпретируемое формализованным способом представление информации, пригодное для коммуникации, интерпретации или обработки [ИСО/МЭК 2382–1] [1] [из 4.2.1 ГОСТ Р 52292–2004]
Анализ определений термина «данные» и поиск ключевых слов
Для поиска ключевых слов в определениях термина «данные» был использован первый попавшийся в поиске онлайновый анализатор текстов seotxt.com/service/optimizer. Тексты сразу всех определений термина «данные» были «скормлены» анализатору, результаты его деятельности приведены в таблице ниже.
# | Слово | Повторы | Плотность |
1 | виде | 4 | 7.41 % |
2 | обработки | 4 | 7.41 % |
3 | средствами | 3 | 5.56 % |
4 | информация | 3 | 5.56 % |
5 | представленная | 3 | 5.56 % |
6 | автоматическими | 3 | 5.56 % |
7 | человека | 3 | 5.56 % |
8 | пригодном | 3 | 5.56 % |
9 | 2 | 3.70 % | |
10 | формализованном | 2 | 3.70 % |
11 | участии | 2 | 3.70 % |
12 | возможном | 2 | 3.70 % |
13 | формализованным | 1 | 1.85 % |
14 | интерпретируемое | 1 | 1.85 % |
15 | автоматизации | 1 | 1.85 % |
16 | средств | 1 | 1.85 % |
17 | способом | 1 | 1.85 % |
18 | представление | 1 | 1.85 % |
19 | пригодное | 1 | 1.85 % |
20 | информации | 1 | 1.85 % |
21 | помощью | 1 | 1.85 % |
22 | коммуникации | 1 | 1.85 % |
23 | понятия | 1 | 1.85 % |
24 | факты | 1 | 1.85 % |
25 | участием | 1 | 1.85 % |
26 | передачи | 1 | 1.85 % |
27 | команды | 1 | 1.85 % |
28 | представленные | 1 | 1.85 % |
29 | обработку | 1 | 1.85 % |
30 | передачу | 1 | 1.85 % |
31 | позволяющие | 1 | 1.85 % |
32 | вручную | 1 | 1.85 % |
Затем пришлось поработать руками — преобразовать исходную таблицу в новую с минимизированным числом словоформ. Словоформу «информации» приплюсовывали к «информация» и удаляли «информации». Аналогично для всех прочих, «очевидных».
После того как «очевидная» часть работы была выполнена, пришлось поработать головой над не вполне очевидной ее частью (работы, а не головы). «Понятия», «факты» и «команды» — это ведь тоже «информация»? Ведь «вручную» — это «участие человека»? Результаты правки приведены в таблице ниже.
# | Слово | Повторы |
1 | виде | 4 |
2 | обработки | 5 |
3 | средствами | 6 |
4 | информация | 7 |
5 | представленная | 5 |
6 | автоматическими | 4 |
7 | человека | 3 |
8 | пригодном | 5 |
9 | интерпретации | 3 |
10 | формализованном | 3 |
12 | возможном участии | 6 |
13 | передачи | 3 |
С анализом покончено.
Унифицированное определение термина «данные»
Из слов, оставшихся в табличке выше, была составлена более–менее осмысленная фраза: «Информация (7), представленная (5) в формализованном (3) виде (4), пригодном (5) для обработки (5), интерпретации (3) и передачи (3) автоматическими (4) средствами (6) с возможным участием (6) человека (3)». Вот и все, унифицированное определение термина «данные» налицо.
Интересно, насколько сформулированное (не без помощи беспристрастного онлайнового анализатора) определение «коррелирует» со стандартными? В табличке ниже сведены все определения термина «данные».
1 | Информация, представленная в формализованном виде, пригодном для обработки, интерпретации и передачи автоматическими средствами с возможным участием человека |
2 | Информация, представленная в виде, пригодном для обработки автоматическими средствами при возможном участии человека [из 1 табл. 1 ГОСТ 15971–90] |
3 | Информация, представленная в формализованном виде, пригодном для передачи, интерпретации или обработки с участием человека или автоматическими средствами [из 2.7 ГОСТ 34.321–96] |
4 | Факты, понятия или команды, представленные в формализованном виде и позволяющие осуществлять их передачу или обработку как вручную, так и с помощью средств автоматизации [из 4 Приложения А ГОСТ Р 50922–2006] |
5 | По ГОСТ Р 51170–98 — удалено, поскольку полностью дублировало поз. 1 |
6 | Интерпретируемое формализованным способом представление информации, пригодное для коммуникации, интерпретации или обработки [ИСО/МЭК 2382–1] [1] [из 4.2.1 ГОСТ Р 52292–2004] |
Самым близким по духу оказалось определение данных по ГОСТ 34.321–96. Определение по ГОСТ Р 50922–2006 совсем никуда не годится, по ГОСТ 15971–90 — неполное, поскольку не учитывает возможность передачи информации, определение по ГОСТ Р 52292–2004 и вовсе какое–то «бесчеловечное»...
Сразу возник ряд предложений и вопросов.
Понятие передачи информации на текущий момент в терминологических стандартах по информационным технологиям не обнаружено. Возможно, оно и имеется, но пока такого ГОСТа в нашей базе нет. Но есть какое–никакое определение обмена данными — «Перенос данных между функциональными блоками в соответствии с набором правил, управляющих передачей данных и координацией обмена [ИСО/МЭК 2382–1] [1] [из 7.2.1 ГОСТ Р 52292–2004]». Очевидно, что понятие обмена данными шире, чем понятие передачи данных, поскольку под обменом подразумевается передача данных в обе стороны. Итак,
Данные — это информация, представленная в формализованном виде, пригодном для обработки, интерпретации и обмена автоматическими средствами с возможным участием человека.
Теперь о человеках. Человек — это, конечно, звучит гордо, но как–то не к месту, когда речь идет о технической тематике. В информационных технологиях все же принято оперировать понятиями оператор, оператор системы «человек — машина», оператор информационной системы. Тогда унифицированное определение может зазвучать так:
Данные — это информация, представленная в формализованном виде, пригодном для обработки, интерпретации и обмена автоматическими средствами с возможным участием оператора.
Вопросы. Зачем в ГОСТах по информационным технологиям целых пять определений термина «данные»? Полигамия, конечно, штука интересная, но вряд ли уместна в технике... Но «Послушайте! Ведь, если звезды зажигают — значит — это кому–нибудь нужно? Значит — кто–то хочет, чтобы они были?»
Ответ. Во время оно, судя по всему, промышленным организациям и предприятиям сверху спускался план по стандартизации, вот они его и выполняли. В настоящее время стандарт может быть разработан чуть ли не физическим лицом и, при соблюдении им известных требований и правил, преспокойно введен в действие.
Зачем? Престижа ради: «Мы настолько крутая компания, что способны на разработку государственного или межгосударственного стандарта. Читайте, завидуйте!» Или для прогибания конкурентов.
В 2006, кажется, году автора волею судеб занесло в одно замечательное заведение, занимавшееся много чем, в том числе и системами электронного документооборота (СЭД). Предметная область была знакома, поскольку еще в 2001 году пришлось поработать в интересах другой, конкурирующей компании, держащей (по состоянию на 2006 год) примерно 45–50 % рынка электронного документооборота как в России, так и в странах СНГ.
Оценив обстановку в заведении (и на рынке СЭД) и присвоив ей почетное звание «полнейший бардак», автор вышел на руководство с предложением разработать и ввести в действие жесточайший по своим общим техническим требованиям стандарт на системы электронного документооборота, запросив всего полгода времени и какие–то жалкие 1,5 млн. рублей в качестве компенсации. Руководство терзалось в раздумьях около месяца, но в итоге так ни на что и не решилось. А зря — у него была прекрасная возможность утереть нос конкурентам...
Примечание от 11.07.2014 г. — Вот и все! Тот самый конкурент утер нос руководству несуществующей уже компании, ищите в поисковиках «Утвержден ГОСТ Р 53898–2013 «Системы электронного документооборота. Взаимодействие систем электронного документооборота. Технические требования к электронному сообщению»». А могло бы быть все с точностью «до наоборот» еще в 2007 году...
Выводы
По определениям (по датам введения стандартов):
- самое толковое определение данных дано в ГОСТ 34.321–96;
- изменение в ГОСТ 15971–90 никто, разумеется, внести не удосужился, а следовало бы;
- разработчики ГОСТ Р 50922–2006 либо вообще не знали о существовании ГОСТ 34.321–96, либо поленились стряхнуть с него пыль;
- с ГОСТ Р 52292–2004 ситуация аналогична.
Теперь в целом: понятно, что ранее не существовало инструментария, позволяющего автоматически искать ключевые слова во множестве документов одновременно, связывать схожие разделы документов с возможностью их актуализации, но сейчас–то есть могучие AuthorIT и Framemaker — карты сами идут в руки. Только взяться и сделать – сформулировать жесткие требования к унификации терминологии и сократить количество стандартов, отменив явно лишние.
Но как–то странно работают занимающиеся стандартизацией организации — не вглубь, а вширь — они все больше «гармонизируются» со стандартами «стран–экономических лидеров» вроде Сьерра–Леоне или Берега Слоновой Кости.
Вот как–то так.
Продолжение последовало — см. Государственные стандарты (ГОСТы) в информационных технологиях (ИТ). Часть III — Унификация терминологии в стандартах. Определения термина «информационная технология».