ГОСТ Р 71688-2024 Искусственный интеллект. Наборы данных для разработки и верификации моделей машинного обучения для косвенного измерения физико-механических свойств объектов аддитивного производства. Общие требования

Обложка ГОСТ Р 71688-2024 Искусственный интеллект. Наборы данных для разработки и верификации моделей машинного обучения для косвенного измерения физико-механических свойств объектов аддитивного производства. Общие требования
Обозначение
ГОСТ Р 71688-2024
Наименование
Искусственный интеллект. Наборы данных для разработки и верификации моделей машинного обучения для косвенного измерения физико-механических свойств объектов аддитивного производства. Общие требования
Статус
Действует
Дата введения
2025.01.01
Дата отмены
-
Заменен на
-
Код ОКС
35.020, 35.240.99

ГОСТ Р 71688-2024


НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ


Искусственный интеллект


НАБОРЫ ДАННЫХ ДЛЯ РАЗРАБОТКИ И ВЕРИФИКАЦИИ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ ДЛЯ КОСВЕННОГО ИЗМЕРЕНИЯ ФИЗИКО-МЕХАНИЧЕСКИХ СВОЙСТВ ОБЪЕКТОВ АДДИТИВНОГО ПРОИЗВОДСТВА


Общие требования


Artificial intelligence. Data sets for the development and verification of machine learning models for indirect measuring the physical and mechanical properties of additive manufacturing objects. General requirements

ОКС 35.020

35.240.99

Дата введения 2025-01-01


Предисловие

1 РАЗРАБОТАН Федеральным государственным бюджетным учреждением "Российский институт стандартизации" (ФГБУ "Институт стандартизации")

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 164 "Искусственный интеллект"

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 11 октября 2024 г. № 1438-ст

4 ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. № 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)


Введение

Одной из основных целей в области проектирования новых композиционных материалов является прогнозирование их надежности и долговечности. Известные способы прогнозирования свойств материалов взаимосвязаны с состоянием внутренней структуры материала, что является ресурсоемкой задачей. Существуют стандартные методы испытаний пултрузионных полимерных композитов по ГОСТ Р 57921 на растяжение, сжатие, изгиб, сдвиг в плоскости армирования и ударную прочность при изгибе. Физико-механические свойства, полученные в результате стандартных испытаний, могут быть использованы для "косвенного" прогнозирования стойкости и долговечности изделия без дополнительных исследований внутренней структуры материала с использованием машинного обучения.

Установленные в настоящем стандарте общие требования определяют порядок выбора методов сбора, анализа, постобработки набора данных аддитивного производства, а также методы контроля качества и полноты наборов данных для косвенного измерения свойств узлов и элементов конструкций.

Задачами настоящего стандарта являются:

- формирование структуры классификации наборов данных, определение систематизированной структуры для упорядочения наборов данных объектов аддитивного производства;

- формулировка требований к наборам данных, установление перечня основных требований для наборов данных, а также для структурирования данных о технологических параметрах и физико-механических свойствах объектов;

- обеспечение рекомендаций по сбору данных, предоставление методов сбора данных для каждого класса набора, включая рекомендации по выбору методов анализа и постобработки;

- установление единых принципов оценки качества данных, обеспечение надежности и сопоставимости результатов при использовании наборов данных для разработки и верификации системы искусственного интеллекта в аддитивном производстве.


1 Область применения

Настоящий стандарт устанавливает требования к наборам данных, используемым для разработки и верификации машинного обучения для косвенных измерений физико-механических свойств объектов аддитивного производства.

Настоящий стандарт распространяется на наборы данных: технологические параметры аддитивного производства и физико-механические свойства объектов, полученных при аддитивном производстве.

В данном стандарте приведена классификация наборов данных технологических параметров объектов аддитивного производства.


2 Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ГОСТ Р 57586-2017 Изделия, полученные методом аддитивных технологических процессов. Общие требования

ГОСТ Р 57588 Аддитивные технологии. Оборудование для аддитивных технологических процессов. Общие требования

ГОСТ Р 57910 Материалы для аддитивных технологических процессов. Методы контроля и испытаний металлических материалов сырья и продукции

ГОСТ Р 57921 Композиты полимерные. Методы испытаний. Общие требования

ГОСТ Р 59276 Системы искусственного интеллекта. Способы обеспечения доверия. Общие положения

Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.


3 Термины, определения и сокращения

3.1 Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями:

3.1.1


аддитивное производство; АП (аддитивный технологический процесс) (additive manufacturing): Процесс изготовления деталей (2.6.1), который основан на создании физического объекта по электронной геометрической модели путем добавления материала, как правило, слой (2.3.10) за слоем, в отличие от вычитающего (субтрактивного) производства (механической обработки) и традиционного формообразующего производства (литья, штамповки).

[ГОСТ Р 57558-2017, статья 2.1.2]


3.1.2


измерять (measure) (глагол): Производить измерение.

[ГОСТ Р ИСО/МЭК 25000-2021, пункт 4.19]


3.1.3 значение величины: Число с указанием основы для сравнения, выражающее размер величины.

Примечание - См. [1], пункт 1.19.

Примеры

1 Толщина материала: 0,65 мм.

2 Сила упругости: 10 Н.

3 Коэффициент Пуассона: 0,27.

4 Напряжение сдвига: 5,88 МПа.

3.1.4


функция измерения (measurement function): Алгоритм или вычисление, выполняемое для комбинации не менее чем двух элементов показателя качества.

[ГОСТ Р ИСО/МЭК 25021-2014, пункт 4.7]


3.1.5


элемент данных (ЭД) [data element, DE)]: Единица данных, для которой с помощью набора атрибутов заданы определение, идентификация, представление и допустимые значения.

[ГОСТ Р ИСО/МЭК 11179-1-2010, пункт 3.3.8]


Примечания

1 Поле считается синонимом ЭД.

2 ЭД - это физический объект, "контейнер" значений данных (см. [2]*, пункт 4.9).

3.1.6


тип данных (datatype): Множество различающихся значений, охарактеризованных свойствами этих значений и операциями над ними.

[ГОСТ Р ИСО/МЭК 11179-1-2010, пункт 3.3.11]


Примечание - Примерами типов данных являются строки символов, тексты, даты, числа, изображения, звуки и т.д. (см. [2], пункт 4.16).

3.1.7 значение данных: Содержание элемента данных.

Примечания

1 С "внутренней" точки зрения качество данных относится к самим данным, таким как значения предметной области и возможные ограничения (см. [3], пункт 5.11).

2 Номер или категория, присвоенная атрибуту целевого объекта путем проведения измерения (см. [2], пункт 4.17).

3.1.8 запись данных: Набор связанных элементов данных, рассматриваемых как единое целое.

Примечание - См. [2], пункт 4.15.

3.2 Сокращения

В настоящем стандарте применены следующие сокращения:

ИИ - искусственный интеллект;

МО - машинное обучение.


4 Общие положения

Для эффективного подхода к процессу структурирования информации и входных данных необходимо использовать два класса наборов данных: технологические параметры самого АП и физико-механические свойства объектов, полученных при АП. Такой подход должен учитывать различные аспекты производственных процессов и позволять создавать модели МО, которые совершенствуют качество конечных объектов.

4.1 Технологические параметры аддитивного производства

Набор данных, содержащих технологические параметры, приведен в А.1.

4.2 Физико-механические свойства объектов аддитивного производства

Набор данных, содержащих физико-механические свойства объектов АП, приведен в А.2. Эти свойства разделяются на две подкатегории: свойства материала и свойства изделия. Такое разделение обусловлено необходимостью учета различий между производством эталонного образца и реальными изделиями для будущей эксплуатации.

Первая подкатегория содержит данные о физических и механических свойствах материалов, используемых в процессе 3D-печати. Они характеризуют материал в идеальных условиях независимо от процесса печати. Включают механические параметры, термическую устойчивость, оптические свойства и другие характеристики.

Вторая подкатегория содержит данные о физико-механических свойствах объектов, созданных аддитивной печатью. Они характеризуют уже изготовленные объекты и определяются после завершения процесса печати. Включают механические характеристики, размеры, плотность, поверхностные свойства и другие параметры, важные для оценки качества и соответствия требованиям.

Такое разделение позволяет более точно анализировать и оптимизировать процесс аддитивной печати, учитывая как свойства материала, так и свойства объектов.

4.3 Классификация наборов данных

Наборы данных подразделяют на данные для разработки и для верификации моделей МО.

Также необходимо различать входные и выходные наборы данных.

В контексте МО для косвенного измерения физико-механических свойств объектов АП входные данные могут содержать информацию о технологических параметрах 3D-печати и свойствах материала (см. приложение А).

Выходные данные могут представлять собой физико-механические свойства объектов, изготовляемых с применением аддитивных технологий. Эти данные описывают характеристики изготовленных объектов, являющихся целевыми переменными, которые система ИИ должна предсказывать.


5 Требования к наборам данных для обучения и верификации моделей машинного обучения

5.1 Общие требования к наборам данных

5.1.1 Набор данных должен достоверно отражать разнообразие объектов АП по ГОСТ Р 57586.

5.1.2 Наборы данных должны обеспечить репрезентативность модели МО таким образом, чтобы они были обучены в предельном диапазоне и могли обобщаться на новые данные.

5.1.3 Данные должны быть точными и достоверными. Это относится к правильности измерений, отсутствию выбросов и ошибок, а также проверке наличия аномалий.

5.1.4 Набор данных должен содержать достаточное количество примеров для моделей МО и соответствовать сложности модели МО. Недостаточное количество данных может привести к переобучению моделей, тогда как избыток данных может увеличить время обучения и затруднить обработку.

5.1.5 Данные должны содержать технологические параметры 3D-печати и физико-механические свойства объектов, чтобы модели могли учитывать различия и особенности процесса.

5.1.6 Набор данных должен быть полным и сбалансированным в отношении объектов АП по ГОСТ Р 57586-2017 (раздел 6), чтобы предотвратить смещение моделей к определенному классу, что обеспечивает эффективное и точное обучение.

5.1.7 Для защиты коммерческой и чувствительной информации данные должны быть обезличены и защищены от несанкционированного доступа для обеспечения конфиденциальности и безопасности.

5.1.8 Набор данных должен сопровождаться подробной документацией, описывающей исходные источники данных, методы сбора и обработки, а также контекст использования (см. приложение А).

5.1.9 Доступ к наборам данных должен быть обеспечен для определенного круга пользователей с соответствующими разрешениями.

5.1.10 Следует использовать стандартизированные форматы данных, чтобы облегчить обмен информацией и совместимость с различными инструментами МО.

5.2 Требования к наборам данных технологических параметров аддитивного производства

5.2.1 Данные по технологическим параметрам должны быть высокоточными и достоверными, чтобы обеспечить надежное обучение моделей и соответствовать сложности модели МО. Неправильные или неточные значения могут привести к некорректным прогнозам и оптимизации.

5.2.2 Необходимо иметь данные, собранные с высокой частотой в процессе 3D-печати. Это позволит учесть динамические изменения параметров в процессе и создать более точные модели.

5.2.3 Набор данных должен содержать перечень технологических параметров, используемых в процессе печати (см. А.1). Недостающие параметры могут привести к неполной и недостоверной оценке процесса.

5.2.4 Если печать производится с использованием различных материалов, требуется учитывать их уникальные технологические особенности и параметры.

5.2.5 Важно учесть разнообразные условия печати, такие как различные настройки оборудования, окружающая среда, скорость печати и т.д. Это поможет моделям быть более адаптивными к различным ситуациям.

5.2.6 Набор данных должен быть своевременно обновляемым, чтобы учитывать изменения в технологиях и методах АП.

5.3 Требования к наборам данных физико-механических свойств

5.3.1 Все данные по физико-механическим свойствам объектов должны быть представлены ЭД в одной системе единиц измерения и обладать одинаковой точностью измерений.

5.3.2 Данные должны быть собраны и предоставлены в актуальном состоянии, чтобы отражать текущие характеристики объектов АП.

5.3.3 Выборка объектов для анализа должна быть репрезентативной и хорошо представлять общую популяцию объектов, чтобы системы ИИ были способны обобщаться на новые данные.

5.3.4 Данные должны быть согласованными и консистентными по всем измеренным свойствам, чтобы избежать противоречий и неправильных выводов.

5.3.5 При возможности повторные измерения или контрольные измерения должны проводиться для оценки повторяемости результатов.

5.3.6 Данные должны учитывать вариабельность свойств объектов от различных условий печати.

5.3.7 Данные должны быть проверены на наличие выбросов или ошибок измерений, чтобы не искажать общую картину свойств объектов.


6 Требования к сбору и применению наборов данных

6.1 Общие требования

6.1.1 Если исследуемая область уже хорошо исследована, рекомендуется начать с обзора литературы и поиска доступных баз данных, чтобы использовать уже существующие данные и избежать повторения работы.

6.1.2 При необходимости получения точных и контролируемых данных рекомендуется проводить экспериментальные измерения в контролируемых условиях, позволяющих получить желаемые свойства объектов.

6.1.3 Если целью является получение данных, соответствующих реальным условиям эксплуатации, рекомендуется собирать данные в реальной среде, чтобы учесть разнообразные факторы, влияющие на свойства объектов.

6.1.4 В зависимости от сложности задачи рекомендуется комбинировать различные методы сбора данных для получения более полного и точного представления о свойствах объектов.

6.1.5 Перед масштабированием сбора данных рекомендуется провести пилотные исследования для проверки методов сбора данных и идентификации возможных проблем.

6.1.6 При сборе данных, содержащих конфиденциальную информацию, рекомендуется предусмотреть механизмы защиты данных и соблюдения правил обработки личной информации.

6.1.7 При выборе метода сбора данных необходимо учитывать цели и задачи исследования, доступные ресурсы, необходимую точность данных, временные и бюджетные ограничения, а также специфические требования исследования или проекта.

6.1.8 Необходимо документировать весь процесс сбора данных, включая методы, инструменты, условия экспериментов и любые возможные ограничения или искажения данных (см. приложение Б).

6.2 Сбор данных технологических параметров и физико-механических свойств объектов аддитивного производства

6.2.1 Способы сбора данных:

- лабораторные испытания;

- производственные данные;

- сгенерированные данные;

- литературные данные.

6.2.2 Сбор данных технологических параметров проводят с учетом требований к технологическим процессам, разработанным для аддитивных технологий по ГОСТ Р 57588.

6.2.3 Сбор данных физико-механических свойств изделий проводят с учетом требований к изделию по ГОСТ Р 57586.

6.2.4 Сбор основных характеристик материалов, исходных компонентов и материалов изделий проводят с учетом требований по ГОСТ Р 57910.

6.3 Анализ и постобработка наборов данных для аддитивного производства

6.3.1 Извлечение общих закономерностей, тенденций и вариаций в данных рекомендуется осуществлять с применением статистического анализа по ГОСТ Р 59276. Рекомендации по выбору методов анализа:

- использование графических представлений зависимостей и распределений для обнаружения скрытых структур и отношений между переменными наборов данных;

- применение корреляционного анализа для определения взаимосвязи наборов данных и выявления наиболее влиятельных параметров;

- использование анализа временных рядов для выявления трендов и сезонных колебаний в свойствах наборов данных.

Это позволяет выявить значимые свойства и параметры, а также аномалии и выбросы.

6.3.2 Для обработки данных рекомендуется:

- удалять выбросы, которые могут искажать результаты анализа и обучения моделей;

- нормализовать данные, чтобы предотвратить доминирование одних параметров над другими;

- разрабатывать стратегию для заполнения или удаления пропущенных значений, чтобы обеспечить полноту данных;

- применять методы для устранения шума в данных, чтобы повысить их точность и надежность;

- объединять данные из разных источников для создания единого набора данных, если это необходимо;

- применять фильтры и обработку сигналов, если данные подвержены внешним искажениям;

- выбирать наиболее информативные признаки для анализа и обучения моделей;

- применять метод кросс-валидации для оценки производительности моделей и предотвращения переобучения.

6.3.3 Учитывая цели и задачи исследования, а также характер данных рекомендуется комбинировать различные методы анализа и постобработки для получения надежных результатов и более полного понимания свойств объектов АП.

Приложение А

(рекомендуемое)


Входные и выходные наборы данных аддитивного производства при разработке и верификации систем искусственного интеллекта

А.1 Перечень технологических параметров, которые могут являться входными данными при разработке МО:

- температура печати (подачи материала, сопла и т.д.);

- скорость движения печатающего устройства;

- давление материала в сопле или распылителе;

- тип используемого материала (пластик, металл, керамика и т.д.);

- размер и форма печатаемого объекта;

- параметры слоя (толщина слоя, площадь контура и т.д.);

- скорость охлаждения и отверждения материала;

- плотность материала;

- параметры подачи материала (скорость подачи, температура материала и т.д.);

- энергия лазера (для лазерного АП);

- мощность и частота источника света (для селективного лазерного спекания);

- температура платформы или рабочей поверхности;

- относительная влажность в производственной среде;

- время воздействия (длительность процесса печати);

- концентрация химических добавок или составляющих материала;

- используемый тип и параметры подачи газа (для процессов с плавлением металла);

- управление энергией плазмы (для процессов с плазменным покрытием);

- параметры обработки поверхности (пескоструйная обработка, шлифовка и т.д.).

А.2 Перечень физико-механических свойств объектов АП, которые могут являться выходными данными при разработке:

а) прочностные характеристики:

1) прочность на разрыв,

2) предел текучести,

3) удлинение при разрыве,

4) модуль упругости,

5) твердость материала;

б) термические свойства:

1) температура плавления,

2) температурный коэффициент расширения,

3) теплопроводность;

в) электрические свойства:

1) удельное электрическое сопротивление,

2) электрическая проводимость,

3) диэлектрическая проницаемость;

г) магнитные свойства:

1) магнитная индукция,

2) магнитная проницаемость;

д) оптические свойства:

1) прозрачность материала,

2) коэффициент преломления,

3) отражательная способность;

е) акустические свойства:

1) скорость звука в материале,

2) акустическая абсорбция;

ж) теплофизические свойства:

1) теплоемкость материала,

2) тепловое сопротивление;

и) вязкостные свойства - вязкость материала;

к) коэффициент трения и износостойкость;

л) плотность материала;

м) усталостные характеристики - усталостная прочность;

н) параметры микроструктуры:

1) размер зерен,

2) пористость материала;

п) механические свойства поверхности:

1) шероховатость поверхности,

2) адгезия.

Приложение Б

(рекомендуемое)


Перечень метаданных для хранения верифицированного набора данных для косвенного измерения физико-механических свойств объектов аддитивного производства

Идентификатор набора данных: уникальный идентификатор для однозначного обозначения данного набора данных.

Название и описание: описательное название набора данных и краткое описание его содержания и цели.

Дата сбора данных: дата, когда данные были собраны или измерены.

Метод косвенного измерения: описание метода, используемого для косвенного измерения физико-механических свойств объектов.

Тип материала: указание типа материала объектов, к которым применялся данный набор данных.

Параметры и условия измерения: список всех параметров и условий, которые были использованы при косвенных измерениях свойств объектов.

Условия эксперимента: описание условий окружающей среды и параметров эксперимента, которые могут повлиять на результаты.

Обработка и предобработка данных: описание процедур, которые были применены для обработки и предварительной обработки данных.

Метрики и показатели качества: список метрик и показателей, используемых для оценки качества и достоверности данных.

Результаты верификации: запись о результатах верификации данных, включая оценку достоверности и соответствия стандартам.

Ссылки на источники данных: указание ссылок на источники данных, если они были получены из других источников.

Метаданные о методе верификации: описание методов верификации, использованных для проверки точности и достоверности данных.

Лицензия и права доступа: информация о лицензии, которая регулирует доступ и использование данных.

Авторы и контактная информация: имена авторов набора данных и контактная информация для возможной связи.

Версионность данных: указание версии набора данных и даты последнего обновления.


Библиография


[1]

Международный словарь по метрологии: основные и общие понятия и соответствующие термины: пер. с англ. и фр./Всерос. науч.-исслед. ин-т метрологии им.Д.И.Менделеева, Белорус. гос. ин-т метрологии. Изд.2-е, испр. - СПб.: НПО "Профессионал", 2010. - 82 с.


[2]

ИСО/МЭК 25024:2015*

Системная и программная инженерия. Требования и оценка качества систем и программного обеспечения (SQuaRE). Измерение качества данных. [Systems and software engineering - Systems and software Quality Requirements and Evaluation (SQuaRE) - Measurement of data quality]


[3]

ИСО/МЭК 25012:2008

Разработка программного обеспечения. Требования и оценка качества программного продукта (SQuaRE). Модель качества данных. [Software product Quality Requirements and Evaluation (SQuaRE) - Data quality model]


[4]

Федеральный закон от 26 июня 2008 г. № 102-ФЗ "Об обеспечении единства измерений"


УДК 004.01:006.354

ОКС 35.020

35.240.99

Ключевые слова: искусственный интеллект, средства измерений, наборы данных, разработка, верификация, модели машинного обучения, косвенное измерение, физико-механические свойства, аддитивное производство, общие требования