Как анализ инструктажей по охране труда с помощью LLM в металлургии заменяет выборочный контроль?
Анализ инструктажей по охране труда с помощью LLM в металлургии: запись есть — контроля нет
Аудиозапись инструктажа сама по себе не снижает травматизм. На участках регулярно пишут устные инструктажи, но в отчётах остаются только отметки или выборочные проверки. Например, смена может не проговорить действия при разливе металла — и это не попадёт в контроль.
Возникает разрыв: данные есть, но их нельзя измерить и сравнить. Моя позиция проста: ценность не в записи, а в измеримой полноте содержания. Это достигается связкой ASR, доменной LLM и отраслевой базы знаний.
Отсюда последствия. Без сопоставимых метрик появляются слепые зоны. Одна смена пропускает аварийные сценарии, другая — закрывает всё. Система этого не видит.
Это важно для руководителей по ОТ и ПБ, производственных директоров и IT. Ниже — как перейти от выборочного аудита к сплошному цифровому контролю: какие модули нужны, что проверять и какие метрики использовать. Фокус — не на «ИИ вообще», а на связке ASR + LLM + база знаний, которая превращает шумные записи в проверяемые отчёты.
Почему запись не даёт контроля
Кажется, что запись инструктажа закрывает задачу. Есть файл, есть подпись — значит контроль выполнен. Из-за этого содержание почти не проверяют.
На практике записи остаются сырыми. Это часы аудио с шумом, эхом и наложением голосов. Без транскрибации и сверки с базой знаний нельзя понять, проговорены ли ключевые риски.
В результате часть тем просто выпадает. Например, из 10 обязательных пунктов может звучать только 6–7. Аварийные сценарии часто упоминают вскользь или не упоминают вовсе.
Итог — слепые зоны. Пропуски повторяются от смены к смене, но не попадают в KPI. Формальный контроль есть, управления рисками — нет.

Как работает анализ инструктажей
Поток обработки
Запись — это исходные данные. Инструктажи фиксируют перед сменой, при переводе изменениях технологии.
ASR переводит аудио в текст и делит его на фрагменты. Это критично: записи могут длиться часами.
Далее доменная LLM сопоставляет текст с отраслевой базой знаний. Она отмечает, какие темы есть, а какие пропущены.
На выходе — отчёт с оценкой качества. Это процент покрытия и уровни: высокий, достаточный, недостаточный.
Как считаются метрики
Процент покрытия — это доля обязательных тем, которые реально озвучены. Например, из 12 пунктов закрыты 9 — это 75%.
Уровни задаются порогами. Условно: выше 85% — высокий, 60–85% — достаточный, ниже — недостаточный.
Также учитываются критические пропуски. Если не проговорён аварийный сценарий, уровень может снижаться независимо от процента.
Почему без связки система не работает
ASR нужен из-за шума и наложения голосов. Без него смысл теряется.
Обычная языковая модель не понимает специфику. Поэтому используют дообученную модель — например, Gemma 3 от Google (12 марта 2025 года), адаптированную под металлургию.
База знаний задаёт эталон. В ней — риски, регламенты и сценарии. Без неё система видит слова, но не их значимость.
Что это меняет в управлении
Контроль становится сплошным. Система находит пропуски автоматически: нет запрета, не разобран сценарий, не учтён новый норматив.
Появляются метрики. Руководитель видит динамику по сменам и подразделениям.
Дальше — внедрение. Нужно:
настроить транскрибацию и сегментацию
подключить доменную модель
собрать базу знаний
задать метрики и пороги
После этого отчёты становятся основой для решений, а не формальностью.

Где система даёт сбой без анализа
Отметка в журнале вместо контроля
Вы видите запись и подпись. Кажется, что всё в порядке.
Но запись не разобрана. Ключевые риски могут не прозвучать.
Ошибка — доверие формальному признаку. Итог — системные пропуски, которые не видны до инцидента.
Проверка «хорошего» фрагмента
Вы слушаете короткий отрывок, где всё корректно.
Но это не вся запись. Проблемные части остаются вне проверки.
Ошибка — выбор удобного участка. Итог — искажённая картина качества.
Есть текст, но нет смысла
Вы получили транскрипт и отчёты.
Но система не выделяет важное. Риски и сценарии не интерпретируются.
Ошибка — отсутствие доменной модели и базы знаний. Итог — данные есть, решений нет.
Подход | Что получают | Проверка полноты инструктажа | Работа с шумом и многочасовыми записями | Сопоставимость между сменами и подразделениями | Итог для управления |
|---|---|---|---|---|---|
Традиционный выборочный контроль | Аудиозапись, отметка в журнале | Частичная — проверка по выборочным фрагментам | Не масштабируется; ручной разбор многочасовых записей затруднён | Отсутствует или фрагментарна | Формальность контроля; скрытые слепые зоны |
ASR — транскрибация только | Текстовые транскрипты (ASR) | Не оценивает значимость рисков и сценариев — фиксирует слова, но не их важность | Нуждается в автоматическом сегментировании; распознавание осложнено шумом и наложением голосов (факт) | Технически возможна, но без стандарта оценки содержание несопоставимо | Есть данные, но нет интерпретации для принятия решений |
ASR + доменная LLM + база знаний | Отчёт с оценкой качества (процент/уровни) и сегментированные фрагменты | Автоматическая проверка наличия рисков, аварийных сценариев, запретов изменений нормативной базы (факт) | Предназначена для обработки многочасовых записей; шум остаётся фактором, влияющим на распознавание (факт) | Формируется статистика подразделениям, сменам и динамике качества (факт) | Измеряемые метрики и сопоставимость, позволяющие управлять полнотой инструктажей |
Как меняются управленческие решения
Аудиозапись и галочка не управляют рисками. Управляют метрики.
Связка ASR, доменной LLM и базы знаний переводит звук в измеримую полноту. Появляется единый стандарт оценки.
Это убирает слепые зоны. Видно, где и что именно пропускают.
Пример: отчёт показывает, что в ночной смене падает покрытие аварийных сценариев до 60%. Руководитель вводит целевой инструктаж по этим сценариям и проверяет динамику через неделю.
Вместо разовых проверок появляется цикл управления: обнаружение — корректировка — контроль изменений.
От записи к управляемым метрикам
Аудиозаписи создают видимость контроля. Но без анализа нет сопоставимых показателей и видимых рисков.
Решение — перевести процесс в цифровой слой. Транскрибация, доменная модель и база знаний дают оценку покрытия и статистику по сменам.
Это работает, потому что каждый элемент закрывает свою задачу: текст вместо шума, контекст вместо слов, метрики вместо ощущений.
Начать можно с простого: собрать базу обязательных тем и запустить транскрибацию сегментацией. Затем подключить доменную модель и задать пороги качества.
Дальше система сама покажет, где теряется полнота — и где нужно вмешательство.










