Репортаж от Wedoany,Фонд LF AI & Data, входящий в структуру Linux Foundation, сформировал рабочую группу, специализирующуюся на разработке спецификации DocLang. Её цель — создание интероперабельного стандарта обработки документов для кросс-ИИ и агентных рабочих процессов.

Рабочая группа, учреждённая ключевыми участниками — IBM, Nvidia и Red Hat, — призвана создать открытый, универсальный, AI-нативный формат документов, направленный на улучшение способов подготовки, обмена и управления документными данными предприятий для систем ИИ. К разработке также присоединятся участники ABBYY и Human Signal.
Согласно заявлению, в настоящее время предприятия работают с множеством разрозненных форматов документов, включая PDF, JPEG и другие типы файлов, созданные в первую очередь для чтения человеком, а не для интерпретации ИИ. По мере того как организации всё больше полагаются на генеративный ИИ и агентные системы, этот разрыв может вносить сложность, увеличивать затраты и снижать надёжность при извлечении смысла из деловых документов.
Исполнительный директор LF AI & Data Марк Коллиер (Mark Collier) отметил, что цель рабочей группы по спецификации DocLang — разработать нейтральный к поставщикам, интероперабельный стандарт, помогающий организациям более надёжно, прозрачно и в масштабе готовить документные данные для ИИ. В информационном документе, опубликованном рабочей группой, говорится: «PDF создан для печати, DOCX — для редактора, а DocLang — для следующей эпохи — стандарт машиночитаемых документов, которым модели могут по-настоящему доверять». DocLang определяет структурированный, машиночитаемый формат для документов любого типа — как JSON для данных, HTML для сетей, — который может быть реализован любым инструментом и использован в любом конвейере.
Независимый технологический аналитик Карми Леви (Carmi Levy) отметил, что существующие стандарты документов десятилетиями позволяли глобальным заинтересованным сторонам уверенно сотрудничать, но по мере того, как ИИ меняет правила работы, эти стандарты остро нуждаются в обновлении. Он считает, что DocLang представляет собой самую раннюю и самую большую надежду на достижение некой фундаментальной базовой линии в стандартах документов, которая может сделать рабочие процессы умнее, эффективнее и менее рискованными, чем сейчас. Открытый, нейтральный к поставщикам подход гарантирует, что коллективные интересы будут преобладать над потребностями конкретных поставщиков. Ранние работы по стандартизации в области сетей, документов, веб-страниц и облачных технологий способствовали формированию свободного цифрового ландшафта, определяющего современную жизнь.
Главный аналитик Moor Insights & Strategy Джейсон Андерсен (Jason Andersen) полагает, что при применении таких стандартов, как DocLang, для приёма контента пользователь, загружая документ в агент, может запустить навык для предварительной обработки документа в стандартный формат DocLang, экономя токены. Он предполагает, что эти стандарты должны сохранять возможность для человека делать то, что он хочет, и умело использовать их, не зная кодирования. Предварительная обработка добавляет к документу метаданные или код, и при надлежащем обслуживании управление может стать проще, однако в спецификации это пока не отражено, и он призывает команду рассмотреть этот аспект.
Старший аналитик Info-Tech Research Group Яз Паланичами (Yaz Palanichamy) отметил, что концепция AI-нативных документов с точки зрения продуктивности пользователей помогает организациям подготавливать документные данные для систем, встраивающих ИИ. Однако он подчеркнул, что абсолютно необходимы организационные меры контроля и общая модель управления, а также понимание того, готова ли компания технически стандартизировать внутренние практики управления документами. Без проведения внутреннего исследования осуществимости или предварительной подготовки управление изменениями не может быть должным образом выполнено, что может помешать организации дальнейшее развитие или масштабирование возможностей обработки документов с помощью ИИ. С точки зрения управления по-прежнему требуется надлежащий анализ ряда организационных мер контроля, чтобы обеспечить ответственное и безопасное расширение этого нового стандарта и набора инструментов.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









