Американская компания Protege запускает исследовательскую инициативу DataLab для продвижения научного подхода к данным в ИИ
2026-03-13 16:22
В избр.

Американская платформа данных для ИИ Protege недавно представила исследовательскую инициативу DataLab, направленную на превращение данных для ИИ в более строгую научную дисциплину, чтобы решить растущую проблему узких мест в данных при развитии искусственного интеллекта. По мере того как системы ИИ развиваются в сторону сложных практических приложений, качество, выбор и оценка данных стали ключевыми факторами, сдерживающими прогресс.

DataLab, как специализированное исследовательское подразделение, стремится помочь исследователям решать ключевые вызовы в области науки о данных. Команда состоит из внутренних экспертов и уже получила предварительную поддержку для сотрудничества от нескольких технологических гигантов, включая Amazon, Apple, Alphabet, Microsoft, NVIDIA, Meta и Tesla. Недавний опрос Snowflake показал, что, несмотря на значительную отдачу от проектов генеративного ИИ, проблемы с подготовкой и качеством данных остаются широко распространенным препятствием, что дополнительно подтверждает важность оптимизации уровня данных ИИ.

Генеральный директор Protege Бобби Сэмюэлс отметил: «Мы понимаем три ключевых столпа, движущих ИИ: модели, чипы и данные. Мы уверены, что с помощью правильных наборов данных — третьего, пока недостаточно развитого столпа — можно продвинуть весь фронт вперед». Он подчеркнул, что компания «создала DataLab, чтобы рассматривать данные как инфраструктуру, а не как отходы», выступая за повышение надежности систем путем установления лучших стандартов, воспроизводимости и научных норм.

DataLab сосредоточится на трех ключевых областях: содействие научному сотрудничеству, создание высококачественных наборов данных и продуктов данных, а также лидерство в исследованиях данных для ИИ. Эта работа будет сочетать академические изыскания и коммерческое применение, планируется публикация результатов бенчмаркинга и технических исследований. Соучредитель Protege Энджи Зидан заявил: «Сила DataLab заключается в его способности объединять обычно изолированные точки зрения». Он далее пояснил, что для этого «требуется думать на пределе, то есть взвешивать предельную ценность точки данных для обучения и альтернативные издержки выбора неправильного набора данных», чтобы обеспечить дисциплинированный дизайн наборов данных и глубокое понимание реальной сложности.

По мере того как технологии ИИ проникают в научные и критически важные прикладные области, требования к точности данных значительно возрастают. Исследователи все больше сосредотачиваются на предельной ценности данных, то есть на том, как отдельная точка данных влияет на поведение модели. Protege заявляет, что DataLab будет играть роль на этом уровне, обеспечивая научно обоснованное принятие решений по выбору, структурированию и оценке влияния данных, чтобы гарантировать надежную работу систем ИИ в реальных условиях и обеспечить поддержку для научного развития данных в ИИ.

Связанные продукты
Связанные рекомендации
Microsoft пересматривает соглашение с OpenAI: лицензия становится неэксклюзивной, выплата доли доходов прекращена, приоритетные условия Azure сохраняются
2026-04-28
Хоу Юнцин из TSMC заявил, что для удовлетворения потребностей AI в вычислительной мощности компания удваивает темпы расширения производства, а выпуск 2-нм чипов в первый год будет на 45% выше, чем у 3-нм чипов за аналогичный период.
2026-04-28
Приложение Qianwen запускает публичное бета-тестирование видеомодели Alibaba HappyHorse с поддержкой 15-секундного мультисценарного повествования и вывода в сверхвысоком разрешении 1080p
2026-04-28
Компания Star Dynamics в сфере воплощённого интеллекта завершила новый раунд финансирования на сумму более 200 миллионов долларов США, который возглавила логистическая группа SF Express. Началась серийная поставка более тысячи роботов.
2026-04-28
Министерство науки и технологий Южной Кореи и Google DeepMind подписали меморандум о сотрудничестве в области ИИ для продвижения национального инновационного проекта K-Moonshot
2026-04-28
Baidu Wenku и Baidu Netdisk совместно выпустили универсальный интеллектуальный агент GenFlow 4.0: число активных пользователей (MAU) превысило 100 миллионов, ежемесячный объём выполненных задач достиг 200 миллионов
2026-04-28
Samsung Heavy Industries подписала меморандум с Mousterian Corporation о совместной разработке плавучих центров обработки данных для AI-вычислений
2026-04-28
Lightmatter назначает Роя Кима вице-президентом по продуктам для ускорения масштабного развертывания фотонной платформы взаимосвязей
2026-04-28
IQM развернёт первый в Японии квантовый компьютер, приобретённый частной компанией
2026-04-28
Австралийские квантовые часы TEMPO успешно выведены на орбиту: точность времени в десять раз превышает показатели GNSS
2026-04-28
Последние новости
1
Чешские железные дороги заказывают аккумуляторные поезда RegioPanter
2
Astrobotic установила рекорд с горячими испытаниями вращающегося детонационного двигателя
3
Оп реснительная установка в Дампире, Западная Австралия, получила 606 миллионов австралийских долларов в рамках инвестиционного плана водоснабжения на 2,7 миллиарда
4
SIMI использует домкраты Enerpac для монтажа генератора на севере Италии
5
Крупнейшее в Европе 3D-печатное здание — многоквартирный дом ViliaSprint² — завершено во Франции
6
Стратегия JPMorgan Chase по продвижению устойчивого строительства в глобальном масштабе
7
Порт Балтимора (США) получил 39,66 миллиона долларов на расширение контейнерного терминала
8
Delta Air Lines корректирует стратегию использования A350: трансатлантические рейсы только через два главных хаба
9
Порт Бильбао (Испания) на причале CSP принимает крупный судовой кран
10
Начало разведки на геотермальном проекте Lumut Balai 4 в Индонезии