AllenAI представляет olmo-eval: новый инструмент для разработки и оценки больших языковых моделей
Исследовательский институт Allen Institute for AI (AllenAI) выпустил новую платформу olmo-eval, предназначенную для всесторонней оценки и разработки больших языковых моделей (LLM). Инструмент расширяет возможности стандарта OLMES и упрощает процесс тестирования и улучшения моделей на всех этапах их создания.