H2O.ai предлагает эффективные ИИ-модели для анализа документов
H2O.ai предлагает эффективные ИИ-модели для анализа документов
H2O.ai, ведущий разработчик открытых платформ искусственного интеллекта, представил две новые модели, H2OVL Mississippi-2B и H2OVL-Mississippi-0.8B, нацеленные на улучшение анализа документов и оптического распознавания символов (OCR). Эти модели не только показывают конкурентоспособные результаты по сравнению с более крупными аналогами от крупных технологических компаний, но и предлагают эффективное решение для организаций, работающих с объемной документацией.
Меньший размер и специализированная направленность позволяют этим моделям исключительно хорошо справляться даже с задачами, которые бросают вызов традиционным системам OCR, например, с обработкой низкокачественных отсканированных изображений и сложного рукописного текста. Предоставляя свою технологию на платформе Hugging Face, H2O.ai способствует большей доступности и возможности настройки своих моделей, что позволяет бизнесам адаптировать их под конкретные требования анализа документов.
Как маленькие модели обыгрывают гигантов
Модель H2OVL Mississippi-0.8B от H2O.ai с 800 миллионами параметров удивила индустрию, превзойдя более крупные модели с миллиардными параметрами в задачах распознавания текста на платформе OCRBench. Это достижение подчеркивает, что меньший размер модели не всегда означает меньшую эффективность. В дополнение, H2OVL Mississippi-2B, с двумя миллиардами параметров, демонстрирует выдающиеся результаты в различных тестах, связанных с визуально-языковыми задачами.
Шри Амбати, генеральный директор H2O.ai, отметил, что эти модели разработаны как высокопроизводительные и доступные решения для бизнеса, обеспечивая возможности для реализации AI в OCR, визуальном понимании и анализе документов. Таким образом, H2O.ai создает новые перспективы для внедрения технологии Document AI и предлагает экономически эффективные решения для различных отраслей, что может существенно изменить рынок, ранее контролируемый крупными игроками.
Новый подход к обработке документов
Амбати подчеркивает, что экономические преимущества более мелких специализированных моделей заключаются в их способности эффективно функционировать практически в любых условиях. Эти модели требуют минимальных ресурсов, что делает их доступными для бизнеса с ограниченными вычислительными мощностями. Вместо того, чтобы полагаться на большие языковые модели, существенные расходы на которые часто превышают возможности многих организаций, H2O.ai предлагает решения, которые могут быть адаптированы к конкретным документам и изображениям. Это особенно важно, когда речь идет о традиционных методах OCR, которые часто не выдерживают испытания низким качеством сканов или сложными текстами. Новые модели H2O.ai обещают улучшить результаты анализа документов, обеспечивая при этом экономию ресурсов и упрощая задачу извлечения информации из обширных архивов корпоративных данных.
Стратегия H2O.ai
H2O.ai акцентирует внимание на доступности и практическом применении ИИ, обозначая свою стратегию как движение, а не просто концепцию. Создавая небольшие базовые модели, которые легко настраиваются под специфические задачи, компания открывает новые возможности для разработчиков и предприятий, стремящихся использовать ИИ для решения актуальных бизнес-проблем.
Привлечение $256 миллионов инвестиций от таких уважаемых организаций, как Nvidia и Goldman Sachs, подчеркивает доверие к их подходу. Эти средства позволяют H2O.ai не только развивать свои технологии, но и поддерживать сообщество из более чем 20,000 организаций, среди которых — половина компаний из списка Fortune 500. В условиях постоянного давления цифровой трансформации и необходимости оптимизации работы с неструктурированными данными, новые визуально-языковые модели компании предлагают эффективные решения для внедрения Document AI, минимизируя вычислительные требования, что делает их привлекательными для бизнеса.