Apple продолжает полным ходом работать над искусственным интеллектом. Наконец, компания запустила новую серию моделей искусственного интеллекта с открытым исходным кодом под названием OpenELM (.
Стремясь предложить пользователям мощь и функции искусственного интеллекта без необходимости использования облачных серверов, Apple заявляет, что наиболее важной особенностью этих моделей является то, что они могут работать на устройстве.
А пока мы недавно поделились с вами заявлениями и подробностями Марка Гурмана из Bloomberg об AI LLM в iOS 18. Вот все, что мы знаем о новых моделях искусственного интеллекта.
Что такое OpenELM?
OpenELM состоит из восьми моделей. Четыре из них предварительно обучены, а остальные можно настроить с помощью конкретных инструкций и входных данных. Модели относительно небольшие (от 270 до 3 миллиардов параметров) и оптимизированы для работы на устройствах.
Apple использует стратегию послойного масштабирования для повышения точности и эффективности моделей.
С другой стороны, использование моделей OpenELM дает множество преимуществ.:
- Обработка ИИ на устройстве: В моделях OpenELM функции искусственного интеллекта могут выполняться непосредственно на устройстве без необходимости использования облачных серверов. Это значительно повышает конфиденциальность и безопасность данных.
- Снижение затрат: Снижение зависимости от облачных серверов приводит к экономии затрат.
- Более быстрое время ответа: Обработка данных на устройстве обеспечивает более быстрое реагирование и более удобный пользовательский интерфейс.
- Больше исследований и разработок: Модели OpenELM имеют открытый исходный код, что позволяет исследователям и разработчикам изучать и улучшать их. Это ускоряет развитие технологий искусственного интеллекта и разработку приложений следующего поколения.
Apple сделала следующее заявление о новых языковых моделях:
Воспроизводимость и прозрачность больших языковых моделей имеют решающее значение для продвижения открытых исследований, обеспечения достоверности результатов и возможности расследования предвзятостей данных и моделей, а также потенциальных рисков. С этой целью мы выпускаем OpenELM, современную модель открытого языка. OpenELM использует стратегию послойного масштабирования для эффективного распределения параметров внутри каждого уровня модели трансформатора, что приводит к повышению точности. Например, при бюджете параметров примерно в один миллиард параметров OpenELM демонстрирует улучшение точности на 2,36% по сравнению с OLMo, при этом требуя в 2 раза меньше токенов предварительного обучения.
В отличие от предыдущих практик, которые предоставляют только веса модели и код вывода, а также предварительное обучение на частных наборах данных, наша версия включает полную структуру для обучения и оценки языковой модели на общедоступных наборах данных, включая журналы обучения, несколько контрольных точек и предварительное обучение. конфигурации. Мы также выпускаем код для преобразования моделей в библиотеку MLX для вывода и точной настройки на устройствах Apple. Этот всеобъемлющий выпуск призван расширить возможности и укрепить сообщество открытых исследований, прокладывая путь для будущих открытых исследовательских усилий.
Кроме того, если вы хотите узнать больше об OpenELM, вы можете проверить это Детальный отчет.
В планы Apple входит сделать модели OpenELM доступными в операционной системе iOS 18. Ожидается, что iOS 18 будет включать значительные улучшения, ориентированные на искусственный интеллект, и использовать большую языковую модель. (магистр права) на устройстве.
Модели OpenELM считаются важным шагом в будущее искусственного интеллекта. Ожидается, что с появлением новых моделей ИИ станет более приватным, безопасным и доступным.
Этот шаг Apple может сыграть важную роль в распространении искусственного интеллекта и его интеграции во все аспекты повседневной жизни.
Предоставленное изображение предоставлено: Кеминг Тан / Unsplash