Home » Генеративный ИИ в центре внимания на саммите Databricks Data + AI после приобретения MosaicML

Генеративный ИИ в центре внимания на саммите Databricks Data + AI после приобретения MosaicML

Databricks привлекла внимание к генеративному ИИ на своем ежегодном Саммит данных + ИИтак как было объявлено о множестве новых инноваций в области искусственного интеллекта Lakehouse.

Такое внимание к генеративному ИИ, по словам компании, «подчеркивает переломный момент, достигнутый с ростом популярности больших языковых моделей (LLM)».

В апреле компания запустила то, что она называет первым по-настоящему настроенным LLM с открытыми инструкциями. Долли 2.0который поддерживает такие приложения, как текстовые сводники и чат-боты, и позволяет независимым компаниям и разработчикам использовать их в коммерческих целях.

Недавно он также провел 1,3 миллиарда долларов на приобретение стартапа ИИ MosaicML чтобы предприятия могли создавать генеративные модели ИИ на основе собственных данных.

Лейкхаус ИИ Компания заявила, что стремится предложить тот же «ориентированный на данные подход к ИИ», объединяя данные и платформу ИИ, чтобы клиенты могли быстрее и успешнее разрабатывать свои генеративные решения ИИ, используя базовые модели SaaS для обучения своих собственных пользовательских моделей с их данные предприятия.

Недавно анонсированные возможности включать:

  1. Векторный поиск – Позволяет разработчикам повысить точность своих генеративных ответов ИИ с помощью поиска встраивания. Вложения представляют собой числовые представления текста, фиксирующие его семантическую информацию, что облегчает компьютерам понимание взаимосвязей между понятиями. Он также автоматически создает и управляет встраиванием векторов из файлов в каталоге Unity, флагманском решении Databricks для унифицированного поиска и управления. Благодаря интеграции с Databricks Model Serving разработчики могут улучшить реакцию моделей, добавив в поиск фильтры запросов.
  2. Тонкая настройка в AutoML – Предлагает подход с низким кодом, позволяющий клиентам настраивать LLM с использованием собственных данных, в результате чего модель создается с помощью AutoML без необходимости отправлять данные третьей стороне. Интеграция с MLflow, Unity Catalog и Model Serving также позволяет совместно использовать модель внутри организации.
  3. Кураторские модели с открытым исходным кодом – Databricks Marketplace предлагает список моделей с открытым исходным кодом, включая модели для различных вариантов использования генеративного ИИ, таких как выполнение инструкций, суммирование и создание изображений.
Read more:  Мехмед Дикме: Все в государстве теперь зависит от Пеевского ᐉ Новости Fakti.bg - Болгария

Кроме того, компания анонсировала MLflow 2.5, последнюю версию проекта Linux Foundation с открытым исходным кодом MLflow. Обновления MLflow 2.5, выпуск которых запланирован на июль, включают:

  1. Шлюз искусственного интеллекта MLflow – позволяет централизованно управлять учетными данными для моделей SaaS или API-интерфейсов моделей и предоставляет маршруты с контролируемым доступом для запросов, обеспечивая интегрированные рабочие процессы. Разработчики также могут заменить модель бэкэнда, чтобы улучшить стоимость и качество, а также переключиться между поставщиками LLM. Он также включает кэширование прогнозов для отслеживания повторяющихся запросов и ограничение скорости для управления затратами.
  2. Инструменты подсказок MLflow – Визуальные инструменты без кода, позволяющие пользователям сравнивать выходные данные моделей на основе набора подсказок, которые автоматически отслеживаются в MLflow.

Другие объявления, сделанные на саммите, включают:

  1. Обновите Databricks Model Serving, чтобы включить поддержку логических выводов на основе графического процессора для LLM, с сокращением времени задержки до 10 раз и снижением затрат.
  2. Внедрение Databricks Lakehouse Monitoring для лучшего мониторинга и управления всеми данными и ресурсами ИИ в Lakehouse.
  3. Возможности федерации Lakehouseкоторые позволяют клиентам обнаруживать, запрашивать и управлять данными на всех своих платформах данных из Databricks без предварительного перемещения или копирования данных, что устраняет хранилища данных.
  4. Запуск Delta Lake 3.0представляя универсальный формат (UniForm), который позволяет считывать данные, хранящиеся в Delta, как если бы это были Apache Iceberg или Apache Hudi.
  5. Запуск LakehouseIQкоторый использует генеративный ИИ для понимания жаргона, шаблонов использования данных, организационной структуры и многого другого, чтобы отвечать на вопросы в контексте бизнеса.

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.