Искусственный интеллект, большие языковые модели и архитекторы (часть 2 из 2)

Большие языковые модели: глубокое погружение

Добро пожаловать во вторую часть нашего исследования больших языковых моделей. В этом выпуске мы глубже углубимся в тонкости этих моделей, обсуждая все: от формулирования эффективных подсказок до феномена галлюцинаций с наш хозяин Дэвид Бланк-Эдельман и наши архитекторы кресел Ули Хоманн и Эрик Чарран.

Создание эффективных подсказок

Одним из ключевых аспектов работы с большими языковыми моделями является умение создавать эффективные подсказки. Эти подсказки должны быть соответствующим образом ограничены, чтобы вызвать полезные ответы. Например, архитектор может запросить ответ на перспективу архитектуры решения, который отвечает конкретным функциональным и нефункциональным требованиям.

Эрик привел пример, в котором он предложил: «С точки зрения архитектора программного обеспечения придумать и порекомендовать архитектуру решения, которая удовлетворяет всем этим функциональным и нефункциональным требованиям, а затем написать ее так, как будто я создаю спецификацию для разработчика. Архитектура требует от организации инвестиций в виде капитальных и операционных затрат, новых услуг, новых облачных подписок». В другом приглашении он взял выходные данные и предложил: «Тогда возьмите это и напишите электронное письмо ИТ-директору».

Он взял результаты, поднял их на новый уровень и создал хорошую основу, она не была идеальной, но хорошую основу для информирования руководителей о том, почему ИТ-директор будет лоббировать финансового директора, чтобы тот инвестировал в эти конкретные технологии.

Затем Эрик попросил его сменить персонажа. «Предположим, что я руководитель группы разработки SRE или платформы, и мне нужно поддерживать то, что я только что создал. Напишите мне краткое техническое задание для SRE или руководителя группы разработки платформ, который будет поддерживать архитектуру».

Этот процесс включает в себя своего рода «переключение кода», при котором язык и уровень детализации корректируются в зависимости от аудитории. Это послужило отличной отправной точкой для доработки.

Понимание галлюцинаций

Углубляясь в работу больших языковых моделей, мы сталкиваемся с феноменомгаллюцинации‘. Это происходит, когда модель делает предположения, основанные на закономерностях, которые она наблюдала до сих пор. Например, если модель видит последовательность 1, 2, 3, она может предположить, что естественным образом должна следовать последовательность 4.

Хотя эта экстраполяция может работать во многих сценариях, она также может привести к неточным или даже опасным предположениям, особенно в таких чувствительных областях, как здравоохранение. Очень важно помнить, что эти модели не могут делать предположения или экстраполяции при работе с диагностической информацией.

В начале года галлюцинации были довольно распространены в больших языковых моделях. Однако благодаря совместным усилиям исследовательского сообщества их встречаемость резко снизилась. Такие методы, как точная настройка, позволяют пользователям сдерживать и ограничивать количество галлюцинаций.

Тайна результатов искусственного интеллекта

В мире искусственного интеллекта большие языковые модели стали увлекательной областью изучения. Однако их работа часто остается загадкой для пользователей, что приводит к множеству вопросов и опасений.

Одним из интригующих аспектов этих моделей является получение результатов. Пользователи часто оказываются озадаченными полученными ответами, не зная их обоснования. Такое непонимание может быть проблематичным, особенно для таких профессионалов, как архитекторы, которые полагаются на эти модели в своей работе.

Ключевым моментом здесь является понимание того, как функционируют эти модели. Читая ответ, крайне важно проверить информацию, чтобы убедиться в ее точности. Должен быть голос в глубине вашей головы, говорящий: «Хорошо, позвольте мне просто проверить эту штуку на самом деле, чтобы убедиться, что она выдумала это не потому, что ей так хочется». Модели предназначены для объединения концепций и генерации ответа на основе входных данных. Однако иногда они могут фабриковать связи между концепциями, что приводит к неточным результатам.

Поймите, как работает этот процесс, а затем, читая результат, просто проверьте его качество, чтобы убедиться, что он имеет смысл, прежде чем предлагать его в качестве ответа.

Роль пользователя

Большие языковые модели — это инструменты, предназначенные для помощи пользователям в более эффективном и глубоком создании артефактов. Они предоставляют предложения на основе данных, внесенных пользователем. Важно помнить, что эти предложения должны быть проверены пользователем, прежде чем они смогут быть приняты в качестве окончательного результата.

Пользователь играет жизненно важную роль в этом процессе. Им необходимо понимать, что они просят сделать модель, и проверить вывод как только оно будет создано, оно станет вашим предложением. Ответственность за конечный результат лежит на пользователе, а не на ИИ. Пользователь не может просто винить ИИ, если что-то пойдет не так.

Мир за пределами естественного языка

Хотя большая часть дискуссий вокруг больших языковых моделей вращается вокруг текста на естественном языке, эти модели способны на гораздо большее. Они могут понимать и генерировать код, что делает их полезными для решения задач, выходящих за рамки создания текста на человеческом языке.

Например, OpenAI имеет три семейства моделей: GPT для языка, DALL-E для изображений и Codex для кода. Эти модели могут выражать все, что можно представить в коде, включая схемы. Эта возможность открывает совершенно новую сферу возможностей для пользователей, позволяя им использовать эти модели различными способами.

Типовой чат: быстрое проектирование с помощью JSON

В сфере искусственного интеллекта большие языковые модели стали мощными инструментами, способными генерировать широкий спектр результатов. Эти модели — от создания схем JSON до документирования устаревшего кода — революционизируют наш подход к решению проблем.

Одним из инновационных приложений больших языковых моделей является TypeChat, приложение, разработанное Андерсом Хейлсбергом и его коллегами. TypeChat использует возможности оперативного проектирования для генерации результатов в форме схемы JSON.

Пользователи могут поручить большой языковой модели сгенерировать определенный вывод и отформатировать его с помощью JSON. Предоставляя схему JSON как часть приглашения, система может автоматически отвечать в схеме JSON. Этот подход предлагает элегантный способ создания программируемых выходных данных, поскольку анализ схемы JSON намного проще, чем анализ текста.

Большие языковые модели также могут генерировать код в различных формах. Одна из областей, где эта возможность оказалась особенно полезной, — это документирование устаревших баз кода.

Например, многие базы кода Cobalt довольно старые и не имеют надлежащей документации. Генеративный ИИ можно использовать для документирования этих баз кода и объяснения того, что делает код. Это особенно полезно, когда исходное назначение или функциональность кода больше не известны.

Сбить с толку: впечатляющие подсказки для архитекторов

Когда дело доходит до того, чтобы произвести впечатление на архитекторов возможностями больших языковых моделей, одним из эффективных подходов является использование этих моделей для анализа проблемного кода. Например, часть устаревшего кода или кода, у которого происходит утечка памяти, можно подключить к ChatGPT с помощью подсказки «найти утечку памяти» или «найти другой способ оптимального написания».

Однако важно помнить, что результаты, полученные с помощью этих моделей, должны быть проверены на качество, чтобы гарантировать их правильность. Также крайне важно убедиться, что вашей организации комфортно с данными, передаваемыми в модель, особенно при использовании потребительской версии ChatGPT.

ChatGPT Enterprise и Bing Chat Enterprise.

Для тех, кто обеспокоен конфиденциальностью данных, доступны частные версии ChatGPT, такие как ChatGPT Enterprise и Чат Bing Enterprise. Эти версии гарантируют, что передаваемые в них данные остаются в пределах границ вашей организации, обеспечивая дополнительный уровень безопасности.

Персонифицированное моделирование и оперативное проектирование

Еще одна эффективная стратегия при работе с большими языковыми моделями — моделирование на основе персон. Это включает в себя формулировку подсказок так, как если бы модель представляла собой конкретную личность, например, архитектора программного обеспечения или специалиста по поддержке конкретной технологии. Этот подход помогает модели лучше понять сценарий проблемы и генерировать более релевантные ответы.

Поскольку мы продолжаем исследовать возможности больших языковых моделей, становится ясно, что эти инструменты предлагают огромный потенциал в самых разных областях. Эти модели от оперативного проектирования до генерации кода открывают путь к инновационным решениям сложных проблем. Оставайтесь с нами, чтобы узнать больше об увлекательном мире искусственного интеллекта в наших предстоящих обсуждениях.

Рекомендуемые следующие шаги

Если вы хотите узнать больше об общих принципах, предписанных Microsoft, мы рекомендуем Платформа внедрения облака Microsoft для руководства на уровне платформы и среды, а также Хорошо спроектированная платформа Azure. Вы также можете зарегистрироваться на предстоящий семинар под руководством партнеров Azure по темам миграции и внедрения в облако, а также включать интерактивные лаборатории для обеспечения эффективного и прагматичного обучения.

Ты можешь читать Часть 1 этого блога, если вы только что прочитали Часть 2.

Вы можете просмотреть все видео ниже и посмотреть другие наши видео из Выставка возможностей Azure,

2024-01-04 23:02:32

1705323330
#Искусственный #интеллект #большие #языковые #модели #архитекторы #часть #из

Искусственный интеллект, большие языковые модели и архитекторы (часть 2 из 2)

Related

Leave a Comment Cancel reply

Share this:

Related

Leave a Comment Cancel reply