Как элементы ввода влияют на производительность большой языковой модели
Группа провела анализ популярной мультимодальной LLM GPT-4V, которая оценивает данные как из текста, так и из изображений, чтобы лучше понять, как различные входные элементы влияют на производительность этих моделей при постановке дифференциальных диагнозов. Были изучены четыре типа входных данных: изображения без модификаторов, аннотации, истории болезни и описания изображений. Используя несколько комбинаций этих входных данных, GPT-4V … Read more