Быстрый инжиниринг


Быстрая инженерия — это концепция искусственного интеллекта , в частности, обработки естественного языка (NLP). В оперативной инженерии описание задачи, которую должен выполнить ИИ, встраивается во входные данные, например, в виде вопроса, а не дается явно. Быстрая разработка обычно работает путем преобразования одной или нескольких задач в набор данных на основе подсказок и обучения языковой модели с помощью того, что было названо «обучением на основе подсказок» или просто «обучением подсказок». [1] [2]

Языковые модели GPT -2 и GPT-3 были важными шагами в области быстрой разработки: обученные на больших объемах текста с использованием методов глубокого обучения , они получили возможность генерировать выходные данные, которые напоминают текст, созданный человеком. [3]

В 2021 году исследователи точно настроили одну генеративно предварительно обученную модель (T0) на выполнение 12 задач НЛП (с использованием 62 наборов данных, поскольку каждая задача может иметь несколько наборов данных) показала хорошую производительность на новых задачах, превзойдя модели, обученные непосредственно на выполнении одной задачи (без предварительной подготовки). . Чтобы решить задачу, T0 дается задание в структурированной подсказке, например, If {{premise}} is true, is it also true that {{hypothesis}}? ||| {{entailed}}.подсказка, используемая для того, чтобы заставить T0 решить следствие . [4]

В методе, называемом подсказкой по цепочке мыслей (CoT), языковой модели давали несколько примеров задачи, что улучшало ее способность рассуждать . [5] Широкая доступность этих инструментов была обусловлена ​​публикацией нескольких записных книжек с открытым исходным кодом и проектов по синтезу изображений под руководством сообщества. [6]

Репозиторий подсказок сообщил, что в феврале 2022 года было доступно более 2000 общедоступных подсказок для примерно 170 наборов данных. [7]

Модель компьютерного зрения Meta 's Segment Anything — это основанная на подсказках модель для создания масок для объектов на изображениях. Его можно вызвать несколькими способами, например, выбрать несколько «положительных» и «отрицательных» точек, чтобы создать маску, которая включает все положительные точки и исключает все отрицательные точки. [8]