1️O que é Engenharia de Prompts?

A engenharia de prompts é a prática de projetar e otimizar instruções (prompts) para interagir eficazmente com modelos de linguagem de inteligência artificial. Essa técnica visa obter respostas mais precisas, relevantes e úteis desses sistemas.

Diretrizes para a Criação e Otimização de Prompts

A criação de prompts bem formulados e otimizados envolve:

Clareza e Precisão: Criar instruções específicas e bem estruturadas.
Contexto: Fornecer informações de fundo relevantes.
Exemplos: Incluir exemplos para orientar o modelo.
Restrições: Definir limites ou condições para as respostas.
Formato: Especificar o formato desejado para a saída.
Iteração: Refinar prompts com base nos resultados obtidos.

Entendendo os Parâmetros de Inferência

Os parâmetros de inferência são os ajustes e configurações que influenciam como o modelo de Inteligência Artificial gera previsões ou respostas quando está em uso. Eles são aplicados após o modelo ter sido treinado e ajudam a definir a forma como o modelo lida com novos dados.

Inferência é o processo de aplicar um modelo treinado a novos dados para gerar previsões, classificações ou respostas.

Dentre os principais parâmetros, temos:

Parâmetro

Descrição

Tipo de Aplicação

System prompts

Instruções iniciais que ajustam o comportamento e respostas do modelo conforme o contexto específico.

Sistemas que requerem personalização de comportamento em assistentes e suporte.

Temperature

Controla a "aleatoriedade" e "criatividade" das respostas; valores mais altos produzem respostas mais diversas, já os mais baixos resultam em saídas mais determinísticas.

Valores altos para aplicações que exigem criatividade (ex: geração de conteúdo), e baixos para as que exigem precisão (ex: suporte técnico).

Top P

Define a gama de opções para o próximo token; em valores inferiores a 1,0, são consideradas as mais prováveis e desconsideradas as menos prováveis.

Assistentes virtuais e chatbots para equilibrar diversidade e fluidez ao gerar saídas naturais e coerentes.

Top K

Limita a seleção de tokens aos K mais prováveis; útil para explorar variedade em um conjunto controlado de possíveis saídas.

Geração criativa (ex: histórias, diálogos para jogos).

Maximum Length

Define o número máximo de tokens na resposta; importante para respostas concisas.

Resumos e mensagens concisas em chatbots.

Stop Sequences

Strings específicas que fazem o modelo parar de gerar mais texto.

Controle de conteúdo em descrições e FAQs.

Para o Claude, um token representa aproximadamente 3,5 caracteres em inglês, mas o número exato pode variar a depender do idioma usado.

AnteriorExplorando o Claude 3 no Amazon Bedrock PróximoBoas Práticas de Engenharia de Prompts no Claude 3

Atualizado há 1 ano