Escolher entre Fine-tuning, RAG ou um método híbrido para um chatbot com IA

Ao criar um chatbot inteligente, tens de escolher a abordagem técnica correta para o conceber. Dependendo do que queres que ele faça, a IA utilizada terá de ser ajustada! Atualmente, há dois métodos que dominam a engenharia de mensagens: Fine-tuning e RAG (Retrieval-Augmented Generation). Estas duas abordagens melhoram a relevância das respostas da IA, mas baseiam-se em lógicas bastante diferentes.

Try our awesome AI for free

Ask me anything...

Então, deves especializar um chatbot de IA com afinação, enriquecer as suas respostas com uma base de dados de documentos através do RAG, ou combinar os dois numa abordagem híbrida, que é frequentemente a mais eficaz?

Este artigo vai ajudar-te a compreender as diferenças entre o Fine-tuning e o Rag, as respectivas vantagens em função do teu perfil e, finalmente, alguns exemplos práticos de aplicação de cada método.

Afinação e Rag: definição para compreender melhor as diferenças

O Fine-tuning e o RAG são duas abordagens avançadas para melhorar o desempenho da IA de conversação, como o ChatGPT. Os dois métodos baseiam-se em lógicas muito diferentes, embora tenham o mesmo objetivo de aumentar a relevância e a personalização das respostas da IA.

O que é o ajuste fino na IA?

A afinação é uma técnica que consiste em especializar um modelo de inteligência artificial pré-treinado para o adaptar a uma tarefa específica.

Em termos práticos, trata-se de voltar a treinar a totalidade ou parte da IA num conjunto de dados restrito e específico, correspondente à tarefa ou ao domínio em questão. Este método permite ajustar os parâmetros do modelo (frequentemente as camadas superiores da rede neural da IA) para que este tenha um melhor desempenho em casos de utilização específicos, mantendo os conhecimentos gerais adquiridos durante a pré-treino.

Afinação na IA

O objetivo deste método de formação da IA é adaptá-la a necessidades comerciais específicas, a áreas de especialização ou a tarefas personalizadas.

Para aplicar o método de Afinação a uma IA, tens de :

Acrescenta conhecimentos específicos da profissão ou vocabulário especializado (jurídico, médico, etc.);
Adapta o tom da resposta ou a um estilo particular, por exemplo, mais formal, educativo, envolvente, etc;
Tem em conta casos especiais ou novos tipos de dados, para que a IA tenha um contexto preciso, ensinando-lhe o que ainda não sabe;
Melhora o desempenho em tarefas específicas, como a classificação de texto, imagens ou documentos comerciais.

Exemplo de aplicação do método Fine-tuning na IA

Segue-se um exemplo de aplicação do método de afinação em inteligência artificial, num determinado contexto empresarial:

Considera, por exemplo, uma sociedade de advogados que pretende utilizar uma IA generalista(como o Chat da Mistral AI) para ajudar os seus advogados a redigir documentos jurídicos e a analisar contratos.
Mas a IA :

Utiliza uma linguagem por vezes demasiado vaga ou inadequada ao jargão jurídico;
Não domina a legislação francesa recente;
Nem sempre interpreta corretamente casos complexos de direito do trabalho.

O objetivo do aperfeiçoamento será adaptar o modelo LLM ao :

Direito do trabalho francês (incluindo as últimas actualizações) ;
Vocabulário jurídico preciso ;
A estrutura esperada dos documentos jurídicos (acordos, cláusulas, avisos formais, etc.) ;
Casos reais tratados pela empresa.

O que é o RAG (Retrieval-Augmented Generation) em IA?

O Retrieval-Augmented Generation (RAG) é um método híbrido que combina dois módulos complementares:

Um módulo de recuperação de informação, que procura em tempo real documentos ou dados externos relevantes (base de conhecimentos, documentos internos, Web, etc.) com base no pedido do utilizador;
Um módulo generativo, que utiliza tanto a pergunta do utilizador como a informação recuperada para gerar uma resposta contextualizada, precisa e alinhada com as fontes que a IA consultou.

Um dos princípios fundamentais das RAG é a dissociação entre conhecimento (recuperação) e raciocínio (geração). A IA continua a ser geral, mas antes de responder, pesquisa numa base de dados ou em documentos actualizados. Depois, utiliza esta informação para formular uma resposta mais rica e actualizada ao que foi perguntado.

Ao contrário da afinação, o RAG não modifica os parâmetros internos do modelo de IA para o adaptar a um determinado contexto. Apoia-se numa base de conhecimentos externa, que permite :

Incorpora informações actualizadas ou específicas sem voltar a treinar o modelo;
Reduz os custos de manutenção e adaptação;
Acrescenta transparência, citando as fontes utilizadas para gerar a resposta.

O método RAG será particularmente vantajoso para :

Acede a dados internos da empresa não presentes nos dados de formação ;
Responde a perguntas que exigem informações recentes ou em evolução;
Limita as alucinações dos modelos generativos de IA, com base em factos verificáveis.

Exemplo de aplicação do método RAG na IA

Segue-se um exemplo de aplicação do método RAG na inteligência artificial, num determinado contexto empresarial:

Por exemplo, o departamento de RH de uma grande empresa pode querer utilizar uma IA de uso geral (como o ChatGPT) para ajudar os empregados a gerir questões internas de RH (férias, teletrabalho, formação, benefícios, procedimentos internos).

Mas a IA :

Por vezes, dá respostas vagas ou genéricas, não alinhadas com as regras internas;
Não conhece as políticas de RH da empresa (por exemplo, RTT, mobilidade interna, convenções colectivas);
Não se adapta às caraterísticas específicas dos diferentes sítios ou perfis de empregados.

O objetivo do método RAG é ligar a IA à :

Documentação interna de RH actualizada (políticas, manuais, procedimentos);
Acordos de empresa e guias específicos para cada entidade ou país;
Histórico de perguntas já feitas (FAQs internas, tickets de RH) ;
Os calendários e as regras em vigor em cada departamento ou região.

Comparação entre o aperfeiçoamento e as RAG

Em suma, eis a comparação entre os métodos Fine-tuning e RAG:

Afinação: um modelo é adaptado a uma tarefa específica, treinando-o novamente com novos dados. Ideal para requisitos altamente especializados ou tarefas em que o comportamento subjacente do modelo precisa de ser modificado.
RAG: enriquecemos dinamicamente as respostas do modelo, dando-lhe acesso a informações externas, sem afetar os seus parâmetros internos. Ideal para integrar os conhecimentos em evolução, garantir a atualidade e a verificabilidade das respostas e limitar os custos de manutenção.

	Afinação	RAG (Retrieval-Augmented Generation)
Princípio	Especializa o modelo num tema específico	A IA procura informações no documento
Modificação do modelo	Sim (regulação dos parâmetros internos)	Não (o modelo mantém-se inalterado)
Dados utilizados	Dados específicos para a tarefa em causa	Base de conhecimentos e documentação externa (interna ou na Web)
Adaptação a novos temas	Necessita de uma nova formação	Atualização da base de dados documental
Custo de manutenção	Superior (reciclagem, gestão de versões)	Mais fraco (atualização do documento)
Transparência	Fraco (origem da resposta difícil de rastrear)	Forte (a IA pode citar fontes)
Exemplos de utilização	Tradução especializada, deteção de objectos, etc.	Chatbot da empresa, FAQ dinâmicas, pesquisa de documentos

O que achas de uma abordagem híbrida dos dois métodos?

Longe de serem mutuamente exclusivos, os métodos de afinação e RAG podem ser estrategicamente combinados para tirar o melhor partido de ambas as abordagens. Esta combinação permite criar uma IA que seja simultaneamente especialista num domínio específico e capaz de aceder a dados actualizados. Por outras palavras, uma abordagem híbrida!

Nesta configuração híbrida :

Utiliza-se um ligeiro ajuste fino para especializar a IA numa tarefa ou num tipo de diálogo recorrente, ensinando-lhe o tom, a estrutura e as expectativas comerciais;
O RAG complementa esta experiência, permitindo-lhe obter informações precisas e actualizadas a partir de uma base de conhecimentos externa (interna à empresa ou ligada à Web).

Esta abordagem evita as duas armadilhas clássicas:

É um modelo afinado, mas estático, que não sabe o que há de novo;
Um modelo generalista que consulta documentos, mas não tem uma compreensão detalhada do contexto ou do negócio.

Exemplo de uma técnica híbrida de afinação da luz + RAG numa base especializada

Imagina um assistente de conversação com IA na área da medicina, concebido para orientar os doentes ou apoiar os profissionais de saúde:

Começamos com uma ligeira afinação

A IA é treinada em :

Diálogos reais entre doentes e médicos;
Intercâmbios anónimos de teleconsultas;
Instruções para triagem ou resposta médica.

Aprende a adotar um tom tranquilizador, a fazer as perguntas certas e a estruturar as suas respostas de acordo com o nível de urgência ou de especialidade.

Em seguida, utilizamos o RAG numa base de dados (neste caso, uma base de dados médica actualizada)

Ao mesmo tempo, a IA está ligada à :

Uma base de dados regularmente actualizada de sintomas e patologias (por exemplo, OMS, bases de dados internas dos hospitais);
Recomendações clínicas, protocolos e actualizações científicas.

Quando interage com um doente, a IA pode contextualizar as suas respostas graças a esta base de informações verificadas. Também integra a lógica de conversação adquirida através do aperfeiçoamento.

diferença afinação fina-rag prompt engenharia chatgpt chatbot ia

Estudos de casos e exemplos entre RAG e Afinação

Quando é que o RAG deve ser utilizado?

FAQs dinâmicas ou regulamentares (banca, seguros) ;
Base de dados documental extensa ou frequentemente actualizada;
Requisitos de rastreabilidade (conformidade, legais) ;
Chatbots multilingues: base de documentos traduzíveis.

Quando deves utilizar o ajuste fino?

Chatbot assistente de RH ou apoio técnico interno com poucos documentos, mas com necessidade de um diálogo fluido ;
Casos em que a velocidade de execução do modelo é crucial (sem fase de pesquisa);
Aplicações offline ou incorporadas.

Que estratégia deves adotar para conceber um chatbot de alto desempenho?

Para te dar uma ideia, aqui estão alguns exemplos de recomendações, de acordo com as áreas profissionais, para a conceção de um chatbot inteligente:

Startup/PME: começa com o RAG e repete-o rapidamente ;
Empresas com dados altamente sensíveis: afinação interna + possibilidade de auditoria ;
Grupo com uma base documental rica: RAG + camada de classificação inteligente ;
Necessidade de um chatbot de conversação forte, com uma abordagem UX: afinação + RLHF (reforço por feedback humano) + persona.