File: README.md

Recommend this page to a friend!

README.md

File:	`README.md`
Role:	Documentation
Content type:	`text/markdown`
Description:	Documentation
Class:	PHP Nano RAG Learn and ask questions using AI with RAG
Author:	By Rodrigo Faustino
Last change:
Date:	3 months ago
Size:	`5,526 bytes`

Download

Nano RAG for PHP

Nano RAG � uma biblioteca PHP de c�digo aberto que implementa uma arquitetura de Gera��o Aumentada por Recupera��o (RAG - Retrieval-Augmented Generation) utilizando puramente PHP e armazenamento em arquivos locais (JSON).

O projeto foi desenhado para ambientes onde bancos de dados vetoriais complexos (como Pinecone ou Milvus) n�o est�o dispon�veis, permitindo a cria��o de Agentes de IA com mem�ria persistente e contextual em servidores de hospedagem compartilhada.

Parte 1: Guia de Instala��o e Uso

Pr�-requisitos do Sistema

PHP 8.2 ou superior.
Composer para gerenciamento de depend�ncias.
Ollama rodando localmente ou em um servidor acess�vel via rede.

Configura��o do Ollama

O Nano RAG depende do Ollama para processamento de linguagem natural. Voc� precisa instalar o servidor e dois modelos espec�ficos: um para gerar vetores (Embeddings) e outro para o chat (LLM).

Baixe e instale o Ollama em ollama.com.
Abra seu terminal e execute os seguintes comandos para baixar os modelos necess�rios:

ollama pull nomic-embed-text ollama pull llama3.2

Nota: Voc� pode utilizar outros modelos, mas deve atualizar a configura��o na instancia��o da classe OllamaClient.

Instala��o da Biblioteca

Na raiz do seu projeto, execute a instala��o das depend�ncias (atualmente configurado para autoload PSR-4):

composer install

Para iniciar a interface web de demonstra��o:

Inicie um servidor PHP local: php -S localhost:8000
Acesse no navegador: http://localhost:8000

Como Utilizar

O sistema opera atrav�s de um fluxo de ingest�o (aprendizado) e consulta (chat).

1. Ingest�o de Dados (Aprendizado)

Para que a IA responda sobre seus dados, voc� deve "ensinar" o sistema enviando arquivos de texto (.txt). * O sistema l� o arquivo. * O texto � dividido em fragmentos menores (chunks). Cada fragmento � convertido em um vetor matem�tico e salvo naMem�ria de Longo Prazo*.

2. Realizando Consultas

Ao fazer uma pergunta, o sistema utiliza uma Camada de Aten��o para decidir se deve buscar a resposta nos arquivos que voc� enviou ou no hist�rico da conversa atual.

Parte 2: Aspectos T�cnicos e Arquitetura

O Nano RAG diferencia-se por sua arquitetura modular inspirada em processos cognitivos, dividida em tr�s pilares principais gerenciados por um orquestrador central.

1. O C�rebro (Brain Class)

A classe Brain atua como o controlador central. Ela n�o armazena dados, mas orquestra o fluxo de informa��es entre o cliente LLM (Ollama), as mem�rias e a camada de decis�o. � respons�vel por receber o input do usu�rio e devolver a resposta final processada.

2. Mem�ria de Longo Prazo (Long-Term Memory)

Fun��o: Armazenamento persistente de fatos e conhecimento "cristalizado".
Implementa��o: Utiliza arquivos JSON locais (`knowledge_base.json`).
T�cnica: Armazena o texto original junto com seu Embedding Vector.
Recupera��o: Utiliza o algoritmo de Similaridade de Cosseno para encontrar matematicamente qual texto no banco de dados � mais pr�ximo da pergunta do usu�rio. Funciona como uma biblioteca est�tica.

3. Mem�ria de Curto Prazo (Short-Term Memory)

Fun��o: Manter o contexto da conversa atual (sess�o), permitindo que a IA entenda refer�ncias como "ele", "aquilo" ou "a resposta anterior".
Implementa��o: Baseada em sess�es PHP (`$_SESSION`), mas enriquecida com vetores.
Diferencial: Diferente de arrays simples, esta mem�ria armazena o vetor de cada mensagem trocada. Isso permite que o sistema busque no hist�rico n�o apenas por ordem cronol�gica, mas por relev�ncia sem�ntica.

4. Camada de Aten��o (Attention Layer)

Este � o componente mais complexo do sistema, atuando como um filtro l�gico (Gatekeeper) antes de acionar a Intelig�ncia Artificial. Ela resolve o problema de alucina��o evitando enviar contexto irrelevante para o modelo.

A camada de aten��o decide dinamicamente a estrat�gia de resposta: Estrat�gia Retrieval:* Se a pergunta do usu�rio tem alta similaridade matem�tica com dados do JSON, a aten��o foca na Mem�ria de Longo Prazo. Estrat�gia Contextual:* Se a pergunta se conecta semanticamente com a frase anterior, a aten��o foca na Mem�ria de Curto Prazo. Estrat�gia Meta-Analysis:* Se o usu�rio pergunta sobre a pr�pria conversa (ex: "O que eu perguntei antes?", "Resuma o chat"), a camada ignora a matem�tica e recupera o hist�rico linear bruto, simulando uma mem�ria sequencial.

Conceitos Fundamentais: Vetores e Embeddings

Para que o PHP realize buscas sem�nticas sem um banco de dados externo, utilizamos o conceito de Embeddings.

O que � um Embedding? � uma representa��o num�rica de um texto. O modelo `nomic-embed-text` transforma uma frase como "O PHP � uma linguagem de script" em uma lista de 768 n�meros flutuantes (ex: `[0.123, -0.542, 0.991, ...]`).
Por que isso � necess�rio? Computadores n�o entendem significado, apenas n�meros. Ao transformar texto em n�meros, podemos calcular a dist�ncia geom�trica entre duas frases. * A frase "Eu gosto de ma��" ter� um vetor matematicamente muito pr�ximo de "Adoro frutas". * A frase "Eu gosto de ma��" ter� um vetor distante de "O servidor caiu".

O Nano RAG calcula essas dist�ncias nativamente em PHP para determinar o que � relevante para responder ao usu�rio.