Un usuario detalla un pipeline de investigación web totalmente local para agentes de IA que evita todas las llamadas a APIs en la nube. La arquitectura incluye capas: SearXNG autoalojado para búsqueda, la capa de caché/índice Hister, rnet (ahora wreq) para fetches HTTP con TLS fingerprinting, y Camoufox como navegador headless de respaldo.
- SearXNG maneja las consultas de búsqueda iniciales localmente.
- Hister almacena cada página obtenida para asegurar que las búsquedas repetidas sean instantáneas y preservar el contenido incluso si las páginas cambian o desaparecen.
- rnet (ahora wreq) evita medidas básicas anti-bot usando TLS fingerprinting.
- Camoufox renderiza páginas con mucho JS que requieren interacción completa del navegador.
- Un qwen3-reranker-4b local puntúa la relevancia, con todos los componentes comunicándose a través de un MCP server.
Se destaca la capa de caché como el componente más valioso para mantener el acceso al contenido original. Toda la pila se ejecuta en una sola caja junto con modelos de inferencia sin dependencias externas.