Este artigo apresenta o Svarna, uma bancada de trabalho de corpus gratuita, de código aberto e baseada na web, projetada para preencher lacunas na tecnologia do grego moderno integrando cinco bancos de dados distintos. A plataforma consolida mais de 507 milhões de palavras e aproximadamente 29 milhões de sentenças de registros institucionais, literários, dialetais, de redes sociais e históricos em uma única interface acessível sem login ou instalação.

  • Integra cinco bancos de dados cobrindo vários registros para fornecer mais de 507 milhões de palavras e cerca de 29 milhões de sentenças.
  • Oferece um concordancer com marcação KWIC, análise de frequência com normalização registro por registro e extração de collocations usando informação mútua.
  • Inclui um dicionário de 93 marcadores do discurso grego, ferramentas de análise em nível de texto para n-grams e variantes, e comparação de registros via log-ratio.
  • Apresenta busca por expressões regulares e uma camada LLM opcional para anotação pragmática e modo de pesquisa livre.
  • Construído sobre índices de texto completo SQLite FTS5 com um backend FastAPI, implantado como contêineres Docker no Azure sob a licença MIT.

O Svarna serve como uma ferramenta fundamental para explorar os dados gregos disponíveis e espera-se que suporte pesquisas mais abrangentes no futuro.