PeerCheck: Mejorando las revisiones académicas generadas por LLM

PeerCheck analiza las diferencias entre las revisiones académicas de LLM y humanas, descubriendo que los LLM se centran en la teoría mientras que los humanos priorizan la metodología y los experimentos. El marco utiliza ingeniería de prompts como Chain-of-Thought y generación aumentada por recuperación, con CoT mejorando significativamente la calidad de las revisiones, aunque RAG introduce un 'paradoja' inesperada que a veces reduce la calidad.