PDT-C 2.0 presenta un corpus checo uniformemente anotado y diversificado por género, de casi 4 millones de tokens. Incluye representaciones de significado y fenómenos interoracionales como la co-referencia y las relaciones discursivas, y está acompañado de lexicons totalmente compatibles. El recurso está disponible bajo una licencia CC BY-NC-SA.
Se lanza PDT-C 2.0 consolidado
Traducido del English → Español