- Léxicos, ou seja, listas de palavras com suas correspondentes classificações morfossintáticas;
- Glossários e bases terminológicas, conjuntos de palavras relativos a áreas específicas de conhecimento;
- Bases de conhecimento, ontologias, taxonomias e tesauros, com informações de relações interlexicais;
- Dicionários monolíngues, bilíngues ou plurilíngues, para tradução automática;
- Tree-banks: conjuntos de sentenças anotadas com suas correspondentes estruturas sintáticas;
- Gramáticas: conjuntos de regras para o processamento morfossintático da língua;
- Corpora, conjuntos de textos anotados, manual ou automaticamente, para extração de informação, validação de hipóteses e teste e treinamento de algoritmos de aprendizagem de máquina;
O Projeto Linguaral tem por objetivo o desenvolvimento de recursos linguísticos para o processamento automático do português. Trata-se da compilação e da construção de fontes de informação linguística para o sistema. Entre os recursos visados incluem-se: