- normalizadores textuais, responsáveis pelo reconhecimento e substituição de algarismos, abreviaturas, abreviações, emojis e outros caracteres especiais, de forma a prover uma entrada mais uniforme para os sistemas de processamento de língua;
- segmentadores de texto, tokenizadores e concordanciadores, responsáveis pelo reconhecimento das unidades linguísticas (como palavras, expressões multipalavras, frasemas, sentenças e parágrafos);
- lematizadores e stemmers, responsáveis pela identificação de raízes, radicais e afixos;
- etiquetadores morfossintáticos, responsáveis pela identificação das classes e atributos de palavras;
- etiquetadores semânticos, responsáveis pela resolução de ambiguidades lexicais;
- analisadores sintáticos, parciais (chunkers) ou completos (parsers), responsáveis pela extração da estrutura sintática das sentenças;
- analisadores semânticos, responsáveis pela estrutura semântica das sentenças;
- analisadores pragmáticos, responsáveis pela resolução de dêiticos e pela identificação de relações de coesão lexical;
- analisadores textuais, responsáveis pela identificação de relações interfrásticas;
- analisadores discursivos, responsáveis pela identificação de redundâncias, contradições, ambivalências, implicaturas e implicitudes;
- analisadores retóricos, responsáveis pela identificação de elementos etóticos (relativos ao autor), logóticos (relativos à estrutura) e patéticos (relativos ao destinatário) dos textos.