• normalizadores textuais, responsáveis pelo reconhecimento e substituição de algarismos, abreviaturas, abreviações, emojis e outros caracteres especiais, de forma a prover uma entrada mais uniforme para os sistemas de processamento de língua;
  • segmentadores de texto, tokenizadores e concordanciadores, responsáveis pelo reconhecimento das unidades linguísticas (como palavras, expressões multipalavras, frasemas, sentenças e parágrafos);
  • lematizadores e stemmers, responsáveis pela identificação de raízes, radicais e afixos;
  • etiquetadores morfossintáticos, responsáveis pela identificação das classes e atributos de palavras;
  • etiquetadores semânticos, responsáveis pela resolução de ambiguidades lexicais;
  • analisadores sintáticos, parciais (chunkers) ou completos (parsers), responsáveis pela extração da estrutura sintática das sentenças;
  • analisadores semânticos, responsáveis pela estrutura semântica das sentenças;
  • analisadores pragmáticos, responsáveis pela resolução de dêiticos e pela identificação de relações de coesão lexical;
  • analisadores textuais, responsáveis pela identificação de relações interfrásticas;
  • analisadores discursivos, responsáveis pela identificação de redundâncias, contradições, ambivalências, implicaturas e implicitudes;
  • analisadores retóricos, responsáveis pela identificação de elementos etóticos (relativos ao autor), logóticos (relativos à estrutura) e patéticos (relativos ao destinatário) dos textos.