Início | Falatório | Letras+ | Pibid | UnDF



Manual de coleta, correção e anotação de textos
Projeto CUTIA - CorpUs de Textos Induzidos Anotados • Versão 1.0

🎯 Escopo
O objetivo deste manual é padronizar procedimentos de coleta, digitalização, digitação, correção, avaliação e anotação de redações escolares para formação do corpus CUTIA.
📝 Coleta de Redações
  1. A coleta pode ocorrer em qualquer sala de aula da Educação Básica: Ensino Fundamental II (6º ao 9º anos), Ensino Médio (1º ao 3º anos) ou EJA.
  2. Os textos devem ser produzidos a partir de uma proposta de redação, que pode ser elaborada pelo coletor, pelo professor, ou retirada das provas aplicadas nos exames nacionais ou regionais (ENEM, PAS, vestibulares, etc.). Não serão aceitos textos sobre "tema livre" ou produzidos "espontaneamente".
  3. A proposta utilizada deve ser informada no formulário de cadastramento das redações.
  4. Não há nenhuma restrição quanto ao tipo ou gênero textual. Podem ser coletados textos dissertativos, narrativos, descritivos, injuntivos, etc.
  5. Serão aceitos apenas textos manuscritos com o mínimo de 7 linhas escritas.
  6. Deve ser informada série/ano escolar do autor; não deve ser incluído nenhum outro dado pessoal.
  7. O manuscrito deve ser integralmente anonimizado antes da digitalização.
Aviso sobre anonimização: remova nomes, apelidos, locais, assinaturas, referências identificáveis e metadados. A anonimização deve ser irreversível.
📷 Digitalização
  1. Digitalize a redação somente após a anonimização completa do manuscrito.
  2. Formato aceito: .jpg (imagem), com tamanho máximo de 2 MB por arquivo.
  3. Se a imagem exceder 2 MB, comprima usando ferramentas gratuitas online (ver Anexo B).
  4. Qualidade mínima: imagem nítida, bem iluminada, com todo o texto visível; evite sombras, cortes ou distorções de perspectiva.
✍️ Digitação
  1. A digitação deve ser fiel ao manuscrito, preservando todos os desvios ortográficos, gramaticais e de pontuação.
  2. Não efetue nenhuma correção durante a digitação.
  3. A translineação (quebras de linha/silabação no fim da linha) não precisa ser mantida; entretanto, a paragração original deve ser respeitada.
  4. Mantenha a distinção entre maiúsculas e minúsculas exatamente como no original.
  5. Em problemas de caligrafia/legibilidade:
    • Se for possível inferir o termo, coloque-o entre colchetes: [palavra].
    • Se o trecho for indecifrável, use [] para marcar a lacuna.
🔍 Correção

A correção consiste em identificar, no texto digitalizado e digitado, os segmentos que apresentam desvios em relação à norma esperada para o gênero e tipo textual propostos. Ela é realizada exclusivamente pelas ferramentas específicas da plataforma CUTIA, seguindo o protocolo abaixo.

Procedimento geral de correção
ℹ️ Procedimento: Para cada desvio identificado: (1) selecione o segmento com problema (palavra, frase ou período); (2) escolha a camada e o subtipo correspondentes; (3) preencha o campo de sugestões com a forma correta ou com a descrição explícita do problema.

Seleção do segmento: Selecione o menor trecho que contenha o problema: uma palavra, uma expressão ou, quando necessário, uma frase ou período inteiro. Evite selecionar trechos maiores do que o necessário.

Escolha da camada: Cada desvio deve ser classificado em uma das sete camadas descritas abaixo. Em caso de dúvida entre duas camadas, prefira a mais específica. Use "Outros" apenas quando o problema genuinamente não se encaixar em nenhuma das demais.

Campo de sugestões: Deve conter a forma correta, quando houver uma única alternativa evidente, ou uma descrição clara do problema, quando a correção depender de reformulação mais ampla ou de escolha do autor.

⚠️ Atenção: A correção não equivale a reescrita. O objetivo é apontar problemas e sugerir soluções, preservando, sempre que possível, as escolhas do autor. Em textos informais, coloquiais ou de gêneros não-padrão, avalie o desvio em relação à norma do gênero, não à norma culta escrita.
Camadas de correção

As sete camadas abaixo correspondem a diferentes dimensões da correção textual. Elas são ordenadas do nível mais local (a palavra) ao mais global (o discurso), facilitando a identificação e a classificação dos problemas.

C1 Ortografia

Engloba todos os desvios relacionados à forma gráfica das palavras: erros de grafia, acentuação incorreta ou ausente, uso equivocado de letras maiúsculas ou minúsculas, hífen e separação silábica (translineação).

Subtipos Instruções ao corretor Exemplos
  • Grafia (troca ou omissão de letras)
  • Acentuação (acento inexistente, ausente ou trocado)
  • Maiúsculas / minúsculas
  • Hífen (uso indevido ou ausência)
  • Separação silábica na translineação
  • Selecione a palavra com o problema.
  • Indique o subtipo: Grafia, Acentuação, Maiúsculas/minúsculas, Hífen ou Separação silábica.
  • No campo de sugestões, escreva a forma correta.
  • Em caso de dúvida, consulte o Acordo Ortográfico de 2009 e o Vocabulário Ortográfico da Língua Portuguesa (VOLP).
excessãoexceção
vocevocê
brasilBrasil
guarda roupaguarda-roupa
faz-se necessáriofaz-se necessário ✓
C2 Vocabulário

Compreende o uso inadequado de palavras em relação ao contexto comunicativo: escolhas lexicais imprecisas, palavras com sentido impróprio, uso de registro incompatível com o gênero (gírias, jargões, coloquialismos em textos formais; arcaísmos em textos contemporâneos). Não inclui erros de grafia (→ C1) nem de estrutura morfossintática (→ C3).

Subtipos Instruções ao corretor Exemplos
  • Escolha lexical inadequada / imprecisa
  • Gírias e slangs (em textos formais)
  • Jargões (em contextos inapropriados)
  • Coloquialismos (em textos formais)
  • Arcaísmos (em textos contemporâneos)
  • Estrangeirismos desnecessários
  • Eufemismos ou disfemismos inadequados
  • Selecione a palavra ou expressão problemática.
  • Identifique o subtipo e explique brevemente a inadequação no campo de sugestões.
  • Sugira uma alternativa mais adequada ao gênero e registro do texto.
  • Atenção: em textos informais, gírias e coloquialismos podem ser adequados. Avalie sempre em função do gênero proposto.
  • Não marque como vocabulário desvios que sejam erros de concordância ou regência (→ C3).
O governo tá errandoestá errando
a problematicidadeo problema / a dificuldade
input de dadosentrada de dados
outrossim (em texto informal)além disso
C3 Morfossintaxe

Cobre desvios relacionados à estrutura interna das palavras (morfologia) e às relações gramaticais entre elas na frase (sintaxe): formação incorreta de palavras, flexões inadequadas, problemas de concordância (verbal e nominal), regência (verbal e nominal) e uso de pronomes.

Subtipos Instruções ao corretor Exemplos
  • Estrutura / formação de palavras
  • Flexão (número, gênero, tempo, modo, pessoa)
  • Concordância verbal
  • Concordância nominal
  • Regência verbal
  • Regência nominal
  • Uso de pronomes (forma e colocação)
  • Uso de artigos e preposições
  • Selecione o segmento que contém o desvio (pode ser uma palavra ou a frase inteira, quando o problema for de concordância ou regência).
  • Indique o subtipo (ex.: Concordância verbal, Regência verbal).
  • No campo de sugestões, escreva a forma correta e, se necessário, explique brevemente a regra.
  • Para problemas de regência, indique a preposição correta e, se possível, cite o verbete do dicionário.
  • Para colocação pronominal, indique a posição correta (próclise, ênclise, mesóclise) e a justificativa.
os aluno foramos alunos foram
a gente fomosa gente foi
assistir o filmeassistir ao filme
Me dê (início de frase)Dê-me
C4 Frase

Contempla problemas na estrutura da frase como unidade sintática: pontuação, ordem dos constituintes, coordenação e subordinação inadequadas, além de estruturas frásicas truncadas ou ambíguas que dificultem a compreensão.

Subtipos Instruções ao corretor Exemplos
  • Pontuação (vírgula, ponto e vírgula, dois-pontos, ponto final, travessão, parênteses, aspas)
  • Ordem dos constituintes (hipérbato inadequado, topicalização problemática)
  • Anacoluto / frase truncada
  • Coordenação inadequada
  • Subordinação inadequada
  • Paralelismo sintático
  • Ruptura lógica na estrutura da frase
  • Selecione o trecho que apresenta o problema (pode ser toda a frase ou apenas o ponto de pontuação).
  • Identifique o subtipo.
  • No campo de sugestões: para pontuação, indique o sinal correto e a posição; para ordem e estrutura, proponha uma reformulação ou descreva o problema.
  • Diferencie problemas de pontuação que afetam a frase (→ C4) de problemas de coesão que afetam a relação entre frases (→ C5).
  • Para paralelismo, indique a estrutura esperada e sugira a reformulação.
Eu gosto, de estudarEu gosto de estudar
O homem que vi, ele fugiu.O homem que vi fugiu.
Gosto de nadar, correr e de andar de bike.nadar, correr e andar de bike (paralelismo)
Fui ao mercado. Sendo que estava cansado.Fui ao mercado, embora estivesse cansado.
C5 Coesão

Aborda os mecanismos que garantem a unidade do texto: uso de conectivos (conjunções, advérbios conectivos, preposições), referenciação (pronomes anafóricos e catafóricos, demonstrativos, artigos), substituição lexical e elipse. Problemas de coesão dificultam a progressão textual e a articulação entre frases e parágrafos.

Subtipos Instruções ao corretor Exemplos
  • Conectivos inadequados ou ausentes
  • Referenciação ambígua ou incorreta
  • Repetição desnecessária (ausência de substituição ou elipse)
  • Substituição inadequada (pronome ou sinônimo que não retoma corretamente o referente)
  • Elipse problemática (omissão que gera ambiguidade ou ruptura)
  • Falta de progressão temática
  • Selecione o segmento que concentra o problema coesivo (o conectivo, o pronome, o termo repetido ou o trecho sem coesão).
  • Para conectivos, indique o tipo de relação semântica esperada (adição, oposição, causalidade, temporalidade, etc.) e o conectivo adequado.
  • Para referenciação, identifique o referente esperado e explique a ambiguidade ou o erro.
  • Para repetição, sugira um pronome, sinônimo ou elipse adequada.
  • Quando o problema for de ausência de coesão entre parágrafos, selecione o início do segundo parágrafo e indique que falta articulação com o anterior.
Porém, ele também gosta de correr."Porém" indica oposição; usar "Além disso"
João disse a Pedro que ele estava errado.ambiguidade referencial; reformular
A educação é importante. A educação transforma.A educação é importante; ela transforma.
C6 Argumentação

Concerne à qualidade lógica e argumentativa do texto: identificação de falácias, contradições internas, ambiguidades semânticas, imprecisão de sentido e falta de embasamento das afirmações. Aplica-se principalmente a textos dissertativos, mas também a outros textos em que haja argumentação explícita ou implícita.

Subtipos Instruções ao corretor Exemplos
  • Falácia (argumento de autoridade indevido, ad hominem, generalização indevida, etc.)
  • Contradição interna
  • Ambiguidade semântica
  • Imprecisão / vagueza
  • Afirmação sem embasamento (ausência de evidência ou justificativa)
  • Raciocínio circular
  • Relação causal equivocada
  • Selecione o trecho que contém o problema argumentativo (pode ser uma frase, um período ou um parágrafo).
  • Identifique o subtipo e explique o problema no campo de sugestões.
  • Não proponha uma reescrita completa: descreva o problema e indique como poderia ser resolvido (ex.: falta evidência; incluir dado estatístico ou exemplo concreto).
  • Diferencie ambiguidade argumentativa (→ C6) de ambiguidade sintática por ordem dos constituintes (→ C4) ou por referenciação (→ C5).
  • Ao identificar falácias, nomeie o tipo e explique por que o argumento é falacioso.
Todo mundo sabe que a violência aumentou.generalização sem embasamento; citar fonte
Essa política é boa porque é boa.raciocínio circular; apresentar evidências
O Brasil é rico, então não há pobreza.contradição com a realidade; reformular
C7 Outros

Reservada para problemas que não se enquadrem em nenhuma das seis camadas anteriores. O uso desta camada deve ser excepcional e criterioso.

Instruções: Selecione o segmento problemático. No campo de sugestões, descreva o problema com precisão, indicando por que ele não se encaixa nas camadas C1 a C6, e proponha uma solução ou indique a natureza do desvio. Se o mesmo tipo de problema surgir repetidamente, entre em contato com a equipe do projeto para avaliar a inclusão de um novo subtipo em uma das camadas existentes.

📊 Avaliação

A avaliação é realizada de forma holística e global, após a leitura integral do texto, e independe da correção segmento a segmento. Ela reflete a qualidade geral do texto em cada um dos cinco critérios descritos abaixo.

Escala de pontuação

Cada critério é avaliado numa escala de 0 a 200 pontos, em intervalos de 40 pontos. A tabela abaixo descreve os seis níveis da escala:

Nota Nível Descrição geral
0 Ausente / Comprometido O critério está totalmente ausente ou compromete de modo grave a compreensão e a qualidade do texto.
40 Muito insuficiente Presença mínima do critério, com problemas graves e recorrentes que dificultam a leitura ou o propósito comunicativo.
80 Insuficiente O critério é contemplado parcialmente; os problemas são frequentes e afetam de forma considerável a qualidade do texto.
120 Mediano O critério é contemplado de forma satisfatória, embora com falhas pontuais que não chegam a comprometer seriamente a qualidade.
160 Bom O critério é bem desenvolvido, com poucas falhas; o texto revela domínio consistente do aspecto avaliado.
200 Excelente / Exemplar O critério é plenamente atendido e demonstra uso criativo, produtivo e acima da média; o texto vai além do esperado e serve como modelo.
⭐ Nota máxima (200): A nota 200 não é simplesmente a ausência de problemas. Ela deve refletir um uso produtivo, criativo e acima da média do critério avaliado: um texto que, naquele aspecto, se destaca claramente dos demais e serve como modelo.
Critérios de avaliação

Os cinco critérios abaixo correspondem, em linhas gerais, às cinco competências avaliadas nas redações do Exame Nacional do Ensino Médio (ENEM), mas se aplicam, com as devidas adaptações, a qualquer gênero e tipo textual coletado pelo projeto CUTIA.

A Modalidade

Avalia o domínio das convenções da escrita exigidas pelo gênero discursivo e pelo tipo textual propostos. Em textos formais (dissertações, artigos, relatórios), observa-se a conformidade com a norma culta da língua portuguesa: estruturas sintáticas adequadas, vocabulário formal, ausência de marcas de oralidade inadequadas. Em textos de outros gêneros (relatos, cartas pessoais, histórias em quadrinhos, etc.), o critério é a adequação à modalidade própria do gênero: em textos conversacionais ou orais, coloquialismos e regionalismos podem ser plenamente adequados.

Nota Nível Descrição
0 Ausente Problemas ortográficos, gramaticais e de registro tão graves que comprometem a compreensão do texto.
40 Muito insuficiente Desvios muito frequentes e graves da modalidade esperada; registro claramente inadequado ao gênero.
80 Insuficiente Desvios frequentes da modalidade esperada; o texto revela dificuldade em manter o registro adequado ao longo da produção.
120 Mediano A modalidade esperada é, em geral, mantida; ocorrem desvios pontuais que não chegam a comprometer o texto como um todo.
160 Bom Boa adequação à modalidade; desvios raros e de menor gravidade; o registro é consistente e coerente com o gênero.
200 Excelente Pleno domínio da modalidade exigida pelo gênero; uso criativo e expressivo das convenções da escrita, com variação de estruturas que evidencia repertório linguístico amplo.
B Informatividade

Avalia a capacidade de entender a proposta de redação e extrapolar o enunciado e o material de apoio fornecido, incorporando outras informações relevantes para o tema. O texto deve demonstrar domínio de referenciais culturais e conhecimentos de outras áreas (história, ciências, artes, filosofia, etc.), incluindo a intertextualidade (citações, referências literárias, alusões, paráfrases). Um texto com alta informatividade vai além do óbvio: traz dados, exemplos, referências culturais e perspectivas que enriquecem o tratamento do tema.

Nota Nível Descrição
0 Ausente O texto desconsidera a proposta ou a compreende de forma totalmente equivocada; ausência de informações relevantes.
40 Muito insuficiente Compreensão muito limitada da proposta; o texto repete apenas o que está no enunciado, sem acrescentar informações ou exemplos.
80 Insuficiente Compreensão parcial da proposta; o texto apresenta poucos dados ou exemplos, geralmente superficiais ou genéricos.
120 Mediano Compreensão adequada da proposta; o texto incorpora algumas informações além do enunciado, com uso satisfatório de exemplos.
160 Bom Boa compreensão da proposta; o texto traz informações pertinentes, com referências culturais ou de outras áreas do conhecimento.
200 Excelente Excelente compreensão e extrapolação da proposta; o texto demonstra repertório cultural diversificado, intertextualidade bem articulada e informações que surpreendem pela pertinência e profundidade.
C Analiticidade

Avalia a capacidade de selecionar, organizar e interpretar informações, fatos, opiniões e argumentos sobre o tema proposto. Em textos dissertativo-argumentativos, observa-se a construção do raciocínio: tese, argumentos, contra-argumentos, exemplos e conclusão. Em textos narrativos e descritivos, observa-se a construção da cenografia (contexto, espaço, tempo), o desenvolvimento das personagens e a coerência interna da história. Em textos injuntivos, observa-se a clareza e a completude das instruções.

Nota Nível Descrição
0 Ausente Ausência de raciocínio organizado; o texto é incoerente ou não desenvolve nenhuma ideia de forma reconhecível.
40 Muito insuficiente Raciocínio muito frágil; o texto apresenta ideias soltas, sem organização ou sem relação lógica entre elas.
80 Insuficiente Raciocínio parcialmente desenvolvido; o texto tem ideias, mas não as desenvolve ou não as organiza adequadamente.
120 Mediano Raciocínio satisfatório; o texto desenvolve o tema com clareza, embora sem profundidade analítica ou criativa.
160 Bom Bom raciocínio; o texto apresenta argumentos ou narrativa bem desenvolvidos, com organização clara e coerência interna.
200 Excelente Raciocínio excepcional; o texto demonstra capacidade analítica ou criativa acima da média, com argumentos ou construção narrativa originais, coerentes e persuasivos.
D Textualidade

Avalia a capacidade de fazer com que o texto seja uma unidade coesa e não um amontoado de frases ou parágrafos. O critério observa o uso de mecanismos coesivos (referenciação, substituição, elipse, conectivos, paralelismo, progressão temática), a articulação entre as partes do texto e a fluidez da leitura. Um texto com alta textualidade é aquele que o leitor consegue acompanhar sem percalços, em que cada frase e cada parágrafo se conectam naturalmente ao anterior e ao seguinte.

Nota Nível Descrição
0 Ausente O texto é fragmentado; as frases e os parágrafos não se articulam; a leitura é impossível ou extremamente difícil.
40 Muito insuficiente Coesão muito precária; há repetições excessivas, conectivos inadequados ou ausentes, e rupturas frequentes na progressão textual.
80 Insuficiente Coesão insuficiente; o texto apresenta problemas frequentes de articulação, embora seja possível acompanhar o raciocínio com esforço.
120 Mediano Coesão satisfatória; o texto é articulado, com uso adequado de conectivos e referenciação, embora com alguns percalços na leitura.
160 Bom Boa coesão; o texto flui com naturalidade; o uso de mecanismos coesivos é variado e adequado ao gênero.
200 Excelente Coesão exemplar; o texto demonstra domínio pleno dos mecanismos coesivos, com progressão textual fluida e articulação criativa entre as partes.
E Discursividade

Avalia a adequação do texto à situação comunicativa proposta: gênero, destinatário, propósito e contexto de circulação. Em dissertações para o ENEM, observa-se a exigência de um projeto de intervenção social (com agente, ação, modo/meio, efeito/finalidade e detalhamento). Em outras dissertações, avalia-se a eficácia argumentativa e a preocupação com o convencimento do leitor. Em cartas, observa-se a preocupação com o destinatário e a interação. Em textos narrativos, observa-se a adequação ao gênero (conto, crônica, fábula, etc.). Em todos os casos, avalia-se se o texto cumpre o propósito comunicativo para o qual foi produzido.

Nota Nível Descrição
0 Ausente O texto ignora completamente a situação comunicativa: gênero errado, propósito ausente, destinatário desconsiderado.
40 Muito insuficiente Adequação muito precária; o texto demonstra pouca consciência do gênero ou do propósito comunicativo proposto.
80 Insuficiente Adequação parcial; o texto contempla alguns aspectos da situação comunicativa, mas ignora outros relevantes (ex.: dissertação-ENEM sem proposta de intervenção).
120 Mediano Adequação satisfatória; o texto cumpre o propósito comunicativo básico, com alguma preocupação com o destinatário e o gênero.
160 Bom Boa adequação; o texto demonstra consciência clara do gênero, do destinatário e do propósito, com elementos discursivos bem desenvolvidos.
200 Excelente Adequação exemplar; o texto demonstra pleno domínio da situação comunicativa, com estratégias discursivas sofisticadas, preocupação evidente com o destinatário e cumprimento exemplar do propósito comunicativo.
ℹ️ Proposta de intervenção (ENEM): Em redações com proposta para o ENEM, o critério E deve considerar especificamente a presença e a qualidade da proposta de intervenção, que deve incluir: agente (quem vai agir), ação (o que será feito), modo ou meio (como será feito), efeito ou finalidade (para quê) e, idealmente, o detalhamento de pelo menos um desses elementos.
Orientações gerais para a avaliação
📌 Lembre-se: Avalie cada critério de forma independente dos demais. Um texto pode ter excelente repertório informativo (critério B) e, ao mesmo tempo, coesão precária (critério D). As notas de cada critério não precisam ser iguais nem próximas.
  • Avaliação holística: leia o texto integralmente antes de atribuir qualquer nota. A nota reflete a impressão global de cada critério, não a soma de acertos e erros pontuais.
  • Nota máxima: reserve a nota 200 para textos que genuinamente se destacam naquele critério. A ausência de problemas é condição necessária, mas não suficiente para a nota máxima.
  • Nota zero: atribua nota 0 apenas quando o critério estiver totalmente comprometido ou ausente, não quando houver problemas graves mas o critério ainda for reconhecível.
  • Adequação ao gênero: o parâmetro de avaliação é sempre o gênero e o tipo textual propostos. Um texto conversacional não deve ser avaliado pela norma da dissertação formal.
  • Consistência entre corretores: em caso de dúvida entre dois níveis adjacentes (ex.: 120 ou 160), prefira o nível inferior. A calibração entre corretores é feita periodicamente pela equipe do projeto.
🏷️ Anotação Linguística

A anotação linguística é um procedimento de marcação de fenômenos específicos no texto, realizado com objetivos de pesquisa definidos pelo anotador. Diferentemente da correção — que identifica desvios em relação a uma norma — a anotação é descritiva e neutra: ela não pressupõe erro nem acerto, mas simplesmente salienta ocorrências linguísticas de interesse.

⚠️ A anotação é opcional no Projeto CUTIA. Ela só deve ser realizada quando houver um objetivo de pesquisa claramente definido e um esquema de etiquetas (tagset) previamente estabelecido pela equipe responsável. Não anote textos sem um guia de anotação específico.
Anotação e correção: diferenças fundamentais

A tabela abaixo resume as principais diferenças entre os dois procedimentos:

✏️ Correção 🏷️ Anotação
Objetivo Identificar desvios em relação à norma do gênero Marcar fenômenos linguísticos de interesse para pesquisa
Pressuposto Há uma forma correta ou mais adequada Não há julgamento de valor; a ocorrência é apenas registrada
Obrigatoriedade Obrigatória para todos os textos do corpus Opcional; depende dos objetivos da pesquisa
Escopo Qualquer segmento com problema (palavra, frase, parágrafo, texto) Apenas os fenômenos definidos no guia de anotação específico
Etiquetas Camadas fixas C1–C7 (definidas neste manual) Tagset variável, definido a cada projeto de pesquisa
Campo de observações Forma correta ou descrição do problema Identificação do fenômeno, contexto ou nota interpretativa
Para que serve a anotação

A anotação permite criar subcorpora etiquetados que podem ser consultados, quantificados e analisados automaticamente. Exemplos de perguntas de pesquisa que a anotação pode responder:

  • Quais conectivos adversativos são mais usados por alunos do Ensino Médio?
  • Como os alunos estruturam a introdução em dissertações?
  • Quais figuras de linguagem aparecem em textos narrativos escolares?
  • Como se distribui o uso de metáforas conceituais ao longo do texto?
  • Quais estratégias de referenciação são empregadas na progressão temática?

Para cada pergunta desse tipo, é necessário um guia de anotação que defina: quais fenômenos serão marcados, quais etiquetas serão usadas, o que cada etiqueta significa e exemplos de aplicação.

Domínios de anotação

A tabela abaixo apresenta os principais domínios que podem ser objeto de anotação, com exemplos de fenômenos em cada um. Esta listagem é ilustrativa, não exaustiva: qualquer fenômeno linguístico observável no texto pode, em princípio, ser anotado.

🔗 Coesão e conectividade

  • Conectivos (aditivos, adversativos, causais, concessivos, temporais, etc.)
  • Pronomes anafóricos e catafóricos
  • Substituição lexical e sinonímia
  • Elipse e zeugma
  • Progressão temática (tema/rema)
  • Sequências de tópico

🏗️ Estrutura frasal e oracional

  • Tipos de oração (coordenada, subordinada, relativa)
  • Ordem dos constituintes (SVO, topicalização, deslocamento)
  • Voz verbal (ativa, passiva, reflexiva)
  • Estruturas de foco e ênfase
  • Paralelismo sintático
  • Fragmentação e anacoluto

🎭 Recursos retórico-estilísticos

  • Metáfora e metonímia
  • Comparação e símile
  • Hipérbole e eufemismo
  • Ironia e sarcasmo
  • Antítese e paradoxo
  • Anáfora e outros esquemas de repetição
  • Perguntas retóricas

🗣️ Estratégias discursivas

  • Modalização (epistêmica, deôntica, afetiva)
  • Polifonia e discurso relatado (direto, indireto, livre)
  • Marcadores de pressuposição e implicatura
  • Hedges (atenuadores) e boosters (intensificadores)
  • Marcas de interação com o leitor
  • Intertextualidade e citação

📐 Estrutura textual e genérica

  • Segmentação em macroestruturas (introdução, desenvolvimento, conclusão)
  • Movimentos retóricos (problema-solução, tese-argumento, etc.)
  • Marcadores de gênero (vocativo, fecho em cartas; título em artigos)
  • Sequências textuais (narrativa, descritiva, argumentativa, injuntiva)
  • Parágrafos temáticos e de transição

🔤 Léxico e morfologia

  • Campo semântico e rede lexical
  • Neologismos e empréstimos
  • Processos de formação de palavras (derivação, composição)
  • Variação lexical (regional, social, etária)
  • Tempo, aspecto e modalidade verbal
  • Determinação nominal (artigos, demonstrativos, possessivos)
Como realizar a anotação na plataforma CUTIA

A anotação é realizada exclusivamente pelas ferramentas específicas da plataforma CUTIA. O procedimento geral é:

  1. Tenha em mãos o guia de anotação do projeto. Nunca anote sem um guia que defina as etiquetas e os critérios de aplicação.
  2. Selecione o segmento a anotar — pode ser uma palavra, uma expressão, uma frase ou um bloco maior, conforme o fenômeno.
  3. Escolha a etiqueta (tag) correspondente ao fenômeno, conforme o guia.
  4. Preencha o campo de observações com informações adicionais, quando o guia assim o exigir (ex.: tipo de metáfora, referente do pronome, relação semântica do conectivo).
  5. Vincule a anotação ao nível pertinente (palavra, frase, parágrafo, texto, discurso), conforme indicado no guia.
📌 Consistência: Utilize sempre as etiquetas exatamente como definidas no guia de anotação. Em caso de dúvida sobre a aplicação de uma etiqueta a um caso específico, registre a ocorrência como DUVIDA e anote a justificativa no campo de observações. Não invente etiquetas novas sem aprovação da equipe.
Exemplo de anotação

O trecho abaixo ilustra como um mesmo excerto pode receber diferentes camadas de anotação, dependendo dos objetivos da pesquisa. Cada cor corresponde a um domínio de anotação distinto:

"A educação é fundamental para o desenvolvimento do país. No entanto, muitos jovens abandonam a escola precocemente por causa da necessidade de trabalhar. Essa situação precisa ser enfrentada com urgência."
CONEC-ADV = conectivo adversativo REF-GEN = referente genérico CONEC-CAUS = conectivo causal ANA-DEM = anáfora demonstrativa

Note que as anotações não implicam julgamento: "No entanto" é marcado como conectivo adversativo independentemente de estar bem ou mal empregado (isso seria objeto da correção, camada C5).

Fenômenos não previstos no guia

Para fenômenos não contemplados pelo guia de anotação em uso:

  • Selecione a etiqueta OUTROS (ou equivalente definido no guia).
  • Descreva o fenômeno com precisão no campo de observações.
  • Registre a ocorrência numa planilha de revisão do tagset, se a equipe mantiver uma.
  • Não deixe a ocorrência sem marcação: mesmo uma anotação provisória é mais útil do que a ausência de marcação.
ℹ️ Guias de anotação disponíveis: O Projeto CUTIA disponibiliza, separadamente, guias de anotação para projetos específicos. Consulte a equipe ou acesse a área de documentação do projeto para verificar quais guias estão ativos e disponíveis para download.
📋 Anexo A - Protocolo de Coleta e Digitalização de Dados

A LGPD (Lei 13.709/2018) considera que dados anonimizados não são dados pessoais (art. 12, caput). Portanto, o tratamento de dados anonimizados não requer consentimento do titular. No entanto, o projeto CUTIA adota uma abordagem ética e responsável, caracterizada pelas obrigações abaixo indicadas:

  • Realizar a coleta os dados de forma transparente, ética e responsável, com autorização de professores e alunos, sem prejudicar o andamento das aulas ou o processo de avaliação.
  • Informar aos participantes os objetivos e a metodologia do projeto, bem como o processo de anonimização dos dados.
  • Explicar aos participantes que os dados serão utilizados exclusivamente para fins de pesquisa, ensino e extensão, respeitando a legislação vigente e princípios éticos.
  • Garantir a segurança e a confidencialidade dos dados durante todo o processo.
  • Anonimizar integralmente os textos antes da digitalização, removendo todas as informações que possam identificar os autores, incluindo nomes, apelidos, iniciais, endereços, nomes de instituições, referências a familiares, eventos locais específicos ou outras informações que possam levar à identificação.
🛠️ Anexo B – Ferramentas úteis para compressão de imagens

Utilize uma das opções abaixo para reduzir arquivos .jpg acima de 2 MB antes do envio:

Dica: após a compressão, verifique legibilidade e integridade do texto antes do envio.