Cristina Mota

ORCID: 0000-0001-8127-8503
Publications
Citations
Views
---
Saved
---
About
Contact & Profiles
Research Areas
  • Natural Language Processing Techniques
  • Topic Modeling
  • Speech and dialogue systems
  • Linguistics and Education Research
  • Public Health in Brazil
  • Education and Digital Technologies
  • Advanced Text Analysis Techniques
  • Social and Political Issues
  • Cultural, Media, and Literary Studies
  • linguistics and terminology studies
  • Spanish Linguistics and Language Studies
  • Linguistics and Discourse Analysis
  • Wikis in Education and Collaboration
  • Semantic Web and Ontologies
  • Social and Cultural Studies
  • Syntax, Semantics, Linguistic Variation
  • Text Readability and Simplification
  • Authorship Attribution and Profiling
  • Social and Economic Solidarity
  • Sentiment Analysis and Opinion Mining
  • Language, Metaphor, and Cognition
  • Education and Public Policy
  • Discourse Analysis in Language Studies
  • Linguistic Studies and Language Acquisition
  • Network Time Synchronization Technologies

Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento
1999-2022

Universidade Federal Fluminense
2020

University of Lisbon
2004-2019

Universidad de Valladolid
2019

University of Algarve
2019

University of Oslo
2012-2015

SINTEF
2009

Instituto Superior Técnico
2002

Instituto Politécnico de Lisboa
2002

Este artigo apresenta o Desafio de Identificação Personagens (DIP) em profundidade. Documenta a sua motivação, as escolhas feitas, desenrolar do processo organização, avaliação conjunta, e os resultados que podemos mostrar, assim como recursos compilados são públicos. Relatamos aprendemos com organização DIP sobre literatura português. Por exemplo, nas obras DIP, (1) número personagens femininas é muito inferior ao das masculinas, (2) existem sempre algumas referidas nomes diferentes na...

10.21814/lm.15.1.399 article PT cc-by Linguamática 2023-07-04

Neste artigo é descrita em pormenor a tarefa de identificação relações familiares no Desafio Identificação Personagens (DIP), uma avaliação conjunta para identificar personagens textos literários português. Explicamos motivação esta subtarefa, e quais as dificuldades criar coleção dourada com os valores corretos. Depois referir abstrato como se processa desta sub-tarefa, relatamos resultados do sistema participante, o PALAVRAS-DIP, comentamos alguns problemas na sua avaliação. Além disso,...

10.21814/lm.15.1.402 article PT cc-by Linguamática 2023-07-04

Resumo : Apresentamos aqui os resultados iniciais de um amplo estudo sobre o léxico do corpo humano e seus sentidos, realizado por meio da anotação revisão corpora grandes dimensões. Ao longo artigo explicitamos as decisões linguísticas subjacentes à anotação, relatamos resultado classes exploramos vasto material criado: corpus entrevistas (1,4 milhão palavras) literário (1,2 anotados integralmente revistos, demais projeto, parcialmente revistos. Todo está publicamente disponível para a...

10.17851/2237-2083.23.3.641-680 article PT cc-by Revista de Estudos da Linguagem 2015-12-22

In this paper we describe the first evaluation contest (track) for Portuguese whose goal was to detect and classify relations between named entities in running text, called ReRelEM. Given a collection annotated with belonging ten different semantic categories, marked all relationships them within each document. We used following fourfold relationship classification: identity, included-in, located-in, other (which later on explicitly detailed into twenty relations). provide quantitative...

10.3115/1621969.1621992 article EN 2009-01-01

In this paper, we present the current state of development a large-scale lexicon built at LabEL for Portuguese. We will concentrate on multiword expressions (MWE), particularly nouns, (i) illustrating their most relevant morphological features, and (ii) pointing out methods techniques adopted to generate inflected forms from lemmas. Moreover, describe corpus-based aproach acquisition new which led significant enlargement existing lexicon. Evaluation results concerning lexical coverage in...

10.3115/1610042.1610060 article EN 2004-01-01

For many NLP tasks, including named entity tagging, semi-supervised learning has been proposed as a reasonable alternative to methods that require annotating large amounts of training data. In this paper, we address the problem analyzing new data given NE tagger trained on from an earlier time period. We will show updating unlabeled is sufficient maintain quality over time, and outperforms labeled Furthermore, also augmenting with older in most cases does not result better performance than...

10.3115/1667583.1667693 article EN 2009-01-01
Coming Soon ...