- Natural Language Processing Techniques
- Topic Modeling
- Speech and dialogue systems
- Linguistics and Education Research
- Public Health in Brazil
- Education and Digital Technologies
- Advanced Text Analysis Techniques
- Social and Political Issues
- Cultural, Media, and Literary Studies
- linguistics and terminology studies
- Spanish Linguistics and Language Studies
- Linguistics and Discourse Analysis
- Wikis in Education and Collaboration
- Semantic Web and Ontologies
- Social and Cultural Studies
- Syntax, Semantics, Linguistic Variation
- Text Readability and Simplification
- Authorship Attribution and Profiling
- Social and Economic Solidarity
- Sentiment Analysis and Opinion Mining
- Language, Metaphor, and Cognition
- Education and Public Policy
- Discourse Analysis in Language Studies
- Linguistic Studies and Language Acquisition
- Network Time Synchronization Technologies
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento
1999-2022
Universidade Federal Fluminense
2020
University of Lisbon
2004-2019
Universidad de Valladolid
2019
University of Algarve
2019
University of Oslo
2012-2015
SINTEF
2009
Instituto Superior Técnico
2002
Instituto Politécnico de Lisboa
2002
Este artigo apresenta o Desafio de Identificação Personagens (DIP) em profundidade. Documenta a sua motivação, as escolhas feitas, desenrolar do processo organização, avaliação conjunta, e os resultados que podemos mostrar, assim como recursos compilados são públicos. Relatamos aprendemos com organização DIP sobre literatura português. Por exemplo, nas obras DIP, (1) número personagens femininas é muito inferior ao das masculinas, (2) existem sempre algumas referidas nomes diferentes na...
Neste artigo é descrita em pormenor a tarefa de identificação relações familiares no Desafio Identificação Personagens (DIP), uma avaliação conjunta para identificar personagens textos literários português. Explicamos motivação esta subtarefa, e quais as dificuldades criar coleção dourada com os valores corretos. Depois referir abstrato como se processa desta sub-tarefa, relatamos resultados do sistema participante, o PALAVRAS-DIP, comentamos alguns problemas na sua avaliação. Além disso,...
Resumo : Apresentamos aqui os resultados iniciais de um amplo estudo sobre o léxico do corpo humano e seus sentidos, realizado por meio da anotação revisão corpora grandes dimensões. Ao longo artigo explicitamos as decisões linguísticas subjacentes à anotação, relatamos resultado classes exploramos vasto material criado: corpus entrevistas (1,4 milhão palavras) literário (1,2 anotados integralmente revistos, demais projeto, parcialmente revistos. Todo está publicamente disponível para a...
In this paper we describe the first evaluation contest (track) for Portuguese whose goal was to detect and classify relations between named entities in running text, called ReRelEM. Given a collection annotated with belonging ten different semantic categories, marked all relationships them within each document. We used following fourfold relationship classification: identity, included-in, located-in, other (which later on explicitly detailed into twenty relations). provide quantitative...
In this paper, we present the current state of development a large-scale lexicon built at LabEL for Portuguese. We will concentrate on multiword expressions (MWE), particularly nouns, (i) illustrating their most relevant morphological features, and (ii) pointing out methods techniques adopted to generate inflected forms from lemmas. Moreover, describe corpus-based aproach acquisition new which led significant enlargement existing lexicon. Evaluation results concerning lexical coverage in...
For many NLP tasks, including named entity tagging, semi-supervised learning has been proposed as a reasonable alternative to methods that require annotating large amounts of training data. In this paper, we address the problem analyzing new data given NE tagger trained on from an earlier time period. We will show updating unlabeled is sufficient maintain quality over time, and outperforms labeled Furthermore, also augmenting with older in most cases does not result better performance than...