Um estudo sobre aprendizagem distribucional de categorias sintáticas no português brasileiro
Resumo
Em Redington et al. (1998), o potencial da informação distribucional na categorização lexical do inglês é analisado com base em uma série de experimentos computacionais. Tomando-o como base, propomos replicar experimentos e análises conduzidos ali sobre dados do português brasileiro (PB), contribuindo para uma avaliação translinguística. Os corpora consistirão em dois conjuntos de dados: dados de fala dirigida à criança e dados de diálogos entre adultos. Os primeiros serão compilados a partir da Coleção "Projeto de Aquisição da Linguagem Oral" e dos dados do PB disponíveis na base CHILDES. O segundo conjunto será obtido na plataforma NURC ("Projeto Norma Linguística Urbana Culta - RJ").Downloads
Publicado
2018-08-09
Edição
Seção
Artigos