Area: Inteligencia Artificial
sub-area: Processamento de Linguagem Natural
Objetivos gerais
A linguagem natural é aquela com a qual nos comunicamos (ao contrário
da artificial como C, Fortran, etc.). Exemplo: português, inglês, etc.
Este processamento pode ser sobre textos escritos ou voz.
A nossa pesquisa em processamento de linguagem natural enfoca
textos escritos. Nesta área diversos trabalhos estão sendo realizados mundialmente e envolvem
etiquetadores (associar cada palavra à sua categoria morfológica dentro de um contexto), analisadores sintáticos, e em especial "machine translation" ou tradução automática.
A tradução automática envolve a análise do texto de entrada (através de etiquetadores e analisadores sintáticos) e a conversão para o texto de sáida. Este trabalho é realmente sofisticado e é nele que estamos concentrando mais esforços.
Equipe
- prof. Dr. Jorge Kinoshita
- prof. Dr. João José Neto
- Carlos Menezes - mestre EPUSP, orientador: João José Neto.
- José Fontebasso Neto - mestrando, orientador: Jorge Kinoshita
Trabalhos publicados
- prof. Dr. Jorge Kinoshita: http://www.pcs.usp.br/~jkinoshi
- Carlos Dantas Menezes: dissertação sobre etiquetadores sob orientação do prof. Dr. João José Neto; veja na Biblioteca da Elétrica
Curso de pós-graduação: processamento de linguagem natural
Veja: http://www.pcs.usp.br/~jkinoshi/pos99.html
Pelo programa do curso, pode-se observar que estamos procurando utilizar
tecnicas de machine learning no aprendizado de características da
linguagem. Um exemplo bem sucedido eh o etiquetador de Eric Brill (ver
pos99.html). Este etiquetador eh um programa que associa a cada palavra
de uma sentenca a sua etiqueta ou categoria morfologica. Por exemplo: em
"the machine will display it", a palavra "display" eh um verbo e nao um
substantivo e o etiquetado consegue neste caso descobrir isso.
Convite
Junte-se a nós! Se você já parou para pensar como adquirimos a linguagem, ou porque podemos classificar um objeto como "mesa" sem que nunca o tivéssemos visto antes, ou até que ponto informações são perdidas e/ou acrescentadas no processo de tradução, venha e fale conosco.