Tradução automática, corretor ortográfico ou gramatical e assistentes virtuais/chatbots são aplicações amplamente utilizadas por usuários de tecnologia, todas relacionadas à área da Ciência da Computação, mais especificamente ao Processamento de Linguagem Natural (PLN). De maneira geral, o PLN ajuda computadores a entender, interpretar e manipular a linguagem humana.
O conceito de PLN, a geração de modelos, as aplicações, os domínios, as questões éticas, entre outros assuntos, são discutidos no livro Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. Em 36 capítulos, pesquisadoras(es) de diferentes universidades brasileiras e do exterior destacam aspectos deste campo de pesquisa. Ainda que a tecnologia avance rapidamente, tornando-se obsoleta e passível de ser substituída, a obra é relevante por apresentar um núcleo de conhecimento comum para quem trabalha na área. O material foi revisto, atualizado e ampliado para esta terceira edição, que está disponível gratuitamente. Alguns capítulos apresentam, além do texto, exemplos de código, uma palestra em vídeo das(os) autoras(es) e um conjunto de slides usado por elas(es).
“Este livro é a concretização de um desejo da área de PLN em ter um recurso didático sobre o processamento automático da nossa língua, escrito na nossa língua e de acesso livre, voltado principalmente a alunas(os), professoras(es) e outras(os) profissionais de PLN e Inteligência Artificial”, afirma a professora Paula Christina Figueira Cardoso, vinculada à Faculdade de Computação do Instituto de Ciências Exatas e Naturais da Universidade Federal do Pará (Icen/UFPA), que coassina dois capítulos no livro: Modelos discursivos e Sumarização Automática.
Em “Modelos discursivos”, apresentam-se fundamentações teóricas gerais sobre modelos de relações discursivas, descrevendo dois modelos discursivos relevantes nos estudos de PLN no mundo e no Brasil: a Rhetorical Structure Theory (RST) e a Cross-document Structure Theory (CST). Também são mostrados os principais recursos disponíveis e as aplicações em PLN que utilizaram modelos discursivos para sua constituição e/ou realização. Já em “Sumarização automática”, além de discutir conceitos importantes, são apresentados exemplos de algoritmos introdutórios e simples para que a(o) leitora(or) possa praticar a sumarização e aplicá-la em outros cenários.
“Antes da publicação deste livro, nossas referências eram pesquisas feitas para outras línguas, como a língua inglesa. Agora temos um livro escrito em português brasileiro, com aplicações e exemplos na nossa língua. Queremos que mais pessoas utilizem o livro e que mais pessoas possam colaborar com a escrita de outros capítulos, visto que, nesta área, as mudanças são muito rápidas”, comenta a professora Paula Cardoso. “Acreditamos que a parte de Aplicações é a que terá mais atualizações à medida que a comunidade crescer, indicando novos recursos e necessidades.”
Sobre – O livro Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações foi lançado durante o Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2024), que ocorreu em novembro de 2024, na Universidade Federal do Pará (UFPA). A obra resulta dos esforços da área de PLN, sobretudo do Grupo Brasileiras em PLN, que produziu a primeira versão do livro, lançada em setembro de 2023.