×
[Vídeo] Introdução à Linguística Computacional:
Introdução
Inscreva-se
Alana for innovation

[Vídeo] Introdução à Linguística Computacional

A Juliana Porto, que faz estágio conosco no time de Inteligência Artificial, foi convidada para uma live no canal EstaTiDados para bater um papo sobre…

Tempo de leitura: 7 min

A Juliana Porto, que faz estágio conosco no time de Inteligência Artificial, foi convidada para uma live no canal EstaTiDados para bater um papo sobre Linguística Computacional. Segundo ela, podemos arriscar e dizer que uma das grandes profissões do futuro estarão nas mãos de linguistas computacionais. Juliana é pesquisadora e estudante de Letras na Universidade de Brasília. Após um momento de curiosidade insana, decidiu direcionar sua carreira para Linguística Computacional e hoje também faz parte do Grupo de Estudos em Linguística Computacional (GeLinG). 

Assista ao vídeo completo:

Introdução à Linguística

De forma mais objetiva, Linguística nada mais é que uma ciência que estuda a linguagem verbal humana e seus diversos aspectos linguísticos.

Dentro desse campo, há algumas ramificações e divisões da Linguística que são de extrema importância para entender antes de entrarmos nas aplicações em Linguística Computacional e como a Inteligência Artificial pode conversar com esta área.

Divisões da Linguística:

Fonética: Estudo dos fones e como são produzidos, percebidos e quais aspectos fisiológicos são envolvidos para as produções dos sons. Por exemplo, a entrada e saída de ar, posição da nossa língua, grau de abertura da boca e como o nosso corpo responde durante todo o processo.

Fonologia: Estudo dos fonemas e sua função dentro do sistema da língua. Exemplos: Variação regional, nasalização fonológica, assimilação de algum fonema, dentre outros processos.

Morfologia: Estudo da estrutura e formação das palavras. Nessa ramificação, estuda-se como as palavras são formadas e quais são os processos que as palavras podem passar.

Sintaxe: Estuda a relação entre palavras e orações que se relacionam dentro de um período. Exemplificando, como as palavras estão estruturadas dentro de uma oração e a hierarquia dessas palavras quando mudadas de idioma para idioma.

Semântica: Estudo do sentido das palavras e interpretação dos enunciados
O foco na semântica está no sentido que a palavra pode ter.

Pragmática: Estuda a relação dos elementos linguísticos e o contexto dos falantes. Sejam eles históricos, socioeconômicos ou afetivos, são identificados para poder fazer a construção do entendimento de um enunciado.

Linguística aplicada à Inteligência Artificial

Como abordado brevemente no início, a Linguística Computacional é um campo que estuda e manipula o processamento computacional das linguagens naturais humanas. Dentro da Linguística Computacional é possível dividir didaticamente duas áreas: Linguística de Corpus e Processamento de Linguagem Natural (NLP).

Linguística de Corpus – Um corpus linguístico de base computacional corresponde a coleções de textos que ocorrem naturalmente na língua, organizadas sistematicamente para representar áreas de uso da língua, e das quais podemos extrair novas informações (BIBER, 1995, p. 31). Hunston (2002, p. 23) diz que “a corpus can offer evidence, but can not give information”, isto é, um corpus pode oferecer evidências, mas não pode dar informações. São os linguistas que produzirão novas informações, teóricas ou aplicadas, a partir do corpus.

NLP – Processamento de linguagem natural (NLP) é uma vertente da inteligência artificial que ajuda computadores a entender, interpretar e manipular a linguagem humana. O NLP resulta de diversas disciplinas, incluindo ciência da computação e linguística computacional, que buscam preencher a lacuna entre a comunicação humana e o entendimento dos computadores. Estuda a linguagem mais voltada para a criação de software, aplicativos e ferramentas computacionais como por exemplo os tradutores de texto e chatbots. 

Áreas de atuação da Linguística Computacional

Reconhecimento de fala: Aplicativos com reconhecimento de comandos de voz, pesquisa através de fala, assistentes de voz.

Síntese de voz: Programas capazes de gerar fala a partir de dados como, por exemplo, alguns dicionários disponíveis. Ex: App para aprender idiomas Duolingo.

Chatbot: Oferecer ferramenta para atendimento ao cliente humanizado com capacidade de interação e reconhecimento de variações linguísticas.

Tradução Automática: Processo automático de tradução de um determinado idioma para outro por meio de um software.

Análise de Sentimento: Referente ao uso de processamento de linguagem natural e análise textual para estudar e identificar sistematicamente estados afetivos e informações subjetivas.

Sumarização de textos: Desenvolvimento de software que busca extrair palavras-chave ou informações que sejam importantes dentro do texto afim de gerar um resumo, podendo reduzir os números de páginas, selecionando os pontos principais de um texto. Como exemplo, o APP 12 min em que criam um micro-book a partir da leitura dos livros e, de forma sintetizada, otimizada e única, o torna possível para consumir em menos de 12 minutos.

Indicações

Juliana aproveitou para finalizar a live deixando 6 recomendações de livros para introdução à área de Linguística Computacional e que, segundo ela, foram essenciais para seu conhecimento desse campo.