Linguística Computacional

Hans Uszkoreit

O QUE É LINGUÍSTICA COMPUTACIONAL ?
 

A linguagem humana é um quebra-cabeça muito emocionante e exigente.

Ensinamos os computadores a se comunicarem com as pessoas. A linguística computacional aplicada (CL) concentra-se no resultado prático da modelagem do uso da linguagem humana. Os métodos, técnicas, ferramentas e aplicações nesta área são muitas vezes agrupados sob o termo engenharia da linguagem ou tecnologia da linguagem (humana). Embora os sistemas CL existentes estejam longe de alcançar a capacidade humana, eles têm inúmeras aplicações possíveis. O objetivo é criar produtos de software que tenham algum conhecimento da linguagem humana. Esses produtos vão mudar nossas vidas. Eles são necessários com urgência para melhorar a interação homem-máquina, pois o principal obstáculo na interação entre homem e computador é um problema de comunicação. Os computadores de hoje não entendem nossa linguagem, mas as linguagens de computador são difíceis de aprender e não correspondem à estrutura do pensamento humano. Mesmo que a linguagem que a máquina entenda e seu domínio de discurso sejam muito restritos, o uso da linguagem humana pode aumentar a aceitação do software e a produtividade de seus usuários.

Software amigável deve ouvir e falar.

As interfaces de linguagem natural permitem que o usuário se comunique com o computador em francês, inglês, alemão ou outro idioma humano. Algumas aplicações de tais interfaces são consultas de banco de dados, recuperação de informações de textos, os chamados sistemas especialistas e controle de robôs. Os avanços atuais no reconhecimento da linguagem falada melhoram a usabilidade de muitos tipos de sistemas de linguagem natural. A comunicação com computadores usando a linguagem falada terá um impacto duradouro no ambiente de trabalho, áreas de aplicação completamente novas para a tecnologia da informação serão abertas. No entanto, a linguagem falada precisa ser combinada com outros modos de comunicação, como apontar com o mouse ou com o dedo. Se essa comunicação multimodal for finalmente incorporada a um modelo geral eficaz de cooperação, conseguimos transformar a máquina em parceira.

As máquinas também podem ajudar as pessoas a se comunicarem umas com as outras.

Muito mais antigos que os problemas de comunicação entre seres humanos e máquinas são aqueles entre pessoas com diferentes línguas maternas. Um dos objetivos originais da linguística computacional aplicada sempre foi a tradução totalmente automática entre línguas humanas. Por amarga experiência, os cientistas perceberam que ainda estão longe de alcançar a ambiciosa meta de traduzir textos irrestritos. No entanto, os linguistas computacionais criaram sistemas de software que simplificam o trabalho de tradutores humanos e claramente melhoram sua produtividade. Traduções automáticas menos que perfeitas também podem ser de grande ajuda para os buscadores de informações que precisam pesquisar grandes quantidades de textos em línguas estrangeiras.

A linguagem é o tecido da web.

O rápido crescimento da Internet/WWW e a emergência da sociedade da informação colocam novos e excitantes desafios à tecnologia da linguagem. Embora as novas mídias combinem texto, gráficos, som e filmes, todo o mundo da informação multimídia só pode ser estruturado, indexado e navegado por meio da linguagem. Para navegar, navegar, filtrar e processar as informações na web, precisamos de um software que consiga acessar o conteúdo dos documentos. A tecnologia da linguagem para gerenciamento de conteúdo é uma pré-condição necessária para transformar a riqueza da informação digital em conhecimento coletivo. A crescente multilinguagem da web constitui um desafio adicional para a nossa disciplina. A web global só pode ser dominada com a ajuda de ferramentas multilíngues para indexação e navegação.

Nossa disciplina combina visões ambiciosas e aplicações realistas.

Ainda não sabemos muito bem como as pessoas produzem e compreendem a linguagem. No entanto, nossa compreensão dos intrincados mecanismos subjacentes ao processamento da linguagem humana continua crescendo. A modelagem desses mecanismos em um computador também nos ajuda a descobrir e descrever formalmente propriedades ocultas da linguagem humana que são relevantes para qualquer tipo de processamento de linguagem, incluindo muitos aplicativos de software úteis. Nosso objetivo de longo prazo é a compreensão profunda da linguagem humana e poderosas aplicações linguísticas inteligentes. No entanto, mesmo as tecnologias de linguagem de hoje, cheias de atalhos inteligentes e técnicas de processamento superficiais, podem ser transformadas em produtos de software extremamente necessários.

O apelo do campo jovem é sua diversidade.

Para muitos estudantes e praticantes de linguística computacional, a atração especial da disciplina é a combinação de conhecimentos de humanidades, ciências naturais e comportamentais e engenharia. Abordagens científicas e técnicas práticas vêm de linguística, ciência da computação, psicologia e matemática. Em algumas universidades o assunto é ensinado em ciência da computação em outras pertence à linguística ou ciência cognitiva. Além disso, há um número pequeno, mas crescente, de programas e departamentos dedicados exclusivamente à linguística computacional.


© 1996, 2000 Hans Uszkoreit