2023-12: Quase final do segundo período de Letras Português / Inglês na UERJ. Preciso fazer uma revisão do que aprendi em meio à correria do período, para as provas decisivas da semana que vem. Tive a sorte de contar com excelentes professores de Língua Inglesa II (Verbal Presentations – Professora Claudia Rabello + Writing – Professor Victor Veríssimo) e Linguística II (Professora Isabel). Vou falar de linguística, já que o professor Veríssimo também está abordando agora assuntos ligados à teoria de Chomsky. E também vou pedir uma ajudinha à IA (Inteligência Artificial).
ÁRVORES SINTÁTICAS
A essa altura vocês já devem saber que árvore sintática é um modo de representar sentenças hierarquicamente. Não foi Noam Chomsky quem inventou isso, mas ele colaborou bastante para o assunto no livro “Syntatic Structures“, de 1957. É um livro pequenino. Ler e entender, isso é outra história. Creio que vou passar as férias sobre ele. Dê uma olhada no vídeo da Solucionática Concursos. Cuidado, aprecie com moderação, porque há itens duvidosos nessa descrição (Por exemplo, na falta de classificação dos adjetivos). Mas já dá a ideia do que trata a notação de árvore sintática.
Fazer árvores sintáticas é uma tarefa “manhosa”. Sempre acabamos por esquecer de alguma coisa. Sempre a tentação é consultar os “novos oráculos” da IA: O ChatGPT e o Google Bard. Saibam que os dois são fracos e vão nos deixar na mão em algum momento. O menos pior ainda é o ChatGPT, mas deve ser usado com muita reserva. Na análise de sentenças usando a notação de árvore de Chomsky, por exemplo, ele comete muitas falhas e se vocês não pedirem para melhorar os gráficos, eles vão ficar muito confusos. Vejam as imagens de antes e depois de uma “bronca” que dei nele:
De qualquer modo, este ainda não é o jeito adequado de escrever essa notação. Então, não, não confie 100% no ChatGPT. Quanto ao Bard, bem, ele precisa aprender um pouco sobre exibição de árvore sintática:
Consultei o ChatGpt sobre programas gratuitos que eu poderia usar:
“Até a minha última atualização de conhecimento em janeiro de 2022, existem algumas ferramentas e recursos gratuitos que podem ajudar na análise sintática ,em notação de colchetes de Chomsky (Chomsky bracket notation) e na criação de árvores sintáticas de Chomsky. No entanto, é sempre bom verificar a disponibilidade e atualizações mais recentes, pois novas ferramentas podem ter sido desenvolvidas desde então. Aqui estão algumas opções:
- 1. NLTK (Natural Language Toolkit): O NLTK é uma biblioteca de processamento de linguagem natural em Python. Ele inclui módulos para análise sintática, incluindo a capacidade de gerar árvores sintáticas em formato de notação de colchetes de Chomsky. Site: NLTK
- 2. Stanford Parser: O Stanford Parser é uma ferramenta Java que implementa modelos de análise sintática probabilísticos. Ele pode gerar árvores sintáticas em formato de notação de colchetes. Site: Stanford Parser
- 3. Syntax Tree Generator: Existem ferramentas online que geram árvores sintáticas a partir de sentenças inseridas pelo usuário, facilitando a visualização do processo de análise sintática. Exemplo: Syntax Tree Generator
Lembre-se de que o campo de processamento de linguagem natural está sempre evoluindo, e novas ferramentas podem ter surgido desde a minha última atualização. Certifique-se de verificar as últimas fontes e comunidades online para as opções mais recentes.“
EXPERIMENTOS
- O Syntax Tree Generator (STG) é bem legal em árvore sintática, mas vocês precisam antes dominar a notação de colchetes.
- Já o Stanford Parser permite criar a notação de colchetes para uma frase e alimentar no STG. Mas, por simplicidade, preferi gerar a notação de colchetes também no ChatGPT.
Vamos direto ao exemplo prático:
A bracket notation que o ChatGPT criou foi:
[S [NP [Det Everybody] [N else]] [VP [V is] [AdjP [Adv just] [Adj green]]] [. ?]]
Agora, vamos levar isso para o STG. O resultado foi:
Então, amigos, a dica é boa e já dá para resolver alguns problemas dados de sala e de preparação para provas com ela.
[Veja aqui e comente as resposta do exercício 1 da revisão de Grammar II do professor Veríssimo]
Como sou fluente em Python e já fiz um curso da USP / São Carlos sobre o tema, não podia deixar de testar o NLTK para as árvores sintáticas. Percebam que a notação de colchetes é equivalente. Aliás, árvores sintáticas e notação de colchetes estão uma para outra como lógica e teoria dos conjuntos ! Mas o NTLK fica para outro artigo !
Sê o primeiro