Ugarítico, a lingua semítica decifrada por computadores

12 07 2010

—-

—-

Em 2002 Andrew Robinson publicou o livro  Lost Languages  [Línguas Perdidas].  Ele é o editor  literário de ensino superior do suplemento do jornal inglês London Times e na época do lançamento de seu livro, disse que decifrar uma língua arqueológica exigiria uma combinação de lógica e intuição, uma sensibilidade que acreditava computadores não poderiam possuir.

Essa observação não caiu em ouvidos moucos.  Para Regina Barlizay o duelo de conhecimentos acabara de ter uma luva lançada, um desafio a que ela, como professora adjunta de computação no  MIT e do Laboratório de Inteligência artificial, não poderia deixar de responder.  Seu aluno Bem Snyder  e o estudante  Kevin Knight, da Universidade da Southern Califórnia, , decidiram que as coisas não poderiam ficar assim. Os três Juntaram forças e foram  à luta.  O resultado do trabalho em conjunto será mostrado mês que vem.  A intenção do grupo é mostrar na reunião anual da Associação de Lingüística Computacional em Uppsala,  na Suécia, um novo sistema de informática, que em questão de horas, decifrou grande parte da antiga língua semítica ugarítico, que permanecia até hoje um quebra-cabeças sem solução. 

A língua semítica foi submetida ao programa que decifrou  grande parte do extinto idioma ugarítico, descoberto a partir de escritos encontrados na cidade perdida de Ugarit, na Síria, cujas ruínas foram achadas em 1928.  Além disso, o programa poderá ajudar também a decifrar algumas das outras oito línguas semíticas que permanecem misteriosas até o dia de hoje. 

—-

—-

Para duplicar a “intuição” que Robinson disse fugir à capacidade dos computadores,  o programa dos pesquisadores fez várias suposições.  A primeira é que a linguagem a ser decifrada está intimamente relacionada à alguma outra linguagem:  no caso do ugarítico, os investigadores escolheram o hebraico.    A segunda é que existe uma maneira sistemática de se mapear o alfabeto de uma língua levando em conta o alfabeto da outra.  E, além disso, que os símbolos correlacionados aparecem com uma freqüência semelhante em ambas as línguas.

O ugarítico era uma língua semítica escrita em alfabeto cuneiforme com 27 consoantes e três vogais. Os escritos encontrados foram importantes para estudiosos do Velho Testamento, por auxiliar a esclarecer textos hebraicos e revelar como o judaísmo utilizava frases comuns, expressões literárias e frases empregadas pelas culturas gentis que o cercavam.

O programa, além de ajudar a decifrar línguas antigas que continuam resistindo aos esforços de especialistas, poderá expandir o número de idiomas que sistemas automatizados de tradução, como o Google Tradutor, são capazes de manejar.    Ele também fez asserções no nível semântico, no sentido de que as línguas relacionadas teriam pelo menos alguns cognatos, isto é, palavras com raízes comuns.    Por meio de um modelo probabilístico usado em pesquisas em inteligência artificial, os pesquisadores determinaram nos mapeamentos os radicais semelhantes e conjuntos de sufixos e prefixos consistentes, entre outras relações entre palavras das duas línguas.

—-

—-

—-

—-

O ugarítico já havia sido decifrado. Se não tivesse sido, os autores do estudo não teriam como avaliar a performance do sistema que desenvolveram.

O sistema repetiu as análises dos dados resultantes centenas de vezes. E, a cada vez, os acertos eram mais frequentes, pois estávamos chegando mais perto de uma solução consistente. Finalmente, chegamos a um ponto no qual a alteração do mapeamento das similaridades não aumentava mais a consistência dos resultados”, disse Ben Snyder.

Das 30 letras do alfabeto extinto, o sistema foi capaz de mapear corretamente 29 com seus correspondentes em hebraico. Cerca de um terço das palavras em ugarítico tem cognato em hebraico e, desse total, o sistema identificou corretamente 60%.   “Das palavras identificadas incorretamente, na maior parte das vezes o erro foi por apenas uma palavra. Ou seja, o sistema deu palpites bem razoáveis”, disse Snyder.

Apesar dos índices de acerto, os pesquisadores destacam que o sistema não é suficientemente bem resolvido para substituir os tradutores humanos. Mas, segundo eles, é uma ferramenta poderosa cujo desenvolvimento poderá ajudar no processo de decifração de línguas desconhecidas e de tradução mais eficiente dos idiomas conhecidos. 

O ugarítico já havia sido decifrado. Se não tivesse sido, os autores do estudo não teriam como avaliar a performance do sistema que desenvolveram.

 —-

—-

—-

—–

O sistema repetiu as análises dos dados resultantes centenas de vezes. E, a cada vez, os acertos eram mais frequentes, pois estávamos chegando mais perto de uma solução consistente. Finalmente, chegamos a um ponto no qual a alteração do mapeamento das similaridades não aumentava mais a consistência dos resultados”, disse Ben Snyder.

 

Das 30 letras do alfabeto extinto, o sistema foi capaz de mapear corretamente 29 com seus correspondentes em hebraico. Cerca de um terço das palavras em ugarítico tem cognato em hebraico e, desse total, o sistema identificou corretamente 60%.   “Das palavras identificadas incorretamente, na maior parte das vezes o erro foi por apenas uma palavra. Ou seja, o sistema deu palpites bem razoáveis”, disse Snyder.

 

Apesar dos índices de acerto, os pesquisadores destacam que o sistema não é suficientemente bem resolvido para substituir os tradutores humanos. Mas, segundo eles, é uma ferramenta poderosa cujo desenvolvimento poderá ajudar no processo de decifração de línguas desconhecidas e de tradução mais eficiente dos idiomas conhecidos.