Python e Processamento da Linguagem Natural
file:///Library/WebServer/Documents/index02.html
Unix, Python, Lingüística de Corpus e Lingüística Computacional O sítio http://www.leonel.profusehost.net/ tem como foco as atividades de pesquisa e ensino de Leonel F. de Alencar, Dr. phil., professor de língua alemã no Departamento de Letras Estrangeiras da Universidade Federal do Ceará em Fortaleza, Brasil, e de lingüística teórica e lingüística computacional no Programa de Pós-Graduação em Lingüística dessa mesma instituição, e coordenador do Grupo de Pesquisa Computação e Linguagem Natural (CompLin). Enquanto área de interseção entre o estudo das línguas humanas, a informática e a ciência da computação, a lingüística computacional tem uma dimensão tanto teórica quanto aplicada. No primeiro caso, utiliza-se o computador para verificar a consistência interna e a adequação empírica de teorias da linguagem natural. Sob a segunda perspectiva, a disciplina faz interface com a engenharia de softwares, uma vez que está voltada para a construção de programas capazes de simular o desempenho lingüístico de falantes de uma língua natural em um ou mais de um dos diferentes níveis de análise. Sintetizadores de voz, corretores ortográficos e gramaticais, conjugadores verbais, analisadores morfológicos, analisadores morfossintáticos e tradutores automáticos são apenas algumas das muitas aplicações da lingüística computacional no cotidiano. Outra aplicação importante da lingüística computacional é o ensino de línguas mediado por computador (área conhecida pela sigla CALL, do inglês Computer Assisted Language Learning). Na Universidade Federal do Ceará, a disciplina HBP727 Lingüística Computacional é oferecida no âmbito do Programa de Pós-Graduação em Lingüística, em nível de mestrado e doutorado. 1 of 4
11/27/09 5:04 PM
Python e Processamento da Linguagem Natural
file:///Library/WebServer/Documents/index02.html
Tradicionalmente, as ferramentas de análise automática de textos do sistema operacional Unix, como grep, wc e uniq, têm sido empregadas com grande proveito, há algumas décadas, na exploração de corpora lingüísticos. Mais recentemente, no âmbito da lingüística de corpus, Python tem assumido um papel cada vez mais importante, em substituição à linguagem Perl, que praticamente dominou o cenário na década de 1990 e no início do presente século. No campo da lingüística computacional stricto sensu, Python se destaca como uma das linguagens de programação mais importantes na modelação dos diferentes componentes das gramáticas das línguas naturais. De fato, não é apenas suficientemente poderosa para implementar os complexos algoritmos necessários para o processamento da linguagem natural, mas é também especialmente fácil de aprender por pessoas sem uma formação em ciência da computação, como é o caso da maioria dos estudantes de lingüística em nossa universidade. Uma evidência disso é a sua utilização no Natural Language Toolkit (NLTK), uma caixa de ferramentas implementadas como uma biblioteca em Python, destinada à análise automática de textos e ao processamento computacional em nível sintático e semântico das línguas naturais. O tópico principal do sítio é o uso das ferramentas de análise automática do Unix na lingüística de corpus bem como a aplicação da linguagem de programação Python em vários campos relacionados à investigação lingüística e ao ensino e aprendizagem de línguas. Um objetivo secundário é mostrar as vantagens da utilização de softwares "livres", gratuitos e de código-aberto por estudantes e pesquisadores nas áreas de Letras e Lingüística. Isso é exemplificado por meio de diversos programas que revelam o potencial desses recursos nas seguintes áreas: na modelação de algoritmos matemáticos simples (como estratégia didático-pedagógica para o desenvolvimento da habilidade de programar, utilizando, para tanto, sobretudo Python) na construção de comandos de busca utilizando expressões regulares para o levantamento de dados lingüísticos, no âmbito da lingüística de corpus 2 of 4
11/27/09 5:04 PM
Python e Processamento da Linguagem Natural
file:///Library/WebServer/Documents/index02.html
na compilação e anotação automática de corpora em exercícios interativos sobre temas da lingüística computacional, lingüística de corpus e lingüística aplicada O sítio, que ainda se encontra em construção, apresentará tanto scripts na linguagem do interpretador de comandos bash do Unix quanto scripts de CGI em Python por meio dos quais os estudantes podem experimentar interativamente com os programas elaborados nessa linguagem a serem aqui explicados. Um primeiro exemplo de script de CGI em Python permite calcular o máximo divisor comum (MDC) de uma seqüência de números inteiros. Este script, de minha autoria, implementa algoritmo simples, desenvolvido por mim mesmo, que, embora talvez não tão elegante, calcula de forma correta o MDC de dois ou mais números. Pelo que sabemos, trata-se do único programa livremente disponível em língua portuguesa na WWW capaz de calcular o MDC de mais de dois números. O programa do Professor Cardy, por exemplo, opera com dois números apenas. Outros exemplos de scripts de CGI em Python: Controle de acesso a um endereço de e-mail e formulário de envio de mensagem Exercícios do tipo "verdadeiro ou falso" sobre lingüística aplicada ao alemão ensino do vocabulário morfossintaxe do alemão Exercícios interativos de múltipla escolha sobre sintaxe alemã Exercícios interativos sobre lingüística de corpus e lingüística computacional Exercícios interativos de língua alemã (em construção) © 2009 Leonel F. de Alencar [Curriculum Vitae na Plataforma Lattes] [O Constructor – ferramenta amigável para a lingüística de corpus] [Grupo de Estudos sobre Lingüística de Corpus e Lingüística Computacional] [Programa da disciplina HBP727 3 of 4
11/27/09 5:04 PM
Python e Processamento da Linguagem Natural
file:///Library/WebServer/Documents/index02.html
Lingüística Computacional] E-Mail
4 of 4
11/27/09 5:04 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/complin.htm
CompLin – Computação e Linguagem Natural Grupo de pesquisa sobre lingüística computacional e lingüística de corpus na Universidade Federal do Ceará
Vinculação institucional Sediado no Centro de Humanidades da Universidade Federal do Ceará, o grupo CompLin – Computação e Linguagem Natural está vinculado estreitamente ao Curso de Letras, ao Departamento de Letras Estrangeiras e ao Programa de Pós-Graduação em Lingüística, todos integrantes dessa unidade acadêmica, mas congrega também pesquisadores de outras instituições.
Objetivos O grupo CompLin – Computação e Linguagem Natural foca a investigação, em nível teórico, dos aspectos computacionais das gramáticas das línguas naturais bem como a aplicação prática desses estudos no desenvolvimento de programas de processamento automático da linguagem humana nos níveis fonológico, morfológico, sintático, semântico e textual, inserindo-se, portanto, na confluência entre a lingüística teórica e descritiva, a lingüística de corpus e a lingüística computacional.
Fundamentação teórica Lingüística Teórica A lingüística teórica, no âmbito do paradigma gerativo chomskyano, tem como objeto de estudo a Faculdade da Linguagem, que é parte de nosso patrimônio genético enquanto humanos e responsável, por um lado, pela capacidade inata para adquirir uma língua natural e, por outro, pelas características comuns a todas as línguas, constituindo o arcabouço da Gramática Universal. Sob essa perspectiva, a teoria lingüística é um modelo de parte da cognição humana. As estruturas lingüísticas, que consistem em representações que conjugam uma Forma Lógica (LF, do inglês Logical Form) e uma Forma Fonética (PF, do inglês Phonetic Form), são geradas pela interação de dois módulos da mente: o sistema computacional e o léxico, o primeiro operando sobre itens extraídos do segundo. Nessa teoria, as sentenças consistem de emparelhamentos de LF–PF, os quais constituem, por sua vez, o input para os sistemas articulatório-perceptual e conceptual-intencional, responsáveis, respectivamente, por um lado, pela pronúncia e recepção auditiva, por outro, pela interpretação das sentenças.
Lingüística de Corpus A lingüística de corpus tem como objetivo a compilação, a anotação e a exploração de corpora, compreendidos como acervos de textos autênticos em linguagem natural disponibilizados de forma
1 of 3
11/27/09 4:56 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/complin.htm
eletrônica, utilizando, em todas essas etapas, ferramentas computacionais para o processamento automático de textos.
Lingüística Computacional A lingüística computacional constitui área de interseção entre os estudos da linguagem natural e a ciência da computação. Esse enfoque interdisciplinar permite aos lingüistas não apenas direcionar suas pesquisas para aplicações tecnológicas, mas também verificar a consistência e a plausibilidade de análises descritivas de línguas particulares e de modelos teóricos da linguagem humana.
Aspectos metodológicos As pesquisas realizadas nas áreas de lingüística computacional e lingüística de corpus no âmbito do grupo se valem de uma variada gama de métodos e técnicas. Em primeiro lugar, são utilizadas linguagens de programação de propósito geral, tanto interpretadas quanto compiladas, com representantes dos mais diferentes paradigmas de programação, como o declarativo (leia-se Prolog), procedural (com destaque para a linguagem C), funcional (por exemplo LISP), orientada a objetos (sobretudo C++) ou multiparadigma (com forte ênfase em Python). Devido tanto às suas qualidades didático-pedagógicas quanto à enorme quantidade de bibliotecas disponíveis, Python se sobressai como a linguagem mais utilizada no grupo. De fato, nenhuma outra linguagem de programação dispõe de uma biblioteca tão rica voltada para o processamento automático de textos nos diferentes níveis de análise lingüística quanto o Natural Language Toolkit (NLTK), implementado em Python. Outra vantagem de Python é permitir, de modo relativamente fácil, elaborar programas para a chamada "computação nas nuvens" (cloud computing), utilizando, por exemplo, o Google App Engine, talvez a mais importante plataforma de desenvolvimento de aplicativos para a Web dentro desse novo paradigma. Na análise automática de textos no âmbito da lingüística de corpus, merecem destaque as ferramentas de linha de comandos do sistema operacional Unix, como o grep, wc, tr, sort, uniq etc., com as quais se podem realizar tarefas básicas como extração de concordâncias, toquenizacão e contagem de palavras de forma extremamente ágil. A par das linguagens de programação de propósito geral, assumem uma grande importância na modelação de componentes específicos da gramática, por um lado, modelos lingüísticos computacionais(ou formalismos lingüísticos) como a LFG, a HPSG, a Morfologia de Dois Níveis etc., por outro, sistemas de programação lingüística como GFU Lab, LKB , FSA Utilities e xfst (a respeito da distinção entre formalismos lingüísticos e sistemas de programação lingüística, consulte-se Guinovart (2000)). Enquanto os dois primeiros estão mais voltados para a construção de analisadores sintáticos, os dois últimos constituem sistemas para compilação (a partir de expressões regulares) e manipulação de autômatos e transdutores de estados finitos, por meio dos quais fenômenos morfológicos e morfofonológicos, a anotação morfossintática de corpora bem como o mapeamento entre grafemas e fonemaspodem ser modelados computacionalmente de forma extremamente eficiente.
Relevância sócio-econômica As pesquisas desenvolvidas pelos membros do grupo, em nível de iniciação científica, mestrado e doutorado, visam a preencher lacunas tanto na formação de recursos humanos no Ceará, uma vez que não há, nesse Estado, outros grupos na área de gramática gerativa ou processamento automático da linguagem natural, quanto no âmbito da indústria de softwares brasileira como um todo, na qual as tecnologias da linguagem natural, não obstante o papel cada vez mais importante que desempenham nos países mais desenvolvidos, ainda não têm sido suficientemente exploradas.
2 of 3
11/27/09 4:56 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/complin.htm
Equipe Coordenador Prof. Dr. Leonel F. de Alencar (Departamento de Letras Estrangeiras e Programa de Pós-Graduação em Lingüística da UFC)
Pesquisadores Nome
Nível
Financiamento Área
Instituição Aluno do Programa de Pós-Graduação em Lingüística
Tiago Martins doutorando CAPES da Cunha
tradução automática
Andréa Feitosa mestre dos Santos
processamento computacional da Ex-aluna do Programa de sintaxe em gramáticas Pós-Graduação em baseadas em estruturas Lingüística de traços
Ednardo Luiz da Costa
mestrando
Raimundo Cleodimar de iniciação Oliveira Júnior científica Mauro Sérgio Pereira
CAPES
CAPES
CNPq
iniciação científica
Davis Macêdo mestre Vasconcelos
análise morfológica computacional no paradigma de estados finitos lingüística de corpus (anotação automática de corpora)
Aluno do Programa de Pós-Graduação em Lingüística Aluno do Curso de Letras – Português
agentes conversacionais (chatterbots) com tecnologia text to speech
Aluno do Curso de Letras – Alemão
análise lógico-semântica automática
Professor do Bacharelado em Engenharia de Telecomunicações – Instituto Federal do Ceará
Homepage <---
© 2009 Leonel F. de Alencar E-Mail
Página do CompLin – Lingüística Computacional e Lingüística de Corpus no Diretório dos Grupos de Pesquisa no Brasil
3 of 3
11/27/09 4:56 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/lingc.html
Lingüística Computacional e Lingüística de Corpus na Universidade Federal do Ceará Programa da disciplina HBP727: Lingüística Computacional do Programa de Pós-Graduação em Lingüística da Universidade Federal do Ceará Palavras-chave: Unix, Prolog, Python, NLTK, Natural Language Toolkit, sintaxe, semântica, morfologia, linguistica computacional, linguistica de corpus, lingüística computacional, lingüística de corpus, autômatos de estados finitos, transdutores de estados finitos, processamento computacional da linguagem natural, engenharia da gramática, corpora digitais, corpora eletrônicos
Ministério da Educação Universidade Federal do Ceará Pró-Reitoria de Pesquisa e Pós-Graduação
PROGRAMA DE DISCIPLINA 1. Identificação do Curso: 1.1 Curso: Lingüística
2. Modalidades: Mestrado ( X ) Doutorado ( X )
3. Turno(s) Diurno ( X ) Noturno ( ) 1 of 6
11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/lingc.html
4. Departamentos participantes Letras Vernáculas Letras Estrangeiras
5. Identificação da Disciplina: Nome: Lingüística Computacional
Código: HBP727
Carga Horária: 64
Créditos: 4
Optativa: Sim ( X )
Não (
)
Obrigatória: Sim (
)
Não ( X )
6. Pré-Requisitos: 7. Professor Responsável: Leonel Figueiredo de Alencar Araripe
8. JUSTIFICATIVA
2 of 6
11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/lingc.html
A lingüística computacional constitui área de interseção entre os estudos da linguagem natural e a ciência da computação. Esse enfoque interdisciplinar permite aos lingüistas não apenas direcionar suas pesquisas para aplicações tecnológicas, mas também verificar a consistência e a plausibilidade de análises descritivas de línguas particulares e de modelos teóricos da linguagem humana. A presente disciplina, que contempla subárea da Linha de Pesquisa Lingüística Aplicada do Programa de Pós-Graduação em Lingüística, oferece uma introdução ao processamento computacional das línguas naturais tanto no nível da gramática quanto do texto, voltada especialmente para estudantes de pós-graduação em lingüística sem embasamento em matemática, lógica e computação. A graduados dessas áreas, contudo, esta disciplina também poderá ser de proveito, na medida em que o processamento automático da linguagem natural pressupõe teorias, abordagens e ferramentas específicas que normalmente não integram a grade curricular desses cursos (pelo menos no Ceará).
9. OBJETIVOS i. Familiarizar com conceitos-chave da matemática e da lógica pressupostos pela lingüística formal e pela programação nos paradigmas procedural, lógico e de estados finitos. ii. Desenvolver a capacidade de realizar análises gramaticais formais. iii. Familiarizar com os elementos básicos da interface de linha de comandos bash do sistema operacional Unix, das linguagens de programação Prolog e Python, com ênfase na biblioteca NLTK (Natural Language Toolkit), e da programação de estados finitos nos sistemas FSA Utilities e xfst. iv. Familiarizar com a metalinguagem das expressões regulares no sistema operacional Unix e na linguagem Python e desenvolver a habilidade de construir comandos com expressões regulares para extração de padrões em textos. v. Desenvolver a habilidade de manipular corpora lingüísticos utilizando as ferramentas da biblioteca em Python do NLTK. vi. Desenvolver a habilidade de implementar computacionalmente análises gramaticais nos formalismos do NLTK. vii. Familiarizar com aplicações exemplares do processamento computacional da gramática.
10. EMENTA Estudo de formalismos para a modelação computacional da gramática das línguas naturais, de sua aplicação no desenvolvimento de ferramentas para o processamento automático da linguagem natural bem como de técnicas computacionais para a análise automática de textos no âmbito da lingüística de corpus.
11. PROGRAMA DA DISCIPLINA Fundamentos lógico-matemáticos: lógica proposicional; teoria dos conjuntos; relações e funções; lógica de predicados; línguas formais. A organização da gramática: divisão de trabalho entre léxico, morfologia e sintaxe; regras de reescrita categoriais; propriedades morfossintáticas dos itens lexicais; teoria X-barra; interface semântica-sintaxe. Elementos da linguagem de programação lógica PROLOG: predicados e cláusulas; fatos e regras; átomos, variáveis e listas; diretivas; unificação; operações sobre listas; mecanismo de resolução. 3 of 6
11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/lingc.html
Emprego de PROLOG no processamento automático da morfologia e sintaxe: flexão e formação de palavras como concatenação de átomos; estruturação sintagmática como concatenação de listas; a Gramática de Cláusulas Definidas (Definite Clause Grammar DCG). Morfologia de estados finitos: processos morfológicos concatenativos e não-concatenativos; regras de formação de palavras; regras morfofonológicas; ferramentas de estados finitos dos pacotes FSA Utilities e xfst. Lingüística de corpus: compilação e anotação de corpora; expressões regulares; ferramentas do Unix para extração de dados de corpora; processamento de textos em Python utilizando o NLTK. Processamento automático da sintaxe no NLTK: Gramática livre de contexto; gramática baseada em estrutura de traços; métodos e estratégias de parsing. Aplicações da análise morfológica e sintática computacionais: corretores gramaticais, sistemas de tradução automática e de diálogo homem-máquina etc.
12. FORMA DE AVALIAÇÃO Participação nas aulas. Desempenho na resolução de exercícios teóricos e práticos, na apresentação de seminários e em provas escritas. Construção de um fragmento de gramática computacional de uma língua natural e elaboração da respectiva documentação. Desenvolvimento, apresentação e documentação de um miniprojeto na lingüística de corpus.
13. BIBLIOGRAFIA BÁSICA ABEILLE, Anne. Les nouvelles syntaxes. Paris: Armand Colin, 2003. ALENCAR, Leonel Figueiredo de. Linguagem e inteligência artificial. In: MATTES, Marlene Gonçalves (Org.). Linguagens: as expressões do múltiplo. Fortaleza: Premius, 2006. p. 11-53. ARARIBÓIA, G. Inteligência artificial: um curso prático. Rio de Janeiro: Livros Técnicos e Científicos, 1988. BAILLY, Yves. Initiation à la programmation avec Python et C++. Paris: Pearson Education France, 2008. BEESLEY, Kenneth R.; KARTTUNEN, Lauri. Finite state morphology. Stanford: CSLI Publications, 2003. BIRD, S.; KLEIN, E.; LOPER, E. Natural language processing with Python: analyzing text with the Natural Language Toolkit. Sebastopol, CA, O'Reilly, 2009. BLACKBURN, Patrick; BOS, Johan; STRIEGNITZ, Kristina. Learn Prolog now! Saarbrücken: Universität des Saarlandes, 2001. Disponível em:< http://www.coli.uni-saarland.de/~kris/learn-prolog-now/html/prolog-notes.pdf> Acesso em: 29.04.2005. BUTT, Miriam et al. A grammar writer's cookbook. Stanford: CSLI Publications, 1999. CARNIE, Andrew. Syntax: a generative introduction. Oxford: Blackwell, 2002. CLOCKSIN, William F.; MELLISH, Christopher S. Programming in Prolog: using the ISO standard. 5. ed. Berlin: Springer, 2003. DEVLIN, Keith. O gene da matemática. Tradução de Sérgio Moraes Rego. Rio de Janeiro: Record, 2004. FALK, Yehuda N. Lexical-Functional Grammar: an introduction to parallel constraint-based syntax. Stanford: CSLI Publications, 2001. JURAFSKY, Daniel; MARTIN, James H. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition. Upper Saddle River, NJ: Prentice Hall, 2008. KLABUNDE, Ralf et al. (Orgs.). Computerlinguistik und Sprachtechnologie: eine Einführung. 4 of 6
11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/lingc.html
Heidelberg: Spektrum Akademischer Verlag, 2004. KLENK, Ursula. Generative Syntax. Tübingen: Narr, 2003. LANGENDOEN, D. Terence. Linguistic theory. In: BECHTEL, William; GRAHAM, George (Orgs.). A companion to cognitive science. Oxford: Blackwell, 1999. p.235-244. LEMNITZER, Lothar; ZINSMEISTER, Heike. Korpuslinguistik: eine Einführung. Tübingen: Narr, 2006. MIOTO, Carlos; FIGUEIREDO, Maria Cristina; LOPES, Ruth. Novo Manual de Sintaxe. Florianópolis: Insular, 2005. MITKOV, Ruslan. The Oxford handbook of computational linguistics. Oxford: Oxford University Press, 2005. MENUZZI, Sérgio de Moura; OTHERO, Gabriel de Ávila. Lingüística Computacional: teoria & prática. São Paulo: Parábola, 2005. OTHERO, Gabriel de Ávila. Teoria X-barra: descrição do português e aplicação computacional. São Paulo: Contexto, 2006. PAGANI, Luiz Arthur. Analisador gramatical em Prolog para gramáticas de estrutura sintagmática. Revista Virtual de Estudos em Linguagem - ReVEL. Ano 2, n.3, ag. 2004. [www.revelhp.cjb.net]. PARTEE, Barbara; TER MEULEN, Alice; WALL, Robert. Mathematical methods in linguistics. Kluwer, Dordrecht, 1990. RANCHHOD, Elisabete Marques (Org.). Tratamento das línguas por computador: uma introdução à linguística computacional e suas aplicações. Lisboa: Caminho, 2001. RAPOSO, Eduardo Paiva. Teoria da gramática: a faculdade da linguagem. 2. ed. Lisboa: Caminho, 1998. REPPEN, Randi. Review of MonoConc Pro and WordSmith Tools. Language Learning & Technology, Vol. 5, No. 3, May 2001, pp. 32-36. Disponível em: Acesso em: 03.09.2008 SAG, Ivan A.; WASOW, Thomas; BENDER, Emily. Syntactic theory: a formal introduction. 2. ed. Stanford: CSLI Publications, 2003. SARDINHA, Tony Berber. Usando WordSmith Tools na investigação da linguagem. Direct Papers 40, LAEL, PUCSP, 1999. Disponível em:<www2.lael.pucsp.br/direct/DirectPapers40.pdf > Acesso em: 03.09.2008. ______. Preparação de material didático para Aprendizagem Baseada em Tarefas com WordSmith Tools e corpora. Calidoscópio, São Leopoldo, v. 4, n. 3, p. 148-155, 2006. SOBELL, Mark G.; SEEBACH, Peter. A practical guide to UNIX for Mac OS X users. Upper Saddle River, NJ: Prentice Hall, 2006. SOCHER, Guido. Regular expressions. LinuxFocus, July 1998. Disponível em: Acesso em: 30.8.2008. VIEIRA, Renata ; STRUBE DE LIMA, V. L. . Lingüística Computacional: princípios e aplicações. In: Ana Teresa Martins; Díbio leandro Borges. (Org.). SBC - Jornadas de Atualização em Inteligência Artificial (JAIA). Fortaleza - CE: , 2001, v. 3, p. 47-86. Disponível em: . Acesso em: 6 set. 2005. ZELLE, John. Python programming: an introduction to computer science. Wilsonville, Oregon: Franklin, Beedle & Associates, 2004.
14. BIBLIOGRAFIA COMPLEMENTAR ABEILLE, Anne. Une grammaire électronique du français. Paris: CNRS Editions, 2002. ALENCAR, Leonel Figueiredo de. Complementos verbais oracionais: uma análise léxico-funcional. Lingua(gem), Santa Maria, v. 1, n. 1, p. 173-218, jan./jun. 2004. BAADER, Franz. Logic-based knowledge representation. In: WOOLDRIDGE, Michael J.;VELOSO, Manuela (Orgs.). Artificial intelligence today: recent trends and developments. Berlin: Springer, 1999. p.13-41. BERMAN, Judith;FRANK, Anette. Deutsche und französische Syntax im Formalismus der LFG. Tübingen: Niemeyer, 1996. BLACKBURN, Patrick; BOS, Johan. Representation and inference for natural language: a first course in computational semantics. Stanford: CSLI Publications, 2005. BRESNAN, Joan. Lexical-functional syntax. Oxford: Blackwell, 2001. CHUN, Wesley J. Core Python programming. 2. ed. Upper Saddle River, NJ: Prentice Hall, 2008. 5 of 6
11/27/09 4:55 PM
Lingüística Computacional e Lingüística de Corpus
file:///Library/WebServer/Documents/lingc.html
FORST, Martin. La traduction automatique dans le cadre formel de la LFG - Un système de traduction entre l'allemand standard et le zurichois. Cahiers du Centre de Traduction Littéraire de l'Université de Lausanne, Lausanne, n. 41, 2002. GOMEZ, Xavier Guinovart. Lingüística computacional. In: RAMALLO, Fernando; REI-DOVAL, Gabriel; RODRIGUEZ, Xoán Paulo (Orgs.). Manual de ciencias da linguaxe. Vigo: Xerais, 2000. p. 221-268. HAUSSER, Roland. Foundations of computational linguistics: human-computer communication in natural language. 2. ed. Berlin: Springer, 2001. HORNSTEIN, Norbert; NUNES, Jairo; GROHMANN, Kleanthes K. Understanding Minimalism. Cambridge: Cambridge University Press, 2005. KRIEBEL, Wolfgang; ROSE, Andreas; SCHMITT, Dietmar. Zur Geschichte der Programmiersprache PROLOG. Disponível em:< http://www.dietmar-schmitt.de /essays/ SGI/Prolog_geschichte_1.html> Acesso em: 24.05.2005. LOBIN, Henning; LEMNITZER, Lothar (Orgs.). Texttechnologie: Perspektiven und Anwendungen. Tübingen: Stauffenburg, 2004. MEHLER, Alexander; LOBIN, Henning (Orgs.). Automatische Textanalyse: Systeme und Methoden zur Annotation und Analyse natürlichsprachlicher Texte. Wiesbaden: Verlag für Sozialwissenschaften, 2004. MERTZ, David. Text processing in Python. Upper Saddle River, NJ: Addison-Wesley, 2003. NEGNEVITSKY, Michael. Artificial intelligence: a guide to intelligent systems. New York: Addison-Wesley, 2002. RADFORD, Andrew. Minimalist Syntax : exploring the Structure of English. 2. ed. Cambridge: Cambridge University Press, 2004. RAPOSO, Eduardo Paiva. Da Teoria dos Princípios e Parâmetros ao Programa Minimalista: algumas idéias-chave. In: CHOMSKY, Noam. O Programa Minimalista. Tradução de Eduardo Paiva Raposo. Lisboa: Caminho, 1999. p.15-37. REISCHER, Jürgen. Linguistische und philosophische Aspekte der natürlichen und maschinellen Sprachverarbeitung: über Denken, Sprache, Bedeutung und Handeln bei Mensch und Maschine. Idstein: Schulz-Kirchner, 2000. RIBEIRO, Catarina Santiago. Relatório de estágio realizado no âmbito do projecto INQUER Interacção Pessoa-Máquina em Linguagem Natural: módulo I - análise sintáctico-semântica. Lisboa: Departamento de Informática e Centro de Lingüística da Universidade de Lisboa. Disponível em: Acesso em: 06.02.2006. SCHWARTZ, Randal L.; PHOENIX, Tom. Learning Perl. 3. ed. Sebastopol, CA: O'Reilly, 2001. SCHWARZE, Christoph. Lexikalisch-funktionale Grammatik: eine Einführung in 10 Lektionen mit französischen Beispielen. Fachgruppe Sprachwissenschaft der Universität Konstanz, Arbeitspapier Nr. 76, 1998. ______. Introduction à la sémantique lexicale. Tübingen: Narr, 2001. WIELEMAKER, Jan. SWI-Prolog 5.4 Reference Manual. Amsterdam: University of Amsterdam, Department of Social Science Informatics (SWI), 2004. Disponível em:< http://gollem.science.uva.nl/cgi-bin/nph-download/SWI-Prolog/refman/refman.pdf> Acesso em: 29.04.2005. ZELLER, Frauke. Mensch-Roboter Interaktion: eine sprachwissenschaftliche Perspektive. Kassel: Kassel University Press, 2005.
© 2009 Leonel F. de Alencar
Homepage <---
E-Mail
6 of 6
11/27/09 4:55 PM