UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
RAFAEL BERG ESTEVES TRIANON
FOCALIZAÇÃO IN SITU NO PORTUGUÊS DO BRASIL: SINTAXE, SEMÂNTICA E PROSÓDIA
Rio de Janeiro 2019
RAFAEL BERG ESTEVES TRIANON
FOCALIZAÇÃO IN SITU NO PORTUGUÊS DO BRASIL: SINTAXE, SEMÂNTICA E PROSÓDIA
Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Linguística da Universidade Federal do Rio de Janeiro como quesito para a obtenção do Título de Mestre em Linguística.
Orientador: Prof.º Dr. Alessandro Boechat de Medeiros Co-orientador: Profº PhD Albert Olivier Blaise Rilliard
Rio de Janeiro Fevereiro de 2019
CIP - Catalogação na Publicação
T821f
Trianon, Rafael Berg Esteves Focalização in situ no português do Brasil: sintaxe, semântica e prosódia / Rafael Berg Esteves Trianon. -- Rio de Janeiro, 2019. 250 f. Orientador: Alessandro Boechat de Medeiros. Coorientador: Albert Olivier Blaise Rilliard. Dissertação (mestrado) - Universidade Federal do Rio de Janeiro, Faculdade de Letras, Programa de Pós Graduação em Linguística, 2019. 1. Sintaxe. 2. Focalização. 3. Prosódia. 4. Semântica. 5. Gramática Gerativa. I. Medeiros, Alessandro Boechat de, orient. II. Rilliard, Albert Olivier Blaise, coorient. III. Título.
Elaborado pelo Sistema de Geração Automática da UFRJ com os dados fornecidos pelo(a) autor(a), sob a responsabilidade de Miguel Romeu Amorim Neto - CRB-7/6283.
Dedico este trabalho a duas pessoas: primeiro, Àquele que me deu vida, inteligência, força e coragem para concluir este trabalho: Deus, o Autor da minha vida e salvação em Cristo Jesus. A Ele sejam dadas toda glória, honra e louvor, para todo sempre. Segundo, àquela que é o meu combustível, minha noiva Paula, o amor da minha vida.
AGRADECIMENTOS Primeiro e antes de tudo, eu devo agradecer a Deus, “Aquele que me vê” (Gênesis 16:13). Sem Deus, minha vida (atual e eterna) estaria perdida, e por isso devo agradecer a Ele tudo de bom que Ele me deu nesses anos, especialmente a força, a coragem e o ânimo para concluir mais este desafio. É por isso que digo, de peito aberto, que “[faço] tudo para a glória de Deus” (1 Coríntios 10:31). Se eu consegui terminar esta dissertação, é porque o SENHOR, o dono e criador da linguagem verbal, me capacitou para tentar entender um pouquinho mais dessa criação maravilhosa d’Ele, que é a linguagem humana. Em segundo lugar, devo agradecer à mulher que me faz seguir em frente, meu combustível para fazer tudo que preciso fazer: minha noiva (e eterna namorada) Paula. Meu amor, sem você minha vida seria extremamente triste e sem graça. Você é um presente de Deus na minha vida, e eu quero poder logo ser seu marido, seu cuidador, seu constante confidente e melhor amigo. Muito obrigado por ser a pessoa MARAVILHOSA que você é! Eu te amo até o infinito! Uma outra pessoa a quem preciso agradecer é minha querida mãe, dona Conceição (in memoriam). Foi por causa dela que eu tomei gosto por estudar, desde o tempo em que ela me alfabetizou até seu interesse pelo que eu aprendia na escola – ela fazia questão de ouvir interessadamente tudo que me era ensinado e que eu explicava explicava a ela, já em tons professorais. Eu nunca vou me esquecer das noites sentado na cadeira marrom sem braços (cuja réplica, por ironia do “destino”, hoje eu tenho em meu quarto), tendo longas conversas sobre como a vida dela era dura e como ela queria que eu tivesse um fim diferente. Aquelas conversas reverberaram em mim de uma forma que nem ela mesma saberia. E, mesmo que o câncer a tenha levado há longínquos 12 anos, eu quero agradecê-la por ter sido meu farol e meu porto seguro pelos 16 curtos anos que tivemos juntos. Eu te amo, mamãe. Obrigado por ter sido a melhor mãe do mundo! Também devo agradecimentos aos meus sogros, Shirley e Paulo, que me foram um suporte inimaginável no momento mais difícil financeiramente da minha vida, enquanto fazia graduação. O carinho com o qual me acolheram nesse momento de provação estará na minha lembrança para todo o sempre. Não poderia nunca deixar de agradecer ao meu orientador, Alessandro. Desde 2014 tenho sido aluno dessa mente brilhante, que me ajudou de uma forma sem igual a ser o projeto de linguista que sou hoje. Mesmo sem ser especializado no assunto, ele se dispôs a enfrentar comigo os desafios da focalização, sempre me ensinando a pensar essas questões de uma forma
crítica e embasada teoricamente (ainda que ele embarcasse em todas as maluquices que eu inventei durante esses 4 anos e meio). Muito obrigado pelos ensinos, por ter paciência de me explicar minimalismo e semântica formal 300 vezes, sempre que eu escrevia uma baboseira enorme (nesta dissertação mesmo, inclusive), além de corrigir mais de um milhão de vezes as representações lógicas absurdas que eu fazia. Profissionalmente eu não seria nem metade do que sou hoje sem você. Da mesma forma, quero agradecer meu co-orientador, Albert, por ter literalmente salvado a análise prosódica deste trabalho. Ainda que eu seja um completo ignorante em estatística (e fazendo as besteiras mais abomináveis), ele teve paciência de me ensinar, passo a passo, o jeito certo de se fazer análise acústica e estatística, mesmo estando a quase 10.000km de distância. Muito obrigado por ter me cedido seu tempo e seu conhecimento (sem falar nos e-mails escritos por mim em um francês deplorável). Merci beaucoup, professeur! Uma pessoa importantíssima para a minha vida acadêmica foi Fernando Vieira Peixoto Filho, meu professor de português no Ensino Médio. Foi por causa da imensa admiração que eu tinha (e ainda tenho) por esse gênio que eu decidi cursar Letras. As aulas de português no 1º e 3º anos foram, de longe, meu maior motivo de prazer durante o Ensino Médio. Se estou hoje defendendo uma dissertação de mestrado em Linguística é por causa do amor à língua que o Fernando infundiu no fundo da minha alma. Muito obrigado, professor! Também devo esta dissertação a todos os mestres que passaram pela minha vida, tanto na graduação quanto na pós-graduação. Sem essas pessoas eu tenho certeza de que minha formação como linguista (e como bacharel em Letras) teria sido bem mais pobre. Por isso, agradeço a Carolina Serra, Silvia Brandão, Márcia Machado, Humberto Soares, Maria Lúcia Leitão, Lúcia Helena e Silvia Cavalcante pelas aulas de Português; Carlota Rosa, Kristine Stenzel e Vera Paredes pelas aulas de Linguística (além do Alessandro, claro!); Ieda Magri, Vera Lins, Teresa Cristina, Rodrigo Jorge, Dau Bastos, Eucanaã Ferraz, Rafael Santana, Mônica Fagundes, Mônica Figueiredo e Nazir Can pelas aulas de literatura; Conceição Silveira, Simone Bondarczuk, Ricardo Nogueira, Luiz Karol e Anderson Martins pelas aulas de Grego e Latim; Carlota (de novo), Márcia Dâmaso, Tânia Clemente, Aniela Improta, João Moraes e Andrew Nevins (além do Alessandro e do Albert) pelas aulas na Pós-Graduação. Todos vocês foram importantes para mim, e eu lhes agradeço do fundo do meu coração! Aos membros da minha banca, titulares e suplentes, os quais eu conheço e admiro profundamente, eu preciso agradecer pela paciência e disponibilidade de ler este trabalho. Agradeço à Carolina Serra, a primeira professora de português que tive na graduação, e que desde aquele longínquo 2013.2 me fez tomar gosto pela análise linguística, ainda nas aulas de
Variação em LP. Também sou grato ao Max Guimarães, que é pra mim um modelo de coerência científica e o maior especialista em gramática gerativa que eu conheço. Igualmente sou grato à Simone Guesser, uma companheira de trabalho que eu admiro muito (e a quem já peço desculpas antecipadamente por “meter o malho” na Cartografia Sintática). Por fim, agradeço ao João Moraes, simplesmente o maior nome em análise prosódica do Brasil (e um dos maiores do mundo), de quem eu me sinto honrado em ter como membro de banca (embora me tremendo de medo, afinal ele é o cara!). Muito obrigado a todos! Aos meus amigos de faculdade e de vida (que não são muitos, mas são importantíssimos) Lidiane, Neemias, Thiago, Raphael, Neide, Marcus, Camila, Camille, Michelly, Nayana, Bruna, Jéssica, Ohanna, Amanda, Mayara e Nathacia, meu muito obrigado por caminharem comigo (mesmo aqueles cujo caminho se distanciou do meu no decorrer dos anos) e tornar a vida mais fácil! Aos meus informantes (que infelizmente não posso nomear), que me emprestaram suas vozes (e gramáticas) para que este trabalho tomasse forma, meu muito obrigado! Aos órgãos de pesquisa que financiaram esta dissertação, CAPES e Faperj, muito obrigado pela manutenção da minha vida financeira nesses dois anos de trabalho. Mais importante ainda são os contribuintes, que tiveram o fruto do seu trabalho direcionados para mim através dessas agências. Eu espero poder retribuir à sociedade o dinheiro suado de seus impostos aumentando um pouco mais o nosso conhecimento sobre a linguagem humana.
“Os céus declaram a glória de Deus; o firmamento proclama a obra das suas mãos. Um dia fala disso a outro dia; uma noite o revela a outra noite. Sem discurso nem palavras, não se ouve a sua voz. Mas a sua voz ressoa por toda a terra, e as suas palavras, até os confins do mundo.” Salmo 19:1-4
RESUMO TRIANON, Rafael Berg Esteves. Focalização in situ no português do Brasil: sintaxe, semântica e prosódia. Rio de Janeiro, 2019. Dissertação (Mestrado em Linguística) – Faculdade de Letras, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2019.
Esta dissertação tem como objeto de pesquisa o fenômeno da focalização in situ no português do Brasil. Tais construções são caracterizadas pela existência de um acento prosódico especial sobre o constituinte focalizado, mantendo a ordem das palavras na sentença. Algumas abordagens da Gramática Gerativa, como a Cartografia Sintática (Belletti, 2004a, 2004b; Cinque, 1999; Rizzi, 1997; Rizzi & Bocci, 2017 inter alia), assumem que a focalização envolve movimento sintático para projeções dedicadas à veiculação de foco, ao passo que a ordem dos constituintes na frase não se altera porque ocorre um outro movimento de remanescente (Kayne, 1994) que resulta na mesma ordem de palavras que uma sentença sem focalização. Nosso trabalho busca uma alternativa a essa posição, tendo como hipótese que a focalização não envolve movimento sintático. Além disso, propomos que o sistema computacional da linguagem não necessita de codificar uma tipologia de focos (amplo, informacional, contrastivo, mirativo, etc.), pois o único traço relevante na gramática é o de exaustividade. Para embasar essas proposições, empreendemos uma análise semântica, uma análise prosódica e uma análise sintática: a análise semântica chega à conclusão de que LF codifica apenas um traço de exaustividade relativa, que exaure um conjunto pressuposicional dado no contexto; a análise prosódica demonstra que os diversos tipos de foco não são tão diferenciáveis entre si quanto o que se tem proposto – por outro lado, a exaustividade aparenta ser muito mais identificável, sendo marcada pela alteração do núcleo do sintagma entoacional; por fim, a análise sintática propõe duas alternativas de tratamento para a codificação da exaustividade: uma solução lança mão da proposta de Bošković (2007) para o movimento, e afirma que o traço de exaustividade é valorado internamente ao DP através de Agree do núcleo D com uma projeção funcional fP, enquanto a quantificação estabelecida pelo foco é dada através de movimento encoberto para CP. A segunda alternativa assume que a quantificação é resultado obrigatório da exaustividade veiculada pela focalização, marcada na sintaxe através da adjunção de um núcleo f, que introduz um quantificador do tipo “existe um único x”. Com essas análises, pretendemos lançar luz sobre o fenômeno da focalização in situ, apontando caminhos para tratar a questão em maior conformidade aos pressupostos da Gramática Gerativa, mais especificamente o Programa Minimalista (Chomsky, 2015 [1995])
ABSTRACT TRIANON, Rafael Berg Esteves. Focalização in situ no português do Brasil: sintaxe, semântica e prosódia. Rio de Janeiro, 2019. Dissertação (Mestrado em Linguística) – Faculdade de Letras, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2019.
This dissertation aims to research the phenomenon of in situ focalization in Brazilian Portuguese. Such constructions are characterized by the existence of a special prosodic accent on the focused constituent, maintaining the order of words in the sentence. Some approaches of Gerative Grammar, such as Syntactic Cartography (Belletti, 2004a, 2004b; Cinque, 1999; Rizzi, 1997; Rizzi & Bocci, 2017 inter alia) assume that focalization involves syntactic movement to dedicated projections, while the word order does not change because the occurrence of remnant movement (Kayne, 1994), resulting in the same word order as a sentence without focus. Our work seeks an alternative to this position, assuming the hypothesis that focalization does not involve syntactic movement at all. In addition, we propose that the computational system of language does not need to encode a typology of foci (broad, informational, contrastive, mirative, etc.), since the only relevant feature in grammar is exhaustiveness. To support these propositions, we undertake a semantic analysis, a prosodic analysis and a syntactic analysis: the semantic analysis concludes that LF encodes only a relative exhaustiveness feature, which exhausts a given presuppositional set in context; the prosodic analysis shows that the different types of focus are not as differentiable as it is proposed in the literature - on the other hand, exhaustiveness appears to be much more identifiable, being marked by the alteration of the nucleus of the intonational phrase; Finally, the syntactic analysis proposes two alternative approaches for the encoding of exhaustiveness: the first solution uses Bošković's (2007) proposal for the movement, and states that the exhaustiveness feature is DP-internal valued through agree of the D head with a functional projection fP, while the quantification established by the focus is given by a covert movement of the focalized constituent to CP. The second alternative assumes that the quantification is a obligatory result of the exhaustiveness conveyed by the focus, being marked in syntax by the addition of a f head, which introduces a quantifier of the type "there is a single x". With these analyzes, we intend to shed light on the phenomenon of in situ focalization, pointing out ways to treat the issue in greater conformity with the assumptions of Gerative Grammar, more specifically the Minimalist Program (Chomsky, 2015 [1995])
LISTA DE FIGURAS Figura 1: Arquitetura da gramática no modelo minimalista ................................................... 40 Figura 2: Tableau da estrutura prosódica da sentença “A Gina fez café de noite” ............... 105 Figura 3: Gramática dos eventos tonais na abordagem de Pierrehumbert (1980) ................ 108 Figura 4: Curva de F0 da sentença “A Gina fez café de noite” ............................................ 111 Figura 5: Curva de F0 da sentença “A Gina fez café de noite” estilizada pelo método close copy stylization....................................................................................................... 116 Figura 6: Curva de F0 da sentença “A Gina fez café de noite” estilizada pelo método Momel ................................................................................................................................ 117 Figura 7: Curva de F0 da sentença “A Gina fez café de noite” estilizada pelo método Momel ................................................................................................................................ 117 Figura 8: Esquema de organização dos rótulos do modelo Intsint ........................................ 124 Figura 9: Contorno de F0 da sentença “A Rebeca levou o Danilo”, com foco no objeto e padrão de descida na sílaba tônica do foco, segundo Araújo (2015) ..................... 126 Figura 10: Contorno de F0 da sentença “O Danilo escolheu a Marina”, com foco no sujeito e padrão de descida na sílaba tônica do foco, segundo Araújo (2015) ..................... 126 Figura 11: Gráfico da distribuição dos valores de alongamento na vogal focalizada por tipo de foco .................................................................................................................... 140 Figura 12: Gráfico da distribuição dos valores de alongamento na vogal focalizada por sintagma focalizado ............................................................................................... 140 Figura 13: Gráfico da distribuição dos valores de alongamento na vogal focalizada por informante .............................................................................................................. 141 Figura 14: Gráfico da distribuição dos valores da diferença entre a média de F0 e o valor de referência por tipo de foco ..................................................................................... 143 Figura 15: Gráfico da distribuição dos valores da diferença entre a média de F0 e o valor de referência por sintagma focalizado ........................................................................ 143 Figura 16: Gráfico da distribuição dos valores da diferença entre a média de F0 e o valor de referência por informante ....................................................................................... 143 Figura 17: Gráfico da distribuição dos valores da diferença na variação de F0 em relação ao foco amplo, considerando pretônica e tônica, por tipo de foco (valores normalizados tomando como valor de referência o foco amplo) ........................... 145
Figura 18: Gráfico da distribuição dos valores da diferença na variação de F0 em relação ao foco amplo, considerando pretônica e tônica, por sintagma focalizado (valores normalizados tomando como valor de referência o foco amplo) ........................... 145 Figura 19: Gráfico da distribuição dos valores da diferença na variação de F0 em relação ao foco amplo, considerando pretônica e tônica, por informante (valores normalizados tomando como valor de referência o foco amplo) ................................................. 146 Figura 20: Gráfico da distribuição dos valores da diferença da intensidade da vogal tônica do constituinte focalizado em relação ao foco amplo por tipo de foco....................... 148 Figura 21: Gráfico da distribuição dos valores da diferença da intensidade da vogal tônica do constituinte focalizado em relação ao foco amplo por sintagma focalizado.......... 148 Figura 22: Gráfico da distribuição dos valores da diferença da intensidade da vogal tônica do constituinte focalizado em relação ao foco amplo por informante ........................ 148 Figura 23: Curva de F0 suavizada do padrão H* - HL* - L% na frase “A Gina fez café de noite” ...................................................................................................................... 153 Figura 24: Curva de F0 suavizada do padrão H* - LH* - LL* - L% na frase “Minha irmã trabalhou ontem” .................................................................................................... 153 Figura 25: Curva de F0 suavizada do padrão H* - ¡HL* - H% na frase “O Gustavo vai ser pai” ......................................................................................................................... 154 Figura 26: Curva de F0 suavizada do padrão LH* - H* - L% na frase “O irmão da Rosa comprou a casa da esquina” ................................................................................... 155 Figura 27: Curva de F0 suavizada do padrão H* - H* - LL* - L% na frase “A Flávia vai comprar um carro mês que vem” ........................................................................... 155 Figura 28: Curva de F0 suavizada do padrão H* - HH* - H% na frase “O Gustavo vai ser pai” ......................................................................................................................... 156 Figura 29: Curva de F0 suavizada do padrão H* - ¡HL * - L% na frase “A Gina fez café de noite” ...................................................................................................................... 156 Figura 30: Curva de F0 suavizada do padrão H* - ¡HL * - L% na frase “A Gina fez café de noite” ...................................................................................................................... 157 Figura 31: Tela do teste de percepção de tipo de foco .......................................................... 159 Figura 32: Dendrograma apresentando a distância (em termos de categorias de respostas) entre estímulos. O eixo horizontal vermelho indica o lugar de separação em 7 clusters segundo um critério de ganho de inercia. ................................................. 164 Figura 33: Tela do teste de percepção de exaustividade ....................................................... 169
Figura 34: Boxplot da porcentagem de reconhecimento da exaustividade pela presença de deaccenting ............................................................................................................ 173 Figura 35: Boxplot da porcentagem de reconhecimento da exaustividade pelo tipo de foco do estímulo .................................................................................................................. 174 Figura 36: Gráfico de dispersão da porcentagem de reconhecimento de exaustividade pelo alongamento da vogal tônica do foco .................................................................... 175 Figura 37: Boxplot da porcentagem de reconhecimento da exaustividade pela presença de acento tonal ascendente (LH*) ............................................................................... 175 Figura 38: Boxplot da porcentagem de reconhecimento da exaustividade por sintagma focalizado ............................................................................................................... 176 Figura 39: Gráfico de distribuição do reconhecimento do tipo de foco com o input de foco informacional ......................................................................................................... 178 Figura 40: Arquitetura da gramática no modelo minimalista ............................................... 225 Figura 41: Proposta de “arquitetura da linguagem” .............................................................. 226
LISTA DE QUADROS Quadro 1: Distribuição de línguas segundo parâmetros wh e pro-drop ................................. 33 Quadro 2: Distribuição dos exemplos de Menuzzi (2012) de acordo com Contraste, Denegação, Correção e Exaustividade .................................................................... 78 Quadro 3: Taxonomia dos símbolos utilizados no modelo ToBI ......................................... 112 Quadro 4: Resumo dos resultados encontrados por Araújo (2015) ...................................... 125 Quadro 5: Resultados encontrados por Bocci (2013), no experimento A ............................ 132 Quadro 6: Resultados encontrados por Bocci (2013), no experimento B ............................. 132 Quadro 7: Duração da vogal tônica do foco na focalização ampla e contrastiva produzidas pelo informante M2 ............................................................................................... 137 Quadro 8: Média de F0 na vogal tônica do foco na focalização ampla e contrastiva produzidas pelo informante M2 ............................................................................ 139 Quadro 9: Resultado do modelo linear de efeitos mistos para alongamento da vogal tônica do foco considerando todos os tipos de foco e todos os sintagmas focalizados ........ 141 Quadro 10: Resultado do modelo linear de efeitos mistos para alongamento da vogal tônica do foco, desconsiderando a diferença entre foco informacional e mirativo e considerando apenas a distinção sujeito-demais frases ......................................... 142 Quadro 11: Resultado do teste ANOVA para comparação dos modelos lineares de efeitos mistos quanto ao alongamento da vogal tônica do foco ....................................... 142 Quadro 12: Resultado do modelo linear de efeitos mistos para média de F0 da vogal tônica do foco, considerando todos os tipos de foco ....................................................... 144 Quadro 13: Resultado do modelo linear de efeitos mistos para variação de F0 entre vogal pretônica e tônica do foco, considerando todos os tipos de foco .......................... 146 Quadro 14: Resultado do modelo linear de efeitos mistos para variação de F0 entre vogal pretônica e tônica do foco, desconsiderando a diferença entre foco informacional e contrastivo ............................................................................................................. 147 Quadro 15: Resultado do teste ANOVA para comparação dos modelos lineares de efeitos mistos quanto à variação de F0 ............................................................................. 147 Quadro 16: Resultado do modelo linear de efeitos mistos para intensidade da vogal tônica do foco, considerando todos os tipos de foco ............................................................ 149 Quadro 17: Resumo dos resultados dos testes estatísticos para as medidas acústicas .......... 150 Quadro 18: Resumo das curvas entoacionais encontradas no experimento de produção ..... 152
Quadro 19: Distribuição dos dados de reconhecimento de tipo de foco por tipo de foco do estímulo ................................................................................................................. 160 Quadro 20: Distribuição de ocorrências de cada padrão entoacional nos 80 estímulos por tipo de foco conforme contexto de produção. .............................................................. 161 Quadro 21: Distribuição do reconhecimento do tipo de foco por padrão entoacional. ........ 162 Quadro 22: Distribuição dos clusters do dendrograma pelo tipo de foco conforme contexto de produção ........................................................................................................... 167 Quadro 23: Distribuição das respostas do teste de exaustividade por tipo de foco do estímulo ............................................................................................................................... 170 Quadro 24: Distribuição das respostas do teste de exaustividade por padrão fonológico .... 171 Quadro 25: Distribuição das respostas do teste de exaustividade por sintagma focalizado . 172 Quadro 26: Resultado do teste de regressão logística para o teste de exaustividade ............ 173 Quadro 27: Resumo da proposta de focalização in situ de Quarezemin (2012) ................... 188
SUMÁRIO 1
INTRODUÇÃO .............................................................................................................. 18 1.1.
DEFININDO FOCALIZAÇÃO E FOCALIZAÇÃO IN SITU ............................................................................. 18
1.2.
PRESSUPOSTOS TEÓRICOS ................................................................................................................... 24
1.2.1.
Gramática Gerativa e Teoria de Princípios e Parâmetros ............................................................ 24
1.2.2.
O Programa Minimalista e a arquitetura da gramática ................................................................ 36
1.2.3.
O problema da focalização para a arquitetura da gramática e a Cartografia Sintática .............. 45
1.3.
2
QUESTÕES DE PESQUISA ...................................................................................................................... 51
A SEMÂNTICA DA FOCALIZAÇÃO (IN SITU) ...................................................... 53 2.1.
O QUE É LF?........................................................................................................................................ 53
2.2.
ANÁLISES SOBRE A SEMÂNTICA DO FOCO ............................................................................................ 63
2.2.1.
Jackendoff (1974) .......................................................................................................................... 64
2.2.2.
Rooth (1992) .................................................................................................................................. 68
2.2.3.
Menuzzi (2012) .............................................................................................................................. 75
2.3.
3
FOCALIZAÇÃO: SEMÂNTICA OU PRAGMÁTICA?.................................................................................... 82
2.3.1.
Focalização e condições de verdade ............................................................................................. 82
2.3.2.
Focalização e quantificação .......................................................................................................... 87
2.4.
FOCO MIRATIVO: SEMÂNTICO? ............................................................................................................ 89
2.5.
RESUMO DO CAPÍTULO ........................................................................................................................ 92
A PROSÓDIA DA FOCALIZAÇÃO IN SITU ............................................................ 94 3.1.
O MAPEAMENTO DA SINTAXE NA FONOLOGIA, A FONOLOGIA PROSÓDICA E A TEORIA
AUTOSSEGMENTAL-MÉTRICA ........................................................................................................................... 95 3.1.1.
Fonologia Prosódica ..................................................................................................................... 97
3.1.2.
Teoria Autossegmental-Métrica .................................................................................................. 107
3.2.
ANÁLISE PROSÓDICA: ALGUMAS PALAVRAS ...................................................................................... 112
3.2.1. 3.3.
Métodos de estilização da curva de F0 ....................................................................................... 114 ANÁLISES SOBRE A PROSÓDIA DO FOCO ............................................................................................ 119
3.3.1.
Moraes (2006) ............................................................................................................................. 119
3.3.2.
Fernandes (2007) ........................................................................................................................ 120
3.3.3.
Araújo (2015) .............................................................................................................................. 123
3.3.4.
Carnaval (2017) .......................................................................................................................... 127
3.3.5.
Bocci (2013) ................................................................................................................................ 130
3.4.
NOSSO EXPERIMENTO........................................................................................................................ 134
3.4.1.
Teste de produção: metodologia ................................................................................................. 134
3.4.2.
Teste de produção: análise acústica ............................................................................................ 136
3.4.1.1. Duração ......................................................................................................................................................140 3.4.1.2. Média de F0 ................................................................................................................................................143 3.4.1.3. Intensidade .................................................................................................................................................147
3.4.1.2. Resumo dos resultados acústicos ................................................................................................................149
3.4.3.
Teste de produção: descrição dos contornos entoacionais ......................................................... 151
3.4.4.
Teste de percepção (tipo de foco): metodologia e resultados ..................................................... 158
3.4.2.1. Metodologia ...............................................................................................................................................159 3.4.2.2. Descrição dos resultados ............................................................................................................................160
3.4.5.
Teste de percepção (exaustividade): metodologia e resultados .................................................. 168
3.4.3.1. Metodologia ...............................................................................................................................................168 3.4.3.2. Descrição dos resultados ............................................................................................................................170 3.4.3.3. Análise estatística .......................................................................................................................................172
4
3.5.
DISCUSSÃO DOS RESULTADOS DOS EXPERIMENTOS ........................................................................... 177
3.6.
RESUMO DO CAPÍTULO ...................................................................................................................... 180
A SINTAXE DA FOCALIZAÇÃO IN SITU ............................................................. 182 4.1.
ANÁLISES SOBRE A SINTAXE DO FOCO IN SITU EM PB ........................................................................ 182
4.1.1.
Mioto (2001) ................................................................................................................................ 182
4.1.2.
Quarezemin (2012) ...................................................................................................................... 185
4.2.
O PROBLEMA DA ANÁLISE CARTOGRÁFICA – PARTE 1 (OU “O PROBLEMA DOS TIPOS DE FOCO”) ....... 191
4.3.
O PROBLEMA DA ANÁLISE CARTOGRÁFICA – PARTE 2 (OU “O PROBLEMA DAS ILHAS”) ..................... 201
4.4.
NOSSA PROPOSTA SINTÁTICA PARA A FOCALIZAÇÃO IN SITU ............................................................. 205
4.4.1.
Solução 1: exaustividade e quantificação como aspectos separados .......................................... 206
4.4.1.1. Movimento na perspectiva de Bošković (2007) e a Condição de Ativação ................................................212
4.4.2. 4.5.
5
Solução 2: quantificação como consequência da exaustividade ................................................. 217 RESUMO DO CAPÍTULO ...................................................................................................................... 220
CONSIDERAÇÕES FINAIS SOBRE A FOCALIZAÇÃO IN SITU ...................... 222 5.1.
RESUMO DA DISCUSSÃO .................................................................................................................... 222
5.2.
UMA APROXIMAÇÃO SOBRE A “ARQUITETURA DA LINGUAGEM” ....................................................... 225
5.3.
PESQUISAS FUTURAS ......................................................................................................................... 228
REFERÊNCIAS ................................................................................................................... 230 ANEXOS ............................................................................................................................... 240 ANEXO I: FALAS E CONTEXTOS DO TESTE DE PRODUÇÃO .............................................................. 241 ANEXO II: TERMO DE CONSENTIMENTO ASSINADO PELOS PARTICIPANTES DE AMBOS OS TESTES .......................................................................................................................................................... 246 ANEXO III: RESULTADOS DO TESTE DE PERCEPÇÃO POR TIPO DE FOCO ..................................... 247 ANEXO IV: RESULTADOS DO TESTE DE PERCEPÇÃO POR EXAUSTIVIDADE ............................... 249
| 18 1 INTRODUÇÃO Esta dissertação tem como objeto de pesquisa o fenômeno linguístico da focalização, propondo-se a responder uma série de perguntas relacionadas a esse fenômeno. No entanto, a primeira pergunta que precisa ser respondida é: o que é focalização? 1.1.Definindo focalização e focalização in situ Veremos adiante que há, no mínimo, duas definições para focalização correntes na literatura, e a diferença entre elas se dá na direcionalidade da relação entre interpretação e acento prosódico. Mas antes de vê-las, notemos um exemplo: (1)
A: O que aconteceu? B: O João comeu o bolo.
(2)
A: O João comeu o pão. B: O João comeu O BOLO (não o pão).
(3)
A: O que o João comeu? B: O João comeu o bolo.
As sentenças afirmadas por B em (1), (2) e (3) apresentam a mesma sequência de palavras. No entanto, a interpretação (pragmática) é diferente: enquanto em (1B) temos uma sentença neutra, em que toda a sentença é “informação nova”, em (2B) o informante faz um contraste em relação à afirmação dita em (2A), e a sentença em (3B) é a resposta à pergunta feira em (3A). Dizemos que (1B) é uma sentença de foco amplo. (2B) e (3B) são sentenças de foco estreito, focalizadas in situ: (2B) é uma sentença com foco contrastivo e (3B) uma sentença com foco informacional. Alguns trabalhos (Bianchi, Bocci, & Cruschina, 2016) ainda propõem um terceiro tipo de foco, que indica admiração e falta de expectativa, representado em (4B) e chamado de foco mirativo: (4)
A. O João comeu o bolo. B. Não acredito! O João comeu o bolo! Eu nunca imaginaria que ele fosse comer logo o bolo!
Em português do Brasil (doravante PB) também é possível expressar esses focos de outras maneiras1:
1
Para uma discussão sobre essas outras formas de focalização, indicamos o leitor a Quarezemin (2009).
| 19 (5)
a. Foi o bolo que o João comeu. b. O bolo foi que o João comeu. c. O que o João comeu foi o bolo. d. Foi o bolo o que o João comeu. e. O bolo foi o que o João comeu. f. O bolo que o João comeu. g. O bolo o João comeu. h. Foi o bolo.
(Clivada canônica) (Clivada invertida) (Pseudoclivada canônica) (Pseudoclivada invertida) (Pseudoclivada invertida c/foco pré-cópula) (Foco + que) (Ordem OSV – fronteamento) (Cópula + foco) (Quarezemin, 2009)
Esta dissertação tem a focalização como objeto de pesquisa, conforme já dito. No entanto, temos como recorte apenas as sentenças focalizadas cujo ordenamento dos constituintes não se altera, construção que chamamos de focalização in situ (demonstradas em (2B), (3B) e (4B)). Veremos que essas sentenças apresentam questionamentos importantes para a teoria da gramática adotada atualmente na perspectiva da Gramática Gerativa, na sua versão de Princípios e Parâmetros refinada pelo Programa Minimalista (Chomsky, 1981, 2015 [1995]). Os estudos sobre focalização dentro do arcabouço da Gramática Gerativa remontam aos trabalhos de Chomsky (1972) e, mais extensamente, Jackendoff (1974). Esses trabalhos, embasados teoricamente na Teoria Padrão (1965)2, partem de um pressuposto adotado ainda por abordagens mais recentes para o foco: a focalização precisa estar codificada na sintaxe, pois possui efeitos na interpretação semântica. Jackendoff embasa essa afirmação a partir da relação de pressuposição estabelecida em sentenças focalizadas, como demonstrado nos exemplos abaixo, de sentenças clivadas no inglês: (6)
Is it JOHN who writes poetry? É o João quem escreve poesia? a. No, it is BILL who writes poetry. Não, é o BILL quem escreve poesia. b. #No, it is JOHN who writes short stories #Não, é o JOÃO quem escreve contos. (Jackendoff, 1974)
Jackendoff argumenta que o motivo da infelicidade da resposta em (6b) é que a pergunta clivada apresenta como pressuposição que alguém escreve poesia. Como (6b) altera essa pressuposição, a sentença é degradada. Daí a necessidade de o sistema de regras da gramática prever a focalização na sua estrutura. 2
É preciso notar que o trabalho de Jackendoff apresenta modificações em relação à Teoria Padrão. Enquanto a última tem como pressuposto que é a deep structure que é enviada para interpretação semântica, Jackendoff propõe um modelo em que diferentes aspectos da interpretação semântica ocorrem em diferentes “fases” da derivação.
| 20 De fato, a definição de foco adotada por Jackendoff prevê que a relação de pressuposição que o foco estabelece é a característica definidora do foco: Como definições de trabalho, nós usaremos “foco de uma sentença” para denotar a informação na sentença que é assumida pelo falante como não sendo partilhada por ele e pelo ouvinte, e “pressuposição de uma sentença” para denotar a informação em uma sentença que é assumida pelo falante como sendo partilhada por ele e pelo ouvinte. (Jackendoff, 1974, p. 220. Tradução nossa.)3
No capítulo 2, quando discutirmos a semântica do foco, analisaremos em detalhe a proposta de Jackendoff e veremos por que ela é problemática. No entanto, é importante entender que a definição proposta pelo autor é, em linhas gerais, a definição utilizada por todos os estudos de focalização em gramática gerativa. Dessa forma, o foco seria a informação não crida pelo falante como sendo conhecida pelo ouvinte, enquanto a pressuposição seria a informação crida partilhada pelos interlocutores. Um outro aspecto adotado nesses estudos é a relação do foco com o acento frásico. No texto, Jackendoff defende que, embora sentenças clivadas sejam utilizadas em construções de marcação de foco (e que nessas sentenças o foco sempre está dentro do constituinte clivado), é o acento frásico o principal responsável pela marcação exata do material que está sendo focalizado. Ele dá os seguintes exemplos: (7) Was it an ex-convict with a red SHIRT that he was warned to look out for? Foi com um ex-condenado com uma CAMISA vermelha que ele foi avisado para tomar cuidado? a. No, it was an AUTOMOBILE salesman he was warned to look out for. Não, foi com um vendedor de CARROS que ele foi avisado para tomar cuidado. b. No, it was an ex-convict with a red TIE that he was warned to look out for. Não, foi com um ex-condenado com uma GRAVATA vermelha que ele foi avisado para tomar cuidado. c. No, it was a red-shirted AUTOMOBILE salesman that he was warned to look out for. Não, foi com um vendedor de CARROS de camisa vermelha que ele foi avisado para tomar cuidado.
As working definitions, we will use “focus of a sentence” to denote the information in the sentence that is assumed by the speaker not to be shared by him and the hearer, and “presupposition of a sentence” to denote the information in the sentence that is assumed by the speaker to be shared by him and the hearer. 3
| 21 d. No, it was an ex-convict with a shirt that is GREEN that he was warned to look out for. Não, foi com um ex-condenado com uma camisa que é VERDE que ele foi avisado para tomar cuidado. (Jackendoff, 1974) Jackendoff mostra que, apesar de o constituinte clivado ser “an ex-convict with a red shirt”, as respostas em (7a-7d) apresentam pressuposições diferentes: (8)
a. He was warned to look out for [someone] Ele foi avisado para tomar cuidado com [alguém] b. He was warned to look out for an ex-convict with [a something red / a red piece of clothing] Ele foi avisado para tomar cuidado com um ex-condenado com [algo vermelho / uma peça de roupa vermelha] c. He was warned to look out for [a someone with a red shirt / a red-shirted person] Ele foi avisado para tomar cuidado com [alguém com uma camisa vermelha / uma pessoa de camisa vermelha] d. He was warned to look out for an ex-convict with [a shirt of some particular color] Ele foi avisado para tomar cuidado com um ex-condenado com [uma camisa de alguma uma cor específica] (Jackendoff, 1974, p. 232. Adaptado)
A pressuposição em (8a) corresponde à sentença (7a), (8b) é pressuposição de (7b), (8c) é pressuposição de (7c) e (8d) é pressuposição de (7d). A sentença em (7a) é a única em que a pressuposição equivale a todo o material fora da clivada (e, consequentemente, o foco equivale a todo material clivado); em todos os outros casos é a acentuação marcada que vai definir qual elemento está focalizado (e, portanto, qual é a pressuposição válida, que é o ponto central da argumentação de Jackendoff). É importante notar que, embora Jackendoff aceite que o acento prosódico é responsável por marcar exatamente o constituinte focalizado, o autor não defende que o foco seja derivado da acentuação. Ele justifica:
| 22 Não é exatamente correto caracterizar a regra de atribuição de foco como estabelecendo o foco em “o sintagma contendo o acento principal.” Conter o acento principal é uma condição necessária, mas não suficiente para um sintagma ser foco. [...] Uma condição mais precisa pode ser colocada mais convenientemente como uma dependência da posição do acento da escolha do foco [...]. (Jackendoff, 1974, p. 237. Tradução nossa)4
O fato de o acento não ser o atribuidor do foco pode ser ilustrado em (9) abaixo: (9) Was it an ex-convict with a red SHIRT that he was warned to look out for? Foi com um ex-condenado com uma CAMISA vermelha que ele foi avisado para tomar cuidado? a. # No, it was an ex-convict with a red shirt that he was warned to GET AWAY with. #Não, foi com um ex-condenado com uma camisa vermelha que ele foi avisado para FUGIR. Em (9a) o acento prosódico está no verbo get away, mas não é possível que esse seja o foco da sentença, por não estar contido no material clivado (ainda que, como vimos, não seja necessário que ele seja exatamente todo o material clivado), gerando, assim, a inadequação da sentença. Por esse motivo, Jackendoff assume que é o constituinte focalizado na sintaxe que recebe o acento prosódico. A direcionalidade da focalização é semântica/pragmática → prosódia, não o contrário. Basicamente, a solução envolve a introdução, na estrutura de superfície, de um “marcador sintático F” (p. 240), que é uma entidade cuja função é sinalizar para a fonologia que o constituinte dominado por tal marcador deve receber o acento principal da sentença. O autor propõe dois sistemas de regras que se utilizam desse marcador, um na semântica e outro na fonologia. O problema da análise de Jackendoff reside justamente na aparente confusão que o autor faz entre semântica e pragmática. Na sua definição de foco, como vimos, Jackendoff assume que uma informação não pressuposta é uma informação não partilhada entre os informantes. No entanto, existe uma clara distinção entre esses dois conceitos: pressuposição é um conceito semântico, que não depende a priori de compartilhamento de informação5. Essa noção de fluxo informacional da focalização – em outras palavras, entender foco como informação nova, não
“It is not quite correct to characterize the focus assignment rule as establishing the focus on “a phrase containing the main stress.” Containing the main stress is a necessary but not suficiente condition for a phrase to be focus. [...] A more precise condition can be stated more conveniently as a dependence of stress position on choice of focus [...].” 5 No entanto, autores como Levinson (1983) consideração que pressuposição é um conceito da Pragmática. 4
| 23 partilhada – não é muito adequado, porque nem sempre um elemento focalizado é uma informação nova: (10) João está em uma biblioteca com Carlos. Eles estão procurando um livro específico que João leu e recomendou ao Carlos. Ao avistar o livro, João diz: a. Foi ESTE LIVRO que eu li.
(Guesser & Quarezemin, 2013, p. 202 Adaptado)
Na sentença em (10a) não há nenhuma informação nova: o referente livro e a informação de que João leu o livro são conhecidos por ambos os interlocutores. Não há nada que seja “novo” nessa sentença, e mesmo assim ela é focalizada. Dessa forma, é bastante complicado associar focalização com apresentação de informação não partilhada. Outro trabalho que tenta dar conta dessa questão é Chomsky (1972). O autor afirma explicitamente que “[o] foco é o sintagma contendo o centro de entoação; a pressuposição, uma expressão derivada pela substituição do foco por uma variável. (p. 102. Tradução nossa)6. É importante notar que a definição de Chomsky difere da de Jackendoff pela direcionalidade. Enquanto Jackendoff afirma que a interpretação semântica/pragmática do foco é a que determina a entoação, Chomsky prefere definir foco pela prosódia e afirmar que é a marcação prosódica que interfere na interpretação pragmática. Embora não afirme categoricamente uma solução para a sintaxe da focalização, ele sugere que uma solução seria assumir uma regra de reescritura7 que reescreveria uma sentença S em F(foco) + P(pressuposição), como (11): (11)
S→F+P
Assim, casos como a infelicidade de (9a) seriam explicados por uma regra que determinaria que uma resposta à sentença expressa pela regra em (11) só seria uma resposta natural se o valor de P fosse igual para ambas as sentenças. No entanto, o próprio Chomsky reconhece que essa solução não é muito adequada. Assim sendo, a noção de foco tem sido definida a partir de dois fatores: um fator fonológico (ser o elemento mais proeminente de uma sentença) e um fator semânticopragmático (ser o elemento não pressuposto da sentença, pressuposição sendo definida, nesses trabalhos, a partir de uma visão mais pragmática do que semântica8). No próximo capítulo nos “The focus is a phrase containing the intonation center; the pressuposition, an expression. derived by replacing the focus by a variable.” 7 As regras de reescritura eram um instrumento teórico adotado nas primeiras décadas da teoria gerativa (Chomsky, (Chomsky, 1957, 1965) para dar conta da composição de sintagmas. Por essas regras, um sintagma maior era decomposto em unidades menores. Por exemplo, um NP era decomposto em Det(erminante) + N. 8 Subentende-se dessa afirmação que estamos considerando uma separação entre semântica e pragmática. No capítulo 2 desta dissertação abordaremos com mais detalhes esse assunto. 6
| 24 dedicaremos a formar uma definição estritamente semântica, mas, por ora, adotaremos a segunda definição aqui elencada. Tendo definido o que é foco, é preciso responder à seguinte pergunta: por que é necessário assumir, assim como Jackendoff, que a focalização está inserida na estrutura sintática? Afirmamos que, para o autor, o foco está codificado na estrutura sintática porque possui efeitos na semântica, e ele parte da premissa de que a interpretação semântica precisa estar codificada na estrutura sintática. No entanto, se desconsiderarmos essa premissa (pelo menos uma versão mais dura dela), essa necessidade não se faz presente. Então, qual é a real necessidade de imputar ao foco uma codificação sintática? Podemos responder essa pergunta se olharmos para o modelo atualmente aceito da arquitetura da gramática, proposto inicialmente por Chomsky (1981) e refinado posteriormente (Chomsky, 2015). No entanto, para que essa justificativa seja mais simples, se faz necessário apresentar os pressupostos básicos da Teoria Gerativa, especialmente da Teoria de Princípios e Parâmetros, bem como dos desdobramentos teóricos vindos dessa teoria. Faremos isso na seção seguinte. 1.2.Pressupostos teóricos Como já sinalizado anteriormente, esta dissertação adota o modelo da Gramática Gerativa, especialmente a Teoria de Princípios e Parâmetros. Nesta seção, nos dedicaremos a apontar algumas premissas teóricas importantes desse arcabouço teórico, premissas essas que motivam a proposta aqui desenvolvida e estão subjacentes a ela. Além disso, nos dedicaremos a analisar detidamente alguns desdobramentos advindos dessa teoria – como o Programa Minimalista (Chomsky, 2015) e a Cartografia Sintática (Chomsky, 2004; Cinque, 1999; Rizzi, 1997, 2004; Rizzi & Bocci, 2017) –, cuja especificidade será necessária para entendermos a proposta adotada neste trabalho.
1.2.1. Gramática Gerativa e Teoria de Princípios e Parâmetros9 O que significa o termo “gerativa”? Esse conceito, vindo da matemática, se relaciona à capacidade de um elemento gerar outros elementos. Tomemos como exemplo uma função como 2x. Tal função é capaz de gerar infinitos números, como: 22 = 4; 23 = 8; 24 = 16; 25 = 32; etc. Uma função matemática é gerativa no sentido de que, sempre que substituirmos uma variável
9
Como o objetivo desta seção é apenas apresentar um panorama geral da teoria da linguagem na Gramática Gerativa, nos eximimos de apresentar diversas questões relevantes para a teoria. Para uma discussão mais aprofundada, convidamos o leitor a analisar a obra de Guimarães (2017).
| 25 por um número, a função irá gerar outro número. Por exemplo, a função f(x) = 2x é capaz de gerar o dobro de qualquer número pelo qual substituamos o x. Sabemos que o termo “gramática” se refere, usualmente, a um conjunto de regras linguísticas. Logo, temos como conclusão que uma “gramática gerativa” é um conjunto de regras capaz de gerar infinitas sentenças de uma língua. É importante notar que essa definição de gramática gerativa (e todas as premissas subjacentes a ela) não é extensional, mas intensional. O que isso significa? Os termos extensão e intensão são próprios da teoria de conjuntos. Pensemos novamente na função f(x) = 2x, que apresentamos no parágrafo anterior. Como dissemos, essa função pega todos os valores de x e os converte em seu dobro. Se tivermos um conjunto composto pelos números 2, 3, 4 e 10 (cujo nome, conforme aprendemos na escola, é domínio), o resultado da função aplicada a esse conjunto será o conjunto 4, 6, 8 e 20 (cujo nome, que também aprendemos na escola, é imagem). Nesse exemplo, dizemos que o conjunto {4, 6, 8, 20} é a representação extensional da função; já o conjunto {y: y=2x}, onde x pertence a {2, 3, 4, 10}, é a representação intensional do conjunto imagem da função. Mas o que esse exemplo significa em termos de língua? Quando dizemos que a gramática gerativa é voltada para a intensão, estamos dizendo que seu objeto não é o conjunto de sentenças geradas pelas regras da língua, mas sim as próprias regras (ou, mais corretamente, princípios) responsáveis por sua produção. Em outras palavras, o termo intensão se refere ao conjunto de regras de formação das sentenças de uma língua, enquanto o termo extensão se refere ao conjunto de sentenças de uma língua. Note que, para se chegar a uma gramática extensional é necessário um corpus, um conjunto de sentenças das quais se possa extrair um conjunto de regras. Essas regras precisam ser adequadas para explicar a regularidade daquele corpus específico. No entanto, é possível que o conjunto de regras capazes de explicar um determinado corpus não seja o mesmo conjunto de regras necessárias para dar conta de todas as sentenças de uma língua, isso porque nenhum corpus contém todas as sentenças de uma língua (já que tal conjunto é infinito). Ainda mais: conjuntos limitados de sentenças de uma língua podem ser adequadamente descritos por mais de uma gramática (no sentido de um conjunto de regras que explicam uma regularidade). Nesse caso, não haveria uma gramática única da língua que poderia servir de objeto de estudo, inviabilizando o estudo da língua. Daí a escolha, por parte dos teóricos gerativistas, de pensar uma teoria linguística capaz de fornecer um conjunto de regras gerativas (ou princípios) que expliquem o conhecimento internalizado dos falantes de uma língua, pois tal teoria conseguiria explicar a formação de todas as sentenças de tal língua. Nessa perspectiva, uma língua não seria
| 26 um conjunto de sentenças, mas um conjunto de regras / princípios representados na mente dos indivíduos. Nesses termos, podemos falar em uma única gramática, capaz de ser um objeto de estudo. Essa “gramática gerativa” teria o potencial de explicitar as estruturas sintáticas – chamadas por Chomsky (1965) de descrições estruturais (structural descriptions – SDs) – necessárias para dar conta de todas as sentenças da língua conforme representadas na mente dos falantes. Vejamos um breve exemplo do que foi dito acima. Imaginemos uma língua fictícia X, com um corpus como o de (12) abaixo10: (12)
a. [Suj Mafagafos] [Obj gotemadas] [Adv lubricamente] [V prelecaravam]. b. [Obj Gotemadas] [Suj mafagafos] [Adv lubricamente] [V prelecaravam]. c. [Obj Gotemadas] [Adv lubricamente] [Suj mafagafos] [V prelecaravam]. d. [Adv Lubricamente] [Suj mafagafos] [Obj gotemadas] [V prelecaravam]. e. *[V Prelecaravam] [Adv lubricamente] [Suj mafagafos] [Obj gotemadas].
Se fôssemos estabelecer uma gramática extensional para essa língua, poderíamos propor duas regras: (13) A. Verbos não podem iniciar sentença. A’. Verbos devem estar na última posição da sentença. Ambas as regras dão conta do corpus em (12). Se supormos duas gramáticas, uma com a regra (13a) e outra com a regra (13a'), igualmente descreveríamos o corpus. No entanto, qual das duas gramáticas está “certa”? Do ponto de vista exclusivamente descritivo, ambas estão corretas. Isso ilustra o fato que apontamos acima: a língua X, enquanto um corpus de expressões linguísticas, pode ser descrita por duas gramáticas. Como eleger uma dessas gramáticas como objeto de estudo? Isso é inviável. Por outro lado, se elegemos como objeto de estudo a representação mental da língua X nos indivíduos, cabe a pergunta: Qual das duas regras em (13) é aquela que está na mente do indivíduo? A partir do momento que nos fazemos essa pergunta, estamos saindo da análise estrita do corpus e passando a buscar uma regra que possa se aplicar à representação mental da língua X. Estamos, na realidade, buscando uma gramática gerativa para essa língua. Ou seja, estamos em busca de “um procedimento gerativo finitamente especificado (função), que enumera um conjunto infinito de SDs” capaz de descrever/explicar todas as sentenças da língua X (Chomsky, 1995, p. 12. Tradução nossa)11. Essa gramática
10
Como é usual na literatura gerativa, o asterisco (*) é usado para indicar agramaticalidade de uma sentença, o fato de que tal sentença não é uma sentença da língua. 11 “[...] a finitely specified generative procedure (function) that enumerates an infinite set of SDs.”
| 27 representa um conjunto de conhecimentos capazes de gerar um conjunto de SDs capazes de descrever todos os dados da língua, bem como os dados que não fazem parte da língua, apontando para como os falantes da língua X são capazes de gerar as frases (12a-d) e não são capazes de gerar (12e). O que dissemos acima indica uma outra questão importante que diferencia a gramática gerativa de outras teorias linguísticas: a teoria gerativa se preocupa não apenas com o conjunto de sentenças da língua, mas com o conjunto de sentenças que não fazem parte da língua. Em outros termos, ao analisar julgamentos de gramaticalidade (se falantes aceitam ou não certas sentenças), o linguista recebe evidências positivas e negativas, a partir das quais formula as hipóteses. Nesse sentido, o conjunto de SDs da língua, além de dar conta de gerar todas as suas sentenças, também deve ser capaz de excluir todas as sentenças que não são produzidas. Voltando ao nosso exemplo da língua X, uma gramática gerativa deve explicar por que a sentença (12e) não faz parte do conjunto de sentenças da língua. Nesse sentido, o linguista que adota a gramática gerativa não está preocupado com noções tais como uso, história da língua, etc., mas seu objetivo é identificar e explicar as regras/princípios linguísticos capazes de gerar todas e apenas as sentenças de uma língua; seu olhar é “para dentro” da língua, não “para fora”12. Isso porque a o conhecimento linguístico internalizado dos falantes é a única coisa que pode ser estudada sistematicamente. Outra questão relevante para a teoria gerativa está relacionada ao que Chomsky chamou de adequação explanatória (Chomsky, 1965, p. 25). Se uma teoria linguística é capaz de explicar a regularidade dos dados da língua (ou seja, determinar a formação das SDs de uma língua), dizemos que tal teoria atingiu adequação descritiva: essa teoria é capaz de gerar todas e apenas as sentenças encontradas na língua. Por outro lado, uma teoria linguística atinge adequação explanatória quando consegue responder ao que ficou conhecido como o problema de Platão, resumido nas palavras de Bertrand Russel e aludidas por Chomsky: “como os seres humanos, cujos contatos com o mundo são breves, pessoais e limitados, são, no entanto, aptos
12
Convém deixar claro que o linguista gerativista não trata questões relacionadas a uso e história da língua como irrelevantes. A questão aqui é que tais assuntos não exercem influência nas regras gerativas constituintes da língua na sincronia analisada. Saber, por exemplo, que os pronomes em português apresentam diferenciação de caso porque vieram do latim não é uma questão relevante na busca de entender quais regras permitem que tais pronomes existam e como eles se relacionam com os diferentes constituintes das sentenças. Da mesma forma, saber que uma certa palavra é mais frequente que outra não impacta (na sincronia) nas regras que coordenam a relação dessa palavra com outras na formação de sentenças. É evidente que podemos fazer uma análise diacrônica de uma língua através da perspectiva gerativa, sendo que, nesse caso, o enfoque está em analisar a mudança de uma determinada regra no decorrer da história. De fato, esse é um campo bastante frutífero dentro da análise linguística. Podemos citar estudos recentes que se debruçam sobre questões da história do PB através da teoria gerativa, como Avelar e Galves (2016), dentre outros.
| 28 a saber tanto quanto eles realmente sabem?” (Chomsky, 1986, p. xxv Tradução nossa)13. Em outras palavras: não parece razoável aceitar que nós chegamos ao mundo sem saber absolutamente nada e, ainda assim, sermos capazes de saber tudo que sabemos e, especialmente, aprender tudo que aprendemos com tanta velocidade quando somos crianças. Então, como nós sabemos tudo que sabemos? A resposta para o problema de Platão foi formulada de diversas formas no decorrer da história da filosofia: o próprio Platão usa como solução o Mundo Inteligível, que seria uma existência pré-corpórea na qual temos contato com a ideia das coisas (o conhecimento real delas), de modo que na nossa existência corpórea, no Mundo Sensível, nós já possuímos tais conhecimentos latentes no nosso espírito14. Chomsky concorda com a argumentação de Platão no sentido de que o conhecimento já é preexistente ao indivíduo (embora não aceite a ideia do Mundo Inteligível e de uma vida pré-corpórea). A postura de Chomsky é a de que exista um conjunto de conhecimentos sobre a linguagem universal à espécie homo sapiens sapiens, e que esse conjunto de conhecimentos é transmitido geneticamente, como veremos a seguir. Na área da linguagem, o problema de Platão ganha corpo com o argumento da pobreza do estímulo: 1. 2. 3.
4. 5. 6.
Um número indefinido de conjuntos alternativos de princípios é consistente com as regularidades encontradas nos dados linguísticos primários. O conjunto de princípios corretos não precisa ser (e tipicamente não é), em qualquer sentido pré-teórico, mais simples ou mais natural do que as alternativas. Os dados que são necessários para escolher entre esses conjuntos de princípios não são, em muitos casos, do tipo de dados que estão disponíveis para um aprendiz empirista na situação epistêmica da criança. Então, se as crianças são aprendizes empiristas, elas não poderiam confiavelmente chegar à gramática correta da sua língua. As crianças confiavelmente chegam à gramática correta da sua língua. Logo, as crianças não são aprendizes empiristas. (Laurence & Margolis, 2001. Tradução nossa) 15
“The essence of Plato’s problem was well expressed by Bertrand Russel in his later work when he raised the question: ‘How comes it that human beings, whose contacts with the world are brief and personal and limited, are nevertheless able to know as much as they know?’” 14 Para mais informações sobre esse assunto, indicamos o leitor aos diálogos platônicos Teeteto e, mais especificamente para a questão da linguagem, Crátilo. 15 “1. An indefinite number of alternative sets of principles are consistent with the regularities found in the primary linguistic data. 2. The correct set of principles needn’t be (and typically isn’t) in any pretheoretic sense simples or more natural that the alternatives. 3. The data that would be needed for choosing among these sets of principles are in may cases not the sort of data that are available to an empiricist learner in the child’s epistemic situation. 4. So if children were empiricist learners, they couldn’t reliably arrive at the correct grammar for their language. 5. Children do reliably arrive at the correct grammar for their language. 6. Therefore, children aren’t empiricist learners.” 13
| 29 É importante entender os passos lógicos desse argumento, para que se possa entender a resposta dada pela Teoria Gerativa ao problema de Platão. Na proposição 1, é afirmado que os dados linguísticos primários (PLD – primary linguistic data, termo que se refere aos dados linguísticos – as sentenças – que a criança ouve no período de aquisição da língua) possuem regularidades tais que se torna coerente afirmar que há conjuntos de princípios capazes de reger e explicar essas regularidades, e que, em tese, diferentes conjuntos de princípios podem explicar satisfatoriamente os PLD (semelhantemente ao que apontamos na página 25 para nosso exemplo da língua X). A proposição 2 aborda a ideia de que, dentre esse conjunto de princípios, não é possível dizer se um princípio é mais simples ou mais natural do que outro (isso em um sentido pré-teórico, ou seja, sem levar em conta uma teoria determinada). No entanto, é natural pensar que, considerando todos os dados da língua, um desses princípios deve ser mais correto do que outro. Isso quer dizer que deveria haver dados suficientes para determinar quais das opções é a correta. A proposição 3 afirma que esses “dados suficientes” não estão disponíveis para a criança e não são de seu conhecimento caso ela seja um aprendiz empirista. Por aprendiz empirista devemos entender a criança que nasce sem nenhum conhecimento específico de linguagem, e, na melhor das hipóteses, dispõe apenas de mecanismos gerais de construção de conhecimento (como associação, abstração, reconhecimento de padrões, etc). Isso é relacionado ao que Chomsky afirma sobre o que constitui os dados linguísticos primários: Isso [os PLD] deve incluir exemplos da performance linguística que são tomados como sentenças bem formadas, e também pode incluir exemplos designados como não-sentenças, e com certeza muitas outras informações do tipo que é necessário para o aprendizado da linguagem, independente do que isso possa ser. (Chomsky, 1965, p. 25 Tradução nossa)16
Os PLD, além de não serem ofertados em tamanho suficiente para que um aprendiz empirista possa chegar à plena competência linguística, muitas vezes incluem dados que não são sentenças válidas na língua. Isso ocorre porque o fluxo natural da fala que a criança ouve (que recebe imensa influência de pressões externas à língua) é repleto de hesitações e erros acidentais (conhecidos como lapsus linguae). As proposições 4, 5 e 6 apenas apresentam as consequências das premissas estabelecidas em 1, 2 e 3. Pela proposição 4, se os dados capazes de fazer com que a criança chegue à gramática correta de sua língua não estão disponíveis (e ela, como aprendiz empirista, não 16
This must include examples of linguistic performance that are taken to be well-formed sentences, and may include also examples designated as non-sentences, and no doubt much other information of the sort that is required for language learning, whatever this may be.
| 30 possui nenhum conhecimento prévio e, por isso, não tira princípios “da cartola”), então ela não consegue chegar a essa gramática. Na proposição 5, põe-se o óbvio, que as crianças chegam à gramática correta de sua língua (afinal, toda criança com saúde perfeita chega ao domínio pleno de sua língua materna). Por fim, a proposição 6 apresenta a conclusão lógica, de que as crianças não são aprendizes empiristas, justamente pelos dados precários aos quais elas são expostas (pobreza de estímulo). Se as crianças não são aprendizes empiristas, é lógico pensar que algo preceda o ser humano (relembrando a eterna disputa filosófica entre empirismo e mentalismo). Mas como isso se dá? Uma premissa fundamental nessa linha de argumentação é a de que a línguagem é um mecanismo inato do ser humano. A linguagem, nesse sentido estrito, é uma faculdade intrínseca aos humanos: nós nascemos com um conjunto de conhecimentos linguísticos determinados geneticamente. Após o nascimento (e alguns anos após isso), com a exposição aos PLD (isto é, conforme vamos ouvindo a língua falada onde nascemos), nós naturalmente consolidamos os conhecimentos particulares relativos à língua à qual somos expostos, usando para isso esse conjunto de conhecimentos com o qual nascemos. A Teoria de Princípios e Parâmetros é uma abordagem que tenta explicar como essa dinâmica acontece. Chomsky (Chomsky, 2015) resume bem essa ideia: A faculdade da linguagem possui um estado inicial, determinado geneticamente; no curso normal do desenvolvimento, essa faculdade passa por uma série de estados cedo na infância, alcançando um estado uniforme relativamente estável que passa por poucas mudanças subsequentes, além do léxico. Para uma boa primeira aproximação, o estado inicial parece ser uniforme à espécie. (p. 12. Tradução nossa)17
O estado inicial aludido por Chomsky é chamado de Gramática Universal (GU). Essa gramática representa um conjunto de princípios abstratos já existentes na mente do bebê e determinadas geneticamente. Esses elementos constituintes da GU são chamados de Princípios. Hornstein et al. (2013) ilustram bem a definição de Princípios da GU:
“The language faculty has an initial state, genetically determined; in the normal course of development it passes through a series of states in early childhood, reaching a relatively stable steady state that undergoes little subsequent change, apart from the lexicon. To a good first approximation, the initial state appears to be uniform for the species.” 17
| 31 Esses princípios gerais podem ser considerados como uma receita para “cozinhar” a gramática de uma língua particular GL por combinar, peneirar, organizar e misturar os dados linguísticos primários de maneiras especificáveis. Ou, para fazer o mesmo ponto menos gastronômico, a GU pode ser considerada como uma função que pega os PLD como input e entrega uma gramática particular (como inglês, português do Brasil, alemão, etc.), uma GL, como output. (p. 3. Tradução nossa) 18.
No início deste capítulo, quando apresentamos o conceito “gerativo” em matemática, dissemos que funções são, basicamente, procedimentos gerativos porque tomam um input e entregam um output. Uma função como f(x) = 2x retorna como output o dobro de um número. Na perspectiva apontada por Hornstein et al., a GU é bastante semelhante, pois toma os dados linguísticos ouvidos pela criança como input e entrega um output que será uma língua particular. Aqui cabe uma pergunta: qual é a natureza dessa função? Essa é a pergunta de ouro para o gerativismo. A empreitada gerativista se completará quando chegarmos a uma resposta definitiva a essa pergunta: quando descobrirmos o conjunto de conhecimentos constituintes dessa GU e o modo como nossa exposição aos dados linguísticos entra na GU e, após o período de aquisição da língua, saímos como falantes plenamente competentes da nossa língua materna. Uma postura kantiana afirmaria categoricamente que nós nunca chegaremos a essa resposta. No entanto, faz parte do trabalho científico aproximar-se o máximo possível da explicação da realidade, e isso é o que todo linguista gerativista deve ter em mente ao analisar um fenômeno linguístico particular, na busca de aumentar um pouco nosso conhecimento sobre a GU. Como ver esses princípios na prática? Um exemplo clássico de Princípio diz respeito à ligação de pronomes com seus correferentes. Vejamos o exemplo abaixo: (14)
a. Elei encontrou o Joãoj na feira. b. *Elei encontrou o Joãoi na feira.
No exemplo em (14b) acima, é impossível a interpretação de que o João tenha visto a si próprio na feira, pois o DP [o João] é uma expressão referencial, e não pode estar ligado ao pronome [ele]19. Essa regularidade continua sendo atestada em todas as línguas até o momento, nos dando motivo para pensar que isso é um conhecimento com o qual nascemos, ou seja, tal conhecimento está presente no estado inicial da linguagem, na nossa GU. Além disso, é interessante notar que o exemplo acima corrobora a discussão que empreendemos sobre o “These general principles can be tought of as a recipe for “baking” the gramar of a particular language GL by combining, sifting, sorting and stirring the primary linguistic data in specificable ways. Or, to make the same point less gastronomically, UG can be tought of as a function that takes PLD as input and delivers a particular grammar (os English, Brazilian Portuguese, German, etc.) a GL, as output.” 19 Como o objetivo desta dissertação não é explicar os princípios da Teoria da Ligação, não nos dedicaremos a uma nomenclatura refinada nem a uma explicação mais detalhada. Para uma explicação mais pormenorizada desse assunto, indicamos o leitor a Carnie (2013, cap. 5). 18
| 32 argumento da pobreza de estímulo: a criança não recebe informação dos PLDs que a impossibilite de interpretar (42b). O input, nesse caso, é igualmente consistente para as duas interpretações, embora todos os falantes de português interpretem apenas (41a) – o que indica que o estímulo não é suficiente para explicar a organização da gramática na mente do falante. Voltando a analisar a citação de Chomsky, a GU não é o estado final da faculdade da linguagem (o que é óbvio, já que nem todos os seres humanos falam a mesma língua). No decorrer da infância, nós somos expostos às línguas particulares faladas por nossos pais e pelas pessoas à nossa volta. Nesse processo, nós intuitivamente fixamos valores para alguns parâmetros não especificados na nossa GU: Esses parâmetros abertos podem ser considerados como botões “on/off”, com cada coleção de configurações constituindo uma G L particular. Nessa visão, adquirir uma língua natural equivale a assinalar valores a esses parâmetros abertos, i.e., “fixando” esses parâmetros, algo que a criança faz com base nos PLD que elas têm acesso no seu ambiente linguístico. (Hornstein et al., 2013, p. 3. Tradução nossa) 20
Não é correto afirmar que nós “inventamos regras” baseadas no input linguístico. Na realidade, a GU contém, virtualmente, as possibilidades de fixação dos parâmetros. Com a exposição aos PLD, a criança fixa os valores desses parâmetros, cujo resultado é uma língua particular. Vejamos um exemplo simplificado: imagine que uma criança nasce no Brasil, outra nasce na China e uma terceira nasce nos EUA ao mesmo tempo. Todas são saudáveis e possuem sua GU intacta – o que significa dizer que, em termos de linguagem, as três crianças estão exatamente no mesmo estado inicial. A criança brasileira ouve sentenças como (15), a criança americana ouve sentenças como (16) e a criança chinesa ouve sentenças como (17): (15)
a. O que Hufei comprou? b. Eu acho que (ele) viu (ele).
(16)
a. What did Hufei buy? b. I think he saw him.
(17)
a. Hufei mai-le shenme b. wo xiang (ta) kanjian (ta) le.
(B. L. L. Cheng, 2003, p. 103) (Huang, 1989, p. 187)
These open parameters can be thought of as “on/off” switches, with each collection of settings constituting a particular GL. On this view, acquiring a natural language amounts to assigning values to these open parameters, i.e. ‘setting’ these parameters, something that children do on the basis of the PLD that they have access to in their linguistic environments.” 20
| 33 As sentenças em (15a), (16a) e (17a) envolvem a posição do pronome interrogativo. Em inglês e português, vemos que o interrogativo normalmente se move para o início da sentença (o pronome “o que” e “what” se referem ao objeto do verbo “comprar” e “buy”, respectivamente). Já em chinês (no caso, mandarim), o pronome “shenme” se mantém in situ. A criança chinesa, ao ouvir sempre pronomes interrogativos in situ fixa o chamado “parâmetro wh” com o valor correspondente ao wh in situ, ao passo que as crianças brasileira e americana, ao verem sempre o padrão de movimento de wh, fixam o valor desse parâmetro correspondente ao valor de wh movido21. Já as sentenças em (15b), (16b) e (17b) envolvem a possibilidade da manifestação fonética de pronomes. Note que o caso agora é inverso: enquanto o português e o mandarim possibilitam a omissão de pronomes (quando seus correferentes estão disponíveis no discurso), o inglês não permite tal omissão, de modo que é obrigatória a manifestação fonética do pronome. Podemos dizer, então, que a criança americana fixa esse parâmetro (chamado parâmetro pro-drop) com o valor negativo, enquanto as crianças brasileira e chinesa fixam esse parâmetro com o valor positivo. A tabela 1 abaixo apresenta a distribuição desses parâmetros entre as três línguas: Português Inglês Mandarim
wh + + -
pro drop + +
Quadro 1: Distribuição de línguas segundo parâmetros wh e pro-drop Fonte: Elaboração própria
Através da noção de parâmetros é possível dar conta de várias diferenças entre as línguas de forma que o processo de aquisição possa ser uniforme entre a espécie homo sapiens sapiens, alcançando assim a adequação explanatória. Esse ponto é importante, pois a essa afirmação subjaz um princípio chamado por Chomsky (Chomsky, 2001, p. 3) de Princípio da Uniformidade: (18) Na ausência de evidência convincente, assume-se que as línguas são uniformes, com a variação restrita a propriedades facilmente detectáveis dos enunciados.22
21
No caso do português, a questão é um pouco mais complexa, pois é perfeitamente possível manter o wh in situ: (i) Hufei comprou o quê? No caso do chinês a questão também é complexa, pois essa língua possui um parâmetro topic-drop, que permite o apagamento de constituintes desde que o constituinte apagado seja tópico. No entanto, vamos ignorar essas questões para simplificar a explicação. 22 “In the absence of compelling evidence, assume languages to be uniform, with variety restricted to easily detectable properties of utterances.”
| 34 Tendo (18) em mente, qualquer análise gerativa que olhe para um fenômeno específico de uma língua específica deve, necessariamente, levar em conta o impacto que essa análise teria se aplicada a outras línguas; trazendo essa afirmação para nosso objeto de estudo, nossa análise para a focalização in situ precisa ser adequada para explicar o fenômeno em todas as outras línguas que também apresentam esse fenômeno. Caso isso não se verifique, é necessário (i) buscar outra análise que possa ser aplicada a todas as línguas, ou (ii) justificar análises independentes para tais línguas. Após a fixação de todos os parâmetros relevantes, podemos dizer que o falante atingiu o estado final da faculdade da linguagem. A língua em seu estado final chamamos de LínguaI. A letra I indica que essa língua é interna, individual e intensional: intensional pelo motivo que já vimos (ela é especificada pela intensão, ou a função – no sentido matemático do termo – que a capacita de gerar infinitas SDs); interna porque está atrelada ao funcionamento da mente/cérebro do indivíduo; e individual porque é restrita apenas ao indivíduo. A esse conjunto de conhecimentos pertencentes unicamente à língua-I damos o nome de competência. O que o falante “faz com esse conhecimento” (Chomsky, 1995, p. 12. Tradução nossa)23 é chamado de desempenho. Note que esse conceito de língua não é o mesmo daquele que politicamente chamamos de idioma: podemos dizer que, no Brasil, as pessoas têm o português como língua apenas no sentido de que o conjunto de indivíduos residentes no espaço geográfico politicamente determinado como República Federativa do Brasil possui, em certa medida, línguas-I semelhantes entre si24. Se a população do Brasil é estimada em 208.695.768 pessoas25, podemos dizer que há 208.695.768 línguas-I, e apenas podemos tratar essas línguas-I como PB de forma derivativa, considerando que todas essas línguas-I possuem semelhanças suficientes para enquadrá-las em um mesmo conjunto. Isso é completamente diferente do conceito de língua enquanto produto social, tal como definido por Saussure (Saussure, 2006 [1916])26: Mas o que é a língua? [...] É, ao mesmo tempo, um produto social da faculdade de linguagem e um conjunto de convenções necessárias, adotadas pelo corpo social para permitir o exercício dessa faculdade nos indivíduos. (p.17)
“[...] does with this knowledge [...].” Embora nem sempre seja o caso. Por vezes, uma língua x pode se referir a línguas-I totalmente diferentes. Esse é o caso, por exemplo, do chinês, que abarca línguas diferentes, como mandarim e cantonês. 25 Fonte: https://www.ibge.gov.br/apps/populacao/projecao/box_popclock.php. Acesso: 15/08/2018. 26 O pensamento de Saussure é bem mais complexo do que o que está exposto aqui. No entanto, está fora do escopo desta dissertação tecer comentários a respeito do conceito de língua em Saussure; apenas queremos estabelecer o contraponto entre os conceitos de língua adotados por Saussure e pelo gerativismo. 23 24
| 35 Por esse motivo são inócuas as críticas feitas ao gerativismo baseadas no fato de que as análises gerativistas geralmente não envolvem coleta de dados de fala em contextos reais de uso. Ora, é óbvio que a abordagem gerativa não depende do uso, porque o uso nada mais é do que a concretização permitida pela capacidade gerativa da língua-I; o uso é uma realização concreta do desempenho de um conjunto de falantes. Esse uso ainda sofre efeitos de elementos que não têm a menor relação com o sistema linguístico (entende-se “sistema linguístico” pela língua-I), tais como a frequência e a história de certas palavras/expressões, o contexto discursivo, as possíveis limitações fisiológicas na produção de alguns sons em alguns indivíduos (no caso da fonologia), as limitações de processamento (relacionadas, entre outras coisas, à memória de trabalho), etc. É óbvio que a análise gerativa precisa de dados de fala para chegar a generalizações sobre a constituição da língua-I (já que a língua-I, por ser um objeto mental e abstrato, não é diretamente acessível a nós), mas é necessário ter em mente que o objeto de estudo do gerativismo não são os dados per se, mas o “motor” gerativo capaz de produzir os dados e excluir as sentenças que não são dados de uma determinada língua. Um outro motivo pelo qual não se pode culpar o gerativismo de um suposto “erro” de desconsiderar contextos reais de uso se relaciona ao que aludimos acima sobre evidência negativa. Os dados reais de uso apenas dão informação sobre evidência positiva (as sentenças que existem na língua), mas não nos são informadas as sentenças que não fazem parte da língua. Como chegar a uma generalização adequada do mecanismo gerador de uma língua se não sabemos se essa generalização permitiria a existência de sentenças que, na realidade, não existem (e nem poderiam existir)? Um modelo assim, incapaz de barrar sentenças agramaticais, não representa com correção uma língua-I, de modo que não é possível confiar apenas em um corpus para definir uma língua-I. Do ponto de vista da aquisição (e, portanto, da adequação explanatória da teoria), essa realidade é ainda mais patente: nenhuma criança no período de aquisição da língua recebe informações sobre dados negativos (a menos que uma mãe viva dizendo para o filho: “Cuidado ao atravessar a rua! E se lembre de nunca colocar o artigo posposto ao nome!”). Por esses motivos, o que basta, enquanto metodologia, para uma análise gerativa é o que chamamos de “julgamento de gramaticalidade” das sentenças27. Tendo em vista uma sentença (com todas as suas características sintáticas, fonológicas e semânticas), o linguista submete tal sentença ao julgamento de falantes, tentando encontrar uma generalização que se adeque ao resultado desses julgamentos. Se voltarmos ao exemplo dado em (14), sobre a Teoria da 27
Nesta dissertação, usamos os conceitos de gramaticalidade e aceitabilidade sem distinção, embora reconheçamos que são noções diferentes. Para uma discussão mais detalhada, ver Guimarães (2017, pp. 31-46)
| 36 Ligação, podemos ilustrar como funciona a metodologia do julgamento de gramaticalidade. O linguista submete as sentenças (14a) e (14b) a alguns falantes nativos de português e analisa os resultados. Sabendo que 100% dos informantes julgam (14a) gramatical e (14b) agramatical com a indexação dada (ou seja, tais informantes afirmam que (14a) é uma sentença do português e (14b) não), é necessário buscar uma justificativa teórica, estrutural, que exclua (14b) como uma sentença possível na língua e aceite (14a) como tal. Essa justificativa, caso satisfatória, pode ser adotada como parte da língua-I dos julgadores (um conhecimento que tais julgadores possuem) e, por extensão, ao português enquanto conjunto de semelhantes línguas-I (conforme argumentado acima). No caso da nossa dissertação, embora não façamos julgamentos de gramaticalidade strictu sensu, buscaremos investigar quais interpretações podem ser associadas a sentenças focalizadas in situ, argumentando que, se determinada curva entoacional de uma sentença inibe certa interpretação – julgada por falantes nativos da língua –, isso quer dizer que alguma configuração sintática é responsável por isso. Isso será aferido através do que chamamos de testes de percepção, que envolvem a capacidade do falante de atribuir a uma curva prosódica um significado particular28.
1.2.2. O Programa Minimalista e a arquitetura da gramática No decorrer das décadas, a Teoria Gerativa foi amplamente estudada e readequada de acordo com novos insights e novas evidências empíricas. Podemos esquematizar quatro “versões” da teoria gerativista chomskyana29:
(1) Teoria Padrão: apresentada de maneira sistemática no livro Aspects of the theory of syntax (Chomsky, 1965);
28
Falaremos mais sobre nossa metodologia no capítulo 3. É importante notar que o conceito de Gramática Gerativa não abarca apenas os desenvolvimentos da teoria chomskyana. Alguns exemplos de teorias gerativistas não-chomskyanas são HPSG (Head-driven Phrase Structure Grammar), LFG (Lexical Functional Grammar), entre outras. Qualquer gramática que almeje prover um mecanismo gerativo de sentenças e SDs pode ser chamada de gramática gerativa. O que diferencia a abordagem chomskyana das demais é, grosso modo, a ideia de que a gramática pode ser dividida em duas estruturas: uma estrutura sintagmática, insensível ao contexto e responsável apenas por combinar elementos, a fim de formar itens maiores; e uma estrutura transformacional, cuja responsabilidade é manipular os itens criados pela estrutura sintagmática, sendo, portanto, sensível ao contexto. Todas as “versões” da Gramática Gerativa Chomskyana envolvem essas duas estruturas, de modo que o termo mais adequado para designar a teoria chomskyana é Gramática Gerativo-Transformacional (GGT). Para fins de simplicidade, no entanto, escolhemos utilizar apenas o nome Gramática Gerativa. 29
| 37 (2) Teoria Padrão estendida: mencionada no livro Reflections on language (Chomsky, 1975); (3) Teoria da Regência e Ligação: apresentada no livro Lectures on government and binding (Chomsky, 1981); (4) Programa Minimalista: apresentado no livro The minimalist program (Chomsky, 2015 [1995]) e refinado em diversos trabalhos desde então.
Esta dissertação irá trabalhar especificamente com o Programa Minimalista (doravante PM). Portanto, convém apresentar seus pontos principais30. O PM nasce da necessidade de simplificar o aparato teórico adotado para explicar a estrutura da gramática (daí a alcunha “minimalista”). A versão anterior da teoria (chamada de Teoria GB) adotava uma série de restrições e subteorias que se organizavam em módulos e se aplicavam aos diferentes níveis de representação da sentença. Por nível de representação entende-se um objeto formal abstrato que seria uma “instância” da sentença em um estágio da derivação31. A Teoria GB postulava 4 níveis de representação: Estrutura-D, Estrutura-S, PF e LF (representada pelo conjunto {δ, σ, π, λ}). A Estrutura-D é um nível sintático da fase inicial da derivação, o resultado de todas as operações de combinação de constituintes32; a Estrutura-S é um segundo nível, que seria o resultado das operações de movimento de constituintes (pelo menos aqueles que ocorrem na chamada sintaxe visível); a PF (Phonological Form, i.e. Forma Fonológica) é um nível lido pela Fonologia, para que a sentença seja produzida pelo aparelho fonador ou percebida como objeto linguístico estruturado pelos órgãos dos sentidos; por fim, a LF (Logical Form, i.e. Forma Lógica) é uma estrutura sintática lida pela Semântica (obviamente), para que a sentença possa ser interpretada em seu significado mais primário33.
30
Nessa seção apresentaremos apenas os pressupostos teóricos do PM relevantes para se ter uma visão geral da proposta, bem como os pontos relevantes para a discussão do nosso trabalho. Para uma discussão mais completa, indicamos o trabalho de Hornstein, Nunes e Grohmann (2013) e, obviamente, Chomsky (1995). 31 Damos o nome de derivação ao processo de formação de sentenças: o conjunto de “passos” necessários (e organizados em ordem de precedência) para que uma sentença seja formada. 32 Combinação (Merge) é o processo de juntar dois objetos e criar um constituinte maior. Por exemplo, para formar o DP [o livro] é necessária a concatenação entre o D [o] e o NP [livro]. Na teoria GB, a formação da Estrutura-D depende de dois elementos: um léxico (grosso modo, uma lista de palavras), que fornece um “substrato” para formação da estrutura, e uma versão da Teoria X-barra, que dita o modo como os itens do léxico se concatenam, normalmente representada em forma de diagramas arbóreos. Na Teoria GB, a Estrutura-D é o nível onde entra em ação a estrutura sintagmática. 33 No capítulo 2 buscaremos uma definição mais específica do que seria a semântica relevante em LF.
| 38 Se assumimos que a linguagem é um par de som e significado (cuja representação é {π, λ}), deveriam ser necessários apenas dois níveis de representação: PF e LF. Os níveis intermediários, caso seja possível, deveriam ser eliminados. O PM tem como objetivo principal a simplificação do modelo, a fim de respeitar princípios de economia. No entanto, o que são “princípios de economia”? Essa noção pode ser baseada na máxima proposta pelo filósofo escolástico William de Ockham (1495) e conhecida como “Navalha de Ockham” (Occam’s Razor): “pluralidade não deve ser posta sem necessidade” (Tradução nossa)34. Do ponto de vista da metodologia científica, essa máxima se concretiza na preferência de soluções técnicas que se utilizem do menor número possível de constructos teóricos (chamada de economia metodológica – methodological economy). Como Hornstein et al. (2013, pp. 7, 8) colocam: “[...] tudo se mantendo igual, duas relações primitivas são piores do que uma, três entidades teóricas são melhores do que quatro, quatro módulos são melhores do que cinco. Em resumo, mais é pior, menos é melhor.” (Tradução nossa)35
Com isso, seria melhor que os quatro níveis de representação apresentados acima (DS, SS, PF e LF) pudessem ser diminuídos para apenas dois (PF e LF), respeitando o princípio expresso pela máxima da Navalha de Ockham. Um outro nível em que podemos aplicar princípios de economia diz respeito ao que Hornstein et al. (2013, p. 8) chamam de economia substantiva (substantive economy): A ideia é que condições de localidade e filtros de boa formação refletem o fato de que as gramáticas são organizadas frugalmente para maximizar recursos. Passos curtos impedem longos passos (i.e. Movimento Mais Curto), derivações em que menos regras se aplicam são preferíveis àquelas em que mais se aplicam, movimento somente se aplica quando é necessário (i.e. operações são ávidas e nenhuma expressão ocorre aleatoriamente em representações gramaticais (i.e. o controle de Interpretação Plena) (Tradução nossa)36
Com esse princípio de economia substantiva, estabelece-se que a linguagem é um mecanismo otimizado, que se utiliza do menor número de recursos para gerar as sentenças. Desse ponto de vista, o PM advoga não só pelo fato de que a metodologia de análise da língua
“[...] pluralitas non est ponenda sine necessitate. [...]” “[...] all things being equal, two primitive relations are worse than one, three theoretical entities are better than four, four modules are better than five. In short, more is worse, fewer is better.” 36 “The idea is that locality conditions and wellformedness filters reflect the fact that grammars are organized frugally to maximize resources. Short steps preclude long strides (i.e. Shortest Move), derivations where fewer rules apply are preferred to those where more do, movement only applies when it must (i.e. operations are greedy), and no expressions occur idly in gramatical representations (i.e. Full Interpretation holds).” 34 35
| 39 seja otimizada, utilizando-se de pouca “parafernalha teórica”, mas também pela ideia de que a própria língua é um mecanismo ótimo e “perfeito” do ponto de vista de economia. Uma crítica que poderia ser feita a essa ideia é o fato de que sistemas biológicos normalmente não respeitam esse tipo de economia: por exemplo, sistemas biológicos costumam ser redundantes (dois pulmões, dois rins, etc) e mesmo inúteis em alguns casos (como o apêndice do corpo humano)37. Como constatado por Kinsella (2009, p. 41), “a perfeição da faculdade da linguagem minimalista faz com que ela se pareça diferente de outros sistemas biológicos, que tipicamente não são considerados perfeitos de maneira alguma” (Tradução nossa)38. Essa aparente incongruência pode ser mitigada se analisarmos o fato de que, embora a linguagem per se seja um sistema biológico no sentido de que ocorre no cérebro, é necessário levar em consideração que as afirmações minimalistas a respeito de princípios de economia se aplicam ao sistema computacional da linguagem. É natural pensar que o cérebro, ao processar computacionalmente expressões linguísticas (seja para produzi-las ou para interpretá-las), se utilize da menor quantidade de recursos possível, dando margem, portanto, a operações mais simples e econômicas e a um sistema logicamente orientado39. Já que a linguagem é uma faculdade biológica, inata e guiada por princípios de economia, como ela é organizada? Em outras palavras, qual é a arquitetura da gramática dentro da perspectiva gerativa? Desde bem cedo nos estudos gerativistas (Chomsky, 1965), tem-se assumido que uma gramática gerativa deve possuir três componentes: um componente semântico, um componente fonológico e um componente sintático. O componente semântico teria o papel de determinar a interpretação de uma frase gerada pela sintaxe40; a componente fonológica tem o papel de determinar a forma fonológica de uma frase gerada pela sintaxe; a sintaxe, por fim, se encarrega de gerar as sentenças a serem interpretadas pelas interfaces. A lógica por trás dessa afirmação é a de que a linguagem produz expressões linguísticas compostas de um par som e significado. Então, pelo menos duas componentes são necessárias. No entanto, fica claro que esse par é o produto de um processo, que necessita de um “gerador”.
37
Para mais exemplos dessa natureza, ver Kinsella (2009, pp. 60-63) “The perfection of the minimalist language faculty makes it appear unlike other biological systems, which are typically not considered perfect in any sense.” 39 Não é objetivo deste trabalho desenvolver uma hipótese acerca da implementação fisiológica dos princípios de economia advogados pelo PM, nem abordaremos o que Guimarães (2017, pp. 78, 79) chama de adequação evolutiva. Para uma análise (contrária ao minimalismo) da adequação evolutiva, indicamos o trabalho de Kinsella (2009). 40 A Gramática Gerativa nega a existência de um “componente semântico” independente. Nas palavras de Guimarães (2017, p. 262) “a semântica é tomada como um epifenômeno, um ‘efeito colateral’ da interação entre a sintaxe, os significados dos itens lexicais, e a própria competência pragmática”. Assim, grosso modo, o que chamamos de “semântica” neste trabalho é justamente o conjunto de características que está (e precisa estar) codificado em LF. 38
| 40 Esse “gerador” é a componente sintática, de modo que as componentes semântica (chamada por Chomsky (Chomsky, 2015) de sistema conceitual-intencional) e fonológica (cujo nome no PM é sistema articulatório-perceptual, ou sensório-motor) são apenas interpretativas. No modelo atual da teoria, a arquitetura da gramática é pensada conforme o esquema apresentado na Figura 1 abaixo:
Figura 1: Arquitetura da gramática no modelo minimalista Fonte: Hornstein, Nunes, & Grohmann, 2013:p.73
Nesse modelo, o processo de derivação de uma sentença se inicia pela escolha dos itens lexicais que farão parte dessa derivação, bem como um índice que indica quantas vezes tal item irá aparecer nela. Esses itens são acumulados em uma espécie de buffer, chamado de numeração, a fim de serem selecionados pelo sistema computacional da linguagem. Um exemplo: (19)
a. O menino que comeu o sanduíche pediu o suco. b. N = {menino1, comeu1, sanduíche1, pediu1, suco1, o3, que1}41
Para a sentença em (19a) temos a numeração em (19b). Note que, como o item [o] aparece 3 vezes na sentença, o índice associado a ele é 3, ao passo que os demais itens, como só aparecem uma vez, possuem índice 1. Além de fornecer um starting point, a existência da numeração evita que, sob pretexto de princípios de economia, faça-se uma comparação entre sentenças diferentes. Por exemplo, não faz sentido dizer que a focalização in situ é “mais econômica” do que uma clivada, porque claramente estão envolvidas numerações diferentes. Princípios de economia se aplicam apenas tendo em vista uma única numeração, de modo que uma derivação é mais econômica do que outra se lança mão de menos operações para sua
41
Essa numeração está simplificada, pois omite núcleos funcionais não pronunciados e categorias vazias (pro). No entanto, preferimos manter assim para simplificar a explicação.
| 41 conclusão. Na perspectiva inicial do PM, a numeração é o único ponto de interface entre o sistema computacional e o léxico. A partir da numeração, o sistema computacional da linguagem (doravante SC – a “sintaxe”, grosso modo) efetua diversas operações, como Select, Merge, Move, Agree e SpellOut. A operação Select seleciona itens da numeração e subtrai 1 unidade do índice do item lexical na numeração. A operação Merge combina tais itens para formar um constituinte, rotulando-o e dando ao resultado dessa combinação o rótulo de um dos itens combinados (de modo que Merge é uma junção das operações de Combinar e Rotular). No nosso exemplo em (19), o SC seleciona D [o] e N [suco], combinando-os para formar o DP [o suco] e diminuindo 1 unidade dos índices de [o] e de [suco]. Em seguida, o verbo [pediu] se combina com o DP recém-criado, para formar um objeto maior, continuando assim até que todos os índices sejam 0. Move é uma operação transformacional que (dentro da vertente minimalista aqui adotada) consiste na criação de uma cópia de um constituinte e sua posterior combinação em uma posição específica42. A pergunta que surge é: por que é necessária a existência de tal tipo de operação? A resposta está relacionada a um fato sobre a linguagem: alguns constituintes são interpretados em posições diferentes das quais são pronunciados. Tomemos o exemplo em (18) abaixo: (20)
[O que]i que o João vai comprar ti?43
Em (20), o elemento wh [o que] é interpretado como complemento de comprar; no entanto, esse constituinte é pronunciado na primeira posição da sentença, o que indica que ele “foi parar lá” de alguma forma. O que motiva esse movimento? Embora exista uma discussão acerca desse assunto44, imaginemos o seguinte: o complementizador [que] é dotado de um traço45, que poderíamos chamar de [wh]. Esse traço não seria “digerido” em C pelo sistema 42
Nessa abordagem, Move também é chamado de Internal Merge (Chomsky, 2004) por ser uma operação que tem Merge e Agree como suboperações. A teoria de cópias não é a única explicação para a operação move. Para uma análise mais específica da teoria de cópia, indicamos Chomsky (2000). Por não fazer parte do escopo deste trabalho (além de a escolha da teoria de movimento não afetar a nossa análise), não entraremos nos detalhes dessa abordagem aqui. 43 O símbolo t (chamado de vestígio) é usado para indicar que o constituinte gerado naquela posição se moveu. Na teoria de cópias adotada aqui, esse símbolo indica uma cópia não pronunciada. 44 Nesse trabalho, assumimos que o movimento de wh é motivado por ininterpretabilidade de traços. Rizzi (1996) assume uma proposta diferente, através de critérios (existiria um critério-wh responsável pelo movimento), mas cuja implementação não difere da proposta aqui adotada (embora na nossa proposta para a focalização in situ não seja possível adotar uma abordagem de critério) 45 Em teoria gerativa, traço se refere a um objeto formal que veicula algum tipo de informação. Por exemplo, podemos dizer que o item lexical [meninos] é dotado de um traço [+plural], que é um objeto formal cuja finalidade
| 42 conceitual-intencional, por isso podemos dizer que tal traço é não interpretável46. A faculdade da linguagem possuiria uma condição de boa formação chamada de Interpretação Plena, de modo que nenhum objeto desnecessário deve estar presente nas representações de interface, senão a derivação não convergiria. Traços não interpretáveis não podem existir em LF, pois essa interface não consegue interpretá-los (por isso mesmo são chamados não interpretáveis). Chomsky (2004, p. 106) explica isso de forma mais elegante: A língua L gera um conjunto de derivações. A última linha de cada derivação D é um par
, em que PHON é acessado pelo [sistema sensório-motor] e SEM pelo [sistema conceitual-intencional]. D converge se PHON e SEM satisfazem, cada um, [as condições de interface]; caso contrário, a derivação sofre crash em uma ou outra interface. (Tradução nossa47)
Para que o SC possa “se livrar” desse traço, ele precisa ser valorado por um núcleo possuidor do mesmo traço [wh], só que interpretável. Suponhamos que o DP [o que] possui o traço [+wh] interpretável, e que o complementizador [que] pode “se livrar” desse traço não interpretável através de um processo chamado de valoração de traço48. Uma operação, chamada Agree, envolve um elemento agindo como sonda, buscando, no seu domínio de ccomando49, algum elemento que possa servir de alvo. Quando a sonda encontra seu alvo, ocorre uma operação chamada Match, que consiste na identificação de coincidência entre o traço não valorado e não interpretável da sonda com o traço valorado e interpretável do alvo, possibilitando Agree. Quando Agree se aplica, o traço não interpretável da sonda é valorado e deletado, para que não resulte em crash em LF. Além disso, o núcleo C seria dotado de um traço EPP não interpretável, que prevê uma posição de especificador em CP e não pode ser valorado via Agree, e que o pronome possuiria um traço [Q] não interpretável. Esses dois fatores “obrigariam” o pronome a se mover para o
é veicular a informação de plural, informação essa que irá afetar aspectos da computação (concordância, por exemplo). A abordagem da Morfologia Distribuída (Halle & Marantz, 1993; Marantz, 1997, inter alia) afirma que os componentes da computação sintática não são exatamente itens lexicais fechados, mas conjuntos de traços abstratos. Nessa perspectiva, a inserção de uma forma fonológica para os itens lexicais é feito a posteriori, no caminho da derivação para PF. 46 Mais especificamente, o traço [+wh] seria interpretável no pronome e não interpretável em C. 47 “The language L generates a set of derivations. The last line of each derivation D is a pair , where PHON is accessed by SM and SEM by C-I. D converges if PHON and SEM each satisfy IC; otherwise it crashes at one or the other interface.” 48 O conceito de valoração de traço toma como premissa que traços não interpretáveis entram na derivação sem valor definido. A operação Agree (que veremos adiante) é responsável por atribuir valor a esse traço e o deletar. 49 C-comando é o nome de uma das relações estruturais adotadas no modelo gerativista. Grosso modo, dizemos que X c-comanda Y sse: (i) X não domina Y; (ii) Y não domina X; (iii) O nó mais baixo que domina X também domina Y
| 43 especificador de CP, fornecendo uma motivação para aplicação de Move50/51. Ao ocorrer o movimento, o traço EPP é valorado e apagado, bem como o traço [Q] do pronome interrogativo. Na vertente do PM que estamos adotando aqui, Move consiste na criação de uma cópia do objeto a ser movido e sua posterior combinação com o objeto até então já criado, de forma que a operação Move é, na verdade, a combinação de duas suboperações: Copy e Merge (sendo que essa operação de Merge é diferente, já que combina uma cópia de um constituinte já presente na estrutura e não previsto na numeração). Como isso se dá? Vejamos como seria a derivação da sentença em (20)52:
1. O DP [o que] é combinado via merge com o verbo [comprar], formando o objeto [VP comprar [DP o que]]; 2. O DP [o João] é formado através do merge do D [o] com o N [João]53, formando o DP [DP o [N João]]; 3. utra operação de merge ocorre entre os dois objetos criados, formando um objeto maior: [VP [DP o João] [VP comprar o que]]; 4. O núcleo de tempo preenchido pelo auxiliar [vai] é combinado ao VP criado, formando [T vai [VP o João comprar o que]] 5. O núcleo T valora seus traços-phi com o sujeito; 6. Pela presença de um traço EPP no núcleo T, o SC aplica move ao DP [o João], combinando-o com o objeto já criado e formando o objeto [TP [D o João] [vai o João comprar o que]] e resultando na eliminação do traço EPP de T; 7. Ocorre o merge do núcleo de C [que], formando [C que [TP o João vai o João comprar o que]]; 8. Pelo motivo aludido acima, o DP [o que] sofre move para especificador de C: [CP [D o que] [C que o João vai o João comprar o que]].
50
Chomsky (2001) apresenta uma teoria para a valoração de traços. Veremos adiante que neste trabalho vamos adotar a teoria proposta por Bošković (2007). Na proposta de Chomsky, ainda entram em jogo um traço não interpretável de C, um traço [wh] que tornaria possível que esse núcleo funcione como uma sonda, encontrando o pronome interrogativo, que, por sua vez, possui um traço [wh] interpretável, permitindo o movimento. Na seção 4.4.1.1. vamos analisar em mais detalhes essa proposta. 51 Essa proposta de Chomsky ainda assume que Spell-Out se aplica em momentos específicos da derivação, mais de uma vez, formando o que se conhece como fases – seria esse pressuposto que licenciaria a existência de EPP. Para simplificar a explicação, iremos deixar de lado a explicação dessa parte do modelo, focando apenas na motivação para a existência de Move. 52 Alguns detalhes da derivação (como a projeção vP e o movimento cíclico do wh) foram omitidos para simplificar a explicação. 53 É irrelevante para a discussão em curso se nomes próprios são, categorialmente, Ns ou Ds. Para simplificar a explicação, assumimos que seriam Ns.
| 44 9. Em PF, as cópias mais encaixadas são apagadas, resultando em: [CP o que que o João vai o João comprar o que], e cuja representação árborea pode ser dada em (21): (21)
É importante salientar que operações de Move são governadas pelo princípio Último Recurso (Last Resort), que pode ser definido como (20) abaixo: (22)
Last Resort: Movimento de α só é permitido se α possui traços não interpretáveis.
Isso significa dizer que Move só pode ocorrer quando é estritamente necessário. No exemplo (20), tanto o DP [o João] quanto o DP [o que] se moveram para TP e CP, respectivamente, a fim de valorar o traço EPP (respeitando, assim, Last Resort). No entanto, é possível efetuar a valoração de traços sem necessitar de Move. Ao que parece, Agree não está sujeita ao princípio Last Resort. Tendo isso em vista, surge uma pergunta: Se a única função do traço EPP é garantir o movimento, seria possível eliminá-lo, e mesmo assim garantir Move? Analisaremos aqui brevemente a proposta de Bošković (2007)54. Vejamos as duas configurações abaixo: (23)
54
(24)
Na seção 4.4.1. discutiremos em mais detalhes a proposta de Bošković.
| 45 (23) difere de (24) porque, no primeiro, YP possui um traço [F] não interpretável e X possui o traço F interpretável, enquanto, no segundo, ocorre o contrário: o núcleo X possui o traço F não interpretável enquanto YP possui F interpretável. Na análise de Bošković, a configuração em (24) não requer movimento porque a condição para tal não se configura (de acordo com o princípio Last Resort, declarado em (22), Move se aplica devido à ininterpretabilidade de traços do elemento a ser movido). Para que o traço uF do núcleo X seja valorado, basta que a operação Agree ocorra. Por outro lado, na configuração (23), o traço não interpretável de YP não tem como ser valorado se YP não se mover (note que, do ponto de vista do núcleo X, nenhum problema ocorre, já que traços interpretáveis são intrinsecamente valorados e podem ser lidos em LF). Isso “sinaliza” que YP precisa se mover até estar em uma posição na qual exista um núcleo com o traço F interpretável em seu domínio de c-comando. Isso ocorre em SpecXP. Quando YP atinge essa posição, ele consegue sondar o núcleo X e valorar seu traço não interpretável via Agree. Daí, (23) é uma configuração propícia para Move e (24) uma configuração propícia para apenas Agree.55 Voltando à explicação do processo derivacional expresso na Figura 1, em determinado ponto da derivação aplica-se uma operação chamada Spell-Out, que “despedaça” a sentença, de modo que os traços relevantes fonologicamente, representados no objeto simbólico PF, são enviados para o sistema articulatório-perceptual, e os traços relevantes para o sistema conceitual-intencional, representados por LF, são interpretados. A sentença é bem formada se a derivação convergir em PF e LF, ou seja, se não houver traços não interpretáveis não valorados em LF. O modelo de arquitetura da gramática apresentado aqui, embora encontre bastante evidência empírica e seja coerente com a proposta minimalista, encontra alguns problemas quando olhamos para a focalização in situ. Vejamos na seção seguinte que problemas são esses e como tem sido feita a abordagem deles.
1.2.3. O problema da focalização para a arquitetura da gramática e a Cartografia Sintática Dentro da abordagem adotada pelo PM para arquitetura da gramática, as interfaces fonológica (PF) e semântica (LF) não são ligadas, mas são intermediadas pela sintaxe (ver Figura 1). A consequência desse modelo é a de que todo fenômeno fonológico que afeta a 55
Essa conclusão não é tão simples como aqui apontado. Questões relevantes relacionadas a abordagem de fases, bem como a Condição de Ativação (Chomsky, 2001) precisam ser desenvolvidas. Bošković desenvolve tais questões em seu trabalho. Na seção 4.4.1.1. abordaremos tais questões.
| 46 interpretação semântica deve, necessariamente, ser intermediado pela sintaxe, o que equivale a dizer que deve existir uma estrutura sintática específica para tais fenômenos. Vejamos novamente os exemplos apresentados em (1-4), reproduzidos abaixo para conforto do leitor: (25)
A: O que aconteceu? B: O João comeu o bolo.
(26)
A: O João comeu o pão. B: O João comeu O BOLO (não o pão).
(27)
A: O que o João comeu? B: O João comeu o bolo.
(28)
A. O João comeu o bolo. B. Não acredito! O João comeu o bolo! Eu nunca imaginaria que ele fosse comer logo o bolo!
Nos exemplos acima, a focalização é expressa apenas pela fonologia (prosódia). Então, se assumimos que (i) os diferentes tipos de focalização precisam ser lidos em LF e (ii) a arquitetura da gramática é conforme apresentada na Figura 1, temos como conclusão lógica que as sentenças (25B), (26B), (27B) e (28B) possuem estruturas sintáticas diferentes entre si – ainda que a ordem linear dos constituintes não se altere. Uma abordagem teórica que potencialmente pode explicar essa questão é a Cartografia Sintática (Belletti, 2004a; Cinque, 1999; Cinque & Rizzi, 2008; Rizzi, 1997, inter alia). Nos próximos parágrafos vamos nos dedicar a apresentar brevemente esse modelo, deixando para o capítulo 4 as considerações mais específicas a respeito de como a Cartografia Sintática pode (ou não) dar conta da focalização in situ. A proposta da Cartografia Sintática, vertente da Gramática Gerativa que se desenvolveu paralelamente ao PM, é a de que aspectos funcionais das sentenças (como relações morfossintáticas e escopo-discursivas) são veiculados por projeções individuais da estrutura sintática. Desde a Teoria GB, tem-se assumido que a estrutura sintática das sentenças pode ser dividida em três camadas (layers): CP, IP e VP:
| 47 (29)
A existência dessas camadas é necessária conceitual e empiricamente: VP é a camada em que as relações de seleção argumental ocorrem; IP é o locus de relações de escopo de advérbios baixos e de valoração de traços formais de caso; CP é necessário para estabelecer relações de escopo de advérbios altos, quantificadores e operadores-wh, dentre outras funções. No decorrer das décadas, foi-se chegando à conclusão de que essas camadas não poderiam ser unitárias: a camada IP, por exemplo, foi “explodida” nas projeções TP (NegP) AgrP no clássico trabalho de Pollock (1989); da mesma forma. o trabalho de Larson (1988) previa múltiplos VPs para dar conta de construções ditransitivas. Rizzi (1997) é um dos trabalhos pioneiros na cisão da camada CP em projeções individuais, cada uma delas assumindo uma função específica. Nesse trabalho, a estrutura proposta era a apresentada abaixo: (30)
A estrutura em (30) pressupõe que o sistema CP seja dividido em dois subsistemas: o primeiro, força-finitude, faz a interface da camada CP com, respectivamente, o que está “acima” (o discurso, no caso de sentenças matriz, ou um constituinte superior, no caso de sentenças
| 48 encaixadas) e com o que está “abaixo” (o sistema flexional, conhecido na Teoria GB como projeção IP). As projeções desse subsistema exibem propriedades e funções muito específicas: ForceP determina a força ilocucionária da sentença (a “natureza” da sentença, se é declarativa, interrogativa, relativa, clivada etc.); FinP determina a finitude da sentença (seria essa projeção que determinaria, por exemplo, se o sistema flexional será infinitivo ou não). Rizzi chega a essa generalização através da distribuição complementar atestada entre che e di no italiano: (31)
a. Credo che loro apprezzerebbero molto il tuo libro Creio que eles apreciariam muito o seu livro b. Credo di apprezzare molto il tuo libro Creio (de) apreciar muito seu livro
(32) a. Credo che, il tuo libro, loro lo apprezzerebbero molto Creio que, o seu livro, eles o apreciariam muito b. *Credo, il tuo libro, che loro lo apprezzerebbero molto Creio, o seu livro, que eles o apreciariam muito (33)
a. *Credo di, il tuo libro, apprezzarlo molto Creio (de), o teu livro, apreciá-lo muito b. Credo, il tuo libro, di apprezzarlo molto Creio, o teu livro, (de) apreciar muito.
(Rizzi, 1997, p. 288)
É possível notar que, em termos de seleção, che seleciona IPs finitos, enquanto di seleciona IPs infinitivos. No entanto, isso não seria um motivo para propor duas projeções diferentes. Por isso, Rizzi apresenta a assimetria atestada em (32) e (33): quando o complementizador selecionado é che, tópicos precisam sucedê-lo; quando o complementizador é di, o contrário ocorre, e tópicos precisam precedê-lo. Assumindo que tópicos estão encaixados dentro da estrutura do CP (e não adjungidos), tem-se como consequência lógica que che e di ocupam posições diferentes na estrutura, a saber, che é núcleo de Force e di é núcleo de Fin. O outro subsistema proposto por Rizzi envolve as projeções TopP e FocP. Esse subsistema, ativado apenas quando necessário, recebe constituintes deslocados para a periferia da sentença por motivos “discursivos”. Assim, em uma sentença como (34a) abaixo, um exemplo clássico de foco fronteado, estaríamos diante de um movimento para a projeção de FocP, como demonstrado em (32b):
| 49 (34)
a. O LIVRO o João leu. b.
No exemplo, além dos movimentos já previstos (do verbo para T e do sujeito para specTP), o DP objeto [O LIVRO] se move para specFocP, para receber a interpretação de foco. A coexistência de focos e múltiplos tópicos no italiano (não disponível no PB) é um argumento a favor da proposição de mais de uma projeção: (35)
Credo che a Gianni, QUESTO, domani, gli dovremmo dire C Top Foc Top IP Creio que, ao Gianni, ISTO, amanhã, devemos dizer-lhe. (Rizzi, 1997, p. 295)
Em trabalhos subsequentes, a estrutura do CP foi se expandindo, de modo que nos trabalhos mais recentes (como Rizzi & Bocci, 2017) essa camada conta com 10 diferentes posições, esquematizadas abaixo56:
56
Como nosso trabalho se restringe ao foco, não apresentaremos nas nossas análises a hierarquia de CP mais recente, apresentada em (36), salvo necessário.
| 50 (36)
Hierarquia do CP segundo Rizzi e Bocci (2017)
Nessa linha de pensamento, Belletti (2004b), ao analisar o fenômeno de inversão da ordem SV no italiano, propõe que esse fenômeno evidencia a existência de um subsistema focotópico também na camada I, mais especificamente acima da projeção vP, região a qual ela chamou de “região baixa de IP” (low IP área). Desse modo, a estrutura da camada flexional possui a seguinte disposição (além de contar com a hierarquia funcional dos advérbios defendida por Cinque (1999), resumida abaixo sob o rótulo IP): (37)
| 51 Qual seria a motivação para adotar duas projeções FocP em locais diferentes da estrutura sintática (além de fornecer uma solução ad hoc para um fenômeno particular a uma língua)? Belletti argumenta que a motivação para tal é o tipo de foco: É muito claro [...] que as posições pré-verbal e pós-verbal possuem um conteúdo informacional bastante diferente: apenas o primeiro pode carregar informação nova. (Belletti, 2004a, p. 22 Tradução nossa)57.
Dessa forma, as duas projeções de FocP estariam em distribuição complementar: FocP em CP veicularia foco contrastivo (cf. 26B) enquanto FocP da região baixa de IP veicularia foco informacional (cf. 27B). Quanto ao foco mirativo, Cruschina (2012, pp. 117–125) propõe que, embora a projeção mirada pelo constituinte focalizado seja a mesma do foco informacional, de alguma maneira há um “operador mirativo orientado para o falante, que requer o fronteamento do [foco informacional] da sentença”58. Na seção 4.2. nos dedicaremos a discutir tanto o trabalho de Cruschina, arguindo sobre a real necessidade dessa solução teórica. 1.3.Questões de pesquisa Tendo em vista a abordagem cartográfica para a focalização – conforme apresentada acima –, bem como a explanação acerca da arquitetura da linguagem que estamos adotando neste trabalho, uma série de perguntas surge:
I.
Por que é possível dizer que a focalização possui efeitos em LF?
II. Assumindo que a focalização possua efeitos em LF, cada tipo de focalização é lida de maneira diferente ou podemos dizer que há um traço semântico em comum que seria o único relevante em LF? III. Há estruturas prosódicas fonologicamente diferentes para diferentes tipos de foco (de modo que tal diferença deva ser lida por PF)? IV. Se há uma estrutura específica, que estrutura é essa? V. Haver estrutura diferente implica dizer que há movimento sintático? Caso sim, a focalização in situ apresenta os mesmos tipos de restrições impostas a operações de movimento sintático?
“It is very clear [...] that the postverbal and the preverbal positions have a very different informational content: only the former can carry new information.” 58 Sobre o foco mirativo e sua (im)possibilidade de estar codificado na sintaxe, falaremos no capítulo 2. 57
| 52 No decorrer desta dissertação, buscaremos respostas a essas perguntas, bem como outras questões que surgirão no decorrer dessa empreitada. No capítulo 2, buscaremos uma definição estritamente semântica para o foco, perseguindo uma resposta às perguntas I e II. No capítulo 3, nossa preocupação será em definir, em termos estritamente prosódicos e baseado em experimentos, se os diferentes tipos de focalização apresentam (ou não) estruturas prosódicas fonologicamente distintas, e, mais importante ainda, se possíveis diferenças são passíveis de serem creditadas a alguma interferência da sintaxe na prosódia. Nesse capítulo também nos deteremos a uma explicação detalhada da metodologia de coleta e análise dos dados, a fim de buscar uma resposta para a pergunta III. No capítulo 4 buscaremos responder as perguntas IV e V, analisando, com base na análise semântica do foco e no resultado da análise prosódica, as possibilidades de derivação sintática para as sentenças focalizadas. Por fim, no capítulo 5, apresentamos uma discussão final, com as implicações da proposta adotada, bem como suas limitações.
| 53 2 A SEMÂNTICA DA FOCALIZAÇÃO (IN SITU) Como vimos no capítulo anterior, é importante definir se a focalização deve ser lida em LF, já que, caso o seja, é necessário que o SC faça a intermediação da focalização entre fonologia e semântica. Este capítulo se dedica a estabelecer se (e como) a focalização precisa estar representada na interface lógica. Inicialmente, vamos propor uma discussão acerca do conceito de LF e do que deve ser relevante nesse nível de interface. Em seguida, iniciaremos uma discussão sobre o que seria semanticamente relevante na focalização, fazendo considerações acerca do trabalho de Jackendoff (Jackendoff, 1974), do texto clássico de Rooth (1992) e da análise de Menuzzi (Menuzzi, 2012). Na seção 2.3, vamos apontar dados de focalização que podem se enquadrar no que consideramos relevante em LF, propondo uma definição semântica strictu sensu para a focalização, afirmando que a focalização introduz uma função de exaustividade – chamada de Exaust(x) – sobre um conjunto pressuposicional contextualmente estabelecido, de modo que é o traço de exaustividade o que é relevante em LF na focalização, além da relação quantificador-variável comumente atribuída ao foco. Por fim, iremos fazer algumas considerações sobre a ideia de tipos de foco, e qual é o lugar disso na nossa proposta. 2.1.O que é LF? No capítulo anterior, apresentamos o modelo gerativo da arquitetura da gramática, afirmando que a estrutura sintática, após a operação de Spell-Out, é “despedaçada” de forma que os traços relevantes fonologicamente vão para a o sistema articulatório-perceptual (gerando uma estrutura de representação chamada de PF) e os traços relevantes semanticamente vão para o sistema conceitual-intencional (através da estrutura representacional LF59). No entanto, é necessário que definamos precisamente tais “traços relevantes semanticamente”. Parece óbvio que nem tudo que faz parte do “sentido” de uma sentença está previsto nessa representação LF. Vejamos o exemplo abaixo: (38)
Maria chega em casa, percebe a janela da sala fechada e sente muito calor. Ela fala para João: a. Está quente aqui, né?
59
Conforme apresentado no capítulo anterior, assumimos que LF é um nível sintático de interface entre o sistema computacional e o sistema conceitual-intencional.
| 54 Falantes do português (de maneira geral) entendem que, além de Maria afirmar que a sala está quente, ela está sugerindo que a janela seja aberta – ao que chamamos de implicatura conversacional. Não parece razoável dizer que LF codifica a implicatura conversacional implícita em (38a). Para que pudéssemos afirmar isso, teríamos que assumir que, de alguma forma, a sentença “Abra a janela” esteja em elipse na estrutura de (38a) apenas na situação em questão, cuja formalização demandaria uma parafernalha teórica bastante indesejável (especialmente do ponto de vista da economia metodológica, apontada na seção 1.2.2.), além de não apresentar nenhuma evidência empírica independente. Portanto, não é possível dizer que tudo que de fato é “(sub)entendido” de uma sentença esteja codificado em LF. Isso necessariamente nos faz estabelecer uma divisão entre o que é “semântico” e o que é “pragmático”. No entanto, o que diferencia a “semântica” da “pragmática”? Embora definir pragmática seja uma tarefa bastante complexa, podemos utilizar uma das definições dadas por Levinson (1983, p. 24): “pragmática é o estudo da habilidade que os falantes têm de parear sentenças com os contextos nos quais elas seriam apropriadas” (Tradução nossa)60. No exemplo em (38a), embora a sentença literalmente expresse que “no lugar denotado por ‘aqui’, os níveis de calor estão altos”, pelo contexto discursivo sabemos que a intenção de Maria é que a janela seja aberta. Implicaturas conversacionais, subjetividade, ironia, sarcasmo, atos de fala e todos os outros fenômenos do significado que derivam da situação discursiva (extralinguística) podem ser enquadrados como a pragmática de uma sentença. Por outro lado, a semântica strictu sensu envolve apenas os aspectos que dizem respeito ao significado primário de uma sentença. No caso de (38a), é semântico o significado que pode ser extraído das relações gramaticais estabelecidas pelos itens lexicais, literalmente que “aqui está quente”61. Nesse sentido, temos a seguinte pergunta: como essa diferença entre semântica e pragmática influencia a arquitetura da gramática? Para responder essa questão, é preciso ter em mente que, conforme afirmado na seção 1.2.2, LF é um nível de representação sintático. O sistema conceitual-intencional não é capaz de “manipular” sintagmas. Em outras palavras, após LF não há a possibilidade de inserção de novos itens, muito menos da aplicação de transformações (como movimento de constituintes)62. Após a interpretação semântica das “Pragmatics is the study of the ability of language users to pair sentences with the contexts in which they would be appropriate.” 61 É interessante notar que a palavra “aqui” é um dêitico, cujo significado se estabelece no contexto de enunciação. Assim sendo, se utilizamos a definição de pragmática que demos acima, dêiticos se situam em uma “fronteira” entre semântica e pragmática. 62 Isso é óbvio. Permitir que uma expressão linguística seja manipulada a fim de extrair significados diferentes daqueles que a expressão denota daria margem para, por exemplo, uma expressão como “O João não comeu o bolo” significar o exato oposto (que João comeu o bolo), ou algo completamente diferente (que Maria comeu o 60
| 55 sentenças (a partir da estrutura sintática de LF), podemos propor a existência de um “componente pragmático” (extragramatical) que atribua aos significados nuances dependentes do contexto enunciativo. No entanto, esse componente não tem a capacidade de alterar o significado literal da sentença, apenas fornecer a ela nuances de sentido. Podemos assumir, portanto, que a pragmática é um componente realizado pós-LF e localizado fora da gramática (no sentido de gramática que estamos assumindo neste texto). Parece bastante intuitivo que a pragmática possa manipular a interpretação semântica de uma sentença para atribuir tais nuances de sentido, sem, no entanto, ser capaz de alterar o core semântico da sentença (condições de verdade, por exemplo). Assim, é uma boa aproximação assumir que LF codifica apenas aspectos estritamente “semânticos”63. Por esses aspectos, podemos entender os seguintes64:
(i) Composicionalidade da interpretação de sintagmas e sentenças; (ii) Correferenciação; (iii) Relações de quantificação; (iv) Condições de verdade das sentenças;
O primeiro aspecto diz respeito à relevância da operação de merge para a interpretação de sintagmas. Vejamos um exemplo: (39)
a. #Bobo é [um gigante e um anão]. b. Bobo é [um anão gigante]. c. Bobo é [um gigante anão].
(Partee, 1995, p. 332 Tradução nossa)
É claro que (39a) é uma sentença contraditória (não é possível ser gigante e anão ao mesmo tempo) – de modo que não é possível extrair um significado dessa sentença65 –, mas tanto (39b) quanto (39c) possuem significado: (39b) se refere a um anão muito maior do que a média de estatura dos anões, enquanto (39c) faz referência a um gigante muito menor do que a bolo, que João comeu os salgadinhos, etc). Claro que estamos desconsiderando coisas como ironia (mas note que mesmo na veiculação de ironia, a expressão linguística não perde o significado – tanto que é perfeitamente possível uma pessoa não entender a ironia e acreditar no significado literal da sentença) 63 Ver nota 40. 64 Não pretendemos propor uma teoria sobre LF – o que extrapolaria em muito o objetivo desta dissertação. Apenas pretendemos deixar claro o que estamos considerando como relevante em LF para discutirmos a possibilidade de codificar a focalização nesse nível de representação. Bons trabalhos sobre LF são May (1985) – uma abordagem baseada na Teoria GB, mas ainda relevante – e Heim e Kratzer (1998). 65 É possível extrair algum sentido dessa sentença através de algum tipo de implicação pragmática: assumir, por exemplo, que Bobo seria um gigante fisicamente, mas um anão moralmente, a depender do contexto em questão. Mas isso não prejudica o argumento, já que estamos considerando uma interpretação puramente baseada nas relações composicionais dos sintagmas.
| 56 média de estatura dos gigantes. Essa diferença de significado está intimamente relacionada ao modo como os itens lexicais são combinados: em (39b), o substantivo [anão] está combinado ao adjetivo [gigante], enquanto em (39c) o substantivo [gigante] está combinado ao adjetivo [anão]. A diferença estrutural entre (39b-c) pode ser dada em (40a-b), respectivamente:
(40)
a.
DP ru D NP um ru NP AP 5 5 anão gigante
b.
DP ru D NP um ru NP AP 5 5 gigante anão
Tendo em vista que, obviamente, o modo de combinação de constituintes influencia a interpretação literal de uma sentença, é possível dizer que esse aspecto precisa estar codificado em LF, sendo intermediado pela sintaxe. Isso equivale a dizer que, conforme afirmado na seção 1.2.2, LF é um nível sintático de interface, no qual as relações de associação gramatical (as operações de merge) estão visíveis. Relacionada à questão da composicionalidade está o conceito de papel temático. Elementos que projetam papéis temáticos (como verbos) o fazem através de relações combinatórias específicas. Por exemplo: (41)
Maria deu o livro ao seu sobrinho.
Em (39), o verbo dar possui propriedades de seleção semântica que atribui papéis temáticos aos seus argumentos: um agente (quem dá), um paciente (o que é dado) e um alvo (para quem é dado). Esses papeis temáticos possuem relação direta com as propriedades de combinação gramatical dos itens lexicais. No exemplo de dar, o papel temático de paciente é recebido pelo complemento direto do verbo; o papel de alvo é recebido pelo complemento indireto; o agente, por fim, é recebido pelo argumento externo. O segundo aspecto levantado diz respeito ao modo como certas expressões retomam referentes mencionados anteriormente ou disponíveis no contexto. Na seção 1.2.1, ao analisar o Princípio da Ligação, mencionamos que existem restrições quanto à possibilidade de interpretação de certas expressões de retomada de referentes. Vejamos o exemplo (14), repetido abaixo para conforto do leitor:
| 57 (42)
a. Elei encontrou o Joãoj na feira. b. *Elei encontrou o Joãoi na feira.
Em (42b), como vimos na página 30, é impossível que se interprete que João viu a si mesmo na feira. Isso ocorre porque o DP [o João] é uma expressão referencial, e, pelo princípio C da TL, expressões referenciais não podem estar ligadas. Como, em (42b), o DP está ligado ao pronome (já que o pronome o c-comanda), a sentença com as indexações apresentadas é agramatical. Ora, apenas a configuração sintática da sentença (conjunto de relações estruturais relevantes) é capaz de explicar esse tipo de restrição, de modo que esse aspecto, relevante para a interpretação literal de uma sentença, precisa estar mediado pela sintaxe e espelhado em LF. O terceiro aspecto relevante em LF mencionado diz respeito às condições de verdade de uma sentença. Antes de analisar esse aspecto, convém fazermos a seguinte pergunta: qual é o significado de uma sentença? Para nós é claro o significado de itens lexicais isolados, como “menino”, “Paris”, “cachorra” etc. No entanto, quando combinamos itens lexicais para formar sentenças, qual é o resultado? Heim e Kratzer (1998, p. 1) afirmam que “saber o significado de uma sentença é saber suas condições de verdade.” (Tradução nossa)66. Mas o que é condição de verdade? Vejamos o exemplo (43) abaixo: (43)
Aline vendeu o carro rápido
(Guimarães, 2017, p. 141)
O que nos possibilita julgar (43) como falso ou verdadeiro? Bom, na interpretação de que o item lexical [rápido] qualifica a ação de vender, temos, no mínimo, as condições de verdade em (44); caso [rápido] qualifique o nome [carro], temos, no mínimo, as condições de verdade em (45): (44)
i. Aline vendeu o carro; ii. Aline não demorou para vender o carro.
(45)
i. Aline vendeu o carro; ii. O carro que Aline vendeu não é lento.
As condições de verdade de uma sentença, portanto, são o conjunto de mundos em que tal sentença é verdadeira. É interessante notar que para as duas sentenças, se Aline não vendeu
“To know the meaning of a sentence is to know its truth-conditions”. Aqui é importante notar que Chomsky critica fortemente a semântica vericondicional nos moldes de Heim e Kratzer, pois acredita que o significado seja algum tipo de representação interna com alguma relação com o mundo. No entanto, como dito anteriormente (ver nota 40), a estrutura sintática influencia a determinação do significado de sentenças; portanto, é coerente assumir que a estrutura sintática tem papel importante na determinação das condições de verdade de uma sentença. 66
| 58 o carro, a sentença sempre será falsa. Mas, para saber se a segunda condição relevante é (44ii) ou (45ii), precisamos saber a estrutura da sentença (em termos chomskyanos, sua SD). Se a estrutura de (43) é (46), então a condição relevante é (44ii); se a estrutura é (47), então a condição relevante é (45ii):
(46) TP ru DPi ru Aline T VP vendeuj ru VP AdvP ty 5 ti ty rápido tj DP 5 o carro
(47)
TP ru DPi ru Aline T VP vendeuj ru ti ru tj DP 5 o carro rápido
Assim, fica claro que essa diferença, importante para a determinação do significado primário de sentenças, deve ser manipulada pelo SC. Por fim, o último aspecto relevante em LF e dependente da estrutura sintática tem relação com expressões de quantificação. Grosso modo, podemos definir quantificação como uma relação “(Qx) Ax”, em que Q é uma quantificação sobre x e A é uma expressão que predica sobre x. Vejamos um exemplo: (48)
Mário comeu todos os salgadinhos da festa.
Em (48), temos um quantificador – a palavra “todos” –, chamado em Lógica de quantificador universal (∀). Podemos representar logicamente a sentença acima como (49) abaixo: (49)
a. Para todo x salgadinho da festa, Mário comeu x. b. ∀𝑥 𝑠𝑎𝑙𝑔𝑎𝑑𝑖𝑛ℎ𝑜, 𝑀á𝑟𝑖𝑜 𝑐𝑜𝑚𝑒𝑢 𝑥 𝑑𝑎 𝑓𝑒𝑠𝑡𝑎67
Isso quer dizer que para todo e elemento que cumpra os requisitos de x (por exemplo, ser salgadinho e estar na festa), Mário o comeu. Note que a expressão “x salgadinho” está quantificada: a quantidade de elementos (que tenham a propriedade de ser salgadinhos) comidos 67
Convém notar que a Gramática Gerativa (pelo menos na sua versão chomskyana mais forte) rejeita a afirmação de que o componente semântico converte uma estrutura sintática em uma expressão lógica. Para essas vertentes, a semântica apenas “lê” a estrutura sintática LF, embora seja comum o uso da metalíngua da Lógica para representar relações semânticas.
| 59 por Mário na festa está determinada pelo quantificador, nesse caso o quantificador universal expresso pelo pronome “todos”. Existe relação entre a quantificação e as condições de verdade de uma sentença. May (1985) aborda a questão da quantificação como uma função que atribui um valor de verdade a uma sentença com base na relação entre os conjuntos estabelecidos pelos itens lexicais das sentenças. Um exemplo: (50)
Nenhum russo é um espião
(May, 1985)68
No exemplo acima, o quantificador “nenhum” estabelece uma condição de verdade para a sentença: o conjunto denotado pela interseção entre o conjunto dos russos (R) e o conjunto dos espiões (S) deve ser vazio: (51)
𝑅 ∩𝑆 = ∅
Assim sendo, o quantificador “nenhum” pode ter seu significado representado como (52) abaixo – o que seria o equivalente a usar o operador não existe (∄): (52)
a. 𝑁𝑒𝑛ℎ𝑢𝑚 (𝑋, 𝑌) = 1 𝑠𝑠𝑒 𝑋 ∩ 𝑌 = ∅ 69 b. ∄𝑥 | 𝑥 = 𝑟𝑢𝑠𝑠𝑜 & 𝑥 = 𝑒𝑠𝑝𝑖ã𝑜
Perceba que, na representação acima, o quantificador precisa ter escopo sobre a variável para que a operação de quantificação ocorra. O que é escopo? Veja a comparação abaixo: (53)
a. O João não disse que a Maria foi à festa. b. O João disse que a Maria não foi à festa.
Nos exemplos acima, fica claro que a posição na estrutura ocupada pelo operador “não” interfere no sentido da sentença – enquanto em (53a) a informação negada tenha sido o ato de dizer praticado pelo João, em (53b) o que é negado é a Maria ter ido à festa. Dizemos que, em (53a) o escopo do operador de negação (grosso modo, a sua “abrangência”) é toda a sentença (negando o ato de dizer), enquanto que, em (53b), o operador tem escopo apenas sobre a oração encaixada (negando o ato de ir). O fato de (53b) não poder ser interpretado como (53a) pode ser explicado pelo fato de o operador de negação não ter escopo sobre o VP nucleado pelo verbo dizer.
68 69
“No Russian is a spy”. As considerações de May se mantêm as mesmas para o exemplo traduzido. Na expressão, 1 significa verdadeiro.
| 60 A imensa maioria dos estudos em gramática gerativa assume que variáveis quantificadas precisam estar debaixo do escopo de quantificadores. De maneira geral, tem-se assumido que isso se dá via movimento sintático, possibilitando uma relação de c-comando entre quantificador e variável quantificada. É interessante notar como a quantificação precisa estar codificada na sintaxe para que possamos explicar algumas questões interessantes de interpretação. Por exemplo, a presença de dois quantificadores na mesma sentença produz uma ambiguidade que pode ser desfeita se considerarmos que a relação quantificador-variável depende de movimento sintático. Veja o exemplo: (54)
Nenhum arqueiro acertou todos os alvos.
A sentença (54) é ambígua: é possível que não exista um arqueiro que tenha conseguido acertar todos os alvos em conjunto e é possível que todos os arqueiros não tenham acertado nenhum alvo. Como explicar essa ambiguidade? Se assumirmos que quantificadores se movem, podemos explicar tal ambiguidade através das relações de escopo que podem ser estabelecidas entre quantificadores. Caso o quantificador “todos” esteja dentro do escopo do quantificador “nenhum”, a interpretação é de que não houve arqueiro que tenha acertado todos os alvos (a interpretação mais clara, representada em (55a)). Caso ocorra o contrário, e “nenhum” esteja dentro do escopo de “todos”, a interpretação é a de que todos os alvos não foram acertados por nenhum arqueiro – representado em (55b): (55)
a. Não existe x arqueiro, tal que, para todo y alvo, x acertou y ∄𝑥 𝑎𝑟𝑞𝑢𝑒𝑖𝑟𝑜 | ∀𝑦 𝑎𝑙𝑣𝑜[𝑥 𝑎𝑐𝑒𝑟𝑡𝑜𝑢 𝑦] b. Para todo y alvo, não existe x, tal que x acertou y ∀𝑦 𝑎𝑙𝑣𝑜[∄𝑥 𝑎𝑟𝑞𝑢𝑒𝑖𝑟𝑜 | 𝑥 𝑎𝑐𝑒𝑟𝑡𝑜𝑢 𝑦]
Ao assumirmos o movimento sintático de quantificadores, conseguimos capturar a ambiguidade do exemplo acima. No entanto, tal movimento não possui efeitos na fonologia. Como implementar movimento nesse caso? Uma saída é assumir que movimento pode ocorrer entre Spell-Out e LF, o que é comumente chamado de “movimento encoberto”. É interessante notar que, se a focalização realmente apresenta o mesmo comportamento de quantificadores – o que veremos na seção 2.3 – uma solução possível é assumir movimento encoberto do constituinte focalizado. Essa questão será abordada no capítulo 4. Assim sendo, se queremos interpretar a focalização como um fenômeno semântico, precisamos evidenciar que tal fenômeno altera ou a composicionalidade ou a correferenciação
| 61 ou a relação de quantificação ou as condições de verdade de uma sentença. Isso será feito na seção 2.3. Algumas propostas (como a Cartografia Sintática – ainda que implicitamente) assumem que exista outro fator que deva ser relevante em LF: a Estrutura Informacional. Diversos autores (Erteschik-Shir, 2007; Vallduvi, 1990 inter alia) propõem que o fluxo de apresentação de informações através da linguagem se organiza em uma estrutura chamada de Estrutura Informacional. É ponto pacífico entre tais autores o fato de que o processo de comunicação se estabelece através da apresentação de novas informações e da retomada de informações já citadas ou inferidas como sendo conhecidas entre os interlocutores. Assim sendo, poderíamos afirmar que a Estrutura Informacional comporta duas configurações: (i) uma configuração tópico-comentário, em que o tópico é uma informação partilhada entre os interlocutores dotada da característica de ser o aboutness da sentença70 e o comentário é uma informação nova afirmada a respeito do tópico; e (ii) uma configuração foco-pressuposição, em que o foco é a informação não pressuposta enquanto a pressuposição é o que é pressuposto (obviamente). Strawson (1964) analisa supostos efeitos da Estrutura Informacional nas condições de verdade de sentenças (ainda que ele não utilize o termo Estrutura Informacional – que não existia à época). Nesse trabalho, o autor afirma que, se um item lexical é tópico de uma sentença, mas não tem referência, as condições de verdade para essa sentença não podem ser verificadas, o que não acontece caso o mesmo constituinte sentencial sem referência seja parte do comentário. Veja o exemplo: (56)
a. O atual rei da França é careca. b. A exposição foi visitada pelo atual rei da França. (Strawson, 1964, p. 112, Adaptado)
A sentença em (56a), segundo Strawson, não pode ter seu valor de verdade determinado. Por outro lado, (56b) é claramente falsa71. Uma possível explicação para isso é que, em (56a), o sintagma sem referência é tópico, enquanto, em (56b), tal sintagma é comentário. Assim sendo, parece, à primeira vista, que tópicos influenciam as condições de verdade de uma sentença. 70
i.e do que a sentença se trata. Existe uma discussão homérica entre duas vertentes da filosofia da linguagem, encabeçadas por Bertrand Russell de um lado e Frederick Strawson de outro, acerca do estabelecimento do valor de verdade de sentenças que contém expressões sem referência (ilustradas com o famoso exemplo de (56a)). A teoria adotada por Strawson (truth-value gap) nos permite fazer tais considerações. Caso a solução de Russell seja adotada, a discussão acima torna-se inócua (já que a sentença será falsa tanto se o tópico não tiver referente quanto se o comentário não tiver referente, de modo que, nesse caso, o tópico não influencia o valor de verdade da sentença). Convém dizer que, mesmo se a solução russelliana seja adotada, é bem claro que (56a) é, de alguma forma, bastante diferente de (56b). 71
| 62 No entanto, tal afirmação não se sustenta a um exame mais aprofundado. Note o exemplo (57): (57)
Maria e João estão conversando sobre uma galeria recém-aberta na rua 15. Maria fala: a. Na galeria da rua 15, o atual rei da França comprou um quadro de Monet. b. Na galeria da rua 15, um quadro de Monet foi comprado pelo atual rei da França.
Nas duas sentenças em (57), o tópico da sentença é o sintagma na galeria da rua 15. No entanto, a mesma assimetria constatada em (56) ocorre: (57a), na proposta de Strawson, não pode ser nem verdadeira nem falsa, enquanto (57b) é falsa – ainda que, nas duas sentenças, a expressão sem referência (“o atual rei da França”) não seja tópico. Caso a proposta de Strawson fosse acurada, (57a) também deveria ser claramente falsa, o que não ocorre. Como explicar isso? Podemos assumir que a relação relevante não é aquela entre tópico e comentário, mas entre sujeito e predicado (diferente da postura de Strawson). Note que, mesmo com a topicalização do adjunto adverbial, a relação que permaneceu relevante para o estabelecimento das condições de verdade é a que ocorre entre o sujeito e seu predicado. Embora Strawson defina essa relação em termos de presunção de conhecimento (i.e o falante presume que sua audiência detém certo conhecimento), na realidade o problema está na (im)possibilidade de o predicado predicar sobre o sujeito, por conter uma expressão sem referência no mundo. Assim, não é possível dizer se “comprar um quadro de Monet na galeria da rua 15” pode ou não ser predicado de “o atual rei da França” (já que tal expressão não possui referente), mas é possível dizer que “ser comprado pelo atual rei da França” não pode ser predicado de “um quadro de Monet”. Dessa maneira, chegamos à conclusão de que, no que diz respeito à discussão empreendida por Strawson, é o sujeito gramatical a categoria que interfere no julgamento do valor de verdade de sentenças com constituintes sem referentes72. Assim sendo, não é necessariamente obrigatório que defendamos a tese de que a Estrutura Informacional (da qual tópico faz parte) da sentença possua efeitos relevantes nas condições de verdade da mesma, de modo que não é necessário (a priori) prever essa estrutura em LF (quanto ao foco, outro
72
Strawson rejeita essa ideia. No entanto, é importante notar que a sua argumentação parte do pressuposto de que é o sujeito lógico da sentença que deve ser levado em conta na discussão semântica (e não o sujeito gramatical). Nesse caso, o DP [o atual rei da França] em (56), segundo o autor, não seria o sujeito lógico da frase (a sentença (56) seria complexa semanticamente – ver Strawson (1950, p. 322)). No entanto, do ponto de vista que assumimos aqui, a sintaxe é fundamental na interpretação semântica, de modo que não é problemático assumirmos que o sujeito gramatical é o elemento relevante para a discussão.
| 63 elemento da Estrutura Informacional, veremos adiante). Seria uma boa posição sugerir que a relação entre as informações veiculadas pelas sentenças são codificadas em um nível pós-LF (pragmático, portanto), que não precisa depender diretamente da estrutura sintática73. Isso vai ao encontro da nossa ideia sobre a divisão entre semântica e pragmática, expressa no início desta seção: o manejo do fluxo de informação em uma conversa é algo pragmático, cujas regras são definidas pela Estrutura Informacional, um elemento pragmático que deriva da interpretação literal da sentença74. Em resumo: apresentamos quatro aspectos que o nível de representação LF codifica: a composicionalidade de interpretação dependente das relações gramaticais estabelecidas na sintaxe; a correferenciação de expressões de retomada de referentes, que dependem das configurações estruturais estabelecidas entre correferentes; as condições de verdade das sentenças e as relações de quantificação estabelecidas por alguns itens lexicais. Como os dois primeiros aspectos não parecem ser relevantes na focalização (como demonstraremos na seção 2.3), e os outros dois possuem relação com as condições de verdade das sentenças, podemos afirmar que nossa investigação irá se concentrar na semântica vericondicional. Antes de analisar a focalização à luz de tais questões, no entanto, convém pontuar algumas análises já estabelecidas para a semântica da focalização, o que será feito na próxima seção. 2.2.Análises sobre a semântica do foco Nessa seção, vamos fazer algumas considerações sobre trabalhos que investigam a semântica do foco. Primeiramente, vamos abordar a análise feita por Jackendoff (1974) sobre a focalização. Em seguida, vamos analisar a proposta mais conhecida sobre a semântica do foco: o trabalho de Rooth (1992). Por fim, vamos apontar as considerações feitas em Menuzzi (2012) acerca do que tem sido proposto para a focalização. Esse último trabalho nos fornecerá considerações importantes, que serão a base da nossa investigação sobre o que é de fato relevante semanticamente no foco. 73
Uma análise da Estrutura Informacional (ainda que fora do escopo da gramática gerativa) pode ser encontrado no trabalho de Erteschik-Shir (2007). 74 Uma questão relevante diz respeito aos casos em que a Estrutura Informacional se faz presente gramaticalmente (seja por um morfema específico (caso de línguas com tópico marcado morfologicamente) seja por uma ordem sensível a tais aspectos. Embora não pretendamos explicar isso, podemos pensar da seguinte forma: morfemas de tópico, por exemplo, seriam idiossincrasias restritas a algumas línguas, de maneira semelhante a, por exemplo, o sufixo -ish do inglês, que tem uma função claramente pragmática – indicar uma aproximação de algo que não é ideal ou que o falante não tem muita certeza (he is happyish ‘ele está (mais ou menos) feliz). No caso de ordenamento específico de palavras que aparentemente possui relação com tópico, o movimento de constituintes que gera tal ordem merece uma aproximação mais detalhada, na tentativa de derivar esse movimento por outros meios (talvez por movimento em PF, ou algo do tipo). Estudos posteriores podem ser empreendidos para endereçar tais questões.
| 64
2.2.1. Jackendoff (1974) Inicialmente, Jackendoff (1974) faz algumas considerações sobre a semântica do foco que convém aventar aqui. É ponto pacífico que o foco estabelece uma relação quantificadorvariável (veremos uma argumentação para isso na próxima seção). Além disso, autor aponta que é necessário que “[...] a variável [tomada como foco] deve ser escolhida de tal forma que defina uma classe coerente de possíveis contrastes com o foco, peças de informação semântica que poderiam igualmente tomar o lugar do foco na sentença.” (ib. p. 243. Tradução nossa)75. Em outras palavras, o conjunto estabelecido por essa variável deve possuir “características” partilhadas por todos os seus membros. Uma dessas “características” é a função semântica. Isso significa dizer que o foco precisa ter a mesma função semântica da variável: se a variável é um predicado, o foco não pode ser um indivíduo; se a variável é um predicado de um lugar, o foco não pode ser um predicado de dois argumentos; e assim por diante. Isso não é o mesmo que dizer que variável e foco precisam ser de mesma natureza sintática; Jackendoff apresenta dois exemplos que mostram que similaridade sintática não é condição nem necessária (58) nem suficiente (59-60) para que a focalização possa ocorrer: (58)
a. Did the cop ARREST Bill? O policial PRENDEU Bill? b. No, he only LEERED at him. Não, ele só OLHOU FEIO para ele.
(59)
a. Did Fred turn the lights ON? O Fred LIGOU as luzes? b. No, he turned them OFF. Não, ele as DESLIGOU.
(60)
a. Did Fred turn the proposal IN? O Fred ENTREGOU a proposta? b. #No, he turned it OUT. Não, ele a PRODUZIU.
(Jackendoff, 1974, pp. 243, 244)
O caso em (58) é o de a similaridade sintática não ser necessária para que haja focalização, já que, em inglês, o verbo arrest seleciona um NP, enquanto o verbo leer seleciona um PP – sendo, portanto, de natureza sintática diferente, embora seja possível a focalização. Já os exemplos em (59-60) apresentam semelhança sintática em ambos os casos (em inglês), embora em (60) a focalização seja impossível. Jackendoff explica que (59) é aceitável porque “[...] the variable must be chosen in such a way that it defines a coherent class of possible contrasts with the focus, pieces of semantic information that could equally well have taken the place of the focus in the sentence.” 75
| 65 o contraste semântico entre turn on e turn off é explicitado pela preposição, o que não ocorre entre turn in e turn out. Daí a variável semântica pode ser substituída apenas pela preposição em (59), mas não pode ser substituída apenas pelo advérbio em (60). Levando em conta essas considerações, Jackendoff propõe uma espécie de “derivação semântica”. Inicialmente, ele propõe que a regra semântica de atribuição de foco derive dois objetos formais: o Foco, que consiste no material semântico associado à estrutura de superfície dominada por um marcador sintático F; e um predicado de um lugar Pressups(x), que não possui relação com a estrutura funcional estabelecida pelas relações argumentais capitaneadas pelo verbo. Jackendoff dá o seguinte exemplo: (61)
John LIKES Bill. John GOSTA de Bill.
(62)
LIKE (JOHN, BILL) GOSTAR (JOHN, BILL)
(63)
The [relation between John and Bill / attitude of John towards Bill] is x A [relação entre John e Bill / atitude de John em relação a Bil] é x (Jackendoff, 1974, p. 245)
(61) é a representação gramatical da sentença; (62) é a estrutura funcional da sentença (61), uma interpretação semântica na qual o verbo estabelece uma função que toma seus complementos sintáticos como argumentos; (62) é a expressão da função Pressups (x) 76. Em seguida, essa derivação semântica cria outro objeto formal, o conjunto pressuposicional, o conjunto de valores que, quando substituídos por x em Pressups (x) poderiam veicular uma proposição verdadeira. Esse conjunto é representado por Jackendoff através da notação lamba λx.Pressups (x)77. A partir daí a derivação constrói a pressuposição e a asserção a partir do conjunto pressuposicional, cuja forma pode ser expressa como (64) abaixo:
Apenas a título de esclarecimento: quando usamos o termo “função”, estamos afirmando que existem operações semânticas à semelhança de operações matemáticas. Por exemplo, compare as duas formalizações abaixo: 76
(i) f(x) = 1 + 3x (ii) Pressups (x) = A relação entre John e Bill é x A função semântica expressa em (ii) possui uma estrutura bastante semelhante à função matemática de primeiro grau expressa em (i): há uma variável (x nos dois casos) e uma expressão associada (1 +3x, no primeiro caso e “A relação entre John e Bill é x” do outro). No caso da proposta de Jackendoff, o que é afirmado é que a sintaxe sinalizaria, através do marcador sintático F, qual é o valor da variável da função Pressup s (x). 77 Notação lambda nada mais é do que uma forma de representar funções.
| 66 (64)
λx.Pressups(x) [é um conjunto coerente no presente discurso/ é bem definido no presente discurso / é concernente à discussão / está em discussão] (Jackendoff, 1974, p. 246)78
No caso de sentenças afirmativas, a asserção apresenta o foco como pertencente ao conjunto pressuposicional: (65)
Focus ∈ λx.Pressups(x)
(Jackendoff, 1974, p. 246)
Baseado em todas essas afirmações, o autor chega à seguinte regra semântica para atribuição de foco: (66)
Atribuição de foco Em uma sentença S, com uma representação semântica determinada SR, o material semântico associado a nós de estrutura superficial dominados por F é o Foco de S. Substitua uma variável semântica apropriada x por Foco em SR para formar a função Pressupx (x). A pressuposição de S é então formada como (64[6.76]) e a asserção é (65[6.77]). (Jackendoff, 1974, p. 247)79
Vejamos como essa regra se aplicaria a (61) acima, reproduzido abaixo para conforto do leitor80: (67)
a. John GOSTA do Bill. b. GOSTAR (JOHN, BILL) 𝑟𝑒𝑙𝑎çã𝑜 𝑒𝑛𝑡𝑟𝑒 𝐽𝑜ℎ𝑛 𝑒 𝐵𝑖𝑙𝑙 é 𝑏𝑒𝑚 𝑑𝑒𝑓𝑖𝑛𝑖𝑑𝑎 c. λx[𝑎 { } é 𝑥] { 𝑎𝑡𝑖𝑡𝑢𝑑𝑒 𝑑𝑒 𝐵𝑖𝑙𝑙 𝑒𝑚 𝑟𝑒𝑙𝑎çã𝑜 𝑎 𝐽𝑜ℎ𝑛 𝑒𝑠𝑡á 𝑒𝑚 𝑑𝑖𝑠𝑐𝑢𝑠𝑠ã𝑜 𝑟𝑒𝑙𝑎çã𝑜 𝑒𝑛𝑡𝑟𝑒 𝐽𝑜ℎ𝑛 𝑒 𝐵𝑖𝑙𝑙 d. 𝑔𝑜𝑠𝑡𝑎𝑟 ∈ 𝜆𝑥 [𝑎 { } é 𝑥] 𝑎𝑡𝑖𝑡𝑢𝑑𝑒 𝑑𝑒 𝐵𝑖𝑙𝑙 𝑒𝑚 𝑟𝑒𝑙𝑎çã𝑜 𝑎 𝐽𝑜ℎ𝑛
(67a) é a forma gramatical da sentença; (67b) é a representação da estrutura semântica funcional da sentença; (67c) é o conjunto pressuposicional determinado pela função Pressupx (x); e (67d) é a asserção associada à atribuição do foco gostar à função Pressupx (x). Essa análise, embora bastante interessante, apresenta alguns problemas: a asserção atribuída à focalização estabelece uma relação de pertencimento a um conjunto. Desse modo,
λx.Pressups(x) [is a coherent set in the present discourse/ is well defined in the present discourse / is amenable to discussion / is under discussion] 79 (Focus assignment) In a sentence S, with otherwise determined semantic representation SR, the semantic material associated with surface structures nodes dominated by F is the Focus of S. Substitute an appropriate semantic variable x for Focus in SR to form the function Pressups (x). The pressuposition of S is then formed as (6.76), and the assertion is (6.77). 80 Para facilitar a explicação, vamos usar apenas a tradução do exemplo, que se aplica fielmente ao utilizado originalmente pelo autor 78
| 67 as únicas condições impostas ao foco (em um sentido estritamente semântico) são: (i) ser parte do conjunto pressuposicional; e (ii) partilhar da mesma função semântica com a variável da função λx.Pressups (x), podendo ser um “contraste possível” (p. 278). No entanto, essa associação estreita entre foco e contraste recai no problema já apontado em Menuzzi (2012), que veremos adiante. Além disso, do modo como a solução está proposta, o foco é definido pela pressuposição. No entanto, a relação de pressuposição não necessariamente depende de focalização. Vejamos o exemplo abaixo: (68)
João comeu o bolo. Pressup.: Alguém comeu o bolo.
Em (68), claramente temos uma pressuposição, que não pode ser expressa em uma relação quantificador-variável. Diante disso, temos duas soluções: (i) assumir que a relação de pressuposição possui uma subdivisão entre aquelas que envolvem uma relação quantificadorvariável e aquelas que não envolvem tal relação – sendo necessário explicar por que a função Pressups(x) só se aplica ao primeiro caso –; ou (ii) assumir que a relação de pressuposição é algo separado da atribuição do foco, de modo que sentenças focalizadas são marcadores de pressuposição e que o foco evoca outra relação relevante. Além disso, a análise de Jackendoff não parece ser capaz de afirmar que a focalização interfere nos valores de verdade da sentença. Note que, conforme assumido anteriormente, cabe ao foco cumprir apenas dois requisitos: ser parte do conjunto pressuposicional e possuir a mesma função semântica da variável da função Pressups (x), sendo um “possível contraste”. Isso requer dizer que qualquer elemento que cumpra esses dois fatores pode ser foco. Vejamos o exemplo abaixo: (69)
João, Pedro e Paulo estão sentados à mesa na sala; há um bolo na mesa comido. João comeu o bolo. Maria chega na sala: Maria: Oi, gente. Quem comeu o bolo? a. O João comeu o bolo. b. O Pedro comeu o bolo. c. O Paulo comeu o bolo.
No contexto de (69), o conjunto pressuposicional é {João, Pedro, Paulo}. A pressuposição (que fica clara na pergunta de Maria) é “Alguém comeu o bolo”. Se adotássemos a solução de Jackendoff para a focalização, qualquer um dos elementos do conjunto pressuposicional poderia ser foco (já que os três elementos do conjunto são “possíveis
| 68 contrastes”) – independente se a sentença resultante é verdadeira ou não. No entanto, apenas (69a) é verdadeira. Concluiríamos, portanto, que a focalização não interfere nas condições de verdade da sentença, o que acarretaria que a focalização não precisa ser lida em LF e nossa discussão não faz sentido (assumindo a concepção de LF apresentada na seção anterior). Veremos na seção 2.3, no entanto, que a focalização de fato interfere nas condições de verdade das sentenças, o que inviabiliza a solução proposta por Jackendoff, já que não consegue explicar por que isso ocorre. 2.2.2. Rooth (1992) Rooth (1992) é o trabalho clássico que tem sido usado para explicar a semântica do foco. Por esse motivo, propomos uma análise pormenorizada das considerações feitas pelo autor nesse trabalho, dedicando as próximas páginas a isso. Uma afirmação importante de Rooth é a de que o componente semântico da gramática atribui valores semânticos aos sintagmas sintáticos81. Por exemplo, uma sentença possui o valor semântico de proposição, enquanto nomes próprios possuem o valor semântico de indivíduos. Vejamos a sentença abaixo: (70)
Mary apresentou Bill à Sue
(Rooth, 1992, p. 77. Adaptado)
No exemplo (70), podemos dizer que o verbo apresentar introduz uma função de três argumentos, semelhante à expressa na seção anterior: (71)
APRESENTAR(m, b, s)
Essa função toma indivíduos como argumentos (representado acima pelas constantes m, b e s) e retorna uma proposição – a saber, a sentença (70). Uma representação desse processo pode ser dada abaixo (m, b e s são abreviações de Mary, Bill e Sue, respectivamente): (72)
VP: apresentar(m, b, s) qp NP:m
V’: λx.apresentar(x, b, s)
Mary
wo
V’: λx.λy.apresentar(x, b, y) ei V: λx.λy.λz.apresentar(x, z, y)
PP: s à Sue
NP:b Bill
Grossíssimo modo, podemos entender valor semântico como “classe semântica”, tais quais indivíduos, proposições, predicados, etc. 81
| 69 Nessa abordagem, o verbo [apresentar] introduz uma função que toma três argumentos – o agente da apresentação, o paciente da apresentação e o alvo da apresentação –, expresso, em notação lambda, por λx.λy.λz.apresentar(x, z, y). Ao sofrer merge com o NP [Bill], objeto direto, o argumento z da função é saturado, resultando em λx.λy.apresentar(x, b, y). Quando o PP [à Sue] sofre merge na estrutura, o argumento y é saturado, resultando em λx.apresentar(x, b, s). Por fim, quando ocorre merge do NP [Mary], o último argumento da função é saturado, resultando no VP [Mary gosta da Sue], cuja representação funcional é apresentar(m, b, s). Nesse exemplo, m, b e s pertencem ao valor semântico de indivíduos e o VP pertence ao valor semântico de proposição. Assim, podemos dizer que a função apresentar(x, z, y) mapeia indivíduos em proposições. Para a focalização, Rooth argumenta que o foco é um outro valor semântico, derivado do valor semântico ordinário (por exemplo, indivíduos, no caso de nomes próprios). Essa função semântica seria “o conjunto de proposições obtidas a partir do valor semântico ordinário por efetuar uma substituição na posição correspondente ao sintagma focalizado” (Rooth, 1992, p. 76. Tradução nossa)82. Por exemplo, em (73), caso houvesse focalização em [Mary], teríamos uma notação semelhante ao que é expresso abaixo: (73) [[S[Mary]F apresentou Bill à Sue]] 𝑓 = {apresentar (x, b, s)|𝑥 ∈ 𝐸}, 𝑜𝑛𝑑𝑒 𝐸 é 𝑜 𝑑𝑜𝑚í𝑛𝑖𝑜 𝑑𝑒 𝑖𝑛𝑑𝑖𝑣í𝑑𝑢𝑜𝑠
Em resumo, a ideia de Rooth é a de que o foco nada mais é do que um valor semântico que denota um conjunto de proposições alternativas – no exemplo, o conjunto das proposições com a forma “x apresentou Bill à Sue”. O autor tenta implementar essa abordagem em LF através de um operador (simbolizado por ~) que se adjunge ao sintagma focalizado. Rooth analisa cinco efeitos do foco em sentenças: (i) restrições com advérbios focalizadores; (ii) restrições com sintagmas que estabelecem contraste; (iii) Restrições em implicaturas escalares; (iv) restrições em pares pergunta-resposta; e (v) ambiguidade em bare remnant ellipsis. O primeiro efeito diz respeito a imposições feitas às condições de verdade de uma sentença focalizada com o uso de advérbios como só e apenas. Vejamos o exemplo: (74)
a. Mary só apresentou [Bill]F à Sue b. Mary só apresentou Bill à [Sue]F
(Rooth, 1992, p. 77. Tradução nossa)
“[...] the set of propositions obtainable from the ordinary semantic value by making a substitution in the position corresponding to the focused phrase.” 82
| 70 Em um contexto em que Mary apresentou Tom e Bill à Sue e nenhuma outra apresentação foi feita, (74a) é falsa e (74b) é verdadeira. Rooth assume que essa diferença nas condições de verdade da sentença se deve à focalização. Ele afirma que o advérbio só (only, em inglês) possui um valor semântico de quantificação expresso como (75) abaixo: (75)
∀𝑃[𝑃 ∈ 𝐶 ∩ 𝑃(𝑚) → 𝑃 = 𝑉𝑃]
A expressão em (75) significa que, para toda propriedade P, se P pertencer ao conjunto interseção de um conjunto qualquer de propriedades e a propriedade de Mary, então essa propriedade é identificada pelo VP. Assim, se Mary possui a propriedade de apresentar Bill a Sue, então essa propriedade, caso esteja sob o domínio de quantificação de só, será a propriedade expressa em VP. Nessa abordagem, Rooth afirma que o papel do foco é identificar o conjunto C, já que o foco é o valor da variável, o que pode ser expresso da seguinte forma: (76)
Restrição de advérbios focalizadores: Se C é o domínio de quantificação de um advérbio focalizador com o argumento α, então 𝐶 ⊆ ⟦α⟧ 𝑓 (Rooth, 1992, p. 85. Tradução nossa)83
Isso quer dizer que o conjunto de propriedades em questão deve estar contido no conjunto de alternativas que é o valor semântico do foco (nesse caso, o conjunto de proposições de forma “Mary apresentou x a Sue”). Como o contexto não interfere no conjunto C, não há mudança nas condições de verdade da sentença (seria esse o caso se, no contexto, Mary tivesse apresentado Bill a Sue e Tom, por exemplo). Podemos argumentar, no entanto, que o foco não é o problema nos exemplos em (74). Línguas com posicionamento de advérbios mais flexível (como o português) nos possibilitam afirmar que a questão, na verdade, é de escopo do advérbio, e não da focalização em si: (77)
a. Mary apresentou só Bill a Sue. b. Mary apresentou Bill só a Sue.
No exemplo acima, fica claro que a falsidade de (77a) se deve ao fato de o advérbio só (only no inglês) ter escopo sobre [Bill]. Como a exaustividade não pode ser aplicada a esse caso (já que Tom também foi apresentado a Sue), a sentença é falsa. O que poderia ser interpretado
Focusing adverb constraint. If C is the domain of quantification of a focusing adverb with argument α, then 𝐶 ⊆ ⟦𝛼⟧𝑓 . 83
| 71 como focalização nada mais é do que uma estratégia prosódica de marcação de qual é o escopo do advérbio só84. O segundo efeito do foco diz respeito a restrições em sintagmas que estabelecem um contraste, como (78) abaixo: (78)
Um fazendeiro [americano]F estava falando com um fazendeiro [canadense] F... (Rooth, 1992, p. 80. Tradução nossa)
Esse tipo de contraste, claramente pragmático, é analisado por Rooth como um exemplo de manipulação pragmática de bases semânticas85. Assim, o contraste entre [americano] e [canadense] é resultado da manipulação do valor semântico de foco. O NP [fazendeiro americano] é uma proposição (do tipo 𝑥 ∈ 𝐴 ∩ 𝐹, onde A é o conjunto de americanos e F o conjunto de fazendeiros). A focalização de [americano] cria um conjunto de alternativas de forma fazendeiro x. Note que [fazendeiro canadense] está contido no conjunto expresso por fazendeiro x. Rooth argumenta, então, que a criação do contraste respeita a seguinte regra: (79)
Sintagmas contrastivos: Construa um sintagma α contrastando com um sintagma β, se ⟦β⟧° ∈ ⟦α⟧ 𝑓 .86 (Rooth, 1992, p. 81. Tradução nossa)87
Um problema dessa análise é que ela não pode ser aplicada a outros tipos de contraste, como (80), por exemplo: (80)
Enquanto o João estava cantando no jardim, o Carlos foi trabalhar na fazenda.
Não parece uma solução muito adequada supor que haja a mesma regra de estabelecimento de contraste no exemplo acima. Primeiro por que não há a necessidade de marcação prosódica no contraste de (80) como ocorre – pelo menos em inglês – no exemplo de Rooth. Além disso, para que a regra (79) se aplique a (80), é necessário que o elemento contrastivo faça parte do conjunto de alternativas expresso pelo valor semântico do foco. Não é possível estabelecer tal conjunto em (80), já que não há nada em comum com os dois
As propriedades sintáticas em questão nesse exemplo – i.e. como derivar (77) – não são escopo deste trabalho, mas seria um bom tópico para análises futuras. Também deixamos para pesquisas futuras qual a relação da prosódia de (77) com a prosódia da focalização in situ. 85 Rooth assume que operações pragmáticas são derivadas de base semântica no sentido de que o componente pragmático manipula objetos semânticos nas suas operações. A análise dessa assunção – que não precisa ser consensual – não está no escopo deste trabalho. 86 A notação ⟦x⟧ se refere ao valor semântico de um elemento. O símbolo ° indica o valor semântico ordinário do elemento (nesse caso, indivíduo), e f indica o valor semântico de foco. 87 Contrasting phrases. Construe a phrase α as contrasting with a phrase β, if ⟦β⟧° ∈ ⟦α⟧𝑓 . 84
| 72 elementos do contraste: se o conjunto for definido por x estava cantando no jardim, o outro elemento do contraste (Carlos foi trabalhar na fazenda) não faz parte desse conjunto; se definirmos o conjunto como João x, da mesma forma o segundo elemento do contraste não está contido nesse conjunto. Assim, não se pode generalizar a operação pragmática de contraste através da regra (79). A existência do acento prosódico em (78) pode estar relacionada a outros fatores, cuja análise extrapolaria o escopo deste trabalho. Ainda assim, não é necessário assumir que a sentença (78) apresente qualquer sintagma focalizado. O terceiro efeito do foco apontado por Rooth diz respeito a implicaturas escalares. Vejamos o exemplo: (81)
Steve, Paul e Mats fizeram uma prova. Após a entrega dos resultados, George pergunta para Mats como foi o resultado: a. Bem, eu [passei]F b. Bem, [eu]F passei.
(Rooth, 1992, p. 82. Adaptado)
A sentença (81a) acarreta em Mats não ter gabaritado a prova. A sentença em (81b) acarreta em apenas Mats ter passado (de modo que Steve e Paul não passaram). Rooth analisa isso em termos de implicatura escalar. Olhando para (81a), o autor sugere que, já que gabaritar a prova implica passar nela, há um conjunto ordenado de proposições, definido por acarretamento: (82)
C = {“Mats gabaritou a prova” ≥ “Mats passou na prova”}
A ideia, então, é a de que afirmar um elemento de C implica na negação de todos os elementos hierarquicamente superiores na escala. No exemplo, afirmar “Mats passou na prova” implica negar “Mats gabaritou a prova”. Rooth afirma que o papel do valor semântico do foco, nesse sentido, é determinar o conjunto ao qual a implicatura escalar é aplicada. Ele define essa regra da seguinte forma: (83)
Restrições em escalas: Na construção de uma escala de asserções alternativas determinantes para as implicaturas escalares de uma sentença α, escolha um conjunto subjacente C tal que 𝐶 ⊆ ⟦α⟧𝑓 . (Rooth, 1992, p. 83. Tradução nossa)88
Embora a análise de Rooth seja adequada, é perfeitamente possível analisar esse fenômeno utilizando apenas a noção de exaustividade (que será definida e analisada na seção
88
Constraint on scales. In constructing a scale of alternative assertions determining the scalar implicatures of a sentence α, choose an underlying set C such that 𝐶 ⊆ ⟦𝛼⟧𝑓 .
| 73 2.3.1). Por exemplo, em (81b), interpretamos que Steve e Paul não passaram na prova, apenas Mats, o que indica a exaustão do conjunto C, de modo que apenas Mats seja elemento do conjunto. Caso a sentença incluísse mais de um elemento (como [Eu e Steve] F passamos) – se referindo a um nível mais alto da implicatura escalar, na proposta de Rooth –, também temos a exaustão do conjunto C, sendo que, dessa vez, apenas Mats e Steve passaram, negando o nível mais alto da escala (que seria Mats, Steve e Paul passaram). Já em (81a), temos um conjunto pressuposicional composto por resultados possíveis para a execução de uma prova (como passar, gabaritar, reprovar, etc), e afirmar que Mats passou, focalizando o verbo, indica que, dentro desse conjunto, o único resultado da prova foi Mats passar, e não gabaritar (nem reprovar, nem nada do tipo). Portanto, se podemos reduzir todos os efeitos da focalização à noção de exaustividade, a Navalha de Ockham (apresentada na seção 1.2.2) nos permite afastar a análise proposta por Rooth para esse fenômeno e adotar uma solução mais econômica metodologicamente. O quarto efeito da focalização diz respeito à relação existente entre perguntas wh e focalização. Vejamos o exemplo: (84)
P. Quem colocou o Bill no seu devido lugar? R1. [Mary]F colocou o Bill no seu devido lugar. R2. #Mary colocou [o Bill]F no seu devido lugar. (Rooth, 1992, p. 84. Tradução nossa)
(84R2) não é uma resposta adequada para (84P). Rooth (p.85) analisa que, como perguntas são caracterizadas semanticamente por determinar o conjunto de respostas potenciais, a pergunta em (84P) pode ser expressa como (85) abaixo: (85)
{𝑐𝑜𝑙𝑜𝑐𝑎𝑟𝑛𝑜𝑠𝑒𝑢𝑑𝑒𝑣𝑖𝑑𝑜𝑙𝑢𝑔𝑎𝑟(𝑥, 𝑏)|𝑥 ∈ 𝐸 ∩ 𝑝𝑒𝑠𝑠𝑜𝑎(𝑥)}
O autor assume, então, que o valor semântico do foco de (84R1) é o superconjunto do conjunto expresso em (85) – já que considera elementos que não são pessoas. Em (84R2), o valor semântico do foco em [Bill] não está contido no conjunto definido em (85), daí a inadequação da resposta. Isso significa que, para uma resposta ser adequada a uma pergunta wh, o valor semântico da pergunta deve estar contido no valor semântico do foco da resposta. Isso é formalizado por Rooth na seguinte regra:
| 74 (86)
Restrição em pergunta-resposta: Em um par pergunta-resposta <ψ,α>, ⟦ψ⟧° ⊆ ⟦α⟧𝑓 . (Rooth, 1992, p. 86. Tradução nossa)89
Assim como o caso anterior, a solução adotada por Rooth explica os dados. Mas, se conseguíssemos reduzir a semântica do foco à exaustividade (como é a hipótese com a qual trabalharemos na seção 2.3.1), a Navalha de Ockham nos permitiria rejeitar a análise do autor. Se assumirmos que o foco exaure um conjunto disponível contextualmente, podemos explicar a inadequação de (84R2) dizendo que o foco em [Bill] exaure um conjunto já exaurido (a pressuposição da pergunta já expressa que o conjunto de pessoas que foram “postas em seu devido lugar” tem como elemento apenas o Bill). Na seção 2.3.1 veremos que essa inadequação decorre de uma restrição à operação de exaustão que requer que o conjunto pressuposicional deva ser composto por mais de um elemento. Por fim, o último efeito do foco apontado por Rooth diz respeito ao desfazimento de ambiguidade em casos de bare remnant ellipsis90. Vamos aos exemplos: (87) a. Ela me agride mais frequentemente que a Maria (ambíguo) b. Ela [me]F agride mais frequentemente que a Maria (= ela agride a Maria) c. Ela me agride mais frequentemente que [a Maria]F (= Maria me agride) (88) a. Ela me ama bastante, mas não a Maria b. Ela [me]F ama bastante, mas não a Maria c. [Ela]F me ama bastante, mas não a Maria
(ambíguo) (= ela não ama a Maria) (= Maria não me ama)
(89) a. Ela me visitou antes da Maria b. Ela [me]F visitou antes da Maria. c. Ela me visitou antes da [Maria]F
(ambíguo) (= antes de ela visitar Maria) (= antes da Maria me visitar)
(90) a. Minha mãe quer que ela me escolha e meu pai, a Maria (ambíguo) b. [Minha mãe]F quer que ela [me]F escolha e meu pai, a Maria (= Meu pai quer que ela escolha a Maria) c. [Minha mãe]F quer que [ela]F me escolha e meu pai, a Maria (= Meu pai quer que a Maria me escolha) (Rooth, 1992, p. 98. Adaptado) A focalização é capaz de desambiguizar a posição estrutural de [a Maria] nas sentenças acima. Em outras palavras, a focalização pode determinar qual termo é o correlato de [a Maria] na sentença antecedente. Uma proposta para tal tipo de elipse é a de que o material elidido é idêntico à sentença pronunciada (cujo nome dado por Rooth é antecedente), à exceção do termo que não é apagado (chamado de correlato). Por exemplo, em (87b) a sentença sem elipse seria: Question-answer constraint. In a question-answer pair <ψ,α>, ⟦𝜓⟧° ⊆ ⟦𝛼⟧𝑓 . 90 Bare remnant ellipsis é um caso de elipse no qual apenas um argumento da sentença apagada permanece pronunciável, como os exemplos (85-88). Alguns autores também chamam esse fenômeno de bare argument ellipsis. 89
| 75 (91)
[Ela me agride] mais frequentemente que [ela agride a Maria]
Nessa sentença, a sequência [ela agride] é o antecedente e [me] é o correlato de [Maria] – chamado de remanescente. Rooth assume que haja uma relação de conjunção entre a sentença antecedente e a sentença que contém o correlato, de modo que a estrutura deveria ser: (92)
[[correlato + antecedente] conjunção [remanescente+sentença apagada]]
A fim de evitar contorcionismos teóricos muito grandes, Rooth prefere assumir que o efeito do foco nesse caso se dá indepentendemente da elipse, pois se trata de um caso de contraste tal como (78). No entanto, como rejeitamos a análise do autor para casos de contraste, também devemos rejeitar essa solução. Uma possibilidade seria afirmar que a prosódia pode desambiguizar a função sintática do remanescente, e o que Rooth assume como uma prosódia focalizada pode ser simplesmente algum tipo de ênfase91. Uma última consideração relevante ao trabalho de Rooth diz respeito à implementação formal, em LF, da focalização. O autor assume que ocorre a adjunção de um operador de foco (~), em LF, na posição em que ele tenha escopo sobre o elemento focalizado. No entanto, isso não é adequado à noção de arquitetura da gramática adotada atualmente pela Gramática Gerativa (e apresentada na seção 1.2.2), pois prevê uma operação de merge em LF: se a focalização tem efeitos na fonologia, como é possível que isso ocorra com o operador sofrendo merge apenas em LF? Para que essa solução possa ser implementada no quadro que temos aqui, seria necessário assumir que esse operador está presente na estrutura desde antes do Spell-Out, o que não é assumido por Rooth. Além disso, por adotar apenas o merge, não é possível criar a relação quantificador-variável necessária ao foco, que, como vimos na seção 2.1, envolve movimento.
2.2.3. Menuzzi (2012) Por fim, Menuzzi (2012) faz uma crítica bem fundamentada sobre o que a literatura atual tem proposto sobre focalização, isto é, sobre as justificativas assumidas por muitos estudos sintáticos (cf. Belletti, 2004a; Guesser & Quarezemin, 2013; Mioto, 2003; Quarezemin, 2012, inter alia) para justificar a codificação sintática da focalização. A hipótese perseguida pelo autor é a de que os conceitos de foco, contraste e exaustividade são demasiado complexos para serem simplificados, todos, a um elemento discreto, como um traço sintático. 91
Sobre o efeito desambiguizador da prosódia, ver Ribeiro (2015).
| 76 Inicialmente, Menuzzi busca definições de contraste e exaustividade capazes de estabelecer uma diferenciação entre os termos. Normalmente se define “contraste” como a negação de outras afirmações disponíveis contextualmente. Por exemplo: (93)
A: O João comeu o pão. B: O João comeu O BOLO (não o pão).
Menuzzi (p. 102) afirma que as sentenças (93A) e (93B) “formam o conjunto de alternativas contextualmente relevantes” – no sentido de valor semântico do foco adotado por Rooth (1992). A asserção de (93B) acarreta a negação de (93A), e isso seria a “função” do foco contrastivo. Exaustividade, por sua vez, envolve a negação de todas as alternativas do conjunto de alternativas contextualmente relevantes, o que acarreta na asserção da alternativa que sobrou, o que significa dizer que, no exemplo (93), exaustividade envolve negar (93A), o que implica na asserção de (93B). Ora, se exaustividade e contrastividade forem definidas nesses termos, os conceitos seriam sinônimos: dado um conjunto C {pão, bolo}, a afirmação de que “existe um x tal que João comeu x e x = [bolo], sendo falso que x = [pão]” é equivalente à afirmação de que “não existe um x tal que João comeu x e x ≠ bolo”, e vice-versa. Menuzzi persegue, então, uma outra definição de contraste e exaustividade capaz de diferenciar esses dois conceitos. Ele chega à conclusão de que, enquanto exaustividade é um conceito definível em termos estritamente semânticos (ou seja, ligados às condições de verdade da sentença, como veremos na seção 2.3.1), sendo “uma relação que se estabelece entre a verdade e a falsidade [...] de proposições que constituem um conjunto de alternativas” (p.102), a contrastividade é um conceito pragmático, que envolve a correção de uma afirmação presente no discurso, um ato de fala de denegação, que está sujeito às condições de felicidade (adequação) de um enunciado. Menuzzi explica:
Dessa incursão pelas noções de “exaustividade” e “contraste” tal como se revelam nos contextos típicos que as ilustram, concluo que, se há algo que distingue “contraste” de “exaustividade”, não é a “negação de um conteúdo proposicional”: tanto “exaustividade” como “contraste” envolvem a negação de conteúdos proposicionais. Mas “contraste” envolve mais: não é apenas a negação de certos conteúdos proposicionais, mas a “denegação” deles – isto é, é o ato de fala de assertar uma alternativa contrária a conteúdos que foram previamente assertados, ou são pressupostos, etc., no contexto. (Menuzzi, 2012, p. 103)
Para Menuzzi, o foco contrastivo pode apresentar três características: correção, denegação e exaustividade. O autor dá alguns exemplos que corroboram essa afirmação:
| 77 (94)
A. O João chegou? B. (Não,) O PAULO chegou.
(95)
A. Quem chegou, o João ou o Paulo? B. (*Não,) O PAULO chegou.
(Inferência: o João não chegou)
(96)
A. Qual dos alunos chegou? B. (*Não,) O PAULO chegou.
(97)
A e B compartilham a informação de que Paulo é um dos alunos. A. Os alunos chegaram? B. (Não,) O PAULO chegou. (Menuzzi, 2012, pp. 105, 107)
Em (94), temos claramente um foco contrastivo que respeita a definição proposta por Menuzzi (já que o “Não” sentencial, opcional, indica justamente denegação), além de apresentar a correção de uma informação. Quanto à exaustividade, a falta do contexto nos indica a possibilidade de não haver exaustividade (já que não há um conjunto relevante das pessoas que poderiam ter chegado). Já (95), normalmente considerado um tipo de foco contrastivo92, apresenta o oposto: a inadequação do “não” denegativo indica que não há denegação nem correção, embora haja exaustividade (se tomarmos o conjunto relevante composto por João e Paulo). A sentença (96), embora seja caracterizada como foco informacional, é semelhante a (95) no sentido de haver um conjunto de proposições alternativas (sendo que, em (95) esse conjunto está expresso e em (96) está pressuposto). Em ambos os casos não há denegação nem correção. Quanto à exaustividade, é possível identificá-la, já que é interpretado que, do conjunto pressuposicional (o conjunto dos alunos), apenas Paulo chegou. Por fim, em (97), um caso de difícil categorização entre foco informacional ou contrastivo – talvez poderia ser categorizado como foco amplo –, há uma certa medida de exaustividade (apenas o Paulo chegou), além de também envolver uma certa medida de correção (já que os outros alunos não chegaram, apenas o Paulo), embora a correção não se dê em relação a algo pressuposto, mas apenas à expectativa de que os alunos tenham chegado (o conjunto de alternativas denotado por interrogativas totais só contém dois elementos, verdadeiro ou falso). Podemos resumir essas considerações na seguinte tabela:
92
Alguns trabalhos chamam esse exemplo de tópico contrastivo.
| 78 Sentença 94 95 96 97
Contraste Sim Sim Não Talvez
Denegação Sim Não Não Sim
Correção Sim Não Não Sim
Exaustividade Talvez Sim Sim Sim
Quadro 2: Distribuição dos exemplos de Menuzzi (2012) de acordo com Contraste, Denegação, Correção e Exaustividade Fonte: Elaboração própria
É interessante notar como os conceitos que envolvem a noção de “foco contrastivo” são complexos: (94) e (95), embora sejam ambas consideradas foco contrastivo, apresentam uma combinação diferente desses conceitos, ao passo que (95) e (96), embora apresentem as mesmas características, são categorizadas de maneira diferente. Por fim, o exemplo que apresenta todas as características – e, portanto, deveria ser o mais prototípico – na realidade apresenta uma difícil categorização. Isso mostra a complexidade de enquadrar o conceito de contrastividade em uma categorização discreta. Parece que a denegação e a correção desempenham um papel importante na leitura contrastiva, embora a exaustividade seja um conceito independente da contrastividade e a própria relação entre denegação e correção mereça mais estudos. Com base nisso, Menuzzi assume que “contrastividade” é um conceito definido de maneira gradiente, que não pode ser reduzido a um elemento discreto (como um traço sintático, por exemplo). Em seguida, Menuzzi analisa a relação entre foco informacional e exaustividade. Analisando alguns exemplos e baseado na análise de Wedgwood (2005), ele chega à conclusão de que, assim como as fronteiras entre foco informacional e foco contrastivo não são claras, não é possível dizer que haja uma diferença claramente detectável entre foco informacional e foco exaustivo. Por exemplo: (98)
Várias pessoas estão em torno de uma mesa com café, chá, bolachas, etc. A: O que o João quer? B1: (O João quer) CAFÉ. (Inferência: João não quer chá, bolachas, etc.) B2: # É CAFÉ (que o João quer). B3: Ele quer CAFÉ. Aliás, acho que ele também quer BOLACHAS. (Menuzzi, 2012, p. 111)
Menuzzi afirma que (98), um enunciado típico de foco informacional, apresenta “exaustividade contextual”, como expresso na inferência de (98B1). Essa exaustividade, para o autor, é contextual por ser pragmática: tanto impossibilita o uso de clivada (como mostra (98B2)) quanto pode ser cancelada sem gerar autocontradição (como mostra (98B3)).93 Um fato interessante é que esse “cancelamento” da exaustividade na verdade envolve a inserção de um outro elemento dentro do conjunto de coisas que João quer (uma inferência de (98B3) é que João quer café e bolachas, e nada mais. 93
| 79 Além disso, Menuzzi aborda a ideia de que, “num contexto em que há um conjunto de alternativas relevantes, é o foco não exaustivo que deve ser marcado – isto é, se outras alternativas são verdadeiras, isso deve ser sinalizado” (p. 111). O exemplo dado é o seguinte: (99)
A e B sabem quem são os “amigos patetas do João” A: A Maria me contou que disseram pr’o João ir na festa com os amigos patetas dele. Você sabe quem ele levou? B1: Ele levou O PAULO. (Inferência: Ele não levou os demais patetas.) B2: Ele levou O PAULO e mais dois/os outros/etc. (Menuzzi, 2012, p. 111)
Menuzzi afirma que, na visão de Wedgwood, a resposta em (99B2) deve apresentar marcação prosódica diferente de (99B1), indicando que, na existência de um conjunto de alternativas relevantes, o foco informacional implica exaustividade e deve ser marcado, caso não seja esse o caso. Assim, Menuzzi chega à conclusão que essa “naturalidade” da exaustividade presente no foco informacional deriva da Máxima da Quantidade de Grice: se o falante faz uma asserção dentro do conjunto de alternativas contextualmente relevantes, fica implicado que as outras alternativas são descartadas, de modo que não é necessário informar isso ao ouvinte. Menuzzi também aborda a questão da impossibilidade de clivadas em alguns contextos. O autor apresenta duas restrições: primeiro, clivadas apresentam uma pressuposição que deve ser respeitada; segundo, clivadas apresentam uma pressuposição de unicidade. Vejamos exemplos para essas duas restrições: (100) A. Os alunos chegaram? B1. O PAULO chegou. B2. #Foi O PAULO que chegou. (101) A. Quais dos alunos chegaram? B1. O PAULO chegou. B2. #Foi O PAULO que chegou.
(Inferência: Os demais alunos não chegaram.) (Inferência: Alguns alunos não chegaram.) (Inferência: Dos alunos, só o Paulo chegou.)
Em (100), a clivada é inadequada porque não há pressuposição de que algum aluno tenha chegado. Menuzzi afirma: Se presumimos que a presença desta pressuposição no contexto seja uma condição de felicidade para o enunciado de uma clivada, conseguimos explicar por que alguns dos contextos acima indicados não permitem o uso destas sentenças, ainda que tais contextos satisfaçam a condição de “exaustividade” (p. 113)
Por outro lado, em (101), a inadequação se dá porque a pressuposição estabelecida pela clivada requer unicidade, enquanto a pergunta pressupõe que mais de um aluno chegou.
| 80 O texto de Menuzzi apresenta considerações interessantes sobre a focalização. Quanto à discussão sobre a fluidez do conceito de contrastividade, concordamos plenamente, pois, à luz dos exemplos abordados pelo autor, fica claro que contraste não pode ser um traço sintático, binário, que possa ser adicionado à estrutura sintática. Da mesma forma, parece acertada a afirmação de que exaustividade é um conceito definível em termos estritamente semânticos – veremos isso na próxima seção – e independente da noção de contraste. Por outro lado, as afirmações do autor sobre foco informacional e exaustividade merecem alguns comentários. Inicialmente, não parece muito clara a diferença entre uma exaustividade “contextual” e outra “normal”. Os dois argumentos utilizados pelo autor para caracterizar a exaustividade contextual – possibilidade de clivada e possibilidade de cancelamento da exaustividade sem autocontradição – também podem ocorrer em casos prototípicos, com o uso de advérbios como só: (102) Várias pessoas estão em torno de uma mesa com café, chá, bolachas, etc. A: O que o João quer? B1: O João quer só CAFÉ. (Inferência: João não quer chá, bolachas, etc.) B2: É SÓ CAFÉ (que o João quer). B3: Ele quer só CAFÉ. Aliás, acho que ele também quer BOLACHAS. Como (102) acima deixa claro, é perfeitamente possível o uso da clivada no contexto em questão, já que a existência de um conjunto pressuposicional licencia o uso da clivada, caso haja exaustividade – como é o caso. Além disso, (102B3) também pode apresentar o cancelamento da exaustividade sem autocontradição, embora o uso de só indique exaustividade total. Além disso, quanto às considerações acerca do exemplo (99), não parece muito claro em que sentido o acento prosódico do foco de (99B1) deva ser diferente do acento de (99B2), sendo necessário um estudo prosódico capaz de elucidar tais questões (que estão fora do nosso escopo). No entanto, a afirmação de que foco informacional acarreta exaustividade (salvo contrário) não se confirma em dados como (103) abaixo: (103) João, Pedro e Paulo estão sentados à mesa na sala; há um bolo na mesa comido. João e Pedro comeram o bolo. Maria chega na sala: Maria: Oi, gente. Quem comeu o bolo? a. O João comeu o bolo b. Foi o João que comeu o bolo Uma leitura intuitiva de (103) indica uma diferença entre (103a) e (103b): enquanto (103a) não apresenta a pressuposição de que apenas o João tenha comido o bolo, em (103b)
| 81 essa leitura é quase obrigatória, sendo necessária uma prosódia muito diferente para que outra interpretação seja possível (talvez uma prosódia de descrença, ou uma entoação de pergunta, indicando dúvida se foi o João que comeu o bolo). Assim, exaustividade não é condição necessária para uma resposta a uma pergunta wh, embora concordemos com Menuzzi que, caso haja um conjunto pressuposicional disponível no contexto, é possível que haja exaustividade – ainda que tais contextos sejam comumente caracterizados como foco informacional. Por fim, quanto às considerações do autor sobre restrições de clivadas, algumas considerações são necessárias: primeiramente, a restrição de ser necessário que a pressuposição esteja no contexto, ilustrada no exemplo (100), não parece ser uma restrição em outros casos de clivadas, como (104) abaixo: (104) Foi apenas há 50 anos que Henry Ford nos deu o fim-de-semana. No dia 25 de setembro de 1926, em uma decisão incomum para aqueles tempos, ele decidiu estabelecer a semana de trabalho de 40 horas, dando aos seus empregados dois dias de folga ao invés de um. (E. F. Prince, 1978, p. 895 apud Roisenberg & Menuzzi, 2008, p. 4) Segundo Roisenberg e Menuzzi (2008), a sentença em (104) é um filler de jornal (pequena notícia que ocupa espaço ocioso no jornal); portanto, não há contexto em que a pressuposição Henry Ford nos deu o fim-de-semana há x esteja disponível, e, mesmo assim, a clivada é aceitável. Além disso, a pressuposição de unicidade também não parece ser necessária para a ocorrência de clivadas: (105) É com grande prazer que anuncio nosso conferencista desta noite, o Prof. Carlos Franchi. (Roisenberg & Menuzzi, 2008, p. 9) Em (105) acima, é perfeitamente possível que o falante esteja fazendo outras coisas com prazer (como estar em pé, estar presente na conferência, etc), de modo que a pressuposição não é condição sine qua non para a felicidade do enunciado. A explicação para a inadequação das sentenças (100) e (101) ainda carecem de melhores explicações, que poderão ser alcançadas em estudos posteriores. De toda forma, a contribuição do trabalho de Menuzzi é a de que as noções de foco contrastivo e foco informacional não são tão claras quanto se faz crer. Assim sendo, é difícil assumir uma posição em que um objeto formal discreto – como um traço sintático – esteja codificado de forma a diferenciar esses tipos de foco. Outro aspecto relevante levantado por Menuzzi é a afirmação de que, se há uma propriedade estritamente semântica na focalização,
| 82 tal propriedade é de exaustividade. Por isso, é um bom objetivo investigar se é possível reduzir a focalização à exaustividade, de forma que possamos codificar a focalização na sintaxe através de um traço de exaustividade. Faremos isso na próxima seção. 2.3.Focalização: semântica ou pragmática? Levando em conta as considerações feitas na seção 2.1 a respeito do que deva ser lido em LF (composicionalidade, relações de correferência, condições de verdade e relação quantificador-variável), podemos eliminar as duas primeiras possibilidades de interferência do foco na semântica. Parece óbvio que uma sentença focalizada não possui composicionalidade diferente de uma sentença neutra. Vejamos o exemplo: (106) a. O Gustavo se olhou no espelho. b. [O GUSTAVO] se olhou no espelho. c. O Gustavo [SE] olhou no espelho. Entre (106a) e (106b) não encontramos diferenças na composicionalidade: O DP [o Gustavo] está combinado ao predicado [se olhou no espelho] em ambas as sentenças, e é interpretado igualmente como o sujeito lógico da sentença. Da mesma forma, em (106c) não há diferença no estabelecimento da correferência entre o reflexivo [se] e o DP [o Gustavo], de forma que podemos afirmar que a focalização também não altera a correferencialidade de elementos anafóricos. No entanto, e quanto às condições de verdade e à relação quantificador-variável? Veremos isso nas próximas páginas.
2.3.1. Focalização e condições de verdade Vejamos o exemplo abaixo (o contexto de (103) com algumas outras alternativas): (107) João, Pedro e Paulo estão sentados à mesa na sala; há um bolo na mesa comido. João e Pedro comeram o bolo. Maria chega na sala: Diálogo 1: Maria: Oi, gente. Quem comeu o bolo? a. O João comeu o bolo b. Foi o João que comeu o bolo94 c. Maria: Não acredito! Logo o João comeu o bolo!
94
Devido ao fato de que ainda introduziremos as características prosódicas do foco, é mais didático apresentar a clivagem como estratégia de focalização; por isso utilizaremos, neste capítulo, as clivadas como exemplos de sentenças focalizadas. No entanto, as mesmas afirmações valem para a focalização in situ.
| 83 Diálogo 2: Maria: Oi, gente. O Paulo comeu o bolo, né? Eu sabia que ele era guloso. b’. Não, Maria. Foi o João que comeu o bolo. b'’. Olha, o João comeu o bolo, agora se o Paulo ou o Pedro comeram também eu já não sei. No contexto em (107), podemos dizer que, em (107a) não existe a pressuposição de que apenas uma pessoa tenha comido o bolo, enquanto em (107b) essa pressuposição existe. No caso de (107c), com foco mirativo, essa possibilidade de interpretação exaustiva é opcional: pode tanto estar presente quanto não (clivadas não podem ser usadas para foco mirativo, de modo que a desambiguização da presença ou não de exaustividade será dada apenas pela prosódia). Por fim, em (107b’) e (107b’’), com foco contrastivo, podemos considerar que há exaustividade em (107b’) e não há em (107b’’). Nesse caso, as condições de verdade para as sentenças em (107) podem ser: (108) a. O João, mas não necessariamente só ele, comeu o bolo. (107a-c-b’’) b. No contexto relevante, o bolo foi comido apenas pelo João (107b-c-b’) É interessante notar que existem três elementos em sentenças como (107b-c-b’’): (i) uma pressuposição (no caso do exemplo, a pressuposição de que alguém comeu o bolo); (ii) um conjunto estabelecido contextualmente (no caso, o conjunto composto por João, Pedro e Paulo, os potenciais comedores do bolo naquela situação) – o qual podemos chamar de conjunto pressuposicional; e (iii) uma identificação exaustiva de que, considerando o conjunto dado no contexto, apenas o João comeu o bolo. Esses três elementos são importantes para o estabelecimento da diferença nas condições de verdade da sentença, já que a sentença seria falsa se o bolo não tivesse sido comido, se nenhum dos três elementos do conjunto relevante tivesse comido o bolo ou, como vimos, se alguém desse conjunto além do João tivesse comido o bolo. Comparando essas condições de verdade em (108) com o contexto dado, podemos dizer, então, que (107a) – e semelhantes – é verdadeira e (107b) – e semelhantes – é falsa. É interessante notar que, nesse sentido, a focalização se assemelha aos advérbios exclusivos só, somente, apenas95 etc. Para o contexto em (107), note que as mesmas (ou no mínimo semelhantes) condições de verdade de (108b) emergem com o uso de só: (109) a. Só o João comeu o bolo. b. Somente o João comeu o bolo. Diversos trabalhos (como Tescari Neto (2017), dentre outros) consideram tais advérbios como “advérbios focalizadores”. Como nossa análise semântica do foco vai deixar claro, tal denominação é bastante adequada, pois envolve o conceito de exaustividade (embora expresso de maneira um tanto diferente no uso dos advérbios). 95
| 84 c. Apenas o João comeu o bolo. Portanto, o traço semântico relevante para os casos como (107b) e (109) é o de exaustividade. É possível assumir que o sistema conceitual-intencional conta com uma operação de exaustão (digamos, Exaust(x), uma “função de exaustão”96) que, quando aplicada a um dado conjunto C, exaure todos os seus membros, de modo que apenas o elemento expresso pela sentença a qual Exaust(x) se aplica permanece no conjunto97. Note que é isso o que ocorre em (107b): existe um conjunto C cujos elementos são João, Pedro e Paulo. Ao afirmar a sentença “Foi o João quem comeu o bolo”, a função Exaust(x) é aplicada a esse conjunto C, mapeando o conjunto C em um subconjunto unitário de C cujo elemento é João. Podemos expressar isso formalmente (incluindo os três elementos dados anteriormente) em (110) abaixo: (110) a. ∃𝑥 | 𝑥 𝑐𝑜𝑚𝑒𝑢 𝑜 𝑏𝑜𝑙𝑜 & 𝑥 ∈ 𝐶{𝐽𝑜ã𝑜, 𝑃𝑒𝑑𝑟𝑜, 𝑃𝑎𝑢𝑙𝑜} b. Exaust(C): ∃𝑥 | 𝑥 𝑐𝑜𝑚𝑒𝑢 𝑜 𝑏𝑜𝑙𝑜 & 𝑥 ∈ 𝐴{𝐽𝑜ã𝑜} & 𝐴 ⊂ 𝐶 c. ∃! 𝑥 | 𝑥 𝑐𝑜𝑚𝑒𝑢 𝑜 𝑏𝑜𝑙𝑜 & 𝑥 = 𝐽𝑜ã𝑜 Em (110a), temos o estabelecimento da pressuposição (x comeu o bolo) e do conjunto pressuposicional. Seria adequado dizer que (110a) é uma boa representação formal da pressuposição de (107a) – a sentença “alguém comeu o bolo”. Nesse sentido, a diferença de (107a) para (107b) é a aplicação da função Exaust(x), que, quando aplicada ao conjunto C, o exaure, mantendo apenas João (dito de forma mais correta: a função Exaust(x) mapeia o conjunto C em um conjunto unitário A cujo elemento é João). O resultado é a expressão lógica em (110c). Note que é possível representar a operação Exaust(x) aplicada em (110b) de uma forma semelhante à análise de Rooth (1992) para os advérbios focalizadores (como only): (111) Exaust(C): ∀𝑃[𝑃(𝜆𝑥. 𝑐𝑜𝑚𝑒𝑟(𝑥, 𝑜 𝑏𝑜𝑙𝑜)) ∈ 𝐶 → 𝑥 = 𝑜 𝐽𝑜ã𝑜] Isso quer dizer que, para toda propriedade P, se P, identificado como a função comer(x, o bolo), pertence ao conjunto C – o conjunto pressuposicional, então x é o João. O resultado disso é que apenas João pode saturar a variável x da função comer(x, o bolo).
96
Veremos no capítulo 4 que essa função seria ativada através da existência de um traço de exaustividade existente em uma projeção sintática interna a DP. 97 É importante notar que, embora a Gramática Gerativa descarte que o sistema conceitual-intencional seja capaz de modificar elementos da LF, não é necessário rejeitar que o esse sistema possua a capacidade de interpretar aspectos de sentenças como funções, uma vez que tais funções não alteram o ordenamento de constituintes, nem alteram as relações gramaticais das sentenças – apenas são instrumentos de interpretação.
| 85 Poder-se-ia objetar a necessidade dessa função Exaust(x), considerando que a diferença entre sentenças focalizadas e sentenças neutras se dá apenas pela unicidade do x estabelecido pela pressuposição. No entanto, essa função é necessária para explicar uma diferença importante entre sentenças focalizadas e o uso de advérbios focalizadores, como só e apenas. É possível que os advérbios focalizadores efetuem a exaustão do conjunto universo, o que não ocorre com a focalização. Note o exemplo abaixo, considerando o mesmo contexto de (107): (112) a. Só o João comeu o bolo. b. Foi o João que comeu o bolo. A sentença em (112a) será falsa se qualquer outra pessoa comeu o bolo, independente do contexto, o que não ocorre em (112b)98. Se, por exemplo, no contexto expresso em (107), uma outra pessoa (digamos, Mário) tivesse chegado antes de João, Pedro e Paulo, comido o bolo e ido embora, de modo que depois João comeu mais um pedaço, (112a) seria falsa e (112b) seria verdadeira99. Isso quer dizer que advérbios focalizadores possuem a propriedade de exaurir o conjunto universo, enquanto a focalização depende de um conjunto particular, estabelecido no contexto. Essa diferença pode ser facilmente capturada utilizando a função Exaust(x): (113) a. Exaust(U): ∃𝑥 | 𝑥 𝑐𝑜𝑚𝑒𝑢 𝑜 𝑏𝑜𝑙𝑜 & 𝑥 ∈ 𝑈{𝐽𝑜ã𝑜, 𝑃𝑒𝑑𝑟𝑜, 𝑃𝑎𝑢𝑙𝑜, 𝑀𝑎𝑟𝑖𝑎, 𝑀á𝑟𝑖𝑜, 𝐵𝑜𝑙𝑠𝑜𝑛𝑎𝑟𝑜, 𝐿𝑢𝑙𝑎, 𝐶𝑎𝑏𝑜 𝐷𝑎𝑐𝑖𝑜𝑙𝑜, 𝑃𝑒𝑙é, 𝑀𝑎𝑑𝑜𝑛𝑎, 𝐺𝑒𝑜𝑟𝑔𝑒 𝐶𝑙𝑜𝑜𝑛𝑒𝑦, 𝑜 𝑔𝑎𝑡𝑜 𝑑𝑎 𝑣𝑖𝑧𝑖𝑛ℎ𝑎, 𝑜 𝑐𝑎𝑣𝑎𝑙𝑜 𝑑𝑜 𝑝𝑟í𝑛𝑐𝑖𝑝𝑒 𝑑𝑎 𝐼𝑛𝑔𝑙𝑎𝑡𝑒𝑟𝑟𝑎, 𝑜 𝑟𝑒𝑖 𝑑𝑎 𝐸𝑠𝑝𝑎𝑛ℎ𝑎 … } b. Exaust(C): ∃𝑥 | 𝑥 𝑐𝑜𝑚𝑒𝑢 𝑜 𝑏𝑜𝑙𝑜 & 𝑥 ∈ 𝐶{𝐽𝑜ã𝑜, 𝑃𝑒𝑑𝑟𝑜, 𝑃𝑎𝑢𝑙𝑜} (113a) é uma boa representação formal da aplicação de Exaust(x) a (112a), em que U é o conjunto universo, ao passo que, como vimos, (113b) é a aplicação de Exaust(x) a (112b). Note que, mesmo que o conjunto argumento da função Exaust(x) seja dependente do contexto (se focalização ou advérbio focalizador), o resultado da aplicação da função é o mesmo (a
98
Digno de nota é que mesmo os advérbios focalizadores não precisam estar atrelados à exaustividade do conjunto universo. É perfeitamente possível que (109a) seja dita no mesmo contexto de (107). Em exemplos como esse, o uso de advérbios focalizadores se iguala ao uso da focalização (in situ ou ex situ). Da mesma forma, é possível que sentenças focalizadas, em contextos específicos, sejam capazes de tomar como conjunto pressuposicional um conjunto universo particular, como (i) abaixo: (i) É o leão que gosta de comer zebra Nesse exemplo, a exaustividade aparentemente toma como conjunto a ser exaurido o conjunto universo das espécies, de modo que é possível inferir que nenhuma outra espécie goste de comer zebra. 99 É importante notar que o valor de verdade de uma sentença não possui relação com o conhecimento que os indivíduos têm sobre a realidade. (117a) continua sendo falsa mesmo se o locutor de tal sentença não soubesse que Mário havia comido o bolo antes de João.
| 86 expressão em (110c) acima). No entanto, como essa função é “chamada” (para usar o termo de Ciência da Computação) para ser aplicada? Podemos apresentar algumas considerações a respeito do papel que a sintaxe desempenha nisso. Já que a aplicação da função Exaust(x) é relevante para o estabelecimento das condições de verdade de uma sentença, como vimos, seria interessante se pudéssemos estabelecer uma relação da aplicação dessa função com a estrutura sintática. Se estamos assumindo que LF é lida pelo sistema conceitual-intencional, faz sentido dizer que deve existir algo na estrutura enviada a LF que sinaliza para o sistema a necessidade de aplicação de Exaust(x). No caso de advérbios focalizadores, é simples: o próprio advérbio funciona como um operador de unicidade (∃!) que aponta para a aplicação de Exaust(x) ao conjunto universo. No caso da focalização, no entanto, essa implementação é um pouco mais complexa: é necessário assumir que algo dentro do DP seja responsável por essa atribuição. Uma solução seria assumir a existência de um traço de exaustividade [+E], interpretável no DP foco. Tal traço, caso presente na estrutura, ao ser lido em LF, apontaria para a aplicação de Exaust(x) ao conjunto pressuposicional (cujo estabelecimento depende das condições contextuais relevantes para a pressuposição), além de que o item denotado pelo DP foco seria o item “salvo” da operação. Dada a explanação acima, convém investigar se é possível identificar alguns efeitos na interpretação de sentenças focalizadas. Primeiro, fica claro que a aplicação de Exaust(x) depende da existência de um conjunto pressuposicional que tenha mais de um elemento. Na hipótese de o conjunto pressuposicional ser o conjunto vazio, uma sentença focalizada é inadequada100. Além disso, em contextos nos quais tal conjunto possui apenas um elemento, a ocorrência de sentenças focalizadas também é inadequada: (114) João está preso em uma ilha deserta e virgem. Quando seu irmão consegue encontrá-lo e resgatá-lo, vê que há um abrigo construído e diz: a. #Foi o João que construiu o abrigo. (114a) só pode ser adequado se o irmão de João pressupor que outras pessoas além de João já estiveram na ilha, o que não parece muito lógico se ele sabe que a ilha era virgem antes de João se perder lá101. Nas condições normais, o enunciado em (114a) é inadequado porque o conjunto pressuposicional já é exaurido, de modo que a aplicação de Exaust(x) é desnecessária. Podemos formalizar essa restrição à aplicação dessa função da seguinte forma: 100
Na verdade, a própria afirmação de que um elemento pertence ao conjunto vazio é contraditória. Existem alguns contextos pragmáticos muito específicos que poderiam salvar essa sentença, como, por exemplo, se o irmão do João estivesse orgulhoso de seu irmão ter construído o abrigo. Mas, nesses casos, não se pode dizer que haja focalização. 101
| 87 (115) Condição de exaustão: [F] → Exaust(C) sse |C| ≥ 2 (A presença do traço [F] dispara a função Exaust(C) se, e somente se, o conjunto C possuir mais de dois elementos.) 2.3.2. Focalização e quantificação Um outro aspecto que depende de análise é a relação quantificador-variável estabelecida pelo foco. Rizzi (1997, pp. 291–295) fornece argumentos suficientes para afirmar que a focalização é quantificacional – o que, na prática, equivale a dizer que sintagmas focalizados precisam estar em uma relação de quantificador-variável. Basicamente, o foco possui os seguintes efeitos (justificados por uma relação de quantificação): (i) impossibilidade de retomada por um resumptivo; (ii) presença de efeitos de weak-cross-over; e (iii) possibilidade de focalização de elementos quantificacionais nus. Vejamos ponto a ponto. Inicialmente, Rizzi argumenta que o foco não pode ser retomado por um resumptivo: (116) a. Foi [O JOÃO] que eu encontrei na feira; b. *Foi [O JOÃO] que eu encontrei ele na feira. O autor aponta que a impossibilidade de colocação de um pronome resumptivo (ilustrada em (116b)) resulta do fato de o foco estar ligado a uma variável. Como pronomes não são variáveis, logo não podem lexicalizá-las. O segundo efeito diz respeito ao fenômeno de crossover, que pode ser ilustrado nos exemplos abaixo: (117) a. Quemi elej disse que viria jantar? b. *Quemi elei disse que viria jantar? c. Quemi a tia delej disse que viria jantar? d. ??Quemi a tia delei disse que viria jantar? As sentenças em (117) ilustram bem o fenômeno de crossover, que ocorre sempre que um elemento movido “passa por cima” (tradução literal de crossover) de um pronome correferente. Em (117b-c), o DP [quem], ao se mover para CP, cruza o pronome [ele]. A diferença entre (117b) e (117c) é que, no primeiro caso, o pronome não é correferente de [quem] (indicado pelos índices sobescritos), enquanto em (117c) [quem] possui a mesma referência de [ele]. Esse caso, de strong crossover, gera agramaticalidade da sentença. Por outro lado, se o pronome referência estiver encaixado em outro DP, o caso de (117d), embora também apresente crossover, a sentença é parcialmente aceitável, ao que chamamos de weak crossover. Rizzi (1997, p. 290), apoiado na proposta de Lasnik e Stowell (1991), afirma que apenas quando há
| 88 uma relação quantificador-variável é possível identificar efeitos de weak crossover. O autor dá exemplos do italiano para afirmar que a focalização apresenta efeitos de weak crossover, enquanto a topicalização, não: (118) a. Giannii, suai madre loi ha sempre apprezzato. Giannii, suai mãe sempre oi apreciou. b. GIANNIi, suai madre ha sempre apprezzato ti GIANNIi suai mãe sempre apreciou. (i.e. Foi GIANNIi que suai mãe sempre apreciou) Rizzi argumenta que a assimetria entre tópico e foco, atestada nos exemplos do italiano em (118), se dá porque o foco, ao se mover para CP e estabelecer uma relação quantificadorvariável, se comporta da mesma forma que pronomes wh, que apresentam as mesmas características. Como o tópico não é quantificacional, esses efeitos não ocorrem.102 O terceiro fator que Rizzi utiliza como justificativa para analisar o foco como estabelecedor de uma relação quantificador-variável diz respeito à uma assimetria entre tópico e foco no que diz respeito a quantificadores nus. Vejamos os exemplos dados pelo autor: (119) a. *Nessuno, lo ho visto. Ninguém, eu o vi. b. NESSUNO, ho visto t. NINGUÉM eu vi. (i.e. Foi NINGUÉM que eu vi) (120) a. *Tutto, lo ho fatto. Tudo, eu o fiz. b. TUTTO, ho fatto t. TUDO eu fiz. (i.e. Foi TUDO que eu fiz)
(Rizzi, 1997, p. 290)
Rizzi argumenta que os quantificadores não podem ser topicalizados porque não há uma variável na estrutura capaz de se ligar a tais quantificadores em LF: clíticos não são variáveis e o vestígio deixado pelo quantificador topicalizado no movimento encoberto (ver seção 2.1) não
102
Cabe notar que não ocorre weak crossover com a focalização in situ: a sentença (i) é perfeitamente aceitável: (i) O Joãoi disse que a irmã DELEi encontraria o Paulo na feira.
No capítulo 4 nos dedicaremos a encontrar uma solução para essa questão. Mas é possível dizer que esse movimento do foco in situ para criação da relação quantificador-variável ocorre em LF, não estando sujeito a efeitos de crossover: (ii) O Joãoi disse que a irmã de alguémi encontraria o Paulo na feira.
| 89 é uma variável por não estar em uma posição A103. No caso da focalização, como a própria focalização estabelece uma relação quantificador-variável, o quantificador, ao se mover em LF possui uma variável encaixada para estabelecer a ligação. Em resumo, nesta seção apresentamos duas características do foco que justificam sua codificação em LF: a influência do foco (exaustividade) nas condições de verdade da sentença e a relação quantificador-variável estabelecida pelo foco104. Essas condições não contemplam uma diferenciação entre tipos de foco – não faz diferença se o foco é contrastivo ou informacional (e por vezes contraste e inserção de referente não envolve exaustividade). Apoiado na análise de Menuzzi (2012), podemos afirmar que essa distinção, embora importante pragmaticamente, não implica em diferença semântica e, portanto, não precisa estar codificada na sintaxe. No entanto, alguns trabalhos (Bianchi et al., 2016) argumentam que o foco mirativo (apresentado na introdução deste texto) possui estrutura semântica particular. Na próxima seção analisaremos esses argumentos. 2.4.Foco mirativo: semântico? Na seção 1.1, apresentamos o foco mirativo, que envolve unexpectedness105, conforme o exemplo (4), reproduzido abaixo: (121) A. O João comeu o bolo. B. Não acredito! O João comeu o bolo! Eu nunca imaginaria que ele fosse comer logo o bolo! Ao enunciar (121B), o falante revela sua surpresa em relação ao fato de que, dentre um conjunto de coisas comestíveis (possivelmente definido pelo contexto), João tenha comido justamente o bolo. Em algumas línguas (como italiano, segundo Cruschina (2012, pp. 117–125) e Bianchi et al. (Bianchi et al., 2016)), o importe mirativo é veiculado pelo fronteamento do constituinte focalizado: (122) Non ci posso credere! Due bottiglie ci siamo bevuti! Não acredito! Nós bebemos duas garrafas!
(Cruschina, 2012, p. 120)
Uma vez que existe a possibilidade de veiculação do foco mirativo através da sintaxe (mais especificamente através de movimento de constituinte), faz-se necessário entender se a 103
Posição A, grosso modo, é a posição argumental, mais especificamente posições internas às projeções IP e VP. No capítulo 4 iremos perseguir uma proposta que una essas duas características, assumindo que o aspecto quantificacional do foco é, justamente, resultado da exaustividade. 105 i.e. Falta de expectativa. Preferimos manter a palavra inglesa pela falta de termo correlato em português. 104
| 90 noção de unexpectedness está codificada na gramática, ou se é possível explicar o movimento nesses casos de maneira independente. Faremos isso no capítulo 4. Por ora, cabe entender se o foco mirativo é relevante em LF. O trabalho de Bianchi et al. (Bianchi et al., 2016) apresenta uma análise semântica da miratividade através da ideia de probabilidade (likelihood). Dado um conjunto de proposições alternativas (no modelo de Rooth (1992)), se a proposição enunciada for menos provável do que outras, temos unexpectedness e, portanto, miratividade. Isso é o que ocorre em (121) e em (122). Para formalizar essa análise, os autores adaptam a proposta de Grosz (2011), baseada na teoria de modalidade de Kratzer (1991, 2012). Tal abordagem se calca em dois parâmetros: (a) A base modal 𝐵(𝜔), que podemos definir (um tanto simplificadamente) como um conjunto de mundos possíveis acessíveis através do mundo de avaliação 𝜔; (b) A fonte de ordenamento 𝑂(𝜔), um conjunto de proposições que induz um ordenamento nos mundos da base modal. (Bianchi et al., 2016)106 A partir desses parâmetros, é possível avaliar e comparar proposições, tomando como critério a posição do mundo no qual uma proposição é verdadeira em relação à base modal, em comparação a posição do mundo no qual tal proposição é falsa. Bianchi et al. colocam da seguinte maneira: p é ao menos tão provável quanto q no que se refere a uma base modal 𝐵(𝜔) e a uma fonte de ordenamento 𝑂(𝜔) sse não há um mundo u em 𝐵(𝜔) no qual q é verdadeiro e p é falso que seja mais próximo do ideal representado por 𝑂(𝜔) do que todos os mundos v em 𝐵(𝜔) nos quais p é verdadeiro e q é falso. (Bianchi et al., 2016)107
Nessa perspectiva, a leitura de unexpectedness é resultado da avaliação de uma proposição em relação a uma base modal, sendo que a proposição é menos provável do que pelo menos uma proposição alternativa (que seria veiculada, nos termos de Rooth (1992), pelo valor semântico do foco).
“(a) the modal base B(w), which we can define (simplifying somewhat) as a set of possible worlds accessible from the evaluation world w;4 (b) the ordering source O(w), a set of propositions5 which induces an ordering on the worlds of the modal base.” 107 “p is at least as good a possibility as q w.r.t. a modal base B(w) and an ordering source O(w) iff there is no world u in B(w) in which q is true and p is false which is closer to the ideal represented by O(w) than all the worlds v in B(w) in which p is true and q is false.” 106
| 91 Podemos utilizar a sentença mirativa em (121) para ilustrar essa análise. No contexto relevante, teríamos como base modal todos os mundos nos quais João tenha comido alguma coisa. A fonte de ordenamento organiza os mundos da base modal em uma “hierarquia de probabilidade”, como: (123) 𝑂(𝜔){v{João comeu a torta} > x{João comeu o salgadinho} > y{João comeu batata frita} > z{João comeu arroz com feijão} > a{João comeu estrogonofe de frango} > b{João comeu pizza} > u{João comeu o bolo}...} Considerando que, para todos os mundos de 𝑂(𝜔) listados acima a proposição João comeu o bolo seja falsa (exceto, obviamente, o mundo u), a enunciação dessa proposição evoca uma alternativa menos provável (note que, no exemplo acima, a proposição mais provável é João comeu a torta), gerando a miratividade. Dessa forma, a proposta de Bianchi et al. se baseia na ideia de que haja uma comparação entre proposições, de modo que aquela menos provável implicaria na leitura mirativa. Embora essa análise esteja corretíssima, cabe explicar em que medida a miratividade influencia os aspectos relevantes em LF listados na seção 2.1. Em primeiro lugar, não parece que a adição de surpresa a um enunciado seja capaz de alterar as condições de verdade da sentença. Em (121), por exemplo, a sentença João comeu o bolo não deixará de ser verdadeira se for enunciada com uma prosódia neutra, mesmo se for o caso de o falante não estar surpreso com isso108. No entanto, é necessário entender em que nível da linguagem as considerações feitas por Bianchi et al. se aplicam, pois parece intuitivo que as considerações dos autores fazem sentido. Uma boa aproximação seria assumir que essa “operação” de avaliação de proposições alternativas se dê no componente pragmático. Na realidade, Grosz (2011), que serve de base para as considerações de Bianchi et al., deixa explícito que essa “semântica” de construções exclamativas – das quais miratividade faz parte e que, na sua proposta, é creditada a um operador EX – envolve condições de felicidade: [...] EX produz uma semântica que não é de condições de verdade, mas de condições de felicidade [...]. EX serve para expressar uma emoção do falante no que diz respeito à proposição denotada ser alta em uma escala de saliência (em optativas: preferências do falante). (p.68. Tradução nossa 109)
108
Note que, se o falante enunciar (121) com importe mirativo, mas, na realidade, não estiver surpreso, o valor de verdade da sentença João comeu o bolo não se altera. O que será falsa será uma expectativa de que o falante está surpreso com isso, o que não tem relação com a sentença enunciada. 109 “EX yields a semantic that is non-truth-conditional but rather felicity-conditional [...]. EX serves to express an emotion of the speaker with respect to the denoted proposition being high on a salient scale (in optatives: speaker preferences)”
| 92 Assim sendo, miratividade não é codificada na sintaxe, mas é interpretada em um nível pós-LF, no componente pragmático da linguagem humana110. Quanto à evidência do fronteamento do italiano, estudos posteriores podem ser desenvolvidos na tentativa de derivar o movimento sintático de maneira independente111. 2.5.Resumo do capítulo Este capítulo teve como objetivo apresentar as possíveis influências da focalização em LF. Podemos resumir o que foi discutido nos seguintes pontos:
(a) LF precisa codificar (1) composicionalidade; (2) Correferencialidade; (3) Condições de verdade; (4) Relações de quantificador-variável; (b) Tomando (a) como verdadeira, LF não codifica aspectos discursivos, como atos de fala, implicaturas conversacionais ou Estrutura Informacional; (c) As análises semânticas da focalização normalmente envolvem um conjunto de proposições alternativas. No entanto, tais análises podem ser simplificadas ao considerar foco como veiculador de exaustividade; (d) A caracterização em “tipos de foco” não pode ser feita de maneira categórica, pois há diversos casos em que essa distinção não é clara; (e) A afirmação em (e) evidencia que não é possível assumir que tipos de foco possam ser codificados em elementos discretos, como traços sintáticos; (f) A focalização envolve um tipo de exaustividade semelhante ao significado de advérbios como só e apenas; (g) A focalização (além dos advérbios mencionados em (f)) envolve uma função monoargumental de exaustividade (denominada de Exaust(x)) que toma um
110
Uma questão interessantíssima que deixaremos para outros estudos é a semântica de alguns advérbios que parecem apresentar miratividade, como logo e justamente: (i) O João comeu logo o bolo! (ii) O João comeu justamente o bolo! É interessante tentar compreender qual é o papel de tais advérbios, se é possível que eles veiculem algum tipo de unexpectedness. Cruschina (2012) apresenta algumas assimetrias entre os “tipos de fronteamento” no italiano. No capítulo 4 vamos analisar tais assimetrias. 111
| 93 conjunto pressuposicional como argumento e o exaure, mantendo apenas o elemento veiculado pelo foco; (h) A focalização envolve uma relação quantificador-variável que pode ser explicada através de movimento sintático (como veremos no capítulo 4, esse movimento pode ser encoberto); (i) O foco mirativo veicula uma informação puramente pragmática, e, por isso, não está codificado em LF, não estando, consequentemente, codificado na estrutura sintática. Essas são as principais considerações feitas a respeito da semântica do foco. Nesse sentido, estamos propondo uma definição de foco diferente (e bem mais restrita) daquela adotada pela literatura. Fazemos isso pensando no problema que a focalização in situ coloca para a arquitetura da gramática, colocado na seção 1.2.3. De maneira alguma estamos negando que, sob o conceito de foco, estejam colocados diversos elementos diferentes (como fluxo de informação, contraste, miratividade, denegação, correção, etc.). No entanto, cabe definir, dentro dessa salada de conceitos, quais são relevantes para a gramática (no sentido gerativo do termo). Neste capítulo chegamos à conclusão de que é a exaustividade o conceito relevante, justamente por envolver as condições de verdade das sentenças. Quanto aos demais elementos, estamos assumindo que são interpretados em uma fase pós-LF, no componente pragmático da linguagem. Na conclusão deste trabalho, iremos analisar uma “arquitetura da linguagem” na qual tentaremos inserir o componente pragmático nas suas relações com a gramática. Uma vez que estamos considerando relevantes apenas aqueles exemplos em que haja exaustividade – e que a focalização in situ está codificada em LF e em PF –, convém a seguinte pergunta: existe alguma estrutura prosódica e/ou entoacional específica para a focalização (no sentido que estamos utilizando neste trabalho)? O próximo capítulo se dedicará a analisar essa questão.
| 94 3 A PROSÓDIA DA FOCALIZAÇÃO IN SITU No capítulo anterior, apresentamos uma argumentação, baseada na semântica vericondicional, a favor do mapeamento do foco em LF. Uma vez que o traço [exaustivo] é o que é relevante na veiculação do foco, convém nos perguntar: qual é a diferença fonológica relevante na focalização in situ responsável pela veiculação desse traço? Em outras palavras, como o componente fonológico expressa o traço [exaustivo]? Neste capítulo, pretendemos apresentar os resultados e a análise de um experimento prosódico envolvendo a focalização in situ com o fim de responder a essa pergunta. Analisaremos as curvas entoacionais, a variação da frequência fundamental (F0) 112, a duração segmental e a intensidade de sentenças produzidas em um teste de produção estimulada. Além disso, vamos apresentar os níveis de reconhecimento dessas curvas em relação ao tipo de focalização e à exaustividade, aferidos através de dois testes de percepção. Veremos que esses resultados sugerem fortemente que a distinção prosódica entre foco contrastivo e informacional não é tão clara assim, sendo que a noção de exaustividade parece ser o fator determinante da característica prosódica de tais enunciados. Antes disso, no entanto, algumas considerações se fazem necessárias. É preciso deixar clara nossa posição em relação a como se dá a interface sintaxe-fonologia; mais especificamente, precisamos nos posicionar em relação a como ocorre o mapeamento da informação sintática no sistema articulatório-perceptual. Nesse sentido, dois caminhos são possíveis: (1) advogar que a sintaxe (especificamente PF) interfere diretamente na atribuição de características fonológicas aos enunciados, ou (2) aceitar que haja um elemento intermediador dessa relação, a saber, a estrutura prosódica. Além disso, convém fornecer um background teórico a respeito do estudo da prosódia. Nesse aspecto, nosso trabalho se apoia na análise entoacional preconizada pela Teoria Autossegmental-Métrica (doravante AM – Autossegmental-Metrical Theory (Beckman & Pierrehumbert, 1986; Féry, 2017; Ladd, 2008; Pierrehumbert, 1980, inter alia)), ao passo que nos valemos das afirmações da Fonologia Prosódica (Nespor & Vogel, 2007; Selkirk, 1986, 2011; Serra, 2009; Truckenbrodt, 1999, inter alia), para associar a curva entoacional (e sua interpretação fonológica) à estrutura prosódica projetada a partir da sintaxe. 112
Moraes (no prelo) assume que frequência fundamental, duração e intensidade constituem os chamados parâmetrosprosódicos ou supra-segmentais. A duração e a intensidade ocupam, respectivamente, as dimensões horizontal e vertical, num gráfico de onda sonora. Já a F0 se exterioriza, nesse tipo de gráfico, pela "densidade" da onda, i.e., o número de vezes que determinado padrão (ciclo) se repete num dado espaço de tempo. Segundo o autor, esse parâmetro físico “se relaciona diretamente com a frequência de vibração das cordas vocais, que por sua vez, em termos fisiológicos será função da tensão exercida sobre elas pelos músculos da laringe”.
| 95 Este capítulo se organiza da seguinte forma: na próxima seção nos dedicaremos à questão levantada anteriormente sobre a existência (ou não) de uma estrutura prosódica, além de apresentar nossas premissas em relação ao mapeamento da estrutura sintática na estrutura prosódica. Além disso apresentaremos algumas considerações gerais a respeito do quadro teórico que estamos assumindo – a AM e a Fonologia Prosódica –, estabelecendo nossa ideia a respeito de como a prosódia está inserida na arquitetura da gramática que adotamos. Na seção 3.2, faremos algumas considerações a respeito da metodologia de coleta e análise dos dados do nosso experimento. Nesse sentido, é importante tecer alguns comentários acerca da diferença entre a curva de F0 e o pitch, bem como a forma que se interpreta o pitch track, o reconhecimento automático das variações na frequência fundamental (F0) conforme identificadas pelo algoritmo do programa utilizado na análise dos dados – o programa Praat (Boersma & Weenink, 2018). Aqui é importante apontar e justificar nossas escolhas metodológicas de análise da curva de F0; por isso, forneceremos uma pequena revisão dos principais métodos, mostrando o porquê de adotarmos um método específico. Na seção 3.3, vamos apresentar alguns trabalhos acerca da prosódia do foco em PB, como Fernandes (2007), Araújo (2015), Carnaval (2017), Moraes (2006) e Bocci (2013), fazendo comentários a cada uma dessas análises. Na seção 3.4, adentraremos especificamente na descrição dos experimentos e dos resultados obtidos, ao passo que na seção 3.5 apresentaremos uma discussão desses resultados à luz da nossa hipótese, seguido de um resumo da discussão. 3.1.O mapeamento da sintaxe na fonologia, a Fonologia Prosódica e a Teoria Autossegmental-Métrica Como citado nos parágrafos anteriores, quando discutimos sobre a interface entre a sintaxe e a fonologia, duas posições são possíveis: ou assumimos que a estrutura sintática é o domínio per se das regras fonológicas (e isso inclui tanto processos fonológicos, como apagamento, inserção e modificação de segmentos, quanto atribuição de acentos tonais), ou aceitamos que tais regras são aplicadas a outro objeto, uma estrutura tipicamente fonológica. A primeira hipótese é chamada na literatura de hipótese da referência direta (Féry, 2017, p. 35). Dentre os trabalhos que defendem essa análise, podemos citar Lieberman (1966), Xu (2005), Cooper, Eady e Mueller (1985) e Eady e Cooper (1986). Nessa hipótese, a prosódia atribuiria os acentos tonais diretamente às palavras e sintagmas, “enxergando” apenas a estrutura sintática ou os elementos semântico-pragmáticos. A segunda hipótese, denominada de hipótese da referência indireta (Nespor & Vogel, 2007 [1986]; Selkirk, 1984), advoga que a relação entre sintaxe e fonologia é feita indiretamente, através de um objeto fonológico denominado de
| 96 estrutura prosódica. Nessa perspectiva, a representação sintática é interpretada pelo sistema articulatório-perceptual e transformada em uma outra estrutura, essa sim alvo de processos fonológicos, bem como a atribuição de acentos tonais. Essa hipótese é defendida por Liberman (1975), Ladd (2008), Selkirk (2011), Nespor e Vogel (2007), dentre outros113. Neste trabalho, assumiremos a segunda alternativa, propondo que o nível de representação PF é enviado à interface fonológica e transformado em uma representação estritamente fonológica, sobre a qual o componente fonológico opera seus processos (dentre os quais está a atribuição de acentos tonais)114. Dentre os vários argumentos em defesa da hipótese da referência indireta, podemos citar o exemplo do raddoppiamento sintattico, fenômeno de alguns dialetos do italiano analisado por Nespor e Vogel (2007, pp. 37–41) no dialeto da Toscana. O raddoppiamento sintattico consiste na geminação da consoante inicial de uma palavra quando precedida por outra palavra terminada por vogal tônica. No entanto, há algumas restrições a esse processo: inicialmente, a palavra que precede o alvo do processo deve ser terminada por vogal tônica, além de a palavraalvo não poder ser iniciada por cluster sC (fricativa alveolar surda + qualquer consoante): (124) a. Il ragno aveva mangiato metá [f:]arfalla. A aranha comeu metade de uma borboleta. b. Il ragno aveva mangiato quáttro [f]arfalle A aranha comeu quatro borboletas. c. Il ragno aveva mangiato metá [s]corpione A aranha comeu metade de um escorpião. (Nespor & Vogel, 2007, p. 38. Adaptado) No entanto, apenas essas restrições de ordem segmental não são capazes de dar conta de todos os casos. Vejamos os exemplos: (125) a. Ho visto tré [k:]olibrí [b:]rutti. Ele viu três colibris feios. b. Ho visto tré [k:]olibri [k]osí [b:]rutti. Ele viu três colibris tão feios. (Nespor & Vogel, 2007, p. 40. Adaptado) Em (125a), ocorreu raddoppiamento tanto em [k:]olibrí quanto em [b:]rutti, já que há, nesses casos, contexto adequado (conforme apresentado acima). No entanto, em (125b), o processo não ocorreu em [k]osí, embora haja o mesmo contexto favorecedor para que a palavra 113
Ver Selkirk (2011, p. 436) para uma lista mais extensa. Não pretendemos entrar em detalhes sobre como se dá essa codificação de PF na estrutura prosódica. Selkirk (2011) propõe um modelo baseado na Teoria da Otimalidade, que consegue explicar casos em que não há isomorfismo total entre PF e estrutura prosódica. 114
| 97 sofra o processo. Como explicar isso? Nespor e Vogel conseguem dar conta desse fato ao afirmar que o raddoppiamento “enxerga” fronteiras prosódicas. Nesse caso, o processo só ocorrerá se ambas as palavras estiverem dentro do mesmo constituinte prosódico, como demonstra a segmentação abaixo (o símbolo {} indica fronteiras prosódicas, que serão definidas a seguir): (126) a. Ho visto {tré [k:]olibrí [b:]rutti}. b. Ho visto {tré [k:]olibrí {[k]osí [b:]rutti}}. Com a assunção da constituência prosódica, podemos afirmar que [k]osí não sofre o processo por não estar contido no mesmo constituinte prosódico de [k:]olibri. Como tanto [k:]olibri quanto [b:]rutti estão contidos no mesmo constituinte prosódico que a palavra que possibilita o processo (tré para a primeira e [k]osí para a segunda), tais palavras sofrem raddoppiamento. Assim, podemos assumir que existe uma estrutura prosódica que serve de locus para aplicação de processos (no caso em questão nesta dissertação, da atribuição de acentos tonais). Embora seja impossível assumir que a estrutura prosódica e a estrutura sintática sejam isomórficas115, fica claro que, em certa medida, a definição da estrutura prosódica é influenciada pela sintaxe. No entanto, cabe entender como essa estrutura prosódica se organiza, bem como as regras que subjazem à atribuição de acentos tonais. A primeira questão é respondida em diversos trabalhos que se utilizam da teoria da Fonologia Prosódica, aporte teórico que adotamos, enquanto a segunda tem sido amplamente debatida pelos teóricos de diversas correntes que se ocupam da Fonologia Entoacional. Nesta dissertação, trabalharemos especificamente com o modelo da AM, como dito anteriormente. Antes de passarmos à análise, portanto, faz-se necessário dizer algumas palavras sobre cada um desses modelos, o que faremos nas duas subseções a seguir.
3.1.1. Fonologia Prosódica Como afirmado anteriormente, a Fonologia Prosódica assume a hipótese da referência indireta, afirmando a existência de uma estrutura prosódica que, pelo menos em parte, é um subproduto da estrutura sintática (levando em consideração a discussão sobre a arquitetura da gramática proposta na seção 1.2.2.). Como advogado em Nespor e Vogel (2007, p. 1):
115
Ou seja, não existe uma relação de 1:1 entre a estrutura prosódica e a estrutura sintática.
| 98 O subsistema no qual nós estaremos interessados no presente estudo é o subsistema prosódico, e, em particular, a teoria dos domínios. De acordo com a teoria prosódica, a representação mental da fala é dividida em porções hierarquicamente organizadas. No fluxo contínuo típico da fala, tais porções mentais, os constituintes prosódicos da gramática, são assinalados por diferentes tipos de pistas, abrangendo desde modificações segmentais a mudanças fonéticas mais sutis. Ou seja, cada constituinte prosódico serve como o domínio de aplicação de específicas regras fonológicas e processos fonéticos. (Tradução nossa)116
De acordo com Nespor e Vogel, a estrutura prosódica é uma representação mental (abstrata) que pode ser identificada a partir de “pistas” fonético-fonológicas. De maneira geral, os pesquisadores em Fonologia Prosódica se utilizam de fenômenos segmentais (como o raddoppiamento, descrito acima) para propor suas análises. No entanto, pistas autossegmentais (relacionadas à atribuição de acentos tonais) podem também ser evocadas, especialmente para reforçar hipóteses levantadas a partir da análise de fenômenos segmentais. Grande parte do trabalho dos pesquisadores que adotam a Fonologia Prosódica é definir a natureza da estrutura prosódica e as regras que subjazem à sua constituição. Quanto à primeira questão, a maior parte da literatura afirma que a estrutura prosódica possui uma hierarquia de constituintes, iniciando pela sílaba e continuando bottom-up até o enunciado prosódico. Essa hierarquia, com os símbolos que representam cada constituinte prosódico, pode ser representada como (127) abaixo117: (127)
“The subsystem we will be concerned with in the present study is the prosodic subsystem, and in particular, the theory of domains. According to prosodic theory, the mental representation of speech is divided into hierarchically arranged chunks. In the typically continuous flow of speech, such mental chunks, the prosodic constituents of the grammar, are signaled by different types of cues ranging from actual segmental modifications to more subtle phonetic changes. That is, each prosodic constituent serves as the domain of application of specific phonological rules and phonetic processes” 117 Alguns trabalhos (como Selkirk, 1986; 2011) ignoram a existência do constituinte chamado grupo clítico. 116
| 99 A hierarquia dada em (127) restringe, por exemplo, que haja um sintagma entoacional subordinado a um sintagma fonológico. No entanto, quais outras restrições se aplicariam à formação da estrutura prosódica? Nespor e Vogel (ib., p. 7) afirmam que os componentes da hierarquia prosódica se combinam de um modo possível de ser representado em estruturas arbóreas. A geometria dessas árvores respeita quatro princípios:
Princípio 1: uma unidade não-terminal da hierarquia prosódica é composta por uma ou mais unidades da categoria imediatamente inferior; Princípio 2: uma unidade de um dado nível da estrutura está exaustivamente contida no nível imediatamente superior118; Princípio 3: As estruturas hierárquicas da estrutura prosódica são n-árias, ou seja, não precisam, como na sintaxe, ser binárias (uma unidade de um nível da estrutura pode ser ramificada em mais de duas unidades do nível inferior); Princípio 4: A relação de proeminência relativa estabelecida entre nós-irmãos na estrutura ocorre no sentido de que um elemento é forte (s) enquanto os demais são fracos (w).
Esses princípios tornam a estrutura prosódica diferente da estrutura sintática, embora aquela seja derivada desta. Nespor e Vogel apresentam exemplos de estruturas prosódicas que seriam ruled out pelos princípios acima119: (128)
As estruturas geradas por tais princípios resultam em um output que não é necessariamente isomórfico em relação à estrutura sintática. Vejamos um exemplo prático: (129) A Flávia vai comprar um carro mês que vem.
118
Os princípios 1 e 2, denominados em Selkirk (1984) de Strict Layer Hipothesis, são alvo de discussão sobre sua validade empírica. Para tal discussão, indicamos Féry (2017, p. 37-39) 119 Lembrando que a existência da estrutura em (128a) é discutível, conforme nota anterior.
| 100 a.
b.
A estrutura sintática em (129a) é perfeitamente binária, como se pode ver. No entanto, a estrutura prosódica correspondente, em (129b), não é, pois o nó do sintagma entoacional está dominando imediatamente três sintagmas fonológicos. Por isso, não podemos afirmar que a estrutura prosódica possa ser isomórfica em relação à estrutura sintática120/121. Assim sendo, como a estrutura prosódica é mapeada da estrutura sintática? Podemos assumir que haja algoritmos (funções) de formação dos constituintes prosódicos. Isso quer dizer que o subcomponente prosódico, ao analisar uma estrutura sintática, aplica a essa estrutura uma série de operações de leitura, conversão e rotulação, de modo que o input sintático resulte em um output prosódico. Uma vez que nosso trabalho é voltado para a atribuição de acentos tonais, nos dedicaremos a desenvolver os algoritmos de formação dos constituintes prosódicos superiores, a saber o sintagma entoacional e o sintagma fonológico, que geralmente têm sido assumidos como os domínios típicos da atribuição de tais acentos (cf. Tenani, 2002). No âmbito da Fonologia Prosódica, temos predominantemente dois modelos adotados: o primeiro modelo, proposto por Nespor e Vogel (2007 [1986]), adota a noção derivacional
120
De maneira geral, a estrutura em (129b) deriva do fato normalmente assumido de que a estrutura prosódica não é recursiva (ou seja, um constituinte prosódico não poderia dominar outro constituinte de mesma natureza). Caso a recursividade fosse possível, a estrutura em (129b) poderia ser algo tipo {(A Flávia)φ ((vai comprar um carro)φ (mês que vem)φ)φ}ι. Alguns trabalhos em fonologia prosódica advogam pela possibilidade da recursividade. Para uma discussão, ver Féry (2017, p. 78-85) e Ladd (2008, p. 290-293). 121 Um aspecto importante que diferencia a estrutura prosódica da estrutura sintática reside no fato de que as cópias não pronunciadas (ver páginas 40-41 desta dissertação sobre a ideia de cópias) não são “enxergadas” pelo subsistema prosódico. Assim, mesmo que, entre o núcleo T [vai comprar] e o DP [um carro], no exemplo em (129), haja duas cópias apagadas (do DP [A Flávia] e do núcleo V [comprar], respectivamente), o subsistema prosódico efetua o parsing dos dois constituintes sintáticos em um mesmo constituinte prosódico). Um estudo sobre como esse mecanismo, que ignora cópias em PF, pode ser formalmente descrito depende de um estudo mais aprofundado e está fora do escopo deste trabalho.
| 101 proposta acima, e utiliza a relação de núcleo-complemento para a sua caracterização. Assim, os algoritmos de formação dos constituintes prosódicos “enxergam” a cabeça lexical dos constituintes sintáticos e, a partir da relação com seus complementos, efetuam o parsing dos elementos em unidades da hierarquia prosódica. Abaixo apresentamos os algoritmos para formação do sintagma entoacional e do sintagma fonológico dentro do modelo de Nespor e Vogel atualizados : (130)
Formação do Sintagma Fonológico (φ) a. Domínio φ: O domínio da formação de φ é definido pela configuração […LexXP…]Lexmax (em que Lex é o núcleo de uma categoria lexical, and Lexmax a projeção máxima de uma categoria lexical). b. Construção de φ: Elementos em torno de Lex são organizados em φs de modo que: i. Todos os elementos do lado não recursivo de Lex que ainda estão dentro de Lexmax estão contidos no mesmo φ com Lex; ii. Um φ pode opcionalmente conter (i) e o sintagma seguinte que é complemento de Lex Condição de ramificação (ou de peso) em φs: um φ deve conter mais material do que uma palavra prosódica. (Frota, 2000, p. 365. Tradução nossa)122
De acordo com (130), o domínio do sintagma fonológico (que é, segundo o algoritmo em (130II), o que define os limites desse constituinte prosódico) é a projeção máxima de uma categoria lexical (como NPs, VPs, etc.), englobando tanto o núcleo lexical quanto todos os itens do lado não recursivo de tais núcleos (em PB, o lado não recursivo dos núcleos lexicais é o lado esquerdo). Como (bii) ainda demonstra, é possível que um complemento de Lex ainda esteja dentro do mesmo φ que contém Lex, sendo que, conforme Nespor e Vogel (Nespor & Vogel, 2007, p. 173) apontam, isso só ocorre se o complemento de Lex não for ramificado. Para exemplificar a aplicação desse algoritmo de formação do sintagma fonológico, apresentamos, em (132-136) abaixo, a representação dos sintagmas fonológicos que
122
“Phonological Phrase (φ) Formation (EP) a. φ domain: The domain of φ-formation is defined by the configuration […LexXP…] Lexmax (where Lex stands for the head of a lexical category, and Lexmax for the maximal projection of a lexical category) b. φ construction: Elements around Lex are organized into φs so that i. all elements on the non-recursive side of Lex which are still within Lexmax are contained in the same φ with Lex; ii. a φ may optionally contain (i) and a following phrase that is a complement of Lex. Branchingness (or weight) condition on φs (EP): a φ should contain more material than one prosodic word.
| 102 compreendem as 5 frases que foram utilizadas no experimento que realizamos (e que será descrito e analisado na seção 3.4): (131) a. [A Gina]DP [fez [café]DP [de noite]PP]VP Estrutura sintática (simplificada)123 b. (A Gina)φ (fez)φ (café)φ (de noite)φ Aplicação do algoritmo em (130bi) c. (A Gina)φ (fez café)φ (de noite)φ Aplicação do algoritmo em (130bii) (132) a. [A Flávia]DP [vai comprar [um carro]DP]VP [mês [que vem]DP]PP b. (A Flávia)φ (vai comprar)φ (um carro)φ (mês)φ (que vem)φ c. (A Flávia)φ (vai comprar um carro)φ (mês que vem)φ (133) a. [O Gustavo]DP [vai ser [pai]DP]VP b. (O Gustavo)φ (vai ser)φ (pai)φ c. (O Gustavo)φ (vai ser pai)φ (134) a [O irmão [da Rosa]PP]DP [comprou [a casa [da esquina]PP]DP]VP b. (O irmão)φ (da Rosa)φ (comprou)φ (a casa)φ (da esquina)φ c. (O irmão da Rosa)φ (comprou)φ (a casa da esquina)φ (135) a. [Minha irmã]DP [trabalhou [ontem]AdvP]VP b. (Minha irmã)φ (trabalhou)φ (ontem)φ c. (Minha irmã)φ (trabalhou ontem)φ Aplicando os algoritmos de formação do sintagma fonológico, temos como output das estruturas sintáticas em (132-136a) as estruturas prosódicas em (132-136c). Como o português é uma língua de ramificação à direita, todas as sentenças deveriam portar acento/contorno nuclear no elemento mais à direita, respectivamente em (de noite), (mês que vem), (vai ser pai), (a casa da esquina) e (trabalhou ontem). Por sua vez, dentro de cada sintagma fonológico, deveria ser a palavra fonológica mais à direita que receberia o acento. Como veremos adiante, quando o foco entra em jogo, essa regra de atribuição de proeminência é alterada. O que podemos dizer quanto ao nível acima do sintagma fonológico, o sintagma entoacional? Apresentamos abaixo o algoritmo de formação desse constituinte prosódico da seguinte forma:
123
Por motivos de simplificação, vamos rotular a combinação [T [VP]], que ocorre em [vai comprar i [ti [um carro]]] no exemplo em (137), apenas como VP.
| 103 (136) Formação do Sintagma Entoacional (ι): a. Domínio de ι: O domínio de formação de ι pode consistir de: i. todos os φs em uma cadeia que não são estruturalmente conectados à árvore da sentença, ou ii. qualquer sequência remanescente de φs adjacentes em uma sentença raiz. b. Construção de ι: Os constituintes incluídos em um ι devem portar uma relação núcleo/complemento. Condição de peso em ιs: sintagmas longos tendem a ser divididos; sintagmas balanceados, ou o sintagma mais longo na posição mais à direita, são preferidos. (Frota, 2000, p. 365. Tradução nossa)124 O algoritmo de formação do sintagma entoacional proposto acima se baseia na noção de sentença raiz, que pode, atualmente, ser definida como a projeção CP. Assim sendo, CPs tendem a ser combinados em sintagmas entoacionais próprios125. Quando um CP intervém dentro de uma sentença raiz (como é o caso de sentenças parentéticas, orações relativas não restritivas e (possivelmente) vocativos), o algoritmo proposto pelas autoras efetua o parsing de cada “pedaço” da sentença raiz em um sintagma entoacional. Como os dados que utilizaremos (que estão representados em (132c-136c)) não apresentam esse tipo de caso, todos os sintagmas fonológicos são fraseados em um mesmo sintagma entoacional. Nos parágrafos anteriores apresentamos o modelo proposto por Nespor e Vogel (2007) para o mapeamento da estrutura PF na estrutura prosódica. Um segundo modelo foi proposto por Selkirk (2011), baseado na Teoria da Otimalidade (OT) (Prince & Smolensky, 1993), mais especificamente na Teoria da Correspondência (McCarthy & Prince, 1995)126. Esse modelo é, epistemologicamente falando, mais adequado à nossa posição, pois prevê que as fases
“Intonational Phrase (I) formation (EP): a. I domain: the domain of I-formation may consist of: i. all the φs in a string that is not structurally attached to the sentence tree, or ii. any remaining sequence of adjacent φs in a root sequence. b. I-construction: the constituents included in an I must bear a head/complement relation. Weight conditions on Is (EP): long phrases tend to be divided: balanced phrases, or the longest phrase in the rightmost position, are preferred.” 125 Uma questão se coloca ao se fazer essa afirmação: tem sido demonstrado que tópicos definem, por si só, sintagmas entoacionais (como os exemplos dados por Nespor e Vogel (2007, p. 187-190)). Normalmente se assume que tópicos ocupam uma posição dentro da camada CP, o que inviabilizaria a ideia de que CPs formam ιs. Caso se adote uma proposta cartográfica (Rizzi 1997, dentre outros), pode-se assumir que TopP também forme por si só um sintagma entoacional. No entanto, como essa questão não é relevante para nossa discussão, deixamos essas considerações para serem apuradas em trabalhos posteriores. 126 Embora a proposta mais elaborada da teoria de Selkirk seja o trabalho citado, a autora aponta que suas considerações remontam trabalhos anteriores (Selkirk, 1986, 1996). 124
| 104 resultantes da operação de Spell-Out (ou certos sintagmas que podem ser definidos nos termos da teoria de fases) são lidas como sintagmas fonológicos127/128. Nessa abordagem, restrições de fidelidade, nomeadas como Match(α, π) e Match(π, α) advogam pela correspondência, respectivamente, entre um input sintático e um output prosódico e entre um output prosódico e um input sintático, de forma que um constituinte sintático do tipo α seja sempre mapeado como um constituinte prosódico do tipo π (α e π tomados como constantes para, respectivamente, rótulos sintáticos e prosódicos quaisquer). Mas quais seriam os constituintes, sintáticos e prosódicos, que entram nessa relação de correspondência? Selkirk defende uma hierarquia prosódica bastante semelhante à proposta em (127) – com a exceção do constituinte grupo clítico (C) e do enunciado fonológico (U) –, de modo que o mapeamento se daria entre sintagma entoacional e a cláusula, o sintagma fonológico e o sintagma sintático e palavra fonológica e a palavra sintática. Mas, em termos dos rótulos propostos na literatura gerativa, a que categorias pertenceriam, respectivamente, os termos “cláusula”, “sintagma sintático” e “palavra sintática”? Selkirk (2011, pp. 452–454) apresenta o seguinte panorama: 1. O termo “cláusula”, que entra em relação de correspondência com o sintagma entoacional, pode se referir tanto ao que, em termos minimalistas, é o TP quanto ao que é o CP. A autora afirma que é possível que haja dois tipos de restrições quanto ao sintagma entoacional: Match(TP, ι) / Match(ι, TP) e Match(CP, ι) / Match(ι, CP). 2. O termo “sintagma sintático” é mais restrito do que qualquer projeção máxima (XP), já que projeções funcionais (como DP e PP) não são combinadas em sintagmas fonológicos próprios. Assim, Selkirk propõe que apenas projeções lexicais (LexP) sejam aquelas que são correspondentes a sintagmas fonológicos – através de restrições Match(LexP, φ) / Match(φ, LexP)129. 3. O termo “palavra sintática” se refere aos núcleos de projeções lexicais, através de restrições Match(Lexº, ω) / Match(ω, Lexº). Assim sendo, núcleos lexicais são
127
Para uma discussão mais específica da noção de fases, ver Chomsky (2001). Uma possível exceção a essa ideia é o fato de que geralmente se assume que DPs são fraseados como sintagmas fonológicos, mas não são fases (embora haja algumas versões da teoria gerativa que considerem que DPs sejam fases). 129 Truckenbrodt (1999, p. 226) dá conta dessa “seleção” por projeções lexicais através de uma Condição de Categoria Lexical (Lexical Category Condition). No entanto, ainda se faz necessário formalizar essa questão em termos gerativistas (responder, in a principled way, como é possível que o subcomponente prosódico consiga “enxergar” o que é projeção lexical e o que é projeção funcional). 128
| 105 correspondentes a palavras fonológicas, enquanto os núcleos funcionais se cliticizam a esses núcleos lexicais (dirigidos por restrições de marcação). No modelo de Selkirk, o mapeamento de PF na estrutura prosódica ocorre através de um modelo de computação paralela (nos moldes da OT): diversos outputs da estrutura prosódica são gerados e submetidos a um ranqueamento de restrições de fidelidade (como as apontadas acima), que irão apontar para uma isomorfia entre estrutura sintática e estrutura prosódica, e restrições de marcação, que irão advogar pela eliminação de certos outputs. No final das contas, o output ótimo (ou seja, que viola restrições menos relevantes no ranqueamento) é o que emerge como a estrutura prosódica atestada. A fim de exemplificar a aplicação desse modelo, tomemos a sentença em (136a). O tableau130 abaixo apresenta a representação da elaboração da estrutura prosódica dessa sentença:
[A [Gina]NP]DP [fez [café]NP]VP [de [noite]NP]PP]TP a. ((A Gina)φ (fez café)φ de (noite)φ)ι b. ((A Gina)φ)ι ((fez café)φ (de noite)φ)ι c. ((A (Gina)φ)φ (fez (café)φ)φ (de (noite)φ)φ)ι d. ((A Gina)φ (fez (café)φ)φ (de (noite)φ)φ)ι e. ((A Gina)φ (fez café)φ (de)φ (noite)φ)ι f. ((A Gina fez)φ (café de noite)φ)ι F g. ((A Gina)φ (fez café)φ (de noite)φ)ι
MAX Match Match (XP, φ) (φ, LexP) (CP, ι) *! * ** *! ** ** ** ** **
NonRec (φ)
*!** *!*
BinMin Match (φ,ω) (LexP, φ) ** ** ** *** *** **** * ***! ** ****! ** ***
Figura 2: Tableau da estrutura prosódica da sentença “A Gina fez café de noite” Fonte: Elaboração própria
Para esse exemplo, elencamos 6 restrições131: 1. MAX (XP, φ): Todos os sintagmas devem estar inseridos em um sintagma fonológico. Conta uma violação para cada sintagma que não está fraseado; 2. Match (φ, LexP): Todos os sintagmas fonológicos devem ser correspondentes a uma projeção lexical. Conta uma violação para cada φ que seja correspondente a outro elemento que não uma projeção lexical (VP, NP e AP); 3. Match (CP, ι): Toda projeção CP deve corresponder a um sintagma entoacional. Conta uma violação para cada CP que não é fraseado como ι.
130
Tableaux são formalizações do modelo da Teoria da Otimalidade. Uma boa introdução ao tema pode ser encontrada em McCarthy (2007) 131 A restrição MAX (XP, φ) foi a única elaborada pelo autor (baseada na família de restrições MAX, bastante analisada na literatura); as demais restrições estão contidas em Selkirk (2011)
| 106 4. NonRec (φ): Sintagmas fonológicos não podem ser recursivos. Conta uma violação sempre que um φ dominar outro φ; 5. BinMin (φ, ω): Sintagmas fonológicos devem ser compostos por, no mínimo, duas palavras fonológicas. Conta uma violação sempre que um φ for composto por apenas uma ω; 6. Match (LexP, φ): Toda projeção lexical deve ser correspondente a um sintagma fonológico. Conta uma violação sempre que uma projeção lexical for correspondente a outro elemento que não seja um φ.
Com esse corpo de restrições, foi possível derivar a estrutura prosódica correta (a opção (g) da figura 2). Esse exemplo ilustra bem a ideia de que o modelo proposto em Selkirk (2011) é capaz de derivar as estruturas prosódicas tão bem quanto o modelo de Nespor e Vogel. Ainda assim, embora a discussão entre os dois modelos seja relevante para embasar teoricamente o trabalho (e, conforme afirmamos acima, o modelo de Selkirk nos parece mais adequado para tratar a formação da estrutura prosódica em concordância com as afirmações do Programa Minimalista), em termos práticos, para as frases com as quais trabalharemos aqui, não há diferença entre adotar um modelo ou outro, de modo que as estruturas prosódicas das frases do experimento que empreendemos serão as mesmas para ambos os modelos – aquelas representadas em (132c-136c). Qual é a relevância da estrutura prosódica para a atribuição de acentos tonais? A teoria da Fonologia Prosódica fornece o locus no qual os acentos tonais irão se manifestar. Parte dos estudos nessa teoria assumem que, por exemplo, línguas de núcleo à direita (como o PB) recebem proeminência no elemento mais à direita dentro do constituinte prosódico. Isso resulta em uma estrutura de acentuação semelhante ao exposto abaixo: (137) ( φ φ ‘φ)ι (ω ‘ω)φ (ω ‘ω)φ (ω ω ‘ω)φ O esquema em (138) exemplifica que, dentro de um sintagma fonológico, o elemento que recebe os acentos tonais geralmente é a sílaba tônica mais à direita dentro de φ, ao passo que, dentro do sintagma entoacional, o elemento que recebe o acento tonal é o elemento mais à direita dentro de ι. Essas noções nos auxiliam a perceber os movimentos tonais que ocorrem nessas regiões, na busca de semelhanças ou divergências entoacionais capazes de agrupar ou separar sentenças de acordo com possíveis codificações gramaticais (como, por exemplo, a focalização).
| 107 3.1.2. Teoria Autossegmental-Métrica Enquanto a teoria da Fonologia Prosódica dá conta do mapeamento de PF na estrutura prosódica, A AM se encarrega de caracterizar a natureza dos acentos tonais que figuram em posições específicas na estrutura prosódica (como exemplificado em (138)). A afirmação acima carrega dois pressupostos importantes: o primeiro é o de que a entoação desempenha um papel na fonologia. Embora atualmente essa ideia seja amplamente aceita, ela é bastante recente na história dos estudos da linguagem humana. De maneira geral, por muito tempo se acreditou que a modulação da entoação servia apenas a um papel paralinguístico, a fim de expressar emoções, ou mesmo indicar informações sobre o falante (como sexo, idade, etc). Essa afirmação não é de todo errada, já que a entoação de fato envolve tais aspectos. No entanto, como argumenta Ladd (2008), remover a entoação de um status linguístico apenas pelo fato de ser possível utilizá-la como indicador paralinguístico não faz sentido, já que, muitas vezes, a influência de fatores como emoções pode alterar a natureza de, por exemplo, segmentos. O autor dá um exemplo (p.36): em alemão é possível expressar simpatia ou tranquilidade a partir da contração dos lábios. Um efeito óbvio desse gesto é o arredondamento, o que faz com que uma palavra como ja (“sim”) seja pronunciada como jo. A presença desse aspecto paralinguístico não afeta a interpretação fonológica da palavra (a forma fonológica de ja continua a mesma). Analogamente, a informação fonológica veiculada pela entoação não necessariamente é distorcida pelo fato de que fatores psicológicos, como estado emocional, ou mesmo biológicos, como sexo e idade, podem alterar a natureza acústica da curva entoacional de uma sentença. O segundo pressuposto é o de que é possível caracterizar a entoação da fala a partir de eventos tonais específicos. Essa afirmação é dependente da teoria adotada: modelos como o elaborado no Institute for Perception Research (IPO) tentaram descrever a entoação da fala a partir de movimentos no pitch que seriam “interpretados como relevantes pelo ouvinte” (Ladd, 2008, p. 13 Tradução nossa)132. A abordagem da AM é diferente: a ideia é a de que a curva entoacional é resultado da interação entre eventos tonais específicos, que tomam lugares igualmente específicos na estrutura prosódica (como vimos na seção 3.1.1. acima). O aspecto contínuo da entoação é resultado da interpolação entre tais eventos. Conforme explicitado por Ladd (2008, p. 47):
132
“interpreted as relevant by the listener”
| 108 Uma inovação chave da AM é que ela desenha uma distinção explícita entre eventos e transições. Ela reconhece que certos aspectos localizados do pitch são linguisticamente importantes, enquanto grande parte do resto do contorno de pitch é meramente o que acontece entre aspectos importantes. (Tradução nossa. Grifo do autor)133
A teoria assume que haja dois tons primitivos (monotonais, ou simples), alto (H) e baixo (L), de modo que outras configurações tonais podem ser derivadas a partir da interação desses dois tons em um mesmo evento, resultando, por exemplo, em um padrão ascendente, resultado da combinação LH, ou descendente, resultado da combinação HL (originando tons complexos, ou bitonais). Quando dois tons se combinam, é necessário que um deles seja o predominante, o que resulta na proposição de uma distribuição de quatro eventos tonais bitonais (L*H, com proeminência em L; LH*, com proeminência em H; H*L, com proeminência em H; e HL*, com proeminência em L). A tonicidade da sílaba é determinante tanto para a atribuição tonal – isto é, sílabas tônicas são as que recebem os acentos tonais –, quanto para a ancoragem da estrela – a posição da tônica vai determinar qual dos dois tons será o mais proeminente. A afirmação de que os diversos acentos tonais são unidades discretas que podem ser derivadas de dois tons primitivos, aliada à ideia de que a fala é prosodicamente estruturada (vista na seção anterior), fez com que as primeiras versões da AM (especificamente Pierrehumbert, 1980) apresentassem uma “gramática da entoação”, conforme a figura abaixo:
Figura 3: Gramática dos eventos tonais na abordagem de Pierrehumbert (1980) Fonte: (Pierrehumbert, 1980, p. 29)
Posteriormente definiremos as classes denominadas pela autora como Boundary Tone, Pitch Accents e Phrase Accent. Por hora, é importante notar que assumir uma configuração discreta para a entoação possibilita que esse aspecto da linguagem seja descrito em termos “One key innovation of the A[utossegmental] M[etric] theory here is that it draws an explicit distinction between events and transitions. It recognizes that certain localised pitch features are linguistically important, while much of the rest of the pitch contour is merely what happens between important features.” 133
| 109 linguísticos, tornando capaz de captar de maneira muito mais acurada o que é linguisticamente relevante na curva de F0. Ladd (2008, p. 44) aponta quatro princípios básicos assumidos pela AM:
1. Estrutura tonal sequencial: esse princípio atesta o fator que já elencamos, de que a estrutura tonal envolve uma cadeia de eventos tonais discretos, localizados em posições específicas na sentença (mais especificamente, na estrutura prosódica). Tais eventos podem ser acentos tonais (pitch accents) ou tons de fronteira (boundary tones), além de acentos frasais (phrase accents) – embora esse último ainda seja alvo de discussão; 2. Distinção entre acento tonal (pitch acent) e acento (stress): Essa é uma distinção nem sempre assumida abertamente. A AM toma como pressuposto o fato de que os acentos tonais – eventos discretos localizados em alguns pontos da cadeia segmental – não podem ser confundidos com o que na língua inglesa se denomina stress: uma proeminência resultante da métrica estabelecida entre sílabas. Ainda que os acentos tonais na maioria das vezes recaiam sobre sílabas acentuadas (o que auxilia na identificação de tais sílabas), não é correto confundir os dois elementos: enquanto o acento tonal é um aspecto entoacional, o acento (stress) é um aspecto métrico. Isso é importante porque é notório que nem toda sílaba acentuada (stressed) recebe acentos tonais; 3. Análise dos acentos tonais em termos de tons de nível: Como afirmado antes, a AM assume que os acentos tonais são caracterizados por níveis alto e baixo. É importante notar que esses níveis não são absolutos (já que, obviamente, nem todos os falantes falam na mesma faixa de frequências), o que possui relação com o próximo princípio; 4. Fontes locais para tendências globais: A realização fonética dos acentos tonais (que também é chamada de scaling) depende de vários fatores, como ênfase ou posição na sentença. Portanto, na caracterização dos tons de uma frase, tais fatores devem ser levados em conta.
De posse desses princípios gerais, cabe a pergunta: como identificar, na cadeia da fala, tais eventos tonais? Qual é a característica definidoras dos tipos de eventos tonais descritos acima (acento tonal, acento frasal e tom de fronteira)? Nos próximos parágrafos tentaremos abordar essas duas perguntas.
| 110 Inicialmente, devemos propor a caracterização dos eventos tonais. A totalidade dos trabalhos em AM assume a existência de dois tipos de eventos tonais. O primeiro tipo – os acentos tonais – pode ser definido como “uma característica local de um contorno de pitch – usualmente, mas não invariavelmente, uma mudança no pitch, e frequentemente envolvendo um máximo ou mínimo local – que sinaliza que a sílaba com o qual é associada é proeminente no enunciado” (Ladd, 2008, p. 48 Tradução nossa)134. Como aludido acima, todos os acentos tonais são a realização de um tom alto ou baixo ou uma combinação desses dois tons. O segundo tipo de evento tonal – tons de fronteira – são associados ao fim (em algumas línguas, segundo Ladd (p. 88), também ao início) do sintagma entoacional (ι). Por fim, além desses dois tipos de tons, alguns trabalhos (como Beckman & Pierrehumbert, 1986; Ladd, 2008; Pierrehumbert, 1980) assumem a existência de acentos frasais, que seriam acentos de fronteira associados a constituintes prosódicos intermediários (nomeados por Ladd de intermediate phrase)135. Após essa breve caracterização dos tons, é necessário entender como identificar os acentos tonais (já que os tons de fronteira são mais simples, por estarem localizados na fronteira do sintagma entoacional). Como Ladd argumenta, os acentos tonais são associados a sílabas proeminentes e denotam um pico (ou vale) local. Essa afirmação, associada à ideia de que a cadeia da fala é organizada em uma estrutura prosódica, nos dá a ideia de que turning points da curva entoacional localizados em posições específicas da estrutura prosódica (como sintagmas fonológicos (φ)) muito provavelmente são manifestações fonéticas de eventos tonais. Identificar o alinhamento desse turning point, bem como a direção do movimento, pode auxiliar a identificação de qual tom está sendo produzido (se alto ou baixo; monotonal ou bitonal). Vejamos um exemplo. Na figura 4 abaixo, apresentamos a curva da frequência fundamental normalizada136 da sentença “A Gina fez café de noite”, produzida por informante do sexo feminino:
“[...] a local feature of a pitch contour – usually but no invariably a pitch change, and often involving a local maximum or minimum – which signals that the syllable with which it is associated is prominent in the utterance.” 135 Trabalhos como Ladd (1983) e Frota (2002) desconsideram a necessidade da existência de acentos frasais. Convidamos o leitor a analisar essas referências, bem como as citadas no texto (especialmente Ladd (2008, pp. 142–147)) para uma análise pormenorizada da questão. Neste trabalho, iremos seguir a posição comumente adotada em estudos de prosódia do PB e desconsiderar a existência de acentos frasais. 136 Discutiremos noções como normalização de F0 na próxima seção. 134
| 111
a A
ʒĩ
nɐ gina
A Gina
fejʃ
ka
fez
fɛ café
d͡ʒi de
fez café
t͡ʃɪ
noj noite de noite
A Gina fez café de noite 0
1.41 Time (s)
Figura 4: Curva de F0 da sentença “A Gina fez café de noite” Fonte: Elaboração própria
No exemplo acima, a curva de F0 faz um movimento de descida na última sílaba tônica da sentença (a sílaba [noj]). Por esse motivo, podemos afirmar que haja a especificação para um tom de descida (HL*) nesse local. Ao analisar os demais constituintes prosódicos (os φs (A Gina) e (fez café)), percebemos que há um movimento de subida na curva de F0, por isso podemos considerar que o primeiro constituinte esteja especificado para o tom ascendente (LH*), enquanto o segundo sintagma fonológico não está especificado para tom137. Por fim, podemos considerar que haja um tom de fronteira baixo (L%) fechando o sintagma entoacional. A representação da curva entoacional dessa sentença é dada em (138) abaixo138: (138)
A Gina fez café de noite [H* HL* L%]
A ausência de especificação de tom no sintagma fonológico intermediário não tem como consequência a ausência de F0 (como se pode ver na figura 4). O que acontece é a interpolação entre o tom H* que nucleia o φ (A Gina) e o tom prenuclear H que figura na cabeça do φ (de noite), que se manifesta na manutenção da faixa de frequência por todo o enunciado139.
137
Sobre as microvariações que aparecem na curva da frequência fundamental e sua relação com a curva entoacional, ver a próxima seção. 138 Por convenção, quando estamos nos referindo à representação fonética de uma curva entoacional (ou seja, quando não estamos apresentando uma generalização sobre algum aspecto linguístico específico), utilizamos os tons em letra minúscula. 139 A aparente queda no F0 que está apontada na sílaba tônica do sintagma entoacional intermediário pode ser explicada pela atuação do fenômeno de declinação. Para mais informações sobre esse assunto, ver Féry (2017, pp. 107–113) e Ladd (2008, pp. 75–80)
| 112 A anotação da informação sobre os eventos tonais dentro da AM é convencionalizada no modelo ToBI (sigla de Tonal and Break Index). Uma breve taxonomia dos símbolos adotados nesse modelo pode ser dada no quadro abaixo140:
Símbolo H* L* HL* H*L LH* L*H L% H%
Descrição acento monotonal alto acento monotonal baixo acento bitonal descendente com acento nuclear baixo acento bitonal descendente com acento nuclear alto acento bitonal ascendente com acento nuclear baixo acento bitonal ascendente com acento nuclear alto tom de fronteira baixo tom de fronteira alto
Quadro 3: Taxonomia dos símbolos utilizados no modelo ToBI Fonte: Elaboração própria
No entanto, ao se efetuar a anotação fonológica da entoação de uma frase, é necessário levar em conta diversos fatores para além da manifestação física da frequência fundamental (F0). A próxima seção apresentará a justificativa para essa afirmação, bem como diretrizes gerais que devem ser adotadas (e foram adotadas neste trabalho) na análise entoacional. 3.2.Análise prosódica: algumas palavras Como dito anteriormente, efetuar uma análise da prosódia da fala humana não envolve simplesmente registrar uma sentença, analisar esse registro através de um programa específico (tal como Praat) e, usando a curva crua da frequência fundamental, tecer considerações a respeito. Isso por três fatores básicos: primeiro, F0 é uma grandeza física, fato esse que torna complexo o estabelecimento, a priori, de uma relação biunívoca dessa grandeza física com a informação fonológica que possivelmente é veiculada por ela (do mesmo modo que é complexa a tentativa de equiparar as frequências formânticas de segmentos vocálicos com noções fonológicas como os traços [alto], [arredondado], etc). Isso decorre de uma constatação óbvia: a linguagem é um objeto mental, abstrato. Por mais que sua manifestação esteja calcada em entidades concretas – afinal não existiria linguagem se ela não pudesse ser veiculada por algum meio físico (a menos que exista algo como telepatia e “conversas mentais” entre indivíduos – embora mesmo nesse caso algum meio físico talvez seja necessário) –, não é possível efetuar,
140
Para mais informações sobre a metodologia de uso dos símbolos do sistema ToBI, ver Beckman e Hirschberg (1994) e Beckman e Gayle (1997).
| 113 sem inúmeras ressalvas, uma relação entre essa manifestação abstrata e a concretude da fala. Assim sendo, é necessário efetuar uma abstração em cima da grandeza física da frequência fundamental, a fim de encontrar generalizações capazes de explicar as realidades linguísticas. Um segundo fator que deve ser levado em conta é o de que a entoação percebida (a qual chamamos de pitch) envolve, para além da grandeza da frequência (medida em Hertz – embora normalmente utilizemos a medida em semitons), a intensidade (medida em dB) e a duração dos segmentos (medida em ms). Isso porque estudos já mostraram que a percepção da entoação depende desses três fatores. Uma alteração relvante de F0 que ocorre em uma curta duração possivelmente não será percebida, ao passo que a mesma alteração que toma lugar em um segmento mais alongado provavelmente será percebida. Por isso, a análise prosódica deve levar em conta não só a curva de F0, mas também os dados de intensidade e duração. De posse desses dados, o analista pode ser capaz de julgar a ocorrência e a caracterização dos eventos tonais. Um terceiro fator tem relação com a percepção: o fenômeno físico de F0 não é exatamente o mesmo que o que convencionou-se chamar de pitch: a entoação percebida pela audição humana141. Estudos em psicoacústica (como d’Alessandro & Mertens, 1995) mostram que alguns aspectos da curva de F0 não possuem relação com a percepção acústica, e não adicionam nenhuma informação relevante no que concerne à entoação percebida: algumas variações, embora alterem a medida da frequência fundamental, não são percebidas como variação de pitch, bem como alguns aspectos presentes na curva de F0 e auditivamente percebidos não possuem relação com a entoação, mas têm a ver tanto com o F0 intrínseco a vogais e consoantes quanto com fenômenos de F0 relacionados a fatores como modo e ponto de articulação dos sons, qualidade de voz etc. Isso ocorre porque o sinal da frequência fundamental pode ser dividido em dois componentes: um componente microprosódico, cuja feição possui relação direta com os fatores elencados acima (e são dependentes da natureza articulatório-acústica dos segmentos); e um componente macroprosódico, esse sim relevante para a interpretação da entoação per se. Embora pareça contraintuitivo (afinal, seria natural imaginar que o F0 fosse um retrato fiel do que chamamos de pitch), essa diferenciação entre material acústico e percepção também existe em fonética segmental. Sabemos que o som dos segmentos da fala humana é composto por um conjunto de frequências as quais chamamos de formantes. Esses formantes (normalmente medidos em Hertz) variam de acordo com o registro (um mesmo [a] dificilmente é produzido exatamente da mesma forma, ou seja, com as mesmas medidas para todos os 141 Podemos dizer que a frequência fundamental é um fenômeno físico, enquanto pitch é um fenômeno psicofísico. (Ladd, 2008, p. 5)
| 114 formantes). No entanto, se os valores dos formantes são variáveis, como um falante de português sabe, por exemplo, que uma vogal [e] não é igual a uma vogal [ɛ], além de, em contrapartida, identificar a mesma vogal [e] ainda que haja alguma variação nos formantes? Em outras palavras, qual é a “fronteira” entre as frequências formânticas que nos fazem perceber essas vogais de forma diferente? Fica claro aqui que nossa mente constrói uma abstração em cima de uma grandeza física (os formantes) – e isso antes mesmo de estabelecermos uma diferenciação fonológica (como seria o caso do PB, em que a oposição entre [e] e [ɛ] não existe em contexto pretônico). O raciocínio é exatamente o mesmo para a diferença entre a grandeza física de F0 e a abstração perceptual do pitch. Embora a curva da frequência fundamental apresente características que lhes são peculiares, nossa percepção cria uma abstração em cima disso, mantendo apenas as variações que são relevantes para a entoação percebida. E após isso ainda se extrai a informação fonológica linguisticamente relevante – que, no caso da entoação, envolve eventos tonais discretos, conforme explanado na seção anterior. Com base nas considerações acima, fica claro que existem duas frentes de análise diferentes: de um lado, é necessário extrair, da curva de F0 crua, o componente macroprosódico, ainda no nível fonético. Em seguida, é necessário descobrir qual é a realidade fonológica por trás dessas informações foneticamente percebidas no nível macroprosódico. Essa segunda “fase” do trabalho é crítica para a nossa hipótese, porque, após determinar o que é fonologicamente relevante, devemos proceder à pergunta: o que, desse material fonológico, é relevante para LF? Tal pergunta é importante porque, conforme defenderemos na conclusão desse trabalho, a fonologia é um componente da linguagem que estabelece relações com aspectos gramaticais strictu sensu (grosso modo, através da leitura da informação veiculada em PF) e com aspectos extragramaticais (como é o caso da pragmática). Enquanto a análise fonológica é totalmente dependente da teoria adotada, cuja escolha vai se refletir no método de anotação fonológica escolhido (e, conforme apontado na seção anterior, utilizaremos a AM), é possível realizar a primeira “fase” da análise sem uma teoria específica (podendo, inclusive, realizar tal análise de forma automática). A remoção dos aspectos microprosódicos da curva de F0 é feita através de um processo chamado estilização. Existem diversos modelos de estilização, alguns dos quais iremos apresentar na próxima seção.
3.2.1. Métodos de estilização da curva de F0 A estilização envolve a manipulação da curva de F0 e a consequente sintetização do registro, na tentativa de manter apenas as variações de frequência fundamental que sejam
| 115 perceptualmente relevantes. Desde a década de 1960, diversos modelos de estilização já foram propostos. O primeiro deles foi desenvolvido no Institute of Perception Research of Eindhoven (IPO). O modelo IPO parte do pressuposto de que a curva de F0 pode ser substituída (sendo o som ressintetizado) por uma sequência de linhas retas, ligadas entre si por alguns pontos julgados relevantes perceptualmente. O método de atribuição desses pontos é manual e subjetivo: o analista atribui o mínimo de pontos possível à curva de F0 de modo que, segundo seu julgamento, o som ressintetizado seja semelhante ao som original (i.e. sem perda de informação entoacional), método esse chamado de close copy stylization. Estudos posteriores refinaram o modelo IPO, utilizando contornos padronizados, de modo a tornar possível implementar noções como fronteiras. O método de copy closed stylization pode ser efetuado com o auxílio do programa Praat. O importante a notar no modelo IPO é que a interpretação da entoação se dá a partir de movimentos da curva de F0. Isso significa dizer que, ao efetuar o método de copy closed stylization, o analista não está preocupado em analisar os pontos de inflexão apontados, mas sim o movimento da curva entoacional resultante da atribuição desses pontos. Assim, ao se realizar uma interpretação fonológica de uma curva de F0 estilizada por copy closed stylization, o fonólogo deve se atentar para o fato de que não necessariamente os pontos de inflexão apontados na estilização são locais de atribuição de acentos tonais ou acentos de fronteira142. Enquanto o modelo IPO trabalha com movimentos tonais, controlados subjetivamente, para a estilização da curva do F0, outros modelos preferem analisar a frequência fundamental através de alvos. Esse é o caso do modelo desenvolvido por Daniel Hirst e Robert Espesser no Institut de Phonétique d’Aix-en-Provence. A diferença entre essas duas abordagens está no modo como se dá a transição entre os pontos. Nesse modelo (batizado de Momel – acrônimo de Modelling melody) um algoritmo computacional seleciona alvos na curva de F0 (calculados através de um modelo estatístico) e, através de uma função spline quadrática, é feita a interpolação entre esses alvos, de forma que o resultado é uma curva estilizada. O modelo Momel pode ser aplicado automaticamente através de um script para o programa Praat.143 Um terceiro modelo, escolhido por nosso trabalho, é o desenvolvido por Piet Mertens (d’Alessandro & Mertens, 1995; Mertens, 2004) e conhecido como Prosogram. Esse modelo é baseado no pitch percebido, o que o diferencia dos dois outros modelos apresentados. Enquanto
142
As análises fonológicas feitas pelos pesquisadores do IPO apresentavam uma taxonomia baseada exatamente nesses movimentos, propondo padrões como Type A fall, Type 2 rise, etc. Para mais informações sobre a interpretação fonológica desenvolvida dentro do modelo IPO, ver Ladd (2008, pp. 12–18). 143 Para mais informações sobre o modelo Momel, ver Hirst e Espesser (1993).
| 116 o modelo IPO é baseado na intuição do analista, e o Momel se baseia em um modelo estatístico, o método de identificação do que é relevante prosodicamente no modelo Prosogram é a percepção, como no caso do modelo IPO, mas sem a intervenção de um julgador humano. Esse modelo propõe que os tons aferidos em uma vogal podem ser estáticos (simples) ou dinâmicos (complexos): caso sejam estáticos, assume-se apenas um valor de tom medido para toda a vogal, enquanto os tons dinâmicos envolvem um movimento de subida ou descida, e são identificados a partir da aplicação de uma função matemática capaz de identificar o glissando threshold, o limite abaixo do qual uma variação da frequência fundamental não é percebida. D’Alessandro e Mertens (1995, pp. 264–266) mostram que uma variação de F0 que é relevante e normalmente seria percebida, não o é quando ocorre em um espaço de tempo muito curto. Assim sendo, o modelo Prosogram implementa um valor de glissando threshold capaz de apontar quando a variação de F0 é percebida e quando não é. O Prosogram pode ser aplicado como um script do programa Praat. A fim de exemplificar a aplicação desses três modelos, propomos a aplicação deles a uma frase do experimento que descreveremos na seção 3.4. A frase “A Gina fez café de noite” foi analisada usando os modelos IPO, Momel e Prosogram. O resultado está apresentado nas figuras 5-7 abaixo:
Figura 5: Curva de F0 da sentença “A Gina fez café de noite” estilizada pelo método close copy stylization Fonte: Elaboração própria
| 117 AVAMP1INF1
f0 (Hz)
350 300 250 200
a
ʒĩ A Gina
0
nɐ
fejʃ
ka
fɛ
d͡ʒi
noj
fez café time (secs.) [0..1.410]
t͡ʃɪ
de noite 1
Figura 6: Curva de F0 da sentença “A Gina fez café de noite” estilizada pelo método Momel Fonte: Elaboração própria
Figura 7: Curva de F0 da sentença “A Gina fez café de noite” estilizada pelo método Momel Fonte: Elaboração própria
Algumas considerações podem ser feitas a respeito do exemplo acima. Na seção 3.1.2, ao discutirmos a abordagem da AM, estabelecemos, para esse registro, a representação fonológica conforme dada em (138), repetida abaixo para conforto do leitor: (139)
A Gina fez café de noite [LH* HL* L%]
Comparando essa representação fonológica com os métodos de estilização demonstrados acima, podemos ver que, inicialmente, o modelo IPO indicou um movimento de subida na sílaba tônica do primeiro sintagma fonológico (a GIna); o modelo também apresenta uma manutenção da entoação até a sílaba que abre o último sintagma fonológico, local em que há uma subida da curva de F0 e posterior movimento de descida na sílaba tônica (de NOIte). Esses movimentos podem ser perfeitamente interpretados de acordo com a notação que demos em (139) acima.
| 118 Passando a análise para o modelo Momel, percebemos alguns problemas. Em primeiro lugar, percebemos que o algoritmo fez uma detecção de F0 cru que não condiz com a realidade (indicado pela linha verde): no início do registro não há uma descida brusca do F0. Ainda que a estilização tenha desconsiderado esse erro (indicado pela linha vermelha), isso é preocupante, pois em alguns outros pontos é possível que o algoritmo determine um alvo em uma posição na qual justamente ocorreu um erro de detecção. Além disso, em alguns casos, é complexa a interpretação fonológica da estilização feita pelo Momel, especialmente quando feita utilizando uma teoria de constituintes prosódicos (como o modelo que estamos adotando aqui). O exemplo acima ilustra bem isso: o algoritmo identificou alvos em posições não vocálicas (como no final da sílaba e no início das sílabas e <de>), além de identificar alvos em posições que não condizem com núcleos de constituintes prosódicos. Por exemplo, se fôssemos analisar a estilização feita a partir da taxonomia proposta pelo modelo ToBI e levando em conta noções de Fonologia Prosódica, possivelmente chegaríamos a conclusão de que a representação correta da sentença seria algo como (141) abaixo, bastante diferente do que já propomos144: (140)
A Gina fez café de noite [L* HL* HL* L%]
A anotação dada acima incorre em certa medida de inadequação, pois, na verdade, o pico identificado pelo algoritmo foi localizado na tônica de . Para solucionar esses problemas, seria necessário empreender uma correção, caso a caso, dos alvos identificados pelo Momel, o que tornaria o modelo próximo da metodologia da estilização via close copy stylization. Por fim, analisando o output da análise feita pelo Prosogram, percebemos que o resultado torna bastante simples a interpretação utilizando modelos como o que estamos adotando nesta dissertação. O Prosogram efetua a análise em cada vogal, de modo que o analista, levando em conta o modelo fonológico adotado, empreenderá a anotação de acordo com os pressupostos de tal modelo. Inicialmente, percebemos uma pequena subida (2 ST) na sílaba tônica do primeiro sintagma fonológico (a GIna), enquanto o tom alto se mantém com pouquíssimas variações até a sílaba tônica do último sintagma fonológico (de NOIte), local em que há um movimento acentuado de descida (5 ST). Esses dados corroboram nossa análise preliminar sobre os tons associados a essa frase.
144
Hirst (2011, p. 65) afirma que os pontos-alvo não devem ser necessariamente considerados como possuindo alguma realidade psicológica. No entanto, mesmo se considerarmos apenas os movimentos efetuados pela curva de F0, seríamos tentados a analisar a fonologia da frase da forma expressa em (141).
| 119 O exemplo acima serviu para ilustrar a comparação desses três modelos de estilização. Neste trabalho, ao analisar os dados do experimento que fizemos, escolhemos utilizar o Prosogram, justamente por considerarmos de interpretação mais fácil e confiável, além de poder ser aplicado de maneira automática aos dados – um fator que foi importante para escolhermos descartar o método IPO de close copy stylization. 3.3.Análises sobre a prosódia do foco Antes de adentrar na análise dos nossos dados, vamos apresentar nossas considerações sobre quatro análises da focalização em PB: Moraes (2006), Fernandes (2007), Araújo (2015) e Carnaval (2017) e, além da análise de Bocci (2013), baseada no italiano. Nos próximos parágrafos vamos apresentar tais propostas para, na próxima seção, apresentar e discutir os resultados dos testes que efetuamos.
3.3.1. Moraes (2006) O trabalho de Moraes a respeito da prosódia do foco é interessante justamente porque lida com um tipo especial de entoação “contrastiva” que não envolve exaustividade. Esse tipo de sentença, com o contexto que lhe propicia, pode ser exemplificado por (152) abaixo (141) A: Você sabia que o Pedro pintou o muro ontem? B: Olha, o José pintou o muro ontem. (quanto a Pedro, eu não sei, talvez também tenha também pintado o muro). (João Antônio De Moraes, 2006 s/p. Adaptado) Moraes argumenta que sentenças como (152B) são caracterizadas por um movimento ascendente na sílaba tônica do elemento contrastado, que se mantém alto formando um plateau até a sílaba pretônica final da sentença, marcada por um movimento descendente. Por esse motivo, o autor argumenta que a notação fonológica para esse tipo de sentença seja:
(142) José pintou o muro ontem. g g H* HL* L% Para o foco contrastivo com exaustividade, o autor propõe a seguinte representação: (143) José pintou o muro ontem. g g
| 120 HL*
LL*
L%
A comparação das conclusões assumidas por Moraes com as assumidas por Carnaval revela um fator interessante: como vimos na seção anterior, a diferença encontrada por Carnaval entre os focos informacional e contrastivo resumiu-se a parâmetros acústicos de intensidade e amplitude da curva entoacional. Por outro lado, Moraes, ao comparar a focalização contrastiva com exaustividade com aquela sem exaustividade, assume que a diferença entre esses dois tipos de contraste reside na associação de tons diferentes (HL* para o foco contrastivo exaustivo e H* para o foco contrastivo não exaustivo). Isso demonstra que a diferença que, segundo nossa hipótese, se encontra em aspectos pragmáticos não envolve alteração do tom especificado, enquanto a diferença entre ausência e presença de exaustividade consiste na mudança do tom associado, um tipo de mudança mais acentuada e provavelmente gramatical.
3.3.2. Fernandes (2007) O trabalho de Fernandes, embora seja restrito à chamada focalização informacional do sujeito e faça uma comparação entre português brasileiro e português europeu (empreitada que não propomos nesta dissertação)145, apresenta algumas considerações interessantes para nossa análise. A autora analisa em seu experimento 3 falantes de PB, todas do sexo feminino, provenientes da cidade de Campinas (SP), da faixa etária de 16 a 22 anos e com segundo grau completo. Os materiais utilizados pela autora compreendem 56 sentenças, distribuídas de acordo com o tipo de verbo (inacusativo, inergativo e transitivo) e composição do sintagma sujeito (longo, ramificado ou não, ou curto) focalizados informacionalmente ou não. A análise fonológica feita por Fernandes se baseou na ATM, fornecendo, portanto, uma base de comparação com o nosso trabalho. Analisando as sentenças com foco amplo (chamadas por ela de “sentenças neutras”), Fernandes chega à conclusão de que, sistematicamente, há a associação do tom L*H nos sintagmas fonológicos precedentes do foco e de um tom HL* no último sintagma fonológico da sentença, como mostra o exemplo em (142) abaixo: (144)
145
[[(as aLUnas)ω(JOvens)ω]φ[(cheGAram)ω(HOje)ω]φ]I | | | | L*+H L*+H L*+H H+L*
Por esse motivo nos restringiremos a apresentar as considerações da autora apenas para o português brasileiro e exclusivamente a respeito da análise entoacional. Os demais aspectos tratados por Fernandes que, embora interessantíssimos, não possuem relação com a discussão empreendida nesta dissertação não serão abordados aqui.
| 121 (Fernandes, 2007, p. 196) Por outro lado, as sentenças com foco prosódico informacional apresentaram um comportamento dúbio: em parte das sentenças, à sílaba tônica do sintagma focalizado foi associado um tom L*H, com a presença opcional de um acento frasal L associado à sílaba seguinte à tônica. Em outra parte dos dados, um tom H*L associado à sílaba tônica do sintagma focalizado, como exemplificado em (143) e (144) abaixo, respectivamente: (145)
[[(as meNInas)ω(BElas)ω]φ[(moRREram)ω]φ[(no LAgo)ω]φ]I | | | L*+H Lp H+L*
(146)
[[(os JOvens)ω]φ[(moRREram)ω]φ]I | | | H*+L H+L* Li (Fernandes, 2007, pp. 208–209)
Em configurações em que o sujeito é longo e não ramificado, há normalmente a associação de um tom nas sílabas pretônicas, ao passo que quando o sujeito focalizado e ramificado, há a preferência pela associação de um tom (L*H ou H*) à palavra prosódica precedente, embora essa associação seja opcional. Após essa análise, Fernandes chega às seguintes conclusões: (i) elementos focalizados em PB podem tanto receber acentos tonais diferentes em relação aos acentos tonais que receberiam se fossem produzidos em contexto neutro (H*+L versus L*+H), quanto receber acentos iguais aos que receberiam se fossem produzidos em contexto neutro (L*+H); (ii) as sentenças com sujeito focalizado em PB apresentam, como característica principal que as diferencia das sentenças neutras, a ausência de acentos tonais associados a palavras fonológicas intermediárias (entre a φ cabeça do φ que contém o sujeito focalizado e a ω cabeça do último φ de I); (iii) a presença de acento frasal associado à fronteira direita do φ que contém o sujeito focalizado é predominante nos dados de PB. (Fernandes, 2007, p. 213)
As conclusões às quais a autora chega parecem ir ao encontro da nossa análise. A ausência de dados com foco contrastivo não nos permite afirmar que o trabalho de Fernandes chega exatamente às mesmas conclusões que o nosso (de que o foco informacional pode ser associado tanto à prosódia neutra quanto à prosódia contrastiva), mas podemos ver, pela conclusão (i) da autora, que o foco informacional ora se assemelha ao foco amplo, ora se distingue dele. As afirmações em (ii) e (iii), que supostamente serviriam para diferenciar o foco informacional do foco amplo, podem ser esmiuçadas: quanto à (ii), sobre a ausência de tons intermediários associados às palavras prosódicas nas sentenças focalizadas, não parece ser
| 122 ligada diretamente a alguma questão estritamente gramatical (é estranho que a ausência de algo seja a manifestação fonológica de uma característica gramatical), podendo ser apenas algum tipo de marcador pragmático. Já no que diz respeito à conclusão (iii) de Fernandes, a autora afirma que a presença do acento frasal no contexto pós-foco é a codificação fonológica de uma estrutura sintática diferente para essas sentenças. Para esses casos, o sujeito focalizado se moveria da sua posição em TP para a camada C, cujo núcleo possuiria um traço de foco (representado por +F). Essa análise unificaria sentenças com foco in situ, sentenças formadas por Foco + que, clivadas canônicas e clivadas invertidas com foco pré-cópula. No primeiro caso, o núcleo C portador do traço +F não possuiria manifestação fonológica; no segundo e terceiro casos, o complementizador [que] seria a manifestação fonológica do núcleo +F de C; no quarto caso, [que] não possuiria o traço +F, de modo que a solução é o merge de uma cópula, possibilitando que o foco se mova para o CP dessa cópula, cujo núcleo possui o traço +F, com o posterior movimento da cópula para esse núcleo C. As representações dessas derivações são dadas, respectivamente, em (145-148) abaixo: (147) (148) (149) (150)
[CP As venezuelanasi [C’ +F [TP ti lavaram as luvas]]] [CP As velhasi [C’ que+F [TP ti choraram]]] [TP pro foramj [CP as venezuelanasi [C’ que+F [TP ti lavaram as luvas]]]] [CP As velhasi [C’ éj +F [TP tj [CP que -F [TP ti choraram]]]]] (Fernandes, 2007, p. 326)
Olhando apenas para o dado da focalização in situ (em (145)), a autora afirma que a presença do acento frasal pós-foco é responsável por desambiguizar a sentença com foco da sentença de foco amplo. Como veremos na seção 3.4., nosso experimento apresentou uma altíssima taxa de ocorrências de padrões prosódicos de foco (informacional) em contextos de foco amplo. Isso, aliado à altas taxas de confusão na identificação do tipo de foco, por parte dos sujeitos do teste de percepção que efetuamos, nos fornece base para assumir que, na realidade, foco amplo e foco informacional são bastante semelhantes, de modo que a desambiguização assumida por Fernandes não pode ser aceita para todos os casos. Além disso, a derivação sintática proposta por Fernandes, como veremos no próximo capítulo, não pode ser adotada uniformemente para os dados (devido à questão da focalização em ilhas sintáticas, que chamamos de “o problema das ilhas” e analisaremos na seção 4.3).
| 123 3.3.3. Araújo (2015) O trabalho de Araújo se coloca como alinhado parcialmente à nossa hipótese. O autor afirma que foco informacional e foco contrastivo não são diferenciáveis entre si – tanto em sentenças com foco in situ (denominadas por ele de sentenças SVO) quanto em clivadas, e efetua um experimento prosódico para embasar sua análise. Esse experimento foi composto de 144 sentenças, formadas por 18 sentenças produzidas por 8 informantes, sendo 4 sentenças SVO com foco contrastivo (no sujeito e no objeto) e 4 sentenças SVO com foco informacional (no sujeito e no objeto) – além da mesma distribuição para sentenças clivadas. 7 informantes eram do sexo feminino e 1 do sexo masculino, todos estudantes universitários na faixa de 19 a 25 anos e residentes na região metropolitana de Curitiba. Para a análise dos dados, o autor fez a escolha de utilizar o método de estilização Momel, enquanto para a anotação fonológica foi utilizado o sistema Intsint. Esse sistema, criado por Daniel Hirst (Hirst, 1987; Hirst & Di Cristo, 1998), se baseia na modelagem feita pelo Momel e envolve a atribuição de oito rótulos para os alvos identificados pela estilização:
1. Top: o valor mais alto de F0; 2. Bottom: o valor mais baixo de F0; 3. Mid: o valor médio de F0; 4. Higher: estabelecido em relação ao alvo anterior, envolve uma subida no valor de F0; 5. Same: estabelecido em relação ao alvo anterior, envolve a manutenção no valor de F0; 6. Lower: estabelecido em relação ao alvo anterior, envolve uma queda no valor de F0; 7. Upstepped: estabelecido em relação ao alvo anterior, envolve uma subida no valor de F0 menor do que a expressa por H; 8. Downstepped: estabelecido em relação ao alvo anterior, envolve uma queda no valor de F0 menor do que a expressa por L.
Um esquema de como esses rótulos interagem pode ser dado como na figura 8 abaixo:
| 124
Figura 8: Esquema de organização dos rótulos do modelo Intsint Fonte: Hirst (2011, p. 72)
De início já podemos tecer uma crítica a essa escolha. Embora o sistema Intsint seja utilizado como forma de representação da curva entoacional, o sistema não propõe que os alvos rotulados como T, B, M H, S, L U e D sejam, de fato, acentos tonais fonologicamente interpretados. Hirst (2011, p. 70) afirma que o modelo Intsint “foi originalmente desenvolvido como uma ferramenta para linguistas proverem uma representação fonológica de superfície de um padrão entoacional” (Tradução nossa)146. Além disso, o autor considera esse modelo como uma ferramenta capaz de prover descrições entoacionais preliminares de línguas que não possuam uma descrição de padrões entoacionais previamente estabelecidas (que não é o caso do PB). Assim sendo, a realização de afirmações categóricas a respeito da fonologia da entoação em PB não pode ser feita considerando diretamente o resultado da análise feita pelo Intsint, já que, na melhor das hipóteses, o output dessa análise é uma representação de superfície. Analisando os resultados do experimento147, Araújo chega à conclusão de que, no que diz respeito às sentenças com foco in situ, a maior parte dos informantes não fez distinção entre os tipos de foco, à exceção de alguns casos. O autor apresenta o seguinte resumo dos dados:
“[...]was originally developed as a tool for linguists to provide a surface phonological representation of an intonation pattern.” 147 Embora o experimento também considere sentenças clivadas, nós no delimitaremos a efetuar considerações sobre as sentenças com foco in situ, objeto desta dissertação. 146
| 125 SVO - foco no sujeito Informante 1
Informante 2
Informante 3
1 contorno: 4 produções# 2 contornos: contorno 1 - 3 produções contorno 2 - 1 produção# 2 contornos: contorno 1 - 3 produções contorno 2 - 1 produção# 2 contornos: contorno 1 - 2 produções contorno 2 - 2 produções
SVO - foco no objeto 1 contorno: 4 produções 1 contorno: 4 produções 1 contorno: 4 produções
Informante 5
1 contorno: 4 produções
Informante 6
2 contornos: contorno 1 - 3 produções contorno 2 - 1 produção#
2 contornos: contorno 1 - 2 produções contorno 2 - 2 produções 2 contornos: contorno 1 - 2 produções contorno 2 - 2 produções 2 contornos: contorno 1 - 3 produções contorno 2 - 1 produção
Informante 7
1 contorno: 4 produções
1 contorno: 4 produções
Informante 8
2 contornos: contorno 1 - 2 produções contorno 2 - 2 produções
1 contorno: 4 produções
Informante 4
Quadro 4: Resumo dos resultados encontrados por Araújo (2015) Fonte: Araújo (2015, p. 162. Adaptado)
Como o quadro acima mostra, os informantes de Araújo não apresentaram consistência na distinção na curva entoacional, especialmente no que concerne aos tipos de foco (segundo Araújo, apenas as produções do foco no objeto dos informantes 4, 5 e 6 são diferenciáveis pelo tipo de foco. Para analisar todos os informantes de forma única, o autor efetuou um procedimento de normalização dos valores de F0 (que foram apresentados em Hertz), baseandose em uma regra de três148. A análise das curvas de F0 normalizadas relevaram, segundo o autor, que não houve diferença relevante nas curvas de F0 para os diferentes tipos de foco: de maneira geral, o padrão entoacional do constituinte focalizado (independente se informacional ou contrastivamente) envolve um movimento de subida no material que antecede a sílaba tônica do foco, seguido de uma descida na sílaba tônica do foco (exemplificado na figura 9). Ainda há alguns casos (em algumas das falas dos informantes 2, 3, 5, 6 e 7) em que o movimento é de subida na sílaba tônica (exemplificado na figura 10):
148
Para detalhes do método de normalização adotado pelo autor, ver Araújo (2015, pp. 165–170).
| 126
Figura 9: Contorno de F0 da sentença “A Rebeca levou o Danilo”, com foco no objeto e padrão de descida na sílaba tônica do foco, segundo Araújo (2015) Fonte: Araújo (2015, p. 159)
Figura 10: Contorno de F0 da sentença “O Danilo escolheu a Marina”, com foco no sujeito e padrão de descida na sílaba tônica do foco, segundo Araújo (2015) Fonte: Araújo (2015, p. 145)
Embora seja notada essa variação na produção, não foi possível associar nenhum padrão a um tipo específico de focalização, o que corrobora, a priori, a hipótese de Araújo, de que não há diferenças prosódicas entre os tipos de foco. Uma das únicas diferenças atestadas por Araújo entre as sentenças com foco informacional e contrastivo diz respeito ao material pré-focal na focalização do objeto (o que, provavelmente, não possui relação estrita com os tipos de foco). Nossas considerações ao trabalho de Araújo se voltam para problemas metodológicos da abordagem: em primeiro lugar, como já assinalado, a escolha do método Intsint para efetuar uma análise fonológica não é a mais adequada, já que o próprio modelo se propõe como uma ferramenta descritiva de representações de superfície. Além disso, o desenho de experimento
| 127 não nos parece muito adequado para uma análise mais aprofundada: cada informante produziu apenas uma sentença de cada tipo de foco, o que não permite efetuar uma análise completa – caso um informante produzisse uma sentença com entoação aparentemente inadequada, não haveria registro para a condição em questão, o que inviabilizaria a comparação. Além disso, o desenho do experimento não era simétrico: não havia como comparar a produção da mesma sentença com padrões entoacionais diferentes. A única comparação que poderia ser feita envolvia sentenças diferentes, o que não é o ideal. Uma outra crítica que podemos tecer ao trabalho de Araújo diz respeito à falta da apresentação exaustiva dos dados: o autor não apresenta os contornos determinados para todos os dados, apenas mostra curvas que seriam “exemplos” das tendências gerais para a produção de cada um dos informantes. Isso é problemático, pois impede que seja feita uma análise mais completa do por outros pesquisadores, prejudicando a reprodutibilidade do experimento. Um último problema metodológico envolve a ausência de (i) tratamento estatístico dos dados e (ii) testes de percepção. O primeiro ponto não poderia, de fato, ser aplicado aos dados de Araújo, haja visto que há apenas uma ocorrência de cada condição para cada informante (daí o problema de dispor de um conjunto relativamente pequeno de dados), de modo que a ausência de modelagem estatística não nos permite saber se as pequenas diferenças entre os registros são relevantes ou não. O segundo ponto é problemático porque torna impossível determinar se os dados de produção realmente são associados (ou não) a diferentes tipos de foco. Por mais que a diferença fonética, segundo o autor, não seja relevante, é necessário que o julgamento feito por falantes da língua corrobore ou não essa afirmação. O problema da ausência de testes de percepção fica clara quando o autor afirma que determinados contornos entoacionais seriam “inadequados” para os contextos em questão. O único parâmetro de julgamento da inadequação dos contornos entoacionais seria o julgamento do próprio pesquisador, o que, em estudos de prosódia, não é o mais adequado149.
3.3.4. Carnaval (2017) O trabalho de Carnaval é interessante para nossa análise por envolver aspectos estritamente prosódicos, sendo, das três abordagens para o PB aqui apresentadas, a mais
149
É importante notar que testes de percepção prosódica não são iguais a testes de gramaticalidade, pois aqueles são muito mais sutis do que estes. E, mesmo assim, o julgamento de gramaticalidade de sentenças efetuado pelo próprio pesquisador ou por apenas um informante (o conhecido método Hey, Sally) já vem deixando de ser utilizado em pesquisas de cunho gerativo, dando lugar a análises experimentais mais refinadas (como testes de rastreamento ocular, leitura automonitorada, etc.)
| 128 específica na coordenação da manifestação do foco com a estrutura prosódica das sentenças, além de ser a mais bem embasada metodologicamente. A autora busca encontrar diferenças prosódicas na manifestação dos focos amplo/informacional e contrastivo, considerando possíveis interferências que o contexto prosódico pode fornecer nessa especificação. Em seu experimento, foi testada a diferença na manifestação do foco in situ na frase “O marido da Renata derrubou suco de laranja” em diferentes posições no enunciado, além do foco amplo:
i. [O marido] da Renata derrubou suco de laranja ii. O marido [da Renata] derrubou suco de laranja iii. [O marido da Renata] derrubou suco de laranja iv. O marido da Renata [derrubou] suco de laranja v. O marido da Renata derrubou [suco] de laranja vi. O marido da Renata derrubou suco [de laranja] vii. O marido da Renata derrubou [suco de laranja] viii. O marido da Renata [derrubou suco de laranja]
Para efetuar a análise, a autora fez um experimento de produção composto por 17 frases (8 com foco informacional, 8 com foco contrastivo e 1 com foco amplo). Essas frases foram produzidas por 4 informantes, dois do sexo feminino e dois do sexo masculino, totalizando 68 sentenças analisadas. Além de analisar os dados acústicos de F0, duração e intensidade, a autora ainda realizou um teste de percepção, no qual 20 sujeitos ouviam as 68 sentenças-alvo e deveriam (i) determinar o tipo de foco e (ii) identificar qual constituinte foi focalizado150. Na análise dos resultados – considerando tanto os dados acústicos quanto os índices de reconhecimento das frases –, Carnaval argumenta que o foco informacional e o foco amplo são associados ao tom HL*, de modo que, quando o foco informacional se encontra em posição final do sintagma entoacional, em geral foi confundido com o foco amplo. Essa confusão não ocorre quando o foco está em posição não final, contexto no qual, em geral, ocorre, segundo a autora, uma desacentuação (deaccenting) do material pós-focal. Por outro lado, o foco contrastivo, embora apresente o mesmo contorno melódico do foco informacional (um movimento descendente), seria caracterizado por uma acentuação nos parâmetros acústicos de intensidade e altura de F0, o que a levou a caracterizar o foco contrastivo com o uso dos
150
Para detalhes sobre a metodologia adotada pela autora, ver Carnaval (2017, pp. 48–58)
| 129 símbolos de upstep (!) e de maior intensidade (_). Dessa forma, a notação assumida por Carnaval para a diferenciação dos focos é: (151) O marido da Renata derrubou suco de laranja g g LH* HL* L%
amplo
(152) O marido [DA RENATA] derrubou suco de laranja informacional g g HL* LL* L% (153) O marido [DA RENATA] derrubou suco de laranja contrastivo151 g g ¡HL* LL* L% Na proposta de Carnaval, portanto, há diferença entre foco informacional e foco contrastivo devido à diferença de amplitude do movimento melódico e da maior intensidade na sílaba pretônica do foco, embora em termos de tom associado, ambos os focos são iguais, associados a um tom com padrão descendente, representado pelo símbolo HL*. Uma consideração importante que podemos fazer é a de que seja possível que a diferença de amplitude e intensidade sejam creditadas a aspectos pragmáticos do foco. Ao propor nossa análise fonológica, defenderemos a ideia de que, embora assumamos que a exaustividade seja o fator gramaticalmente relevante na codificação do foco, não estamos negando que exista a possibilidade de dotar a esse fenômeno sabores pragmáticos, que envolvam a apresentação de referentes (como é o caso do foco informacional) ou mesmo o ato de fala de denegação (como é o caso, seguindo a proposta de Menuzi (2012) para o foco contrastivo) – até porque negar isso seria negar a realidade dos fatos. Ao analisar o trabalho de Carnaval, é possível assumir que os parâmetros acústicos que motivaram a autora a anotar o foco contrastivo como ¡HL* sejam a manifestação justamente do valor denegativo do foco. Essa “informação prosódica” seria adicionada ao tom HL* associado ao foco pela interface que o subcomponente prosódico tem com fatores extragramaticais, como a pragmática152.
151
Carnaval ainda aponta a possibilidade de realização do foco contrastivo através de um tom L¡H* no lugar de ¡HL*. 152 No capítulo 5 iremos discutir em mais detalhes essa associação do componente prosódico com a pragmática, um nível da linguagem que, conforme argumentamos no capítulo anterior, não está contida dentro do conceito de gramática com o qual trabalhamos nesta dissertação.
| 130 3.3.5. Bocci (2013) Bocci (2013), trabalho situado na interface sintaxe-prosódia, assume que há diferenças na focalização do italiano que justificam uma abordagem sintática específica para diferentes tipos de foco. Embora nossas considerações sobre esse tema sejam feitas no capítulo 4, é interessante apontar aqui as características prosódicas encontradas pelo autor em seus experimentos. Do ponto de vista teórico, Bocci assume os mesmos pressupostos que adotamos nesse trabalho (a Fonologia Prosódica e a AM), e afirma que o subcomponente prosódico, através de dois conjuntos específicos de regras de mapeamento, “lê” a estrutura sintática e a converte em uma representação prosódica. Essas duas regras são (i) regras de mapeamento default, que não “enxergam” elementos como traços sintáticos, e têm como objetivos converter as unidades de computação sintática em unidades da hierarquia prosódica e atribuir os núcleos dessas unidades prosódicas; e (ii) regras de mapeamento sensíveis a traços, que teriam a capacidade de “enxergar” traços sintáticos e seriam responsáveis pela atribuição dos acentos tonais, especialmente quando os elementos dotados dos traços relevantes (como o foco) estão em uma posição na estrutura prosódica que não converge com o núcleo do constituinte prosódico em que estão inseridos. A natureza das regras de mapeamento default propostas por Bocci são baseadas no modelo de Selkirk – que, como vimos, é baseado em uma abordagem de restrições. No entanto, Bocci apresenta, em sua proposta, uma adaptação desse modelo para uma abordagem derivacional. O autor afirma que essas regras se compõem de três grupos, conforme abaixo:
a) Spell-out dos sintagmas prosódicos: (i)
XP → φ – Um XP (um sintagma qualquer) é especificado como um sintagma fonológico;
(ii)
S → ι – Um S (sentença) é especificado como um sintagma entoacional.
(iii)
U → υ – Um U (enunciado) é especificado como um enunciado prosódico
b) Restrições sobre nucleamento prosódico (violáveis): (i)
Núcleo φ: Um sintagma fonológico precisa ter núcleo
(ii)
Núcleo ι:
(iii)
Núcleo υ: Um enunciado precisa ter núcleo
Um sintagma entoacional precisa ter núcleo
c) Restrições sobre atribuição de núcleos às fronteiras (violáveis):
| 131 (i)
Fronteira direita φ-R: O núcleo de φ coincide com o núcleo do constituinte prosódico mais à direita dentro do sintagma fonológico.
(ii)
Fronteira direita ι-R: O núcleo de ι coincide com o núcleo do constituinte prosódico mais à direita dentro do sintagma entoacional.
(iii)
Fronteira direita υ-R: O núcleo de υ coincide com o núcleo do constituinte prosódico mais à direita dentro do enunciado. (Bocci, 2013, p. 115. Tradução nossa)153
As regras de mapeamento sensíveis a traços interagem com as regras default, de modo que podem alterar o posicionamento de acentos tonais. Esse posicionamento é necessário para explicar casos como o da focalização, em que o acento nuclear da sentença não recai sobre o elemento mais à direita (o que seria exigido pelas restrições sobre atribuição de núcleos às fronteiras (apresentado em (c) acima). Nessa proposta, o traço sintático de foco estaria visível à prosódia, que “corrigiria” o posicionamento do núcleo da sentença para a posição em que o foco se encontra154. Partindo desses pressupostos, Bocci efetua suas análises sobre o italiano falado em Siena. O autor efetuou dois experimentos: o primeiro, envolvendo três falantes do sexo feminino, entre 24 e 49 anos, residentes da cidade de Siena, foi composto por 38 sentenças, com 4-5 repetições cada, totalizando 486 dados. O segundo experimento envolveu dois falantes do sexo masculino (25 e 50 anos), também moradores da cidade de Siena. Esse experimento também foi composto por 38 sentenças, com 4-5 repetições cada, totalizando 352 dados. O segundo experimento ainda envolveu um corpus secundário, composto por 20 estímulos, divididos entre sentenças declarativas e interrogativas, com 4-6 repetições cada, totalizando 208
“a. Spell-out of prosodic phrases (i) “XP” = φ: An “XP” is spelled out as a phonological phrase (ii) “S” = ι: An “S” is spelled out as an intonational phrase (iii) “U” = υ: An utterance is spelled out as a prosodic utterance phrase b. Prosodic headedness constraints (violable) (i) Head φ: A phonological phrase must be headed (ii) Head ι: An intonational phrase must be headed (iii) Head υ: An utterance phrase must be headed c. Prosodic head-edgemost constraints (violable) (i) Head-Edge φ-R: The head of φ coincides with the head of the rightmost prosodic constituent within the pho- nological phrase (ii) Head-Edge ι-R: The head of ι coincides with the head of the rightmost prosodic constituent within the into- national phrase (iii) Head-Edge υ-R: The head of υ coincides with the head of the rightmost prosodic constituent within the utter- ance phrase” 154 Propostas que não envolvem tais regras sensíveis a traços comumente assumem que o material pós-focal é extramétrico (invisível ao fraseamento), para que o acento nuclear recaia sobre o elemento mais à direita, que, nesse caso, seria o foco. Para detalhes desse tipo de proposta (contra a qual Bocci argumenta), ver Frota (2000) 153
| 132 dados. Todos os experimentos envolviam sentenças colocadas em contextos escritos em cartões no formato de script, em diálogos nos quais o informante deveria ler ambas as falas. Tais contextos forçavam uma interpretação dos diferentes tipos de foco (amplo, informacional e contrastivo), além de sentenças de topicalização155. O autor procedeu à anotação fonológica da curva entoacional, em ambos os experimentos, através do modelo ToBI. Ele chegou aos seguintes resultados:
Tipo de foco
H*
HL* Occ % 58 90.6%
LH* Occ % 1 1.6%
Total Occ % 64 100%
Occ 5
% 7.8%
Foco informacional
10
8.5%
82
70.1%
25
21.4%
117
100%
Foco contrastivo
3
1.8%
11
6.7%
151
91.5%
165
100%
Total
18
5.2%
151
43.6%
177
51.2%
346
100%
Foco amplo
Quadro 5: Resultados encontrados por Bocci (2013), no experimento A Fonte: Bocci (2013, p. 127. Adaptado)
Tipo de foco Foco amplo Foco informacional Foco contrastivo Total
H* Occ 5 21 1 27
% 9.8% 21.4% 0.5% 7.7%
HL* Occ % 46 71.9% 66 67.3% 1 0.5% 113 32.1%
LH* Occ % 0 0.0% 11 11.2% 201 99.0% 212 60.2%
Total Occ % 51 82% 98 100% 203 100% 352 100%
Quadro 6: Resultados encontrados por Bocci (2013), no experimento B Fonte: Bocci (2013, p. 127. Adaptado)
De posse desses dados, Bocci chega à conclusão de que “parece ser suficientemente seguro concluir que [foco contrastivo], de um lado, e foco informacional e foco amplo, de outro, são fonologicamente distintos” (Bocci, 2013, p. 135. Tradução nossa)156. Embora, segundo os resultados de Bocci, de fato haja uma diferença entre os tons atestados nos registros de foco contrastivo em relação aos focos informacional e amplo, o autor não explica o porquê de haver uma certa variabilidade na produção do foco informacional (representado, por exemplo, no fato de que, no experimento A, pouco mais de 1/5 das ocorrências de foco informacional foi produzida com o padrão LH*, típico do foco contrastivo). Uma possibilidade seria justamente
155
Por não possuir relação com nosso tema, ignoraremos as considerações de Bocci a respeito desses dados de topicalização. Para informações detalhadas da metodologia adotada pelo autor, ver Bocci (2013, pp. 120–125). 156 “it seems sufficiently safe to conclude that [contrastive focus] on the one hand, and informational focus and broad focus on the other, are phonologically distinct”
| 133 a interpretação exaustiva, perfeitamente possível em contextos nos quais ocorre o foco informacional (conforme já discutimos no capítulo 2). Das conclusões que Bocci tira dos resultados do experimento, podemos citar as seguintes: 1. Há necessidade das regras de mapeamento sensíveis a traços, já que as regras default não são capazes de dar conta das diferenças entre tipos de foco (pois sentenças focalizadas envolvem a atribuição de proeminência nuclear fora da posição mais à direita do sintagma entoacional); 2. Há evidências para a existência de uma tipologia do foco; 3. Como os tipos de foco são diferentes em italiano, as abordagens que eliminam o foco da gramática não conseguem dar conta dessa diferença fonológica entre os tipos de foco.
Sobre o ponto 3 acima, haveria a possibilidade de assumir, então, que apenas o foco contrastivo é codificado na gramática. Bocci contra-argumenta da seguinte forma:
a) Belletti (2004a), argumenta que o foco informacional no italiano possui uma projeção dedicada na camada IP. Como o movimento sintático depende de traços que o motivem, é consequência lógica que o foco informacional envolva um traço sintático que licencie o movimento; b) O foco possui a propriedade de singularidade: pode haver apenas um foco por sentença, independente se é informacional ou contrastivo. Não é possível dar conta dessa propriedade se não se assumir que o foco informacional também é dotado de um traço. c) Foco informacional, foco contrastivo e elementos-wh são similares na interface prosódica: (1) eles assumem a proeminência tonal, substituindo a proeminência tonal atribuída pelas regras de mapeamento default e (2) eles disparam um acento tonal L* associado ao que linearmente os seguem.
Por mais convincentes que os argumentos de Bocci possam parecer, o problema de se considerar a codificação de diferentes tipos de foco na gramática, utilizando, para isso, a diferença prosódica entre foco contrastivo e foco informacional é a de que, caso tal diferença ocorra, o foco amplo (sentença neutra) também deveria ser codificado na gramática – inclusive devendo ser codificado da mesma forma que o foco informacional, já que, do ponto de vista
| 134 prosódico, foco informacional e foco amplo se comportaram da mesma maneira no experimento de Bocci. No entanto, é bastante complexo assumir que todas as sentenças da língua devam possuir codificação de foco, dada a falta de evidência empírica (por exemplo, línguas de foco morfológico não são obrigadas a manifestar morfema de foco em todas as sentenças). Assim sendo, é uma opção bem mais coerente assumir que, caso foco deva ser codificado na gramática, apenas um desses “tipos” seja codificado. Quanto aos demais argumentos contra essa conclusão, na seção 4.2 nos dedicaremos a considerar cada um deles. Após a análise desses 5 trabalhos que propõem análises sobre a focalização, passaremos, na próxima seção, a apresentar a metodologia e os resultados do experimento que empreendemos, para, em seguida, apresentar nossa interpretação fonológica dos dados. 3.4.Nosso experimento De posse das informações levantadas nas seções anteriores, temos uma base para apresentar o modelo de experimento que realizamos, na tentativa de encontrar alguma diferença prosódica capaz de fornecer embasamento empírico para propor que o traço de [exaustividade] está codificado em PF. O experimento consistiu tanto em testes de produção (em que o informante lia uma sentença focalizada, sendo gravado) quanto em testes de percepção (informantes julgavam as sentenças produzidas quanto à focalização). Nas próximas subseções detalharemos cada um desses testes e apresentaremos os resultados.
3.4.1. Teste de produção: metodologia O teste de produção foi composto por 5 frases, cada uma com um constituinte focalizado, conforme apresentado abaixo: I. II. III. IV. V.
Sujeito (SJ): “[O Gustavo] vai ser pai” Complemento nominal (CN): “O irmão [da Rosa] comprou a casa da esquina” Adjunto adverbial (AV): “A Gina fez café [de noite]” Objeto (OD): “A Flávia vai comprar [um carro] mês que vem Verbo (VB): “Minha irmã [trabalhou] ontem”
Essa escolha foi motivada pelo fato de que a maior parte dos estudos sobre focalização (especialmente no que concerne à Cartografia Sintática), envolvem apenas dados de focalização de sujeito e/ou objeto. No entanto, é claro que a natureza sintática do constituinte focalizado não interfere na atribuição de acentos tonais (como nossos dados apontam). O fator relevante
| 135 nesses casos é a posição do sintagma na estrutura prosódica (inicial, medial ou final). No entanto, por motivos de metodologia, não levamos essa característica em consideração. Cada frase foi apresentada 4 vezes, com tipos diferentes de foco (amplo 157, informacional, contrastivo e mirativo.)158, sendo produzidas 3 repetições para cada condição, resultando em um total de 60 registros por informante. Tais condições foram submetidas a 4 informantes, 2 do sexo masculino e 2 do sexo feminino (totalizando 240 dados), com idade entre 18 a 30 anos, todos estudantes do curso de Letras da Universidade Federal do Rio de Janeiro (2º e 3º períodos), sem treinamento prévio em fonética. As gravações foram feitas em sala com isolamento acústico, utilizando o microfone Zoom modelo H4n. Os dados foram analisados utilizando o programa Praat (Boersma & Weenink, 2018). Primeiro, fizemos a segmentação dos dados (utilizando o plugin Easy Align do Praat (Goldman, 2011) e efetuando manualmente as correções necessárias). Em seguida, corrigimos a curva de F0 manualmente159. Para a análise das curvas entoacionais (que será efetuada na seção 3.4.3.), utilizamos o modelo Prosogram (Mertens, 2004) para efetuar a estilização da curva de F0, a qual utilizamos como auxílio para efetuar a anotação seguindo o modelo ToBI (Beckman & Gayle, 1997; Beckman & Hirschberg, 1994). Os informantes eram expostos a diálogos escritos em cartões, de modo que o informante lia as falas do personagem do diálogo no qual continha a frase-alvo, enquanto o pesquisador lia as falas do outro personagem no diálogo (quando fosse o caso). Os itens (155-148) abaixo representam algumas dessas falas160. (154) Frase 20 (Foco amplo) (Rafael e Informante se encontram depois de um tempo sem se ver) Informante: Oi, Rafael! Tudo bem? Rafael: Tudo bem, [Informante]. E você? Quais são as novidades? Informante: Eu tô ótimo. O Gustavo vai ser pai. Você soube? (155) Frase 4 (Foco contrastivo no constituinte sujeito)
Obviamente, embora utilizemos a nomenclatura “foco no constituinte X” para facilitar a referência às frases, ao nos referirmos ao foco amplo estamos considerando que não há foco marcado. 158 Ver página 17 para a explicação da distinção dos tipos de foco. 159 A correção da curva envolve acertar erros de detecção (como vozeamento detectado em consoantes surdas e saltos de oitava – quando o algoritmo não identifica a frequência de F0 corretamente, apontando para uma oitava acima ou uma oitava abaixo) e erros relacionados a creaky voice, a qual, na maioria dos casos, consistiu na eliminação do vozeamento, para evitar erros de interpretação. 160 O Anexo I desta dissertação contém todas as falas. 157
| 136 (Rafael e Informante estão conversando. Rafael afirma que Paulo vai ser pai, mas Informante o corrige) Rafael: [Informante], eu fiquei sabendo que o Paulo vai ser pai! Que bom, né? Informante: Não, Rafael. O Gustavo vai ser pai. Quem te disse que era o Paulo?
(156) Frase 12 (Foco mirativo no constituinte sujeito) (Informante está contando para Rafael sobre Gustavo, amigo de ambos que disse que nunca iria ser pai. [Informante] ficou surpreso(a) de que logo o Gustavo seria pai) Informante: Rafael, adivinha só! O Gustavo vai ser pai!
(157) Frase 8 (Foco informacional no constituinte sujeito) (Rafael e Informante estão conversando) Rafael: [Informante], eu soube que alguém na tua família vai ser pai, é verdade? Quem é? Informante: O Gustavo vai ser pai. Tá todo mundo muito feliz lá em casa. 3.4.2. Teste de produção: análise acústica Nesta seção, iremos apresentar uma análise de dados acústicos, considerando os valores de duração, F0 e intensidade, extraídos através de um script, desenvolvido por nós, para o Praat.
As variáveis analisadas foram: 1. Alongamento (em milissegundos) da vogal tônica do constituinte focalizado em relação ao foco amplo; 2. Diferença da média de F0 (em semitons) da vogal tônica do constituinte focalizado em relação ao foco amplo; 3. Diferença na variação de F0 (em semitons) entre o máximo e o mínimo valor F0 considerando a vogal pretônica e tônica do constituinte focalizado em relação ao foco amplo; 4. Diferença da média da intensidade (em decibéis) da vogal tônica do constituinte focalizado em relação ao foco amplo.
| 137 A fim de eliminar variações causadas por fatores como duração intrínseca da vogal, ritmo de fala dos informantes, F0 e intensidade naturais dos informantes, etc., nós efetuamos uma normalização dos dados, calculando por cada vogal a diferença entre um valor de referência e o valor observado na vogal considerada. Esse valor de referência foi calculado como o valor médio da medida considerada sobre as três repetições do foco amplo. A diferença foi calculada como o logaritmo da razão entre o valor observado na vogal e o valor de referência; utilizar uma escala logarítmica garante a simetria das diferenças positivas ou negativas. Essa normalização foi feita utilizando dois cálculos, um para a duração e outro para a média de F0 em semitons e para a intensidade em decibéis (porque esses dois últimos já são medidas em escala logarítmica – os cálculos são similares nos três casos) O cálculo de normalização da duração consiste na seguinte fórmula: 𝐷𝑥𝑦
diferença = 𝑙𝑜𝑔2 (𝑀𝐴𝑥𝑦), onde: MA = Média das medidas observadas (duração, F0 e intensidade) para o foco amplo do informante x na frase y (já que cada frase tem uma vogal diferente focalizada) – esse é o valor de referência; D = Dado em questão do informante x na frase y. Um exemplo para ficar claro: os dados do informante M2 para a duração da vogal tônica no foco contrastivo e amplo estão apresentados no quadro abaixo:
Estímulo AV_AMP_1_INF5 AV_AMP_2_INF5 AV_AMP_3_INF5 CN_AMP_1_INF5 CN_AMP_2_INF5 CN_AMP_3_INF5 OD_AMP_1_INF5 OD_AMP_2_INF5 OD_AMP_3_INF5 SJ_AMP_1_INF5 SJ_AMP_2_INF5 SJ_AMP_3_INF5 VB_AMP_1_INF5 VB_AMP_2_INF5 VB_AMP_3_INF5
Duração Tipo de foco (ms) 96 84 94 142 124 136 83 138 149 108 100 80 126 60 100
AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO
Estímulo AV_CON_1_INF5 AV_CON_2_INF5 AV_CON_3_INF5 CN_CON_1_INF5 CN_CON_2_INF5 CN_CON_3_INF5 OD_CON_1_INF5 OD_CON_2_INF5 OD_CON_3_INF5 SJ_CON_1_INF5 SJ_CON_2_INF5 SJ_CON_3_INF5 VB_CON_1_INF5 VB_CON_2_INF5 VB_CON_3_INF5
Duração (ms)
Tipo de foco
167 153 158 147 174 172 179 168 202 110 54 85 110 142 139
CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO
Quadro 7: Duração da vogal tônica do foco na focalização ampla e contrastiva produzidas pelo informante M2 Fonte: Elaboração própria
| 138 Aplicando a fórmula acima a, por exemplo, o dado SJ_CON_3_INF5161, temos o seguinte cálculo: 85 𝑥 = 𝑙𝑜𝑔2 ( ) = −0.18 96 Dessa forma, o valor normalizado é de -0.18. Essa medida equivale, em escala logarítmica, à proporção de alongamento (no caso em questão, encurtamento, já que o valor é negativo) da vogal tônica no foco do dado em questão em relação ao foco amplo, que é tomado como base de comparação por ser a forma neutra da sentença. Esse método de normalização elimina variações na duração intrínsecas aos falantes e às vogais focalizadas, sendo mais confiável na análise. Quanto aos dados de média/variação de F0 e de intensidade, como as medidas que estamos usando são semitons e decibéis, respectivamente, não se faz necessário que haja uma transformação em escala logarítmica (pois semitom e decibel já são medidas em tal escala), de modo que a fórmula que aplicamos é a seguinte: 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 = 𝐷𝑥𝑦 − 𝑀𝐴𝑥𝑦, onde: MAxy = Média das medidas observadas (duração, F0 e intensidade) para o foco amplo do informante x na frase y (já que cada frase tem uma vogal diferente focalizada) – esse é o valor de referência; Dxy = Dado em questão do informante x na frase y. O resultado dessa fórmula indica a diferença de F0 ou intensidade de um dado estímulo em relação à média do foco amplo para as mesmas condições (informante e frase), exceto para a condição em questão, que é o tipo de foco. Um exemplo:
161
Esse dado se refere ao foco no sujeito, contrastivo, 3ª repetição, produzido pelo informante M2.
| 139
Estímulo
Média F0 Tipo de foco (ST)
AV_AMP_1_INF5 AV_AMP_2_INF5 AV_AMP_3_INF5 CN_AMP_1_INF5 CN_AMP_2_INF5 CN_AMP_3_INF5 OD_AMP_1_INF5 OD_AMP_2_INF5 OD_AMP_3_INF5 SJ_AMP_1_INF5 SJ_AMP_2_INF5 SJ_AMP_3_INF5 VB_AMP_1_INF5 VB_AMP_2_INF5 VB_AMP_3_INF5
84 84 85 89 89 89 85 89 86 88 90 88 88 89 91
AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO AMPLO
Estímulo AV_CON_1_INF5 AV_CON_2_INF5 AV_CON_3_INF5 CN_CON_1_INF5 CN_CON_2_INF5 CN_CON_3_INF5 OD_CON_1_INF5 OD_CON_2_INF5 OD_CON_3_INF5 SJ_CON_1_INF5 SJ_CON_2_INF5 SJ_CON_3_INF5 VB_CON_1_INF5 VB_CON_2_INF5 VB_CON_3_INF5
Média F0 (ST)
Tipo de foco
86 86 85 87 86 85 85 87 88 88 86 91 89 88 88
CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO CONTRASTIVO
Quadro 8: Média de F0 na vogal tônica do foco na focalização ampla e contrastiva produzidas pelo informante M2 Fonte: Elaboração própria
No quadro acima, o cálculo da diferença da média de F0 no dado SJ_CON_3_INF5, por exemplo, seria: 𝑥 = 91 − 88,67 162 𝑥 = 𝟐, 𝟑𝟑 semitons O número 2,33 indica que a diferença da média de F0 na vogal tônica do foco entre o dado SJ_CON_3_INF5 e os dados de foco amplo nessa mesma frase é de 2,33 semitons. Quanto ao tratamento estatístico dos dados, a metodologia adotada envolveu um modelo de regressão linear generalizado de efeitos mistos163. A característica desse modelo é a capacidade de isolar a atuação de fatores considerados aleatórios, ou seja, fatores que, embora afetem a variância dos dados, não são de interesse da análise. Dessa forma, nossa análise estatística busca responder à seguinte pergunta: a diferença entre tipos de foco é estatisticamente relevante na variação da diferença na duração, média de F0, intensidade e variação do F0 da vogal tônica do foco?164 Nosso modelo foi feito considerando como efeitos fixos o tipo de foco (com 4 níveis) e o sintagma focalizado (5 níveis), e como efeitos aleatórios o informante (4 níveis).
162
O número 88,67 é a média de F0 das ocorrências de foco amplo do informante M2 nas frases com sujeito focalizado, que podem ser vistas no quadro 8 (indicadas pela sequência SJ). 163 Através da função lmer() do pacote lme4 do programa R. 164 Para mais informações a respeito do modelo, ver Crawley (2013, cap. 19).
| 140 Nas subseções seguintes apresentamos os resultados para cada uma dessas variáveis analisadas, seguindo a metodologia apresentada anteriormente. Em seguida, iremos apresentar considerações gerais a respeito das curvas entoacionais de cada informante. 3.4.1.1. Duração No gráfico abaixo, apresentamos a distribuição dos valores da diferença da duração (seguindo a metodologia de normalização descrita acima) por tipo de foco:
Figura 11: Gráfico da distribuição dos valores de alongamento na vogal focalizada por tipo de foco Fonte: Elaboração própria
O gráfico acima mostra claramente que o alongamento da vogal tônica do foco contrastivo apresenta uma diferença – em relação à média das ocorrências do foco amplo – muito superiores aos demais tipos de foco. Os focos informacional e mirativo, por outro lado, apresentam alongamento semelhante entre si e levemente superiores ao foco amplo. Nos gráficos, apresentamos a distribuição dos valores pelos fatores sintagma focalizado e informante:
Figura 12: Gráfico da distribuição dos valores de alongamento na vogal focalizada por sintagma focalizado Fonte: Elaboração própria
| 141
Figura 13: Gráfico da distribuição dos valores de alongamento na vogal focalizada por informante Fonte: Elaboração própria
Analisando ambos os gráficos, vemos duas características interessantes: de um lado, os estímulos com focalização no sujeito apresentaram um valor muito baixo de diferença em relação ao valor de referência, enquanto os estímulos produzidos por M1 apresentaram valores bastante altos da diferença em relação aos demais informantes. Essa variação relacionada aos informantes nos parece ser aleatória, por esse motivo consideramos o fator informante como tal na execução do modelo estatístico, colocando o tipo de foco e o sintagma focalizado como fatores fixos. Essa análise é demonstrada o quadro abaixo165:
Predictors Intercept) CONTRASTIVO INFORMACIONAL MIRATIVO ADVERBIAL COMPLEMENTO NOMINAL OBJETO VERBO Observations Marginal R2
Estimates -0.16 0.42 0.19 0.19 0.19 0.13 0.14 0.19
std. Error t value 0.07 -2.11 0.06 6.90 0.06 3.06 0.06 3.03 0.07 2.74 0.07 1.83 0.07 2.01 0.07 2.77 240 0.249
p 0.036 0.001 0.003 0.003 0.007 0.068 0.046 0.006
Quadro 9: Resultado do modelo linear de efeitos mistos para alongamento da vogal tônica do foco considerando todos os tipos de foco e todos os sintagmas focalizados Fonte: Elaboração própria
O resultado acima nos diz que, na comparação com o foco amplo, todos os tipos de foco se diferenciaram, com relevância estatística. Da mesma forma, todas as frases (exceto a focalizada no complemento nominal) se diferenciaram da focalizada no sujeito. No entanto, percebemos que os valores de estimate dos focos informacional e mirativo são bastante
165
Os quadros de resultado do modelo linear de efeitos mistos foram feitos utilizando a função tab_model() do pacote sjPlot do programa R.
| 142 próximos, bem como os valores de todas as frases. Por isso, podemos tentar efetuar um modelo mais simples, que desconsidere a diferença entre focos informacional e mirativo, bem como a diferença entre foco no adjunto adverbial, no complemento nominal, no objeto e no verbo, comparando tal modelo com o do quadro 9 e verificando, via teste ANOVA166, se há diferença entre os modelos167. Nos quadros abaixo, apresentamos o resultado do modelo mais simples e da comparação entre modelos:
Predictors (Intercept) CONTRASTIVO INF-MIR AOVCN Observations R2
Estimates std. Error t value p -0.16 0.07 -2.12 0.035 0.42 0.06 6.94 <0.001 0.19 0.05 3.53 0.001 0.16 0.05 2.97 0.003 240 0.244
Quadro 10: Resultado do modelo linear de efeitos mistos para alongamento da vogal tônica do foco, desconsiderando a diferença entre foco informacional e mirativo e considerando apenas a distinção sujeito-demais frases Fonte: Elaboração própria
AIC BIC logLik Pr(>Chisq) model_dur2 172.10 203.43 -77.052 Model_dur3 167.58 188.46 -77.789 0.6882 Quadro 11: Resultado do teste ANOVA para comparação dos modelos lineares de efeitos mistos quanto ao alongamento da vogal tônica do foco Fonte: Elaboração própria
O resultado da comparação não obteve relevância estatística (p-valor de 0.6882), o que significa dizer que o modelo que considera apenas 3 níveis para tipo de foco (amplo, contrastivo e informacional/mirativo) e 2 níveis para frase (sujeito vs. demais frases) é tão suficiente para dar conta dos dados quanto o modelo que desconsidera tal divisão. Em outras palavras, a diferença no alongamento em relação ao foco amplo é significativa apenas entre o foco contrastivo e o conjunto de foco informacional e mirativo, e a diferença no alongamento em relação ao sujeito é significativa apenas entre o sujeito e todas as demais frases. No entanto, há um fator importante a ser notado: o valor de R² (coeficiente de determinação) é muito baixo para ambos os modelos: apenas 24% da variação é descrita adequadamente pelo modelo. Isso quer dizer que a duração também é afetada por outros fatores que não estão previstos no nosso modelo.
166 167
Através da função anova() do R. Para mais informações sobre a metodologia de simplificação do modelo, ver Crawley (2013, pp. 685–690)
| 143 3.4.1.2. Média de F0 O gráfico apresenta a distribuição da diferença das médias de F0 da vogal tônica do sintagma focalizado em relação ao foco amplo, de acordo com o tipo de foco:
Figura 14: Gráfico da distribuição dos valores da diferença entre a média de F0 e o valor de referência por tipo de foco Fonte: Elaboração própria
Os dados demonstram que o foco mirativo apresentou um valor bastante abaixo dos aferidos no foco amplo. Os dados distribuídos pelo sintagma focalizado e por informante são apresentados nos gráficos abaixo:
Figura 15: Gráfico da distribuição dos valores da diferença entre a média de F0 e o valor de referência por sintagma focalizado Fonte: Elaboração própria
Figura 16: Gráfico da distribuição dos valores da diferença entre a média de F0 e o valor de referência por informante Fonte: Elaboração própria
| 144 Os dados dos gráficos acima merecem duas considerações: em primeiro lugar, há uma diferença bastante acentuada entre o foco no adjunto adverbial em relação aos demais constituintes focalizados. Além disso, os informantes F2 e M1 apresentaram diferenças maiores em relação aos demais informantes. No entanto, convém afirmar que essa diferença está expressa em semitons: uma diferença de cerca de meio semitom provavelmente não é relevante. Cabe ainda elaborar se há a possibilidade de que a diferença de -1,31 ST, encontrada na focalização do adjunto adverbial, é suficiente para ser perceptível. Para o cálculo estatístico, consideramos como efeitos fixos o tipo de foco e a frase, e como efeito aleatório o fator informante. O resultado do modelo linear de efeitos mistos para a média de F0 na vogal tônica do foco é dado no quadro abaixo:
Predictors (Intercept) CONTRASTIVO INFORMACIONAL MIRATIVO COMPLEMENTO NOMINAL OBJETO SUJEITO VERBO Observations R2
Estimates -1.10 0.13 -0.15 -0.82 1.75 1.11 0.94 1.73
std. Error 0.32 0.28 0.28 0.28 0.32 0.32 0.32 0.32 240 0.218
t value -3.46 0.47 -0.53 -2.87 5.50 3.47 2.95 5.42
p 0.001 0.640 0.599 0.005 <0.001 0.001 0.004 <0.001
Quadro 12: Resultado do modelo linear de efeitos mistos para média de F0 da vogal tônica do foco, considerando todos os tipos de foco Fonte: Elaboração própria
O resultado acima apenas encontrou diferença estatística entre o foco amplo (valor de referência) e o foco mirativo, bem como foi significante na diferença entre a frase com foco no adjunto adverbial e todas as demais. Isso significa dizer que o foco mirativo apresentou valores mais baixos de média de F0 na vogal tônica do foco em relação ao foco amplo, ao passo que o foco no adjunto adverbial apresentou valores mais baixos de F0 igualmente, e que tais valores são estatisticamente relevantes. Da mesma forma, aparentemente o sintagma focalizado apresenta uma influência maior na diferença da média de F0 em relação ao valor de referência, que pode ser creditada à posição da palavra na frase. No entanto, é importante notar duas coisas: primeiro, o valor de R² é baixo – o modelo descreve apenas 21,8% da variação dos dados –, o que indica que há outros fatores que explicam melhor a variação no valor médio de F0 atestado. Além disso, como afirmado acima, uma diferença baixa (0,82 ST) provavelmente não será percebida, o que pode dificultar a afirmação de que a variação da média de F0 seja relevante na caracterização do foco mirativo, mesmo com relevância estatística atestada.
| 145 3.4.1.2. Variação de F0 O gráfico abaixo apresenta a diferença do F0 máximo e mínimo entre vogal pretônica e tônica do foco, considerando a metodologia de normalização apresentada na seção 3.4.2.:
Figura 17: Gráfico da distribuição dos valores da diferença na variação de F0 em relação ao foco amplo, considerando pretônica e tônica, por tipo de foco (valores normalizados tomando como valor de referência o foco amplo) Fonte: Elaboração própria
O gráfico acima aponta para uma maior diferença na variação de F0 nos focos contrastivo e informacional. No foco contrastivo, essa variação diferiu em quase 2 semitons em relação ao foco amplo; já no foco informacional, essa variação foi de pouco mais de 1 semitom. Abaixo apresentamos a distribuição pelos demais fatores:
Figura 18: Gráfico da distribuição dos valores da diferença na variação de F0 em relação ao foco amplo, considerando pretônica e tônica, por sintagma focalizado (valores normalizados tomando como valor de referência o foco amplo) Fonte: Elaboração própria
| 146
Figura 19: Gráfico da distribuição dos valores da diferença na variação de F0 em relação ao foco amplo, considerando pretônica e tônica, por informante (valores normalizados tomando como valor de referência o foco amplo) Fonte: Elaboração própria
Novamente aqui temos algums pontos a comentar. Primeiro, percebemos que quando o sintagma focalizado é o advérbio, a variação aumenta bastante. Isso pode ser creditado ao fato de essa condição envolve a focalização da última sílaba tônica da frase, de modo que, como já abordado anteriormente na análise de Carnaval (2017), a focalização contrastiva envolve a presença de um upstep marcado por picos mais altos de F0 (o que veremos, na seção 3.4.3., que se confirma nos nossos dados também – e não só para o foco contrastivo mas também para o foco informacional). Além disso, percebemos que os informantes M1 e F1 apresentaram diferenças de variação menores em comparação aos informantes M2 e F2. Isso pode ser explicado pelo fato de esses informantes possuírem menos modulação na curva melódica. Por esse motivo, consideramos, no nosso modelo, o tipo de foco e o sintagma focalizado foram tomados como fatores fixos e o informante como fator aleatório. No quadro abaixo, apresentamos o resultado do modelo de regressão linear misto:
Predictors Estimates std. Error t value p (Intercept) 0.87 0.35 2.48 0.014 CONTRASTIVO 1.93 0.31 6.18 <0.001 INFORMACIONAL 1.03 0.31 3.30 0.001 MIRATIVO -0.10 0.31 -0.32 0.750 COMPLEMENTO NOMINAL -1.27 0.35 -3.64 <0.001 OBJETO -0.98 0.35 -2.80 0.006 SUJEITO -1.00 0.35 -2.86 0.005 VERBO -1.09 0.35 -3.10 0.002 Observations 240 R2 0.265 Quadro 13: Resultado do modelo linear de efeitos mistos para variação de F0 entre vogal pretônica e tônica do foco, considerando todos os tipos de foco Fonte: Elaboração própria
| 147 O exemplo acima mostra que foi encontrada relevância estatística para os focos informacional e contrastivo, e não foi encontrada relevância para o foco mirativo. Ao mesmo tempo, o modelo encontrou diferença relevante entre todas as frases em relação ao foco no sujeito. Podemos tentar simplificar o modelo unificando foco contrastivo com informacional na mesma categoria e comparar ambos os modelos:
Predictors (Intercept) CONT-INF MIRATIVO COMPLEMENTO NOMINAL OBJETO SUJEITO VERBO Observations R2
Estimates std. Error t value p 0.87 0.35 2.46 0.015 1.48 0.28 5.39 <0.001 -0.10 0.32 -0.31 0.753 -1.27 0.36 -3.58 <0.001 -0.98 0.36 -2.75 0.006 -1.00 0.36 -2.82 0.005 -1.08 0.36 -3.05 0.003 240 0.238
Quadro 14: Resultado do modelo linear de efeitos mistos para variação de F0 entre vogal pretônica e tônica do foco, desconsiderando a diferença entre foco informacional e contrastivo Fonte: Elaboração própria
model_range model_range2
Df AIC BIC 9 956.12 990.92 10 962.51 993.84
logLik -468.06 -472.26
Pr(>Chisq) 0.0038
Quadro 15: Resultado do teste ANOVA para comparação dos modelos lineares de efeitos mistos quanto à variação de F0 Fonte: Elaboração própria
Como apresentado acima, a simplificação do modelo não pode ser efetuada: como o modelo simplificado tem uma perda de informação significativa em comparação ao outro modelo, podemos concluir que a diferença entre os níveis contrastivo e informacional é significativa – embora, como notado também nas demais análises, o valor de R² é baixo (o modelo explica 23,8% da variação). 3.4.1.3. Intensidade Por fim, apresentamos a análise de intensidade da vogal tônica do foco. O gráfico de distribuição dos valores normalizados pelos tipos de foco segue abaixo:
| 148
Figura 20: Gráfico da distribuição dos valores da diferença da intensidade da vogal tônica do constituinte focalizado em relação ao foco amplo por tipo de foco Fonte: Elaboração própria
Percebemos, pelo gráfico acima, que o foco mirativo apresenta um valor maior da diferença em relação à intensidade atestada nas ocorrências de foco amplo (com valor de 1,8 dB mais alto). Quanto aos demais tipos de foco, a diferença é pequena. Abaixo apresentamos a distribuição dessa variável pelos demais fatores:
Figura 21: Gráfico da distribuição dos valores da diferença da intensidade da vogal tônica do constituinte focalizado em relação ao foco amplo por sintagma focalizado Fonte: Elaboração própria
Figura 22: Gráfico da distribuição dos valores da diferença da intensidade da vogal tônica do constituinte focalizado em relação ao foco amplo por informante Fonte: Elaboração própria
| 149 Quanto aos demais fatores, é digno de nota que na frase com sujeito focalizado, os valores de intensidade foram ligeiramente mais baixos do que os valores do foco amplo, enquanto o informante F1 apresentou valores de intensidade superiores aos demais informantes. Para a análise estatística da diferença de intensidade, utilizamos o mesmo modelo das demais análises: sintagma focalizado e tipo de foco como fatores fixos e informante como fator aleatório. O resultado é apresentado abaixo:
Predictors (Intercept) CONTRASTIVO INFORMACIONAL MIRATIVO COMPLEMENTO NOMINAL OBJETO SUJEITO VERBO Observations R2
Estimates -0.07 0.42 0.40 1.80 0.50 0.29 -0.90 0.46 240 0.225
std. Error 0.73 0.46 0.46 0.46 0.52 0.52 0.52 0.52
t value -0.10 0.90 0.86 3.89 0.97 0.56 -1.73 0.89
p 0.922 0.369 0.388 <0.001 0.335 0.576 0.085 0.376
Quadro 16: Resultado do modelo linear de efeitos mistos para intensidade da vogal tônica do foco, considerando todos os tipos de foco Fonte: Elaboração própria
Como se pode ver no quadro acima, a análise da intensidade da vogal tônica do constituinte focalizado se mostrou semelhante à análise da média de F0: apenas o foco mirativo se diferenciou do foco amplo (neutro), sendo que os valores de intensidade são maiores. O mesmo problema, no entanto, se apresentou: o valor de R² é bastante baixo: apenas 5% da variação é descrita pelo modelo. 3.4.1.2. Resumo dos resultados acústicos Após feita a descrição dos resultados, bem como a análise estatística, podemos apresentar algumas conclusões a respeito do que vimos. Em primeiro lugar, percebemos que cada variável acústica analisada apresentou um comportamento diferente quanto à diferenciação entre os tipos de foco. O quadro abaixo resume esses comportamentos, em que podemos agrupar os tipos de foco em relação às variáveis analisadas:
| 150
Amplo
Informacional
Contrastivo
Mirativo
Duração
A
B
C
B
Média de F0
A
A
A
B
Variação de F0
A
B
C
A
Intensidade
A
A
A
B
Quadro 17: Resumo dos resultados dos testes estatísticos para as medidas acústicas Fonte: Elaboração própria
Uma primeira impressão que pode ser extraída diz respeito ao fato de que cada medida acústica aponta para uma configuração de distinção de foco: a intensidade parece não diferenciar os focos contrastivo e informacional, embora a variação do F0 sim; a duração não parece diferenciar os focos informacional e mirativo, embora a intensidade sim; e assim por diante, considerando, inclusive, que nenhuma medida acústica foi capaz de diferenciar todos os tipos de foco entre si simultaneamente. Além disso, de maneira geral, nossos modelos apresentaram baixos índices de R², indicando que há outros fatores (cuja identificação extrapolam o escopo deste trabalho) atuantes de maneira mais importante na caracterização das medidas aferidas nos nossos dados. Esses dois fatores nos possibilitam afirmar que, no mínimo, é demasiado complexo afirmar que haja uma relação direta entre parâmetros acústicos (como o que vimos) e a caracterização dos tipos de foco, e que, por mais que os focos se diferenciem considerando uma medida ou outra, não se pode generalizar e afirmar que, por causa disso, a tipologia de foco deva ser codificada na sintaxe. Essa conclusão vai ao encontro da a afirmação feita por Ladd (2008, p. 72) a respeito dos tons discretos da AM: H e L são abstrações fonológicas, comparáveis a fonemas, e não há razão para esperar que eles sejam realizados sempre da mesma maneira. Pelo contrário, a realização fonética de H e L – assim como a realização fonética de qualquer outro fonema – está sujeita a uma variedade de fatores condicionantes, que podem fazer com que qualquer ocorrência de H ou L seja realizada foneticamente de uma maneira bem diferente de outra ocorrência qualquer. (Tradução nossa)168
“H and L are phonological abstractions, comparable to phonemes, and there is no reason to expect them to be realised always in the same way. Rather, the phonetic realisation of H and L – like the phonetic realisation of any other phoneme – is subject to a variety of conditioning factors, which may make any given occurrence of H or L come out phonetically in a quite different way from some other occurrence.” 168
| 151 Na citação acima, Ladd intenta afirmar que não se pode traçar uma relação direta entre uma medida fonética e uma abstração fonológica (como já argumentamos anteriormente). No caso específico de acentos tonais a questão é mais complexa: enquanto os segmentos fonéticos (fones) possuem apenas uma grandeza física na qual podem variar (a saber, as frequências formânticas169), os suprassegmentos (como os acentos tonais) possuem três grandezas para sua realização: duração, intensidade e F0 (sem considerar a configuração do contorno entoacional resultado da modulação de F0). Assim, a priori, os tons H e L (e suas variações) podem ser foneticamente especificados de acordo com qualquer uma dessas grandezas físicas (às vezes por mais de uma delas ao mesmo tempo). Por esse motivo, se há alguma atribuição de tons específicos para os diferentes tipos de foco, essa atribuição pode levar em conta vários (ou apenas alguns) parâmetros acústicos para sua materialização, sendo difícil perseguir uma relação entre um parâmetro específico e a representação fonético-fonológica dos acentos tonais (e muito menos da configuração que emerge da atribuição de tais acentos).
3.4.3. Teste de produção: descrição dos contornos entoacionais Nesta seção, iremos apresentar uma descrição das curvas entoacionais, conforme analisadas. Utilizamos como parâmetros de análise os resultados da aplicação do método de estilização Prosogram, além da própria curva aferida pelo programa Praat, a fim de constatar possíveis erros da estilização. A metodologia da anotação seguiu algumas diretrizes, como: 1. Tons iniciais em geral foram marcados com o valor H* (exceto em alguns casos específicos)170; 2. A atribuição de tons complexos (HL ou LH) foi feita tanto em casos nos quais a variação é intrasilábica (ou seja, a variação de F0 ocorreu dentro da mesma sílaba, formando um glissando intrassilábico) quanto em ocorrências nas quais a variação ocorreu entre pretônica e tônica ou tônica e postônica; 3. De maneira geral, os tons foram analisados considerando as sílabas tônicas (e seu entorno) da última palavra prosódica que compunha os sintagmas fonológicos. A única exceção para esse caso foi a focalização no verbo (frase “Minha irmã trabalhou ontem”),
169
Estamos desconsiderando, nessa discussão, a diferença de duração que existe, por exemplo, entre vogais longas e breves e também entre consoantes geminadas e singletons, ou mesmo tons lexicais. 170 Análises sobre o tom inicial de sentenças apontam para uma variação regional: falares do Sudeste em geral apresentam um tom ascendente (LH*), enquanto falares do Nordeste envolvem tom alto (H*). Nos nossos dados (produzidos por falantes cariocas), foneticamente podemos considerar que se trata do padrão ascendente, mas para facilitar a explicação (e evitar uma discussão sobre se essa diferença no tom inicial é fonológica ou não), preferimos adotar uma única notação – H*. Para informações acerca desse tema, ver Cunha (2005) e Silvestre e Cunha (2013).
| 152 na qual consideramos também a possível variação no F0 na tônica do verbo (que normalmente seria fraseado junto com o advérbio – ver seção 3.1.1). 4. As variações de F0 foram consideradas relevantes apenas quando situadas em vogais. Desconsideramos variações no interior de consoantes. Por esse motivo algumas curvas que fazem movimentos de subida ou descida foram marcadas com tom simples, porque a variação ocorreu internamente à consoante, o que desconsideramos. No total, encontramos, considerando todos os registros, 22 padrões diferentes171. O quadro abaixo apresenta um resumo dessas ocorrências, divididas por frase e tipo de foco172: AV CN OD SJ VB AMP CON INF MIR AMP CON INF MIR AMP CON INF MIR AMP CON INF MIR AMP CON INF MIR H*HL*L% 10 11 1 4 4 1 7 1 4 3 7 4 10 3 4 1 H*¡HL*L% 12 1 1 1 1 1 4 1 3 LH*LL*L% 6 4 1 5 1 2 LH*HL*L% 1 4 2 1 3 2 2 1 1 H*H*L% 6 4 1 2 3 H*LL*L% 1 3 4 1 2 3 1 H*HL*H% 1 1 3 1 3 3 H*H*H% 3 3 1 H*H*HL*L% 1 3 1 1 3 H*HL*LL*L% 1 4 1 2 H*LH*LL*L% 4 1 1 2 H*H*LL*L% 2 1 1 2 H*LH*H% 1 3 H*HH*H% 3 1 H*HL*HL*L% 2 1 HL*LL*L% 3 H*H*H*H% 1 1 H*LH*HL*L% 2 LH*H*L% 1 1 H*LH*LH*L% 1 LH*H*HL*L% 1 LH*H*LL*L% 1 Total 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12
Total 75 25 19 17 16 15 12 7 9 8 8 6 4 4 3 3 2 2 2 1 1 1 240
Quadro 18: Resumo das curvas entoacionais encontradas no experimento de produção Fonte: Elaboração própria
A uma primeira vista, percebe-se a grande variabilidade das ocorrências. No entanto, é possível retirar algumas generalizações: inicialmente, percebemos que as ocorrências de foco amplo apresentaram menor variação e envolveram, em mais da metade dos casos, a especificação do padrão H*HL*L%, demonstrado na figura abaixo:
171
Um assunto muito importante (e que não será discutido aqui) é a possibilidade de que alguns desses padrões possam ser agrupados. Algumas diferenças (como a que ocorre entre H*H*H% e H*H*H*H%) pode ser justificada apenas pela presença de mais uma palavra prosódica na frase. Estudos posteriores podem se dedicar a analisar os dados e chegar a um agrupamento final (Agradeço à profª Carolina Ribeiro Serra por pontuar essa questão). 172 As curvas aferidas em todos os 240 dados podem ser vistas em formato de imagem seguinte endereço online https://1drv.ms/f/s!AiOM2BdgyJqIgbNKOM3IAKkuH1akww. No texto iremos fazer considerações gerais, na tentativa de determinar generalizações a respeito dos dados e explicar possíveis resultados desviantes.
| 153
Figura 23: Curva de F0 suavizada do padrão H* - HL* - L% na frase “A Gina fez café de noite” Fonte: Elaboração própria
Segundo Carnaval (2017) esse é o contorno melódico padrão do foco amplo e do foco informacional, quando o constituinte focalizado se encontra no final da sentença (que, no nosso caso, se reduz à frase com foco no adjunto adverbial). As ocorrências de outras curvas melódicas no foco amplo podem ser explicadas de duas formas: primeiro, em alguns casos é possível que o informante tenha decidido (por mais que o contexto não indicasse) enfatizar algum constituinte específico da sentença. Provavelmente esse foi o caso, por exemplo, da ocorrência de foco amplo com a frase “Minha irmã trabalhou ontem” em que foi atestado o padrão H*LH*LL*L%, produzido em uma repetição de F2 e reproduzido abaixo:
Figura 24: Curva de F0 suavizada do padrão H* - LH* - LL* - L% na frase “Minha irmã trabalhou ontem” Fonte: Elaboração própria
| 154 Essa curva melódica (produzida no contexto de resposta à pergunta “Quais são as novidades?” pode ter sido resultado do desejo da informante F2 em enfatizar que a irmã tenha trabalhado ontem (talvez por acreditar que seria algo relevante para o ouvinte, mesmo que o contexto não tivesse induzido essa interpretação). Uma outra motivação para a variabilidade da entoação no foco amplo seria a inserção da emoção de surpresa, que produziria a eliminação do contorno descendente no final da sentença. Isso ocorre, por exemplo, em todas as repetições do foco de sujeito produzido por M2, exemplificadas pela figura abaixo:
Figura 25: Curva de F0 suavizada do padrão H* - ¡HL* - H% na frase “O Gustavo vai ser pai” Fonte: Elaboração própria
O padrão com upstep no final da sentença pode ser interpretado como a manifestação de surpresa (ou alegria) de M2 quanto ao fato de Gustavo ser pai, ainda que o contexto apenas exigisse que o informante desse uma resposta à pergunta “Quais as novidades?” Os dados de foco contrastivo, embora a aparente variabilidade, podem ser analisados a partir de uma mesma característica em comum: na imensa maioria dos casos (54 dados / 90% do total) a demarcação de contrastividade foi expressa pela presença de um acento específico sobre sintagma focalizado (podendo esse acento ser ascendente – LH* –, descendente – HL* – ou simples – H) e/ou pela presença de deaccenting (indicado pelo símbolo LL*). As figuras abaixo apresentam alguns exemplos das ocorrências de tom ascendente sem deaccenting (Figura 15) e de tom alto com deaccenting (Figura 16):
| 155
Figura 26: Curva de F0 suavizada do padrão LH* - H* - L% na frase “O irmão da Rosa comprou a casa da esquina” Fonte: Elaboração própria
Figura 27: Curva de F0 suavizada do padrão H* - H* - LL* - L% na frase “A Flávia vai comprar um carro mês que vem” Fonte: Elaboração própria
Os 6 casos desviantes podem ser explicados pela confusão do informante em interpretar o contexto, de modo que produziram ou a entoação não marcada característica do foco amplo (H*HL*L%) – o que ocorreu em 4 dos 6 casos –, ou pela inserção de surpresa no contexto, produzindo uma curva entoacional menos modulada e com tom mais alto (inclusive repetida pelo mesmo informante na condição mirativa de outra frase) , como exemplificado abaixo:
| 156
Figura 28: Curva de F0 suavizada do padrão H* - HH* - H% na frase “O Gustavo vai ser pai” Fonte: Elaboração própria
Uma outra característica específica do foco contrastivo é, no caso da focalização de adjunto adverbial, a presença de um acento descendente com upstep (¡HL), conforme mostra o exemplo abaixo:
Figura 29: Curva de F0 suavizada do padrão H* - ¡HL * - L% na frase “A Gina fez café de noite” Fonte: Elaboração própria
Conforme já atestado por Carnaval (2017), a presença de upstep (marcada pelo pico alto e pelo vale baixo) nesse caso é característica do foco contrastivo, o que o diferencia do foco amplo, que apresenta os mesmos tons, embora sem a acentuação da curva.
| 157 Enquanto os focos amplo e contrastivo apresentam uma relativa regularidade, a focalização informacional é mais complexa de ser analisada de maneira única, porque em muitos casos (31 ocorrências / 51,6% do total) a curva entoacional produzida nos contextos de foco informacional (resposta a pergunta wh) apresentou características do foco contrastivo (presença de deaccenting e/ou acento especificado na posição focal, ou upstep, no caso da focalização de adjunto adverbial). Isso coloca em questão se realmente é possível afirmar que o foco informacional seja codificado na fonologia (na atribuição de acentos tonais), pois, à primeira vista, o foco informacional não é associado a nenhum tipo de entoação específica, pelo que nossos dados apontam. O foco mirativo apresentou uma altíssima variabilidade, com 17 dos 22 contornos entoacionais atestados ligados, em alguma das condições, a produções nas quais o contexto era de falta de expectativa. Isso pode ser explicado por dois fatores: de um lado, é possível que os informantes não tenham compreendido a pragmática da situação e tivessem realizado contornos entoacionais ligados ao foco contrastivo/informacional (o que representou 30% dos casos) ou do foco amplo (10% dos dados). Um fato interessante, no entanto, que pode ser levantado, é que, dos dados que apresentaram tons de fronteira altos (29 dados), a grande maioria figurou na condição de foco mirativo (20 dados / 69% do total). Além disso, o padrão H*H*L%, caracterizado pela manutenção de um tom alto por toda a frase (exceto pelo final), reproduzido abaixo na figura 17, foi o único padrão no qual todas as ocorrências (16 registros) foram produzidas em contexto de foco mirativo. Isso nos leva a crer que, se existe algo na prosódia capaz de veicular miratividade, uma boa aproximação seria dizer que a manutenção de tons globais altos é essa característica.
Figura 30: Curva de F0 suavizada do padrão H* - ¡HL * - L% na frase “A Gina fez café de noite” Fonte: Elaboração própria
| 158 Com base nessas considerações, podemos chegar a algumas generalizações: 1. O foco amplo é determinado pela sequência de tons H*HL*L%, sendo o padrão neutro das sentenças afirmativas; 2. As curvas associadas ao foco contrastivo, embora diferenciem-se na manifestação dos tons, apresentam um padrão geral, composto pela presença de um tom específico no sintagma focalizado, que pode ser ascendente (LH*), descendente (HL*) ou simples (H*), ou, no caso de focalização de constituinte em final de frase, por upstep. A presença de deaccenting é opcional, mas quando o foco está em início de sentença e é especificado como alto, o deaccenting se torna obrigatório. 3. O foco informacional não pode ser distinguido do foco contrastivo e do foco amplo em todos os casos, pois ora se comporta como um, ora como outro. 4. O foco mirativo, embora aparentasse ser de difícil codificação na prosódia pelos informantes, tem como característica a manutenção de tons finais e/ou de fronteira altos.
Na seção 3.5, discutiremos essas generalizações com base no resultado dos testes de percepção, conjugando ambos os resultados à nossa hipótese.
3.4.4. Teste de percepção (tipo de foco): metodologia e resultados Realizamos dois testes de percepção: no primeiro, o objetivo era identificar o registro de acordo com o tipo de foco (se amplo, informacional, contrastivo ou mirativo). No segundo, objetivamos saber se o informante era capaz ou não de ter uma leitura exaustiva do registro ouvido. Por motivos de executabilidade do experimento, decidimos submeter os informantes a apenas uma repetição de cada condição (reduzindo, portanto, o número de estímulos de 240 – total dos testes de produção – para 80 – uma repetição de cada condição)173. Os registros aos quais os sujeitos foram expostos foram escolhidos aleatoriamente. Nesta seção, iremos detalhar a metodologia e os resultados do teste de percepção que envolvia a identificação do tipo de foco, enquanto na próxima seção apresentaremos os resultados e a metodologia do teste de exaustividade.
173
Essa escolha foi motivada pelo fato de que, se os informantes fossem expostos a todos os 240 dados, provavelmente os resultados seriam enviesados devido ao efeito de saturação (a.k.a. falta de paciência).
| 159 3.4.2.1. Metodologia Quanto aos materiais e às condições analisadas, os sujeitos foram expostos a 5 frases, cada uma com um tipo de constituinte diferente focalizado (sujeito, complemento nominal, objeto direto, sujeito e verbo). Cada frase foi produzida por 4 falantes (F1, F2, M1, M2), e com 4 tipos de foco (amplo, contrastivo, informacional e mirativo), totalizando 80 estímulos. Quanto aos procedimentos, os sujeitos foram testados individualmente, utilizando o programa Open Sesame (Mathôt, Schreij, & Theeuwes, 2012), instalado em um computador ASUS X555LF com sistema operacional Windows 10. Inicialmente, o sujeito era exposto a uma tela com as instruções (que também eram dadas oralmente pelo aplicador). Após apertar qualquer tecla do teclado, o sujeito realizava um treinamento, para então passar aos estímulos experimentais. Os estímulos aos quais o informante era exposto no treinamento correspondiam a registros semelhantes aos experimentais, ditas por outra pessoa que não os informantes utilizados no teste de produção. A escolha por expor os sujeitos a registros semelhantes foi feita visando permitir que os indivíduos se acostumassem às frases, a fim de que julgassem apenas a entoação (sem necessitar refletir no conteúdo segmental das sentenças). Após o treinamento, o sujeito era solicitado a apertar qualquer tecla para iniciar o teste com os dados experimentais, que lhes eram expostos randomizados (através de input auditivo via headphone LTOMEX modelo A-B05). No experimento de tipo de foco, os informantes tinham 4 opções de resposta, que lhes eram apresentadas segundo a figura abaixo. Para responder, o informante devia apertar no teclado o número correspondente:
Figura 31: Tela do teste de percepção de tipo de foco Fonte: Elaboração própria
No total, participaram deste teste 21 sujeitos, todos alunos do curso de Letras da Universidade Federal do Rio de Janeiro, com idades entre 18 e 35 anos, moradores da Região
| 160 Metropolitana do Rio de Janeiro e sem treinamento prévio em fonética. O ordenamento temporal dos componentes do trial174 é mostrado na figura abaixo:
Início do trial
Tela de instruções
Ponto de fixação
Exibição do áudio
Janela de resposta
Ilimitado
1000ms
variável
5000ms
Fim do trial
3.4.2.2. Descrição dos resultados Ao final do experimento, temos um número total de 1680 dados (80 x 21)175, mas excluímos do quantitativo final os dados em que o informante não foi capaz de julgar o tipo de foco dentro do tempo de 5000ms determinado (ver figura acima), de modo que os dados analisados totalizaram 1631 julgamentos176. Abaixo apresentamos a distribuição dos dados por tipo de foco:
Tipo de foco do estímulo
Amplo Amplo 180 44.7% Contrastivo 69 16.8% Informacional 129 31.4% Mirativo 115 28.3%
Respostas Contrastivo Informacional Mirativo 32 7.9% 124 30.8% 67 16.6% 195 47.6% 84 20.5% 62 15.1% 105 25.5% 135 32.8% 42 10.2% 101 24.8% 63 15.5% 128 31.4%
Quadro 19: Distribuição dos dados de reconhecimento de tipo de foco por tipo de foco do estímulo Fonte: Elaboração própria
Podemos extrair desse quadro algumas informações interessantes: primeiro, os registros produzidos em contexto de foco amplo foram reconhecidos majoritariamente tanto como foco amplo de fato (45% dos dados) ou como foco informacional (31%). O foco informacional, por sua vez, apresentou uma distribuição bastante homogênea, sendo reconhecido semelhantemente como foco amplo (32%), contrastivo (26%) ou informacional (33%). O mesmo ocorreu com o foco mirativo, sendo, de todos os casos, o que menos foi reconhecido de fato como foco mirativo (apresentando menos de 32% de reconhecimento).
174
Trial é um termo que se refere à parte do teste que engloba a exposição do informante a um estímulo e a solicitação da tarefa. Por exemplo, no nosso experimento, composto por 10 estímulos de treinamento e 80 estímulos-alvo, o participante efetuou um total de 90 trials. 175 Usamos o termo “dado” para nos referir aos julgamentos feitos pelos informantes. 176 Os resultados do teste de percepção de tipo de foco divididos por todas as condições estão apresentados no Anexo III.
| 161 Um outro nível de descrição pode ser feito considerando as curvas entoacionais descritas na seção anterior. Nos estímulos utilizados no experimento, há um total de 18 curvas entoacionais diferentes, cuja distribuição pode ser apresentada nos quadros abaixo:
Amplo
Contrast.
Informac.
Mirativo
Total
H*¡HL*H%
0
1
0
0
1
H*¡HL*L%
4
4
1
0
9
H*H*H*H%
0
1
0
1
2
H*H*H%
1
0
0
1
2
H*H*HL*L%
1
0
0
1
2
H*H*L%
0
0
0
7
7
H*H*LL*L%
0
1
0
0
1
H*HL*H%
1
0
1
4
6
H*HL*HL*L%
0
1
0
0
1
H*HL*L%
11
0
10
2
23
H*HL*LL*L%
0
1
3
0
4
H*LH*H%
0
0
0
1
1
H*LH*HL*L%
0
1
0
0
1
H*LH*LL*L%
0
2
1
0
3
H*LL*L%
0
2
2
1
5
HL*LL*L%
0
0
1
0
1
LH*HL*L%
1
2
0
2
5
LH*LL*L%
0
4
1
0
5
Quadro 20: Distribuição de ocorrências de cada padrão entoacional nos 80 estímulos por tipo de foco conforme contexto de produção. Fonte: Elaboração própria
O quadro acima nos dá um panorama interessante. Inicialmente, percebemos que o padrão neutro H*HL*L% é o mais encontrado, aparecendo em grande quantidade tanto no foco informacional quanto no foco amplo (o que era previsível, haja visto o que percebemos na seção anterior). Além disso, os registros com presença de deaccenting se distribuem pelos focos contrastivo, informacional e mirativo. A distribuição do reconhecimento dos tipos de foco por padrão entoacional é dada no quadro abaixo:
| 162 Amplo
Contrastivo
Informacional
Mirativo
H*¡HL*H%
4
19.0%
9
42.9%
5
23.8%
3
14.3%
H*¡HL*L%
50
27.0%
36
19.5%
72
38.9%
27
14.6%
H*H*H%
20
50.0%
2
5.0%
12
30.0%
6
15.0%
H*H*H*H%
8
19.5%
3
7.3%
6
14.6%
24
58.5%
H*H*HL*L%
10
23.8%
9
21.4%
12
28.6%
11
26.2%
H*H*L%
35
24.6%
43
30.3%
22
15.5%
42
29.6%
H*H*LL*L%
1
5.3%
14
73.7%
1
5.3%
3
15.8%
H*HL*H%
62
50.4%
10
8.1%
21
17.1%
30
24.4%
H*HL*HL*L%
5
23.8%
7
33.3%
5
23.8%
4
19.0%
H*HL*L%
215
44.6%
56
11.6%
164
34.0%
47
9.8%
H*HL*LL*L%
32
39.0%
11
13.4%
30
36.6%
9
11.0%
H*LH*H%
6
28.6%
0
0.0%
2
9.5%
13
61.9%
H*LH*HL*L%
7
33.3%
10
47.6%
1
4.8%
3
14.3%
H*LH*LL*L%
2
3.3%
30
49.2%
8
13.1%
21
34.4%
H*LL*L%
10
9.7%
60
58.3%
16
15.5%
17
16.5%
HL*LL*L%
0
0.0%
15
71.4%
3
14.3%
3
14.3%
LH*HL*L%
17
16.8%
47
46.5%
11
10.9%
26
25.7%
LH*LL*L%
9
8.6%
71
67.6%
15
14.3%
10
9.5%
Quadro 21: Distribuição do reconhecimento do tipo de foco por padrão entoacional. Fonte: Elaboração própria
Dos dados acima, podemos extrair algumas informações interessantes. Primeiro, vemos que, salvo raras exceções, os padrões entoacionais apresentaram uma alta taxa de variabilidade no reconhecimento do tipo de foco. Por exemplo, o padrão H*¡HL*L%, creditado por Carnaval (2017) como típico do foco contrastivo em contexto de final de frase (que é o caso em questão), apresentou uma baixa taxa de reconhecimento do foco contrastivo (apenas 19,5% dos dados), variando entre identificação como foco amplo (27%) ou informacional (38,9%). O padrão neutro H*HL*L% foi reconhecido tanto como foco amplo (44,6% dos dados) como foco informacional (34%), o que vai ao encontro da ideia de que foco informacional e foco amplo são, de fato, extremamente semelhantes prosodicamente. É interessante notar igualmente que os registros com presença de deaccenting (tom final LL*) são os que mais apresentaram taxa de reconhecimento como foco contrastivo: por exemplo, o padrão H*H*LL*L% apresentou 73.7% de reconhecimento como foco contrastivo. No entanto, também encontramos uma taxa relativamente elevada para o reconhecimento de foco informacional em registros com
| 163 deaccenting: o padrão H*HL*LL*L%, por exemplo, apresentou 36,6% de reconhecimento como foco informacional, contra apenas 13,4% de reconhecimento como foco contrastivo. Ainda nesse padrão, é digno de nota o alto reconhecimento como foco amplo (39%). Por fim, quanto ao foco mirativo, os padrões que mais foram reconhecidos como tal são aqueles que têm como característica a manutenção de tons mais altos (por exemplo, o padrão H*LH*H% apresentou 61,9% de reconhecimento como foco mirativo), o que vai ao encontro do que percebemos nos dados de produção. No entanto, esses dados precisam ser tratados estatisticamente, o que efetuaremos na próxima subseção. 3.4.2.3. Análise estatística A análise estatística do teste de percepção foi feita através de uma análise de correspondência177. Essa análise toma como input uma tabela de contingência, e serve para a análise multivariada de dados categóricos, explorando as associações existentes entre os dados178. Através dessa análise, podemos efetuar uma hierarquização dos estímulos tomando como critério a distância entre eles quanto a características definidas (como padrão fonológico, tipo de foco conforme contexto de produção, falantes, etc.). Essa análise pode ser apresentada através de um dendrograma como a figura 32179. Cada agrupamento (cluster) é caracterizado pelas características médias dos estímulos em relação às colunas da tabela de contingência (as categorias de resposta), além de considerar como fatores suplementares tipo de contorno fonológico (como descrito na seção 3.4.3.), informante e tipo de foco teórico (segundo o contexto de produção). O dendrograma da figura 32 apresenta essa divisão. Inicialmente, há uma repartição principal em dois clusters compostos essencialmente por estímulos reconhecidos como “contrastivo/mirativo” e “amplo/informacional” – essa divisão reproduz exatamente a primeira dimensão da análise de correspondência.
177
Para mais detalhes sobre o modelo, ver Husson et al. (2017 cap. 2) Utilizamos a função CA() do pacote FactoMineR do programa R. 179 Utilizamos a função HCPC() do pacote FactoMineR do programa R. 178
| 164
Figura 32: Dendrograma apresentando a distância (em termos de categorias de respostas) entre estímulos. O eixo horizontal vermelho indica o lugar de separação em 7 clusters segundo um critério de ganho de inercia. Fonte: Elaboração própria
| 165
Utilizando um critério de ganho de inércia, temos uma divisão em 7 clusters (representada no dendrograma pela linha vermelha):
180
•
Cluster #1: o Estimulos: OD_AMP_INF4, AV_INF_INF5, OD_MIR_INF1, SJ_AMP_INF4, AV_AMP_INF5, CN_MIR_INF1, CN_INF_INF5, CN_MIR_INF5, OD_INF_INF4, VB_MIR_INF1, AV_MIR_INF1, VB_AMP_INF1, AV_AMP_INF4, OD_INF_INF1, SJ_INF_INF5, AV_CON_INF5, OD_AMP_INF1, OD_INF_INF3 o Características do cluster180: ▪ Etiqueta: “Amplo” a 62% ▪ Contornos fonológicos: H*HL*L%, H*HL*H%, H*H*H% ▪ Falantes: F1, M2 ▪ Tipo de foco teórico [de acordo com a produção]: Informacional, Amplo
•
Cluster #2: o Estimulo: VB_AMP_INF5, VB_INF_INF1, AV_AMP_INF1, VB_AMP_INF4, OD_INF_INF5, VB_INF_INF5, AV_INF_INF4, AV_INF_INF1, AV_AMP_INF3, CN_AMP_INF3, VB_CON_INF4, AV_INF_INF3, VB_CON_INF1, AV_CON_INF3 o Características do cluster: ▪ Etiqueta: Informacional a 51% ▪ Contornos fon: H*¡HL*L%, H*HL*LL*L%, H*HL*L% ▪ Falantes: ▪ Tipo de foco teórico [de acordo com a produção]: Informacional, Amplo
•
Cluster #3: o Estimulo: OD_AMP_INF3, OD_AMP_INF5, SJ_AMP_INF1, CN_AMP_INF1, CN_AMP_INF5, SJ_AMP_INF3, OD_MIR_INF4, OD_MIR_INF3, OD_CON_INF1, CN_MIR_INF4, CN_AMP_INF4, AV_MIR_INF5 o Características do cluster: ▪ Etiqueta: Mirativo (29%), Amplo (40%) ▪ Contornos fon: H*H*L%, H*H*HL*L%, H*H*H%, H*H*H*H% ▪ Falantes: ▪ Tipo de foco teórico [de acordo com a produção]: Amplo, Mirativo
As características apresentadas aqui são aquelas que são significativas comparando o uso médio geral com o uso dentro do cluster, e são apresentadas em ordem decrescente de associação significativa.
| 166 •
Cluster #4: o Estimulo: SJ_MIR_INF5, SJ_MIR_INF1, SJ_AMP_INF5, OD_MIR_INF5 o Características do cluster: ▪ Etiqueta: Mirativo (71%) ▪ Contornos fon: H*LH*H%, H*H*H*H%, H*HL*H%, H*¡HL*L% ▪ Falantes: M2 ▪ Tipo de foco teórico [de acordo com a produção]: Mirativo
•
Cluster #5: o Estimulo: CN_INF_INF4, SJ_INF_INF1, VB_CON_INF5, SJ_INF_INF4, CN_CON_INF5, SJ_CON_INF1, VB_AMP_INF3, VB_MIR_INF4, AV_CON_INF1, OD_CON_INF5, VB_INF_INF3, AV_CON_INF4, VB_MIR_INF5, VB_INF_INF4 o Características do cluster: ▪ Etiqueta: Contrastivo (40%) ▪ Contornos fon: H*LH*HL*L%, H*HL*HL*L%, H*¡HL*H%, H*H*HL*L%, H*LH*LL*L% ▪ Falantes: M1 ▪ Tipo de foco teórico [de acordo com a produção]: Contrastivo, Informacional
•
Cluster #6: o Estimulo: VB_MIR_INF3, SJ_CON_INF5, OD_CON_INF4, SJ_MIR_INF3, SJ_MIR_INF4, AV_MIR_INF3, OD_CON_INF3, AV_MIR_INF4 o Características do cluster: ▪ Etiqueta: Mirativo (41%), Contrastivo (49%) ▪ Contornos fon: H*LH*LL*L%, LH*HL*L%, H*H*L%, H*LL*L%, H*HL*H% ▪ Falantes: F2, M1 ▪ Tipo de foco teórico [de acordo com a produção]: Mirativo, Contrastivo
•
Cluster #7: o Estimulo: CN_CON_INF1, SJ_CON_INF3, CN_INF_INF1, CN_MIR_INF3, SJ_CON_INF4, CN_CON_INF3, CN_CON_INF4, SJ_INF_INF3, VB_CON_INF3, CN_INF_INF3 o Características do cluster: ▪ Etiqueta: Contrastivo (70%) ▪ Contornos fon: LH*LL*L%, H*LL*L%, HL*LL*L%, H*H*LL*L%, LH*HL*L% ▪ Falantes: F2 ▪ Tipo de foco teórico [de acordo com a produção]: Contrastivo Uma discussão bastante interessante pode ser desenvolvida a partir desses dados:
inicialmente, os clusters 4 e 7 apresentaram uma identificação bastante clara das respostas, sendo julgados majoritariamente como foco mirativo e contrastivo, respectivamente. É digno de nota que esses dados são associados com contornos melódicos bem marcados: o cluster 4
| 167 (etiqueta “mirativo”) é composto por, praticamente, todos os dados marcados por tons globais altos, ao passo que o cluster 7 (etiqueta “contrastivo”) se caracterizou por presença de deaccenting ou por um acento nuclear em posição intermediária da frase. Além disso, os clusters 1, 2 e 5 apresentam apenas uma etiqueta, mas apresentam uma mistura de estímulos (tipo de foco de acordo com contexto de produção). O cluster 1, por exemplo, apresenta a etiqueta “amplo”, mas dentre os estímulos desse cluster, apenas 33% foram produzidos realmente em contexto de foco amplo (apresenta 33% de estímulos com tipo de foco informacional, 27% com foco mirativo e 5% (1 dado apenas) com foco contrastivo). O cluster 2, por sua vez, foi etiquetado como “informacional”, mas apenas 43% desses dados são realmente produções feitas em contexto de foco informacional. Por fim, o cluster 5, etiquetado como “contrastivo”, apresenta ocorrências de foco informacional (36%, 5 estímulos), foco amplo (7%, 1 estímulo), foco mirativo (14%, 2 estímulos) e foco contrastivo (43%, 6 estímulos). Um resumo desses dados pode ser dado no quadro abaixo:
Cluster 1 - Amplo 2 - Informacional 5 - Contrastivo
Tipo de foco segundo o contexto de produção Amplo Informacional Contrastivo Mirativo 6 6 1 5 33.33% 33.33% 5.56% 27.78% 5 35.71% 1 7.14%
6 42.86% 5 35.71%
3 21.43% 6 42.86%
0 0.00% 2 14.29%
Total 18 14 14
Quadro 22: Distribuição dos clusters do dendrograma pelo tipo de foco conforme contexto de produção Fonte: Elaboração própria
Podemos concluir do quadro acima que o contexto de produção do foco não apresentou muita influência para o julgamento do foco como contrastivo, informacional ou amplo nos clusters acima, o que pode indicar uma indiferença do contexto de produção em relação ao que, de fato, foi produzido (e é percebido pelos sujeitos do teste de percepção). Não deixa de ser interessante o fato de que (i) a etiqueta de foco amplo apresentou bastantes estímulos de foco informacional; (ii) a etiqueta de foco informacional apresentou grande quantidade de estímulos com foco amplo; e (iii) a etiqueta de foco contrastivo apresentou bastantes estímulos de foco informacional. Um último ponto de destaque dessa análise é o fato de que os clusters 3 e 6 tem etiquetas misturadas: o cluster 3 tem etiqueta “mirativo/amplo”, enquanto o cluster 6 tem a etiqueta “mirativo/contrastivo”. Isso é interessante, pois parece que o foco mirativo é bastante difícil de
| 168 ser reconhecido como tal (haja visto, além dessa “mistura”, o fato de que o cluster 4, etiquetado como simplesmente “mirativo”, tem apenas 4 estímulos. Podemos resumir essas considerações nos seguintes pontos: 1. Parece haver uma clara diferença, facilmente detectável, entre, de um lado, o reconhecimento dos focos mirativo e contrastivo, e, do outro, os focos informacional e amplo. Essa dicotomia sugere que os informantes possuem a capacidade de diferenciar, muito mais facilmente, apenas dois “tipos” de foco (que, na nossa interpretação, pode ser analisado como ausência vs. presença de foco – no sentido de exaustividade); 2. Os clusters etiquetados como foco informacional e amplo apresentam os mais diferentes tipos de foco (considerando o contexto de produção). Isso sugere que essas duas categorias de foco não são facilmente distinguíveis entre si; 3. Os clusters etiquetados como foco contrastivo (clusters 5, 6 e 7) apresentaram como característica marcante a presença de deaccenting ou de um acento nuclear intermediário, o que sugere justamente que o foco, quando marcado pela alteração de um núcleo acentual, é mais percebido como foco contrastivo.
3.4.5. Teste de percepção (exaustividade): metodologia e resultados 3.4.3.1. Metodologia O teste de percepção que julgou a capacidade dos sujeitos de identificar exaustividade seguiu uma metodologia semelhante à adotada para o teste de tipo de foco. Os materiais utilizados foram os mesmos (i.e, os mesmos registros) e os sujeitos, embora retirados do mesmo estrato, eram pessoas diferentes das que realizaram o teste de tipo de foco. Os dados foram coletados também utilizando o software Open Sesame, instalado no mesmo computador. A diferença de metodologia significativa entre os experimentos residiu no seguinte: ao invés de o informante ser exposto à mesma pergunta (identificar o tipo de foco), ele era solicitado a responder uma pergunta específica para cada frase, na qual deveria ser respondida levando em conta a possibilidade ou não de exaustividade. Por exemplo, ao ouvir a frase com foco no sujeito (“O Gustavo vai ser pai”), o informante deveria responder se, do modo como a frase foi dita, era possível que outra pessoa (no caso, Pedro) também pudesse ser pai. Uma mesma pergunta era feira para cada frase com foco, de acordo com (159-163) abaixo:
| 169 (158) Estímulo: “O Gustavo vai ser pai” (foco em [O Gustavo]) Pergunta: “Do jeito que a frase foi falada, O PAULO também pode ser pai?” (159) Estímulo: “A Gina fez café de noite” (foco em [de noite]) Pergunta: “Do jeito que a frase foi falada, a Gina pode ter feito café DE MANHÃ também?” (160) Estímulo: “O irmão da Rosa comprou a casa da esquina” (foco em [da Rosa]) Pergunta: “Do jeito que a frase foi falada, o irmão DO PEDRO também pode ter comprado a casa da esquina?” (161) Estímulo: “A Flávia vai comprar um carro mês que vem” (foco em [um carro]) Pergunta: “Do jeito que a frase foi falada, é possível que a Flávia vai comprar UMA CASA também?” (162) Estímulo: “Minha irmã trabalhou ontem” (foco em [trabalhou]) Pergunta: “Do jeito que a frase foi falada, a irmã do falante também pode ter IDO PASSEAR ontem?” A tela a qual o informante era exposto é representada na figura 28 abaixo. Caso o sujeito julgasse a possibilidade de exaustividade, deveria responder NÃO, apertando a tecla “L” do teclado; caso julgasse que não há exaustividade, deveria responder SIM apertando a tecla “A” do teclado:
Figura 33: Tela do teste de percepção de exaustividade Fonte: Elaboração própria
| 170 A ordem temporal dos itens do trial está representada no esquema abaixo:
3.4.3.2. Descrição dos resultados Ao final do experimento, tivemos (excluindo os dados em que os informantes não responderam a tempo), 1631 dados181. A distribuição das respostas por tipo de foco é apresentada no quadro abaixo:
Exaustivo Amplo Contrastivo Informacional Mirativo
175 42.68% 302 72.77% 254 62.87% 234 58.21%
NãoExaustivo 235 57.32% 113 27.23% 150 37.13% 168 41.79%
Total Geral 410 415 404 402
Quadro 23: Distribuição das respostas do teste de exaustividade por tipo de foco do estímulo Fonte: Elaboração própria
Como podemos ver, de maneira geral, os focos contrastivo e informacional foram os que mais foram julgados como exaustivos, enquanto os focos amplo e mirativo apresentaram valores medianos. Podemos também apresentar a distribuição considerando os padrões entoacionais atestados (e descritos na seção 3.4.3.):
181
A distribuição dos dados por estímulo é dada no Anexo IV.
| 171
H*H*H% H*H*H*H% H*H*HL*L% H*H*L% H*H*LL*L% H*HL*H% H*¡HL*H% H*HL*HL*L% H*HL*L% H*¡HL*L% H*HL*LL*L% H*LH*H% H*LH*HL*L% H*LH*LH*L% H*LH*LL*L% H*LL*L% HL*LL*L% LH*HL*L% LH*LL*L% Total Geral
Exaustivo
NãoExaustivo
Total Geral
24 58.54% 24 58.54% 29 72.50% 79 56.03% 18 85.71% 41 41.84% 11 55.00% 19 90.48% 222 45.40% 94 50.27% 57 69.51% 7 38.89% 17 80.95% 14 66.67% 50 80.65% 79 79.00% 16 76.19% 76 73.79% 88 84.62% 965
17 41.46% 17 41.46% 11 27.50% 62 43.97% 3 14.29% 57 58.16% 9 45.00% 2 9.52% 267 54.60% 93 49.73% 25 30.49% 11 61.11% 4 19.05% 7 33.33% 12 19.35% 21 21.00% 5 23.81% 27 26.21% 16 15.38% 666
41 41 40 141 21 98 20 21 489 187 82 18 21 21 62 100 21 103 104 1631
Quadro 24: Distribuição das respostas do teste de exaustividade por padrão fonológico Fonte: Elaboração própria
| 172 Podemos notar que os padrões marcados por deaccenting e por uma especificação de um acento em posição intermediária apresentaram valores mais elevados de identificação de exaustividade. Por outro lado, aqueles normalmente considerados padrões neutros (como H*HL*L%), apresentaram valores medianos (em torno de 50%) para exaustividade. Por fim, uma última distribuição que podemos apresentar é aquela que considera o constituinte focalizado:
Exaustivo ADVERBIAL COMPLEMENTO NOMINAL OBJETO SUJEITO VERBO Total Geral
158 47.88% 222 68.10% 187 58.07% 210 63.83% 188 58.02% 965
NãoExaustivo 172 52.12% 104 31.90% 135 41.93% 119 36.17% 136 41.98% 666
Total Geral 330 326 322 329 324 1631
Quadro 25: Distribuição das respostas do teste de exaustividade por sintagma focalizado Fonte: Elaboração própria
Como podemos observar, há pouca variação na distribuição dos dados por sintagma focalizado, o que pode nos sugerir que esse fator não desempenha papel relevante na escolha do informante pela exaustividade. No entanto, faz-se necessário que façamos uma análise estatística para verificar se os fatores acima observados são relevantes ou não na caracterização das respostas quanto à exaustividade dos estímulos. Faremos isso na próxima seção. 3.4.3.3. Análise estatística A análise escolhida para o teste de exaustividade foi a regressão logística, feita com um modelo misto182. O modelo maximal que executamos tomou como efeitos fixos os fatores presença de deaccenting, alongamento da vogal tônica do foco, tipo de foco, presença de tom ascendente (LH*) e sintagma focalizado; o fator informante foi modelado como efeito aleatório. Esse modelo foi simplificado a fim de remover fatores que não têm efeito significativo nos resultados: cada fator teve um efeito significativo, mas alguns níveis não são comparáveis. Assim, os níveis “contrastivo”, “informacional” e “mirativo” do fator tipo de foco foram 182
Utilizando a função glmer() do programa R.
| 173 agrupados; os níveis “sujeito” e “complemento nominal”, e os níveis “adverbial”, “objeto” e “verbo” também foram agrupados. Com essas modificações, obtivemos o modelo mínimo adequado, que é descrito no quadro abaixo:
Estimate
(Intercept) Deaccenting- sim LH - sim Lugar foco – Suj./C.N. Tipo foco - estreito Alongamento
-0.480 0.780 0.460 0.342 0.510 0.574
Std. Error
0.127 0.151 0.165 0.118 0.129 0.170
z value
-3.76 5.18 2.79 2.91 3.95 3.37
Pr(>|z|)
< 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001
Quadro 26: Resultado do teste de regressão logística para o teste de exaustividade Fonte: Elaboração própria
Como podemos ver, todos os fatores tiveram efeito relevante para a distribuição da variação das respostas. No entanto, é necessário atentar para o fato de que alguns fatores têm efeito maior do que outros: a presença de deaccenting tem o maior efeito, seguido pela presença de foco estreito (qualquer tipo, contrastando com foco amplo), o alongamento da vogal, foco no grupo sujeito ou complemento nominal, e a presença de tom LH*. Os gráficos abaixo apresentam esses resultados.
Figura 34: Boxplot da porcentagem de reconhecimento da exaustividade pela presença de deaccenting Fonte: Elaboração própria
| 174 Inicialmente, considerando a presença de deaccenting, percebemos que a ausência dessa configuração diminui bastante a porcentagem de reconhecimento da exaustividade (cerca de 30% na mediana), o que aponta para uma forte atuação desse fator na identificação da exaustividade.
Figura 35: Boxplot da porcentagem de reconhecimento da exaustividade pelo tipo de foco do estímulo Fonte: Elaboração própria
Por conseguinte, o gráfico acima mostra que, em comparação com o foco amplo, os demais tipos de foco favorecem a identificação da exaustividade. A possibilidade de simplificar o modelo, considerando apenas o foco amplo e as diversas instâncias de foco estreito advogam pela conclusão de que, na realidade, o julgamento da exaustividade não é sensível à distinção foco contrastivo-foco informacional (nem mesmo ao foco mirativo).
0.8 0.6 0.4 0.2
Reconhecimento da exaustividade
| 175
-0.5
0.0
0.5
Média de alongamento Figura 36: Gráfico de dispersão da porcentagem de reconhecimento de exaustividade pelo alongamento da vogal tônica do foco Fonte: Elaboração própria
Embora o gráfico acima não aponte para uma relação positivamente linear entre o alongamento e a taxa de reconhecimento da exaustividade, reconhecemos que os valores mais altos de alongamento favoreceram taxas maiores de percepção da exaustividade (note que, por exemplo, com alongamento inferior a 0 (ou seja, ausência de alongamento ou encurtamento), a região do gráfico de maiores taxas de reconhecimento é vazia, ao passo que a região de reconhecimento mais alta se situa na sua maioria na região positiva (acima de 0).
Figura 37: Boxplot da porcentagem de reconhecimento da exaustividade pela presença de acento tonal ascendente (LH*) Fonte: Elaboração própria
| 176 Quanto ao fator presença de acento tonal ascendente (LH*), percebemos no gráfico acima que há uma enorme diferença nas taxas de reconhecimento da exaustividade quando esse acento se faz presente (diferença de quase 40% entre as medianas). Isso pode ser devido ao fato de esse tipo de acento indicar o núcleo acentual da sentença (sobre isso, discutiremos na próxima seção).
Figura 38: Boxplot da porcentagem de reconhecimento da exaustividade por sintagma focalizado Fonte: Elaboração própria
Por fim, o último fator que apresentou relevância foi o sintagma focalizado. Percebemos que os níveis que apresentaram relevância (sujeito e complemento nominal) são os que apresentaram maiores probabilidades de serem identificados como exaustivos. Isso pode ser devido a interferência do conteúdo lexical da frase: a frase “O irmão da Rosa comprou a casa da esquina” pode implicar em ninguém mais ter comprado a casa, o que aumentou os julgamentos de exaustividade sobre essa sentença. Da mesma forma, a frase “O Gustavo vai ser pai” pôde ter levado os indivíduos a julgarem a frase como exaustiva (talvez por pensarem que seria difícil mais de uma pessoa ser pai ao mesmo tempo). Por isso é possível que o sintagma focalizado não necessariamente influencie os julgamentos de exaustividade por motivos prosódicos, mas por motivos puramente lexicais. Em suma, com a análise do teste de exaustividade, podemos chegar às seguintes conclusões:
| 177 1. Os fatores presença de deaccenting, tipo de foco, alongamento da vogal tônica do foco, sintagma focalizado e presença de tom LH induziram uma diferença estatisticamente relevante para o julgamento de exaustividade dos estímulos; 2. Dos fatores listados acima, podemos afirmar que o sintagma focalizado pode ter apresentado relevância por motivos não prosódicos: possivelmente houve interferência do conteúdo lexical das frases; 3. O fator tipo de foco foi relevante estatisticamente, e agrupou os focos contrastivo, informacional e mirativo em uma mesma faixa de reconhecimento de exaustividade, superior ao foco amplo;
Na próxima seção, iremos conjugar os achados de todos os experimentos e chegar a algumas generalizações a respeito da prosódica da focalização in situ. 3.5.Discussão dos resultados dos experimentos Nosso experimento revelou aspectos interessantes quanto ao fenômeno da focalização in situ. Em primeiro lugar, ficou clara a impossibilidade de atribuir a variáveis acústicas a especificação e diferenciação dos tipos de foco (pelo menos não categoricamente), já que, nos testes de produção, nenhuma dessas variáveis (F0 médio, variação de F0 no foco, intensidade média ou duração da sílaba tônica do foco) foi capaz de, inequivocamente, diferenciar todos os tipos de foco, embora, em alguns casos, essas grandezas possam ter sido convocadas para fazer algumas distinções. Esses casos específicos podem ser explicados pela veiculação de informações mais pragmáticas, que são suplementares à informação semântica possivelmente veiculada pela prosódia. Em segundo lugar, verificamos que as curvas entoacionais, conforme especificamos na seção 3.4.3, apresentam um padrão regular na diferenciação do foco amplo em contraste ao foco contrastivo, mas que o foco informacional apresentou bastante variabilidade, ora se assemelhando ao foco amplo, ora se assemelhando ao foco contrastivo. Isso fica mais claro ainda quando analisamos os dados de percepção. O gráfico abaixo mostra a distribuição das respostas dos informantes quanto ao tipo de foco nos dados que envolviam frases produzidas em contexto de foco informacional:
| 178
Título do Gráfico 50% 40%
Contrastivo; 25,00%
30%
Informacional; 32,14%
Amplo; 30,71%
20%
Mirativo; 10,00% 10%
Nenhum; 2,14% 0%
Figura 39: Gráfico de distribuição do reconhecimento do tipo de foco com o input de foco informacional Fonte: Elaboração própria
O gráfico acima demonstra claramente a variabilidade que o foco informacional apresentou quanto ao julgamento dos informantes. Isso atesta que o estatuto do foco informacional é bastante duvidoso no que diz respeito à sua prosódia. Um terceiro ponto que nos chamou a atenção nos experimentos foi a natureza do foco mirativo. Embora reconheçamos que, aparentemente, o foco mirativo pode estar associado à manutenção de tons globalmente mais altos (às vezes, como no caso de M1, envolvendo também taxas mais altas de intensidade), não achamos que isso seja suficiente para assumirmos uma codificação estritamente fonológica. Levando em conta a discussão já empreendida na literatura sobre a função paralinguística da prosódia (cf. Féry, 2017; Ladd, 2008), e considerando o que já afirmamos sobre a “semântica” do foco mirativo, na seção 2.4., nos parece muito mais razoável afirmar que os efeitos prosódicos desse “tipo de foco” sejam apenas a manifestação da emoção de surpresa. Ainda sobre isso, convém notar que, no teste de produção, o foco mirativo foi o que mais apresentou variação nas curvas entoacionais utilizadas, além de, no teste de percepção, ser o mais variável quanto ao reconhecimento do tipo de foco. Isso pode ser explicado justamente pelo fato de a miratividade ser “embutida” na prosódia depois da especificação fonológica. Assim, no caso de haver uma especificação para alguma característica vinda da sintaxe (como a exaustividade, por exemplo), a implementação fonética apresenta, como efeito paralinguístico, tons mais altos, que modificam a natureza da curva entoacional. Uma outra possibilidade seria assumir que a miratividade é, ainda que marginalmente, incluída na representação prosódica, mas veiculando apenas uma noção
| 179 pragmática de unexpectedness e não sendo capaz de “anular” a informação realmente semântica, que é a exaustividade183. De maneira geral, portanto, podemos concluir que, quanto aos tipos de foco, a única diferenciação que nos parece mais factível prosodicamente é aquela entre foco contrastivo e amplo. Essa diferença atestada pode ser melhor descrita em termos de sentença neutra x especificação de exaustividade. O teste de percepção que envolveu o reconhecimento de exaustividade apresentou resultados bastante superiores ao teste de tipo de foco, conforme vimos acima, especialmente nos casos em que houve deaccenting e nos casos em que houve especificação de acento nuclear em posição fora da periferia direita da sentença, como o que ocorreu nas sentenças com tom H*HL*HL*L% (atestado em sentenças com focalização no verbo, em que o segundo tom HL* recai sobre o verbo), que apresentaram mais de 90% de taxa de reconhecimento de exaustividade (conforme quadro 24). Dessa forma, podemos afirmar que, de acordo com o resultado dos nossos experimentos, a exaustividade é mais reconhecida do que a tipologia de foco. E isso parece intuitivo quando levamos em consideração a confusão, atestada acima, quanto ao foco informacional. Conforme argumentamos no capítulo 2, o foco contrastivo é, na imensa maioria dos casos, ligado à exaustividade, o que explica, por exemplo, que as ocorrências com foco contrastivo apresentaram taxas maiores de reconhecimento de exaustividade. No entanto, nada impede que uma resposta a uma pergunta wh (que ocorre em contextos de foco informacional) seja dotada de exaustividade. A aparente “confusão”, tanto na produção quanto na percepção do foco informacional é resultado justamente disso: o que é especificado na interface sintaxe-prosódia é a exaustividade: é esse traço que é responsável, nos casos em que ele aparece, pela alteração do núcleo prosódico do sintagma entoacional, cujos efeitos colaterais são, justamente, tanto a especificação de acento próprio (em posições que, normalmente, não receberiam acento tonal) quanto a presença de deaccenting, recurso usado pela fonologia para acentuar a relocação do núcleo prosódico. Dessa maneira, nossa proposta de análise da exaustividade na prosódia é a seguinte: PF carrega um traço sintático de [exaustividade], atribuído a um XP. O subcomponente prosódico, assumimos, possui a capacidade de “enxergar” esse traço. A formalização desse processo pode ser feita tanto utilizando uma abordagem semelhante à de Bocci (2013, cap. 6), através de regras de mapeamento sensíveis a traços, como utilizando, no modelo de Selkirk (2011), uma restrição
183
Um indicativo disso é o reconhecimento do foco mirativo como exaustivo, conforme demonstramos na seção anterior, a ponto de podermos incluir o foco mirativo no mesmo nível dos focos informacional e contrastivo, em oposição ao foco amplo, quanto à taxa de reconhecimento da exaustividade (ver Figura 35 e discussão).
| 180 que preveja a codificação do traço de exaustividade na fonologia. Quando uma sentença carrega o traço de exaustividade, o subcomponente prosódico atribui a esse constituinte o acento nuclear de ι, acarretando os efeitos prosódicos que encontramos acima. Desse modo, a sintaxe (pelo menos no que concerne à exaustividade184) não exige da prosódia a especificação de tons particulares, mas apenas aponta onde deve ser a especificação do núcleo prosódico. O subcomponente prosódico, nessa perspectiva, tem liberdade para atribuir os tons que se adequarem a outros inputs do subcomponente, como, por exemplo, a pragmática. Nessa perspectiva, a prosódia é um subcomponente que estabelece interface tanto com a sintaxe (na atribuição de acentos nucleares) quanto com a pragmática. Assumindo isso, não precisamos assumir que toda variação melódica é resultado de um input sintático (o que seria necessário, caso assumíssemos uma posição mais rígida, como a de Bocci), nem ter de assumir que as variações melódicas que não envolvem traços sintáticos sejam todas resultados de aspectos paralinguísticos (o que não parece rzaoável). Uma abordagem dessa natureza assume três campos de atuação da prosódia: um nível mais core, estritamente gramatical, que envolve apenas a atribuição de núcleos de ι e é influenciado diretamente pela sintaxe; um nível fora da gramática, mas ainda dentro do que chamamos de língua, que envolve a determinação de contornos melódicos e é resultado da interação da prosódia com a pragmática 185; e um nível mais externo, paralinguístico (no sentido de Ladd e Féry), que altera padrões globais de entoação e veicula aspectos psicológicos e mesmo fisiológicos. No capítulo 5 voltaremos a essa questão, na tentativa de formalizar essa proposta. 3.6.Resumo do capítulo Nesse capítulo, procuramos efetuar uma abordagem da prosódia da focalização in situ. Podemos destacar os seguintes pontos:
1. A representação sintática PF é codificada na fonologia através de uma estrutura prosódica, à qual são atribuídos acentos tonais discretos;
184
É bastante provável que essa afirmação não se sustente para perguntas totais (o que seria um problema para nossa proposta). No entanto, deixaremos essa investigação para pesquisas futuras. 185 Como definimos no capítulo 2, tomamos pragmática como o conjunto de fatores que são influenciados pelo contexto da enunciação e determinam aspectos superficiais da expressão linguística. A prosódia pode codificar, por exemplo, índices atitudinais (afetividade com a qual o indivíduo se coloca na situação), atos de fala (tais como confirmação, denegação – no sentido de Menuzzi (2012) –, dúvida, dentre outros), etc. Tais fatores pragmáticos podem determinar a configuração dos acentos tonais, respeitando sempre a atribuição de núcleo de ι feita pela gramática.
| 181 2. O conjunto de acentos tonais de uma sentença estabelece um “esqueleto”. A interpolação entre esses acentos é o que dá luz à curva melódica de uma sentença; 3. As análises sobre a prosódia da focalização, em geral, propõem uma distinção entre, de um lado, foco amplo e informacional, e, de outro, foco contrastivo. 4. Nossos experimentos, tanto de produção quanto de percepção, corroboram a afirmação 3 acima, embora possamos chegar a uma generalização mais adequada, que seria a presença vs. ausência de exaustividade; 5. O teste de percepção da exaustividade nos leva à conclusão que a exaustividade é mais percebida quando há (i) atribuição de acento nuclear em posição fora da periferia direita da sentença ou (ii) deaccenting (além de um efeito mais marginal do alongamento da sílaba tônica do foco); 6. Os efeitos prosódicos acima podem ser explicados através do fato de o componente sintático veicular um traço de exaustividade que se torna responsável pelo deslocamento do acento nuclear do sintagma entoacional da sentença; 7. Temos como conclusão que, no que concerne à focalização (tomada como exaustividade), a sintaxe não “manipula tons”, mas apenas “sinaliza” para a prosódia, através do traço de exaustividade, o núcleo de ι; 8. A prosódia é um subcomponente de interface, tanto com a gramática (isto é, a sintaxe), quanto com a pragmática, e a curva entoacional das sentenças é resultado da interação que a prosódia efetua com esses dois componentes, além de efeitos paralinguísticos.
Com base nessas conclusões, no próximo capítulo iremos apresentar nossa análise sintática para a focalização in situ, na tentativa de explicar como o componente sintático veicula o traço de exaustividade visível pela prosódia.
| 182 4 A SINTAXE DA FOCALIZAÇÃO IN SITU Nos capítulos anteriores, apresentamos um panorama geral de onde nosso trabalho se insere na investigação linguística, da necessidade de considerar o foco relevante em LF e da contraparte prosódica da focalização in situ. Chegamos à conclusão de que [exaustividade] é o traço relevante da focalização in situ, e que esse traço é o que deve ser previsto na estrutura sintática, pois ele alimenta, de um lado, a interpretação estritamente semântica, e, de outro, a especificação do acento nuclear da sentença. Neste capítulo, vamos apontar uma solução para essa questão. O capítulo está organizado da seguinte forma: primeiramente, vamos apresentar algumas análises sintáticas da focalização in situ em PB e propor nossas considerações a respeito. Em seguida, vamos apresentar dois problemas gerais que encontramos na abordagem cartográfica: a distinção sintática de tipos de foco e certas restrições de movimento que deveriam se aplicar ao foco in situ, mas não se aplicam. Na seção 4.4, vamos apresentar nossas propostas para a focalização, retomando, para isso, a discussão do capítulo 1 sobre Move e Agree, bem como a questão de uma possível correlação entre exaustividade e quantificação. Por fim, fecharemos o capítulo com um resumo da discussão. 4.1.Análises sobre a sintaxe do foco in situ em PB Análises da focalização in situ no PB são raras na literatura. Nesta dissertação, elegemos os trabalhos de Mioto (2001) e Quarezemin (2012) como os representativos. Ambos os trabalhos são calcados nas considerações da Sintaxe Cartográfica (Belletti, 2004a; Cruschina, 2012; Rizzi, 1997, 2004; Rizzi & Bocci, 2017; Rizzi & Cinque, 2016, inter alia), abordagem teórica que dá bastante importância para a possível codificação sintática de traços discursivos, como foco e tópico.
4.1.1. Mioto (2001) Mioto (2001) é um dos primeiros trabalhos a tratar do foco em PB com uma inspiração cartográfica, e, embora o autor não se limite a tratar apenas da focalização in situ, é importante trazer à tona esses trabalhos. O seu objetivo principal é aplicar o modelo de Rizzi (1997) a dados do português brasileiro, apresentando evidências para a cisão de CP. Assim como Rizzi, Mioto assume que a relação de especificação estabelecida pelo foco responde a um critério. Podemos definir critério como uma condição imposta a um elemento sintático. Algumas abordagens assumem diversos critérios para explicar a distribuição de elementos sintáticos,
| 183 como partículas de negação (Haegeman & Zanuttini, 1991, pp. 242–244), elementos wh (May, 1985, p. 17; Rizzi, 1996, pp. 64, 65) e tópico/foco (Rizzi, 1997, p. 287). Mioto (2001, p. 113) apresenta o critério que rege a disposição de elementos wh e foco da seguinte maneira: (163) Critério Wh (Foc) a. Um operador wh (Foc) deve estar em configuração Spec-núcleo com um X° [+wh (Foc)] b. Um Xo [+wh (Foc)] deve estar em configuração Spec-núcleo com um operador wh (Foc) Pelo critério exposto acima, elementos focalizados (operadores) deveriam se manifestar na posição de especificador de FocP, cujo núcleo seria dotado de traço [+Foc]. Mioto ainda reinterpreta o sistema de critérios à luz do minimalismo (desenvolvido até então), afirmando que um núcleo dotado do traço [Foc] atrai o constituinte focalizado para FocP na sintaxe visível apenas se o traço for forte. Esse movimento do foco resulta na checagem do traço de foco do núcleo. Essa reinterpretação, segundo o autor, dá conta da comparação entre sentenças com foco in situ e sentenças formadas por foco + que, conforme exemplos abaixo: (164) a. O João comeu O BOLO da Renata. b. O BOLO da Renata que o João comeu. Na interpretação minimalista de Mioto, o DP [o bolo] se move para CP apenas em (165b), pois o complementizador [que] é dotado de traço de foco forte, e atrai o DP focalizado para Spec de FocP (com o pied piping do adjunto). Por outro lado, como o núcleo nulo de FocP em (165a) possui traço de foco fraco, é dispensado o movimento do constituinte na sintaxe visível. No entanto, como o próprio Mioto reconhece (p. 115), essa solução (sem movimento do foco) não é capaz de gerar a entoação correta, de modo que PF não poderia, utilizando as considerações feitas no capítulo anterior, alterar a posição do núcleo do sintagma entoacional, de modo que a prosódia necessariamente adotaria a entoação não marcada. A solução para esse problema proposta por Mioto é assumir que “[...] a expressão Wh per se (ou o foco) é provida lexicalmente do traço relevante para identificar a sentença como interrogativa. Ou, observando que o pico acentual incide paralelamente sobre o foco e expressão Wh in situ [...], podemos dizer com Zubizarreta (1998) que nesse caso se aplica o princípio FCP (Focus Prosody Correspondence Principle: o constituinte de uma frase marcado pelo traço F(ocus) tem que conter a palavra ritmicamente mais proeminente). (p. 115)
As duas soluções propostas por Mioto parecem ser inadequadas para tratar a focalização in situ. Inicialmente, o autor propõe que o traço de foco, nesses casos, seria atribuído no léxico
| 184 ao constituinte focalizado. Não parece que seja esse o caso, já que é possível focalizar (com interpretação exaustiva, que é o que assumimos como relevante para a sintaxe) constituintes maiores que a palavra, como mostra abaixo: (165) O João comprou A CASA DO PAULO
(Inferência: Dentre um conjunto, especificado no contexto, das coisas que João poderia comprar, ele comprou somente a casa do Paulo)
Não parece ser viável assumir que um DP inteiro tenha um traço de foco atribuído lexicalmente. E note que, em (166) acima, o foco não é apenas [casa], mas sim todo o referente [a casa do Paulo]. Isso porque a focalização apenas em [casa] toma como conjunto pressuposicional o conjunto de coisas pertencentes ao Paulo que poderiam ser compradas (ver capítulo 2). Caso o foco fosse apenas [casa], o conjunto pressuposicional seria diferente – o que obviamente não é o caso. Assim, uma série de perguntas surgem: Como esse traço de foco seria enfeixado, se o escopo da focalização é maior do que a palavra? Em qual item lexical o traço de foco seria enfeixado? Como a atribuição de um traço a um item lexical resulta na focalização de todo o DP? Essas perguntas não parecem possuir uma aproximação simples, inviabilizando a solução de Mioto. A segunda solução se baseia na proposta de Zubizarreta (1998) a respeito da prosódia da focalização. Em linhas gerais, Zubizarreta propõe que a focalização altera o núcleo do sintagma entoacional da sentença (a mesma conclusão à qual chegamos no capítulo 3), de modo que alguns tipos de movimento nas línguas românicas (especialmente espanhol e italiano) podem ser derivados da tentativa de readequar o acento nuclear do sintagma entoacional (deslocado para o foco) com a posição do acento neutro das sentenças – o que Zubizarreta chama de p-movement. O princípio apresentado por Mioto propõe que um DP marcado para foco deve conter a palavra mais proeminente da sentença. Como nos exemplos dados pelo autor (p. 113) todos os focos se apresentam como a última palavra da frase (local da atribuição do acento neutro, como vimos no capítulo anterior), PF sabe como pronunciar esses dados apenas pela posição do foco ser coincidente com a posição do acento neutro. Novamente, essa solução não explica dados como (164a), em que o foco não está alinhado com a posição de atribuição do núcleo do sintagma entoacional (que seria, nesse caso, a sílaba tônica de [Renata]). Dessa forma, como o componente prosódico saberia a forma de pronunciar a sentença adequadamente, se, por um lado, não há traço de foco visível para tal e, por outro, o constituinte focalizado não está em posição coincidente com o acento nuclear de sentenças neutras? Assim, as soluções
| 185 propostas por Mioto não parecem ser adequadas para tratar plenamente das sentenças com focalização in situ.
4.1.2. Quarezemin (2012) O trabalho de Quarezemin é o mais recente no que diz respeito à análise sintática do foco in situ no PB. A hipótese da autora é que a focalização in situ envolve movimento sintático, independente do fato de que, considerando a ordem linear da sentença, não pareça haver tal movimento (como em (165a), por exemplo). Além disso, Quarezemin assume que sujeito e objeto são assimétricos em relação à forma como a focalização é codificada na sintaxe em PB: enquanto o sujeito apenas possui como possibilidade de pouso o Spec de FocP de CP, o objeto pode figurar tanto em posição baixa (na posição, proposta por Belletti (2004a), entre vP e IP) quanto em posição alta, no Spec de FocP de CP. A impossibilidade de o sujeito figurar nessa posição baixa de foco decorre do fato de o PB não apresentar inversão livre de sujeito (pelo menos não em linguagem coloquial), como ocorre no italiano, por exemplo: (166) Chi è arrivato alle 3? / Quem chegou às 3? a. (Alle 3) è arrivato Piero (alle 3). (Quarezemin, 2012, p. 206) b. *(Às 3) chegou o Pedro (às 3)186 Na proposta de Belletti, a sentença em (167a) apresenta inversão do sujeito devido à focalização informacional desse constituinte. O sujeito se move de sua posição de base para FocP acima de vP e depois o verbo se move para uma posição mais alta (provavelmente TP, embora na Sintaxe Cartográfica se proponha um núcleo SubjP mais alto), gerando a ordem atestada (os traços-phi do sujeito, nessa abordagem, são checados por um pronome expletivo que figura em Spec de TP, que está ligado ao DP [Piero]). No caso do PB, em (167b), uma explicação para a agramaticalidade está em o sujeito não poder se mover para FocP na região baixa de IP, tampouco se mover para Spec de uma posição alta (já que o verbo o antecede).
186
A sentença em (167b) não nos parece agramatical, o que pode ser explicado pela flexibilidade da ordem VS com verbos inacusativos (caso do verbo chegar). A sentença é bem mais degradada com verbos transitivos: (i) Quem leu o livro? *Leu o João o livro. No caso da sentença em (167b), é possível, inclusive, que se assuma o movimento para FocP na região baixa de IP, pois, como o DP [o Pedro] é, na verdade, complemento do verbo chegar, nada impediria que ele figurasse em FocP de IP. No entanto, preferimos manter a frase com o verbo inacusativo para facilitar a comparação com o exemplo do italiano dado por Quarezemin.
| 186 Nesse caso, o sujeito teria que permanecer em sua posição de base, e, como ele possui um traço de foco, não consegue checá-lo/valorá-lo, gerando agramaticalidade. A solução para essa questão, segundo Quarezemin, é a focalização interna ao DP. Nessa abordagem, o constituinte sujeito focalizado informacionalmente não figura em CP (que, na proposta de Quarezemin, é especializado em veicular foco contrastivo). Como FocP em CP e FocP acima vP estão indisponíveis, a solução que resta é propor mais uma projeção de FocP interna ao DP, conforme proposta por Aboh (2004)187. Assim, uma sentença como (168a) teria como representação (168b): (167) a. [A Maria]F comprou um carro b.
(Quarezemin, 2012, p. 209) Nesse exemplo, o NP [Maria] é alçado para uma projeção de FocP selecionada pelo núcleo D. Essa configuração satisfaria o critério foco e permitiria que o componente prosódico “soubesse” que aquele DP deveria ser pronunciado com entoação de foco informacional, sem que o sujeito focalizado precise figurar em uma posição de FocP acima de vP ou em CP. Por outro lado, a focalização contrastiva de sujeito seria semelhante à focalização contrastiva de objeto: os constituintes focalizados contrastivamente necessitam se mover para FocP em CP, já que essa posição é a específica para o foco contrastivo. Levando em consideração a ordem linear dos constituintes, essa solução não gera nenhum problema para a
187
Quarezemin ainda propõe que o sujeito não esteja em TP, mas em uma projeção acima, chamada SubjP, onde satisfaz um “critério-sujeito”. No entanto, como essa afirmação não influencia na análise proposta pela autora para o foco informacional, preferimos omitir esse fato, em nome da simplicidade da explanação.
| 187 focalização do sujeito (que naturalmente figura à esquerda da sentença) 188, mas a focalização contrastiva de objeto deveria, em princípio, resultar na ordem OSV, como (169) abaixo: (168) [O BOLO] o Paulo comeu. Quarezemin resolve essa questão apelando para a aplicação de uma operação de movimento de remanescente (remnant movement, na proposta de Kayne (1994)): primeiro o objeto se move para FocP em CP; em seguida, todo o TP se move para uma projeção mais alta (TopP, na representação da autora): (169) a. A Marta ganha UMA FLOR (não um chocolate) b.
(Quarezemin, 2012, p. 212) Por fim, a focalização informacional do objeto não precisaria lançar mão da focalização interna a DP, já que a projeção FocP acima de vP estaria disponível para a focalização desse tipo de constituinte. Nessa abordagem, o objeto se move para FocP mais baixo e, como tanto o sujeito quanto o verbo se movem sobre essa projeção, a ordem linear da sentença permanece a mesma de uma sentença neutra, diferindo apenas na prosódia, que é indicada justamente por o objeto estar em uma projeção de foco. Portanto, o trabalho de Quarezemin propõe 4 estruturas diferentes para a focalização in situ, que podemos esquematizar no quadro abaixo:
188
Na realidade, há o problema de que a proposta cartográfica assume um princípio de Criterial Freezing (Rizzi, 2006), que impede constituintes em posições criteriais de serem movidos. Como a projeção SubjP proposta pela Cartografia é uma posição criterial, o sujeito não deveria, em tese, poder se mover para FocP. Há algumas soluções para isso, propostas em trabalhos como Quarezemin (2012) e Guesser e Quarezemin (2013)
| 188
Sujeito
Objeto
Foco contrastivo - Constituinte em FocP de CP; - Sem movimento de remanescente (não necessário)
Foco informacional - Constituinte em FocP interno a DP, que pousa em Spec TP189
- Constituinte em FocP de CP; - Movimento de remanescente de TP para TopP acima do foco
- Constituinte em FocP acima vP
Quadro 27: Resumo da proposta de focalização in situ de Quarezemin (2012) Fonte: Elaboração própria
Nossas considerações sobre a proposta de Quarezemin se iniciam com o questionamento sobre a divisão entre tipos de foco codificados na sintaxe. Embora nos dedicaremos a essa questão mais especificamente na próxima seção, convém ressaltarmos que nosso experimento prosódico constatou que a diferença entre foco contrastivo (mais especificamente, focalização produzida em contexto de contraste de referentes) e foco informacional (igualmente, focalização produzida em contexto de resposta a pergunta wh) não é tão clara assim (em consonância com o que já foi exposto no capítulo 2, a respeito das considerações de Menuzzi (2012) sobre o tema). Nossos sujeitos do teste de percepção apresentaram bastante confusão na identificação do foco informacional. Isso, no mínimo, coloca dúvidas quanto à real necessidade de codificar a focalização informacional na sintaxe. Voltaremos a esse tópico mais adiante. Um segundo problema que vemos na proposta de Quarezemin está relacionado às questões de economia que apontamos no capítulo 1 desta dissertação. Quarezemin afirma que, por exemplo, a focalização informacional de sujeito é diferente da focalização informacional de objeto. Não fica claro, no entanto, por que deve ser assim: por que não assumir que a projeção de FocP baixa não existe, e tanto a focalização de sujeito quanto a de objeto in situ envolvem focalização interna a DP (já que o problema em questão é o sujeito)? Implicitamente, essa solução toma como pressuposto que todas as línguas focalizem informacionalmente seus constituintes na projeção baixa de FocP190. A partir disso, o sujeito é o caso diferente por uma impossibilidade (já que, segundo a autora, não pode figurar nessa projeção baixa de foco). No entanto, há um problema claro nessa análise: Belletti propõe a existência da projeção baixa de foco justamente para dar conta dos casos de focalização informacional de sujeito em italiano, que apresentam inversão com o verbo. Como esse fenômeno (ordem VS para focalização) é bastante restrito em PB (e nos casos em que é permitido, é muito difícil associar a ordem diretamente à focalização), não temos como evidenciar de maneira independente a existência
189
Ver nota 186. Caso não seja assim – e trabalhos como Cruschina (2012), de fato não assumem essa posição rígida – faz-se necessário que haja uma definição clara de como as línguas se comportam em relação a essa “opcionalidade”. 190
| 189 dessa projeção. Assim, Quarezemin adapta uma proposta feita para o italiano sem prover evidências independentes para essa projeção. Uma objeção a essa argumentação seria o fato de que propor a existência de uma estrutura sintática uniforme para todas as línguas respeita de forma mais plena o Princípio da Uniformidade (ver página 32 desta dissertação), o que demandaria que, se a projeção de foco baixa existe em italiano, existe (virtualmente) em todas as línguas. Porém, esse contra-argumento só seria válido se concordássemos com a proposta de Belletti, o que não é necessário. Embora esta dissertação não tenha condições (de espaço e de escopo) de prover contra-argumentos à proposta da autora italiana, é perfeitamente possível que a ordem VS no italiano possa ser derivada de outra forma. Fato é que a proposição de uma projeção FocP em posição baixa em PB se ancora na assunção de que tipos de foco diferentes são codificados de forma diferente na sintaxe, o que, como vimos quanto à semântica e à prosódia, nos capítulos 2 e 3 (respectivamente) – e como veremos adiante para a sintaxe – parece não ser o caso. Quarezemin ainda fornece um outro argumento para a existência dessas duas projeções: a autora afirma que foco informacional não pode preceder advérbios altos: (170) a. Quem recebeu o prêmio elegantemente? a'. ? Quem elegantemente recebeu o prêmio? b. #O Mauro elegantemente recebeu o prêmio. c. Elegantemente o Mauro recebeu o prêmio. d. O Mauro recebeu o prêmio elegantemente. (Quarezemin, 2012, pp. 207, 208) A autora justifica a inadequação de (171b) pelo fato de o sujeito, portador de foco de informação, não estar pousado em FocP de CP; como não está em uma posição alta, ele, logicamente, não pode preceder advérbios cuja posição seja CP (mais especificamente, ModP, segundo Rizzi e Bocci (2017) – ver página 48 desta dissertação). No entanto, a inadequação de (171b) pode ser facilmente explicada por questões de peso fonológico191: o advérbio [elegantemente], por ser fonologicamente pesado, não pode intervir entre um sujeito fonologicamente leve e o verbo. Tanto é assim que (i) se o sujeito for tão pesado quanto o advérbio, a sentença é salva (cf. 172), e (ii) um advérbio interveniente fonologicamente pesado, mesmo sendo baixo, torna a sentença inadequada (cf. 173):
191
Trataremos mais dessa questão na seção 4.2, pois Cruschina (2012) apresenta argumento semelhante.
| 190 (171) a. ?Quem elegantemente recebeu o prêmio?192 b. O irmão do Mauro elegantemente recebeu o prêmio. (172) a. Quem todo santo dia entrega as quentinhas para o Rafael? b. #O Mauro todo santo dia entrega as quentinhas para o Rafael. c. O Mauro entrega as quentinhas para o Rafael todo santo dia. Embora não possamos desenvolver, nesta dissertação, por que aparentemente o peso fonológico desempenha papel importante no ordenamento de adjuntos193, o que podemos extrair desses exemplos é que a impossibilidade de anteposição do sujeito informacionalmente focalizado nos exemplos acima pode ser explicada por fatores puramente prosódicos, e não por o sujeito figurar em uma posição mais baixa. Na realidade, se essa explicação está correta, temos mais um argumento contra a codificação do foco informacional, mesmo na prosódia. Normalmente se assume que a focalização torna o constituinte pesado (cf. Frota & Vigário, 2001). No entanto, se esse fosse o caso na focalização informacional (e a inadequação de (171b) e (173b) se dá por motivos de peso), então, teoricamente, tanto (171b) quanto (173b) deveriam ser adequadas. Se não o são, é justamente porque tais sujeitos não projetam acento nuclear do sintagma entoacional; consequentemente, foco informacional não é codificado pela sintaxe (a menos que envolva exaustividade, situação em que ambas as sentenças seriam adequadas). Um último problema que podemos apontar na proposta de Quarezemin diz respeito à natureza quantificacional do foco e as imposições sintáticas que advêm de assumirmos essa posição. Como visto na seção 2.3.2., o foco dispara uma leitura de quantificação. Também vimos que essa quantificação é estabelecida na sintaxe através do movimento para CP. Consequentemente, todo foco deveria, em princípio, se mover para CP (já que a interpretação quantificacional do foco é muito mais defensável semanticamente do que qualquer propriedade discursiva vinda de um contexto de introdução de referente). Essa afirmação coloca dois problemas para a análise de Quarezemin: primeiro, se o foco informacional de objeto e sujeito se mantém, para usar as palavras da autora, dentro do “domínio sentencial”, como ele pode estabelecer, satisfatoriamente, a relação de quantificação necessária (que ocorre fora desse “domínio”)? Assumir que, no caso da focalização de sujeito, a projeção de foco interna a DP é quantificacional é, a nosso ver, um ad hoc com uma fraca argumentação – uma solução
192
Embora Quarezemin coloque o símbolo (?) para indicar a estranheza dessa sentença, nós a achamos completamente aceitável. No entanto, para manter a fidelidade ao exemplo dado pela autora, resolvemos manter o símbolo. 193 Não intentaremos elaborar uma acomodação teórica dessa afirmação dentro da gramática gerativa. No entanto, entendemos bem que tal questão é, no mínimo, carente de uma melhor explicação intrateórica, já que não é facilmente percebido como o componente fonológico consegue influenciar o ordenamento de constituintes.
| 191 específica para um problema específico, que é pouco justificada e não é aproveitada em nenhum outro caso (todos os quantificadores por excelência – como todo, nenhum, etc. – sofrem alçamento para CP em LF). O mesmo vale para a projeção baixa de foco. Por esse motivo, concluímos que é insatisfatória a análise de Quarezemin para a focalização in situ em PB.
Após as análises dos trabalhos mais relevantes quanto à focalização in situ, podemos apontar para dois problemas mais gerais, que afligem todas as propostas de focalização baseadas em movimento. Chamamos esses problemas de “o problema dos tipos de foco” e “o problema das ilhas”, que serão detalhados na próxima seção. 4.2.O problema da análise cartográfica – parte 1 (ou “o problema dos tipos de foco”) No capítulo 2, argumentamos que o aspecto estritamente semântico da focalização pode ser resumido em (i) quantificação e (ii) efeito nas condições de verdade através da exaustividade (relativizada), concordando com Menuzzi (2012) ao afirmar que as diferenças pragmáticas entre os tipos de foco são sutis demais para poderem ser codificadas em traços sintáticos discretos e binários. No entanto, e se mesmo assim houvesse argumentos a favor da codificação de diferentes “tipos de foco”? Diversas análises propõem essa distinção, apresentando tais argumentos. Neste trabalho, elegemos para discussão a argumentação feita por Cruschina (2012). Analisando dados de dialetos do italiano (especialmente o siciliano, o sardenho e o turinês), o autor propõe que foco informacional e foco contrastivo envolvem projeções diferentes na estrutura sintática. Inicialmente, ele reconhece a dificuldade de, ao analisar questões relacionadas à Estrutura Informacional, estabelecer fronteiras claras entre o que é computado pela sintaxe e o que é apenas pragmático: Não é sempre claro se um específico tipo de tópico ou foco pertence ao conjunto de objetos sintáticos visíveis para computação ou se, ao invés disso, se refere a um valor pragmático em particular ou a uma função que não é diretamente derivada da estrutura sintática. (p.9, Tradução nossa194)
Como apresentado na introdução deste trabalho, nosso critério de determinação do que é sintaticamente interpretado diz respeito diretamente a necessidades das interfaces: se dada informação é lida em LF mas expressa apenas por meios fonológicos, então tal informação “It is not always clear if a specific type of topic or focus belongs to the set of syntactic objects visible for computation or if it instead refers to a particular pragmatic value or function that is not directly derived from syntactic structures.” 194
| 192 necessariamente precisa ser codificada na sintaxe. No entanto, o autor assume uma posição de defesa na distinção entre foco informacional (IFoc, na sua notação) e foco contrastivo (CFoc), afirmando que: Uma distinção entre IFoc e CFoc tem sido claramente delineada por muitos sintaticistas que argumentaram em favor de posições diferentes dedicadas para os dois tipos de foco. Além disso, essa distinção tem sido atestada e comprovada como crucial nas interfaces, tanto pragmaticamente [...] e prosodicamente [...]. Assim, nós mantemos que essa distinção é codificada sintaticamente. (p. 17, Tradução nossa195)
Nessa citação, Cruschina defende a diferenciação do foco na sintaxe com três argumentos: (1) os sintaticistas que defendem uma rica camada de projeções funcionais (Cartografia Sintática) aceitam duas posições de foco; (2) a distinção entre tipos de foco é relevante pragmaticamente; e (3) a distinção entre tipos de foco é relevante prosodicamente. Quanto ao primeiro argumento, não é necessário que se postulem duas projeções diferentes de foco ao se assumir uma rica camada de projeções funcionais simplesmente porque “todo mundo faz”: em geral, as motivações que a maioria dos trabalhos têm para tal envolvem (i) necessidades conceituais intrateóricas (como o princípio one feature, one head, proposto pela Sintaxe Cartográfica – e necessidades conceituais devem sempre vir acompanhadas de embasamento empírico); (ii) construções particulares a algumas línguas (como a focalização via VS do italiano, cuja proposta de Belletti (2004a) envolve essa distinção); (iii) supostas diferenças semânticas (assunto sobre o qual já discutimos no capítulo 2); ou (iv) diferenças prosódicas, que é o terceiro argumento de Cruschina. Quanto ao segundo argumento, podemos rejeitá-lo simplesmente por afirmar que é impossível que todas as diferenças pragmáticas devam ser codificadas sintaticamente (afinal, não encontramos evidências de línguas em que, por exemplo, ironia ou implicaturas conversacionais sejam codificadas na sintaxe). Daí é pertinente nos perguntamos por que uma categoria como foco é codificada na sintaxe mas, por exemplo, ironia, não – uma questão que não parece ter solução simples. Uma posição bem mais coerente com o modelo da Gramática Gerativa é justamente o que estamos defendendo, de “colocar na conta” da sintaxe apenas os traços relevantes em LF que são “vistos” também por PF196. O terceiro argumento, o mais forte, apela para diferenças prosódicas que deveriam estar codificadas na sintaxe. Bem, apenas por algo estar codificado prosodicamente não implica reflexo na estrutura sintática. Como Féry (2017) bem argumenta – e apontamos isso no capítulo “A distinction between IFoc and CFoc has been clearly drawn by several syntacticians who have argued in favour of different dedicated positions for two types of focus [...]. In addition, this distinction has been attested and proven to be crucial at the interfaces, both pragmatically [...] and prosodically [...]. We thus maintain that this distinction is syntactically encoded.” 196 Quanto ao que é relevante em LF, ver seção 2.1. 195
| 193 anterior –, existem diversos aspectos da prosódia que são ora exclusivamente pragmáticos, ora subjetivos e ora apenas e tão somente fisiológicos: Quando detalhamos o que pode ser considerado paralinguístico na entoação, descobre-se que alguns aspectos são fisiológicos, outros são parte da comunicação de emoção e ainda outros são melhor classificados como componentes pragmáticos da entoação dependentes da linguagem. (Féry, 2017, p. 170, Tradução nossa) 197
Da mesma forma que não há evidências para assumir que ironia seja codificada na sintaxe, também não se pode afirmar que aspectos emotivos, bem como aqueles relacionados à fisiologia do aparelho fonador e da reação natural do corpo humano às emoções estejam codificados na sintaxe apenas por terem reflexo na manifestação da frequência fundamental, da intensidade ou da duração dos segmentos. Novamente parece adequado defender uma posição intermediária: se uma dada informação relevante em LF é codificada apenas pela prosódia (como ocorre com o foco in situ), então tal informação, na verdade, está prevista na estrutura sintática. Como argumentamos no capítulo 2 (e analisamos prosodicamente no capítulo 3), essa informação pode ser reduzida ao traço de exaustividade (conforme definida na seção 2.3.1.). No entanto, Cruschina apresenta uma visão contrária à nossa, advogando pela diferença entre tipos de foco codificada na sintaxe, apresentando possíveis argumentos de natureza sintática para tal. Inicialmente, o autor dá exemplos de línguas como o espanhol, em que foco contrastivo envolve fronteamento enquanto foco informacional não: (173) a. MANZANAS compró Pedro (y no peras) ‘Pedro comprou BANANAS (e não pêras) (174) a. ¿Qué compró Pedro? ‘O que o Pedro comprou?’ b. Pedro compró manzanas. c. #manzanas compró Pedro. ‘Pedro comprou bananas.’
(Cruschina, 2012, p. 95)
Nesses exemplos, Cruschina mostra que o fronteamento em espanhol não aceita foco informacional. No entanto, a única coisa que esse exemplo demonstra é que o foco informacional não é codificado sintaticamente em espanhol, impossibilitando seu movimento para a periferia esquerda da sentença. Transformando essa afirmação em termos minimalistas,
“When going into details of what may be considered paralinguistic in intonation, it turns out that some of them are physiological, others are part of the comunication of emotion and still others are best classified as language-dependent pragmatic components of intonation.” 197
| 194 podemos dizer que a periferia esquerda veicula um traço de exaustividade [E], e esse traço não está presente em sentenças de foco informacional como o exemplo (175b) – se o traço não está presente, o movimento é inviabilizado. Nesse caso, se o constituinte focalizado informacionalmente tivesse um traço de foco informacional, a derivação não convergiria em LF, pois não haveria onde esse traço ser checado/valorado. A conclusão lógica é que não há traço de foco informacional codificado na sintaxe. Uma outra linha de argumentação apresentada por Cruschina envolve a comparação entre três dialetos do italiano: o siciliano (falado na ilha da Sicília), o sardenho (falado na região da Sardenha) e o turinês (falado em Turim). Cruschina afirma que o siciliano e o sardenho são línguas nas quais o fronteamento do foco pode ocorrer tanto com foco informacional quanto com foco contrastivo – e analisa esse fato afirmando que, nessas línguas, ambos os tipos de foco miram projeções FocP na camada CP –, enquanto no turinês o foco sempre aparece em posição pós-verbal198: (175) a. Gioann a l’ha catà IL GELATO, nen la torta ‘Gioann comprou O SORVETE, não a torta’ (Cruschina, 2012, p. 103) Cruschina argumenta que o caso do turinês envolve o movimento do foco para a projeção baixa de FocP, proposta por Belletti (2004a). O problema (óbvio) dessa análise é o fato de que não há nada no ordenamento dos constituintes que permita essa solução: é perfeitamente possível que o foco permaneça in situ no turinês, e (caso nossa proposta possa ser aplicada) se comporte à semelhança da focalização in situ no PB (cuja sintaxe veremos na seção 4.4.). Para se assumir a solução proposta pelo autor, é necessário que, antes, se assuma a existência da projeção baixa de FocP, o que não é uma pressuposição necessária (e acaba tornando a argumentação do autor circular199). Um outro argumento proposto por Cruschina diz respeito a efeitos de adjacência apresentados pela focalização, que diferencia foco informacional de foco contrastivo. O autor afirma que, em siciliano, o foco informacional precisa estar adjacente ao verbo, enquanto o foco contrastivo não:
198
O autor não dá exemplos de casos com focalização de sujeito, para que confirmássemos se a afirmação acima está conceitualmente correta (caso esteja, e o foco sempre figure em posição pós-verbal, a focalização de sujeito exibiria ordem VS(O)). 199 Circular porque se assume que existe projeção baixa de foco porque ela acontece no turinês; e o foco em turinês está na projeção baixa de foco porque tal projeção existe.
| 195 (176) a. A cu i dasti i chiavi? ‘A quem eles deram as chaves?’ b. A Salvo i detti (i chiavi) ‘Ao Salvo eles deram (as chaves)’ c. *A Salvo i chiavi i detti *‘Ao Salvo as chaves eles deram’ (177) a. A SALVO i chiavi i detti (, no a Pinu) ‘AO SALVO as chaves eles deram (, não a Pinu) À primeira vista, essa assimetria diferencia os tipos de foco – e além disso, dá base para Cruschina argumentar que há duas projeções de foco na camada CP, uma mais baixa e outra mais alta (totalizando 4 projeções de foco na estrutura sintática: duas em CP, uma acima de vP e outra interna a DP). No entanto, há um modo muito mais simples de derivar essa restrição. Frota e Vigário (2001), analisando dados do português europeu, apontam para certos efeitos que o peso fonológico de constituintes pode exercer sobre o ordenamento de constituintes na frase200. As autoras dão três exemplos: reordenação de complementos (179), topicalização (180) e inserção de parentéticas (181): (178) a. ??/* A Ana comprou [o quadro do vencedor do concurso] [ao Pedro]. b. A Ana comprou [ao Pedro] [o quadro do vendedor do concurso]. c. A Ana comprou o quadro do vencedor do concurso AO PEDRO (179) a. ??/* [As dúvidas que tínhamos]ι, [aos nossos orientadores]ι, [expusemos]ι b. [As dúvidas que tínhamos]ι, [aos nossos orientadores]ι, [detalhadamente]ι c. [As dúvidas que tínhamos]ι, [aos nossos orientadores]ι, [EXPUSEMOS]ι (180) a. ??/* [O João comprou]ι, [segundo me disseram]ι, livros]ι. b. [O João comprou]ι, [segundo me disseram]ι, livros caros]ι. c. [O João comprou]ι, [segundo me disseram]ι, LIVROS]ι. (Frota & Vigário, 2001) Os exemplos acima demonstram que (i) a ordem entre complementos direto e indireto apresenta uma restrição quanto ao tamanho dos constituintes, e (ii) que a interveniência de um sintagma entoacional dentro de outro sintagma entoacional não pode ocorrer quando um dos “lados partidos” não é fonologicamente pesado. No entanto, qual é a definição de “fonologicamente pesado”? As autoras propõem a seguinte (para o português europeu):
200
Ver nota 192.
| 196 (181) Um constituinte é pesado sse a) fonologicamente ramificado (i.e. constituído por mais material do que o constituinte fonológico do tipo relevante); ou b) portador de propriedades de proeminência que o distingam dos restantes (e.g. acento de foco prosódico). (Frota & Vigário, 2001) Por trás dessa definição está o fato de que tanto a quantidade de material fonológico quanto as relações de proeminência estabelecidas são fatores importantes no fraseamento dos constituintes. Se levarmos isso em consideração, podemos explicar os dados apresentados por Cruschina, já que, no caso do foco informacional, todos os dados fornecidos por ele de focalização informacional envolvem apenas uma palavra prosódica. Se tomarmos como exemplo a sentença em (177c), podemos ver isso claramente: o fronteamento, com a interveniência do objeto (aparentemente topicalizado) possivelmente estabelece uma quebra do sintagma entoacional da frase, que só poderia ser permitida caso o complemento preposicionado focalizado fosse (i) constituído de mais de uma palavra prosódica ou (ii) possuísse proeminência focal201. Uma solução adotando exigências de interface (essa exigência de peso seria feita pelo subcomponente prosódico), mesmo com a necessidade de melhor fundamentação intrateórica, é bem mais aceitável do que a proposta de haver mais de uma projeção de foco em CP (que levantaria uma série de problemas, inclusive de ordem semântica). O único possível contra-exemplo dado por Cruschina envolve focalização mirativa: (182) ??/* Non ci posso credere! Due bottiglie, al pub, ci siamo bevuti! ‘Não acredito! Duas garrafas, no bar, nós bebemos!’ Nesse exemplo, era de se esperar que a sentença fosse aceitável, já que (pelo menos à primeira vista), o DP [Due bottiglie] é fonologicamente ramificado. No entanto, se atentarmos para o fato de que esse mesmo DP, ramificado quanto às ocorrências de palavras prosódicas (ω), é formado por apenas um sintagma entoacional (φ), podemos argumentar que, no siciliano, o peso de constituintes prosódicos envolve a quantidade de φs dentro do sintagma entoacional, e não de ωs. O contra-exemplo mais completo (que invalidaria nossa análise) deveria ser algo como:
201
É óbvio que não estamos propondo que, necessariamente seja esse o caso, já que, para que tal tipo de afirmação categórica fosse feita, seria necessário elaborarmos um estudo sobre a prosódia do siciliano, tentando identificar se as produções de foco informacional apresentam entoação sem relações explícitas de proeminência capazes de sustentar o elemento focalizado fraseado sozinho no sintagma entoacional – uma empreitada que foge totalmente ao escopo deste trabalho. No entanto, esse caminho de análise, como argumentaremos a seguir, é muito menos danoso à teoria do que propor duas projeções de foco em CP.
| 197 (183) ??/* Non ci posso credere! [[Due bottiglie]φ [di vinu]φ]ι, al pub, ci siamo bevuti! No exemplo (184), a ramificação de ι em dois φs torna, definitivamente, o DP pesado fonologicamente. No entanto, não temos evidência desse tipo de dado em siciliano. Ainda sobre o foco mirativo, Cruschina afirma que esse seria um subtipo do foco informacional, que, conforme já aludido na seção 1.2., envolve a especificação de um operador mirativo que entra em relação com a posição FocP que receberia o foco informacional. O autor não equipara foco mirativo com informacional por dois motivos: primeiro, ele julga importante que a gramática codifique a relação de unexpectedeness estabelecida pela miratividade. Além disso, ele reconhece que o fronteamento mirativo pode, por vezes, estabelecer contraste. Quanto à primeira questão, já abordamos a (des)necessidade de assumir que a miratividade seja uma característica semântica sintaticamente codificável. Quanto à segunda, o caráter duplo do foco mirativo apenas reforça nossa ideia de que foco informacional e foco contrastivo não envolvem categorias diferenciáveis na semântica/sintaxe, e de que, por conseguinte, o foco mirativo pode ser traduzido como a adição de um importe pragmático a um constituinte que, por sua vez, pode ou não estar carregando o traço de exaustividade. Por fim, Cruschina apresenta dois argumentos a favor da diferenciação entre tipos de foco: primeiro, o foco informacional em siciliano não pode figurar no CP de sentenças encaixadas, enquanto o foco contrastivo pode: (184) a. Chi voli ca ci accattu au mercatu ? ‘O que ele quer que eu compre para ele no mercado?’ b. I mennuli voli ca ci accatti ‘As amêndoas ele quer que você compre para ele’ c. * Voli ca i mennuli ci accatti *‘Ele quer que as amêndoas você compre para ele’ (185) Voli ca I MENNULI ci accatti (, no i fastuchi) ‘Ele quer que AS AMÊNDOAS você compre para ele (, não os pistaches) Além disso, Cruschina afirma que foco contrastivo pode ser extraído de ilhas de wh, enquanto o foco informacional não:
| 198 (186) a. *A Pina un sacciu quannu annu a operari. ‘*A Pina eu não sei quando eles vão operar. b. A PINA um sacciu quannu annu a operari (quannu annu a operari a Salvo u sacciu). ‘A PINA eu não sei quando eles vão operar (quando eles vão operar o Salvo eu sei) Esses dois argumentos são interessantes, e de difícil contra-argumentação. De fato, aparentemente há uma assimetria entre foco contrastivo e foco informacional. No entanto, é necessário entender se essa assimetria vem, explicitamente, da natureza pragmático-discursiva desses focos ou de alguma outra propriedade gramatical. Quanto aos dados em (185-186), Cruschina afirma que a assimetria ocorre porque, na realidade, há dois traços sintáticos: um traço [foc], que só está presente no CP da sentença matriz (atraindo o foco informacional), e um traço [contr], que está presente tanto no CP da sentença matriz quanto da encaixada, de modo que o sintagma focalizado contrastivamente é atraído para essa posição na sentença encaixada (respeitando Minimalidade Relativizada (Rizzi, 1990)). Quanto ao segundo aspecto (nos dados em (187)), o autor afirma que, por essa sensibilidade a ilhas wh, foco informacional se comporta semelhantemente a elementos wh (que também não podem ser extraídos de tal tipo de ilhas). Por mais que os exemplos em si sejam desafiadores, podemos tentar propor uma análise alternativa: embora até aqui assumimos que a focalização sempre envolve exaustividade e quantificação, não é muito claro se a existência concomitante de exaustividade e quantificação é condição sine qua non para a focalização. Caso não seja, podemos assumir que, por exemplo, o contraste em (187) não envolva quantificação, ou que o foco informacional em (186) não envolva exaustividade. Se propomos, por exemplo, que a exaustividade no siciliano se manifesta apenas no CP matriz e que a quantificação pode se dar através de movimento para o CP intermediário, (186c) poderia ser agramatical porque o foco (exaustivo) está em uma posição que não veicula o traço de exaustividade, e que em (187) o foco “contrastivo” não se move para o CP matriz por não estar codificado para exaustividade (como vimos na seção 3.3.4., é possível haver contraste sem exaustividade), mas apresenta quantificação, o que o obriga a ir para o CP intermediário. Embora essa afirmação não se pretenda definitiva, ilustramos que é possível que essa assimetria seja explicada sem apelar para uma diferença sintática entre tipos de foco. Quanto o segundo argumento de Cruschina, Rizzi (2001) afirma que quantificadores wh só podem ser extraídos de ilhas-wh se estabelecem um conjunto pressuposicional:
| 199 (187) a. ?Quanti problemi non sai come risolvere ___ ? ‘Quantos problemas você não sabe como resolver?’ b. *Quanti soldi non sai come guadagnare ___ ? ‘Quanto dinheiro você não sabe como ganhar?’ (Rizzi, 2001, p. 97) Rizzi argumenta que a sentença em (188a) é mais aceitável que (188b) porque, no primeiro caso, há um conjunto pressuposicional de problemas sobre os quais se está perguntando, enquanto em (188b) não há um “conjunto de dinheiros”. Se assumirmos que a existência de um conjunto pressuposicional nos casos de extração de quantificadores permite a extração do foco (o que ocorre em contexto de exaustividade), podemos dar conta da assimetria atestada por Cruschina: em (187b), o foco pode ser extraído por possuir um conjunto pressuposicional associado, enquanto (187a) isso não ocorre, e a extração é proibida. Com base nessa discussão, podemos concluir que a divisão entre foco informacional e foco contrastivo, abordada por Cruschina como relevante na sintaxe, apresenta a possibilidade de diversas contestações e contra-argumentos. No entanto, o ideal seria refutar a análise do autor através de uma proposta alternativa, e tal tarefa, embora necessária, não poderá ser feita exaustivamente neste trabalho. No entanto, algumas hipóteses podem ser testadas quanto a isso: inicialmente, Crushina assume que, em siciliano, a focalização geralmente se manifesta pelo fronteamento do constituinte. Essa afirmação, aliado ao fato de que, conforme apontado por ele, itens quantificadores em geral também são deslocados para CP antes de Spell-Out, pode nos permitir assumir que a focalização – que envolve quantificação – se move sempre abertamente para a periferia da sentença em siciliano, justamente por ser quantificacional. Em turinês, por outro lado, o movimento do foco para CP sempre ocorre na sintaxe encoberta. Assim, a assimetria entre esses dialetos se dá pelo momento da derivação na qual o movimento ocorre – se pré ou pós Spell-Out –, e não pela existência de duas (três ou quatro) projeções de foco na estrutura sintática. Quanto aos casos em que a focalização informacional não envolve fronteamento (atestado pelo autor), podemos assumir que, de fato, não há focalização no sentido quantificacional do termo – há apenas a introdução de um referente no discurso. Pelos dados apresentados por Cruschina, e abordados nos exemplos (185-187), poderíamos concluir que o foco, além de envolver quantificação, pode envolver o estabelecimento de um conjunto pressuposicional (possivelmente associado à exaustividade). Essas considerações vão ao encontro da nossa proposta para a focalização in situ no PB, conforme veremos na seção 4.4. Embora praticamente todos os trabalhos que tratam do foco apresentem como hipótese a diferenciação na sintaxe entre foco contrastivo e informacional, há alguns trabalhos
| 200 interessantes que seguem uma linha semelhante ao que estamos adotando aqui. É. Kiss (1998), por exemplo, argumenta que, no húngaro, há diferenças entre foco exaustivo (chamado pela autora de identificacional) e foco informacional, mas que apenas o primeiro é codificado na sintaxe. Vejamos os exemplos202: (188) a. Mari egy kalapot nézett ki magának Mari um chapéu-ACC pegou fora ela mesma-ACC ‘Mari pegou UM CHAPÉU para ela mesma’. b. Mari ki nézett magának egy kalapot ‘ Mari pegou para ela mesma um chapéu’
(É. Kiss, 1998, p. 249)
Os contextos adequados para essas sentenças são dados pela autora: A sentença [(189a)], contendo um foco identificacional pré-verbal, seria adequada para descrever uma situação na qual Mari escolhe uma dentre várias peças de roupa; expressa que, das peças de roupa presentes no domínio do discurso, ela pegou para si um chapéu, e não pegou nada mais. [...] [(189b)] seria adequada em um contexto no qual Mari é um participante familiar; a ação de escolher [...] pode ou não ser inferida dos eventos precedentes [...]; e o DP egy kalapot ‘um chapéu-ACC’ introduz uma informação nova, não pressuposta [...]. (p.249. Tradução nossa)203
É. Kiss afirma que as sentenças com deslocamento para posição pré-verbal no húngaro envolvem leitura exaustiva (em um conceito de exaustividade relativizada semelhante ao que propomos na seção 2.3.1.), enquanto a posição pós-verbal (in situ) apenas veicula a introdução de um referente novo, sem necessidade de interpretação exaustiva. A autora defende que, no primeiro caso, há movimento do DP [egy kalapot], enquanto no segundo o constituinte não se move. O movimento do DP no foco identificacional é responsável por criar uma relação quantificador-variável, indispensável semanticamente ao foco (como já vimos em diversas partes do texto). Quanto à derivação, a autora propõe uma projeção funcional acima de VP, que recebe o foco identificacional, seguido do movimento do sujeito para uma posição mais alta204.
202
ACC indica caso acusativo. “Sentence [(189a)], containing a preverbal identificational focus, would be adequate to describe a situation in which Mary choose one from among various pieces of clothing; it expresses that of the pieces of clothing present in the domain of discourse, she picked for herself a hat, and she did not pick anything else. […] [(189b)] would be adequate in a context in which Mary is a familiar participant; the action of choosing […] can or cannot be inferred from the preceding events […]; and the DP egy kalapot ‘a hat-ACC’ introduces new, nonpressupposed information […].” 204 Não intentaremos questionar a análise da autora. Uma análise do húngaro dentro da perspectiva sintática que estamos assumindo neste trabalho poderia revelar onde, exatamente, está contida essa projeção funcional (já que não nos parece uma saída muito elegante “inventar” uma projeção funcional acima de VP apenas para explicar a ordem). 203
| 201 Embora É. Kiss reconheça que existem diferenças pragmáticas entre o foco identificacional e o foco informacional, fica claro que apenas o foco identificacional é derivado sintaticamente. A diferença da nossa proposta para a da autora é a de que assumimos que, em PB, o foco in situ também pode ser exaustivo (conforme argumentamos no capítulo 2). Essa diferença não é muito relevante, já que estamos tratando de línguas diferentes – embora seja um excelente objetivo propor uma análise generalizada da focalização capaz de justificar todas as suas manifestações. Além da questão de diferenças de tipos de foco, a proposta cartográfica não consegue explicar, dentro do conjunto de pressuposições que precisam ser assumidas para implementar movimento de foco, restrições que deveriam existir quando um constituinte focalizado é extraído. Sobre isso, trataremos na próxima seção. 4.3.O problema da análise cartográfica – parte 2 (ou “o problema das ilhas”) Como vimos, as propostas de focalização in situ que lançam mão de movimento – em geral as propostas baseadas na análise cartográfica – assumem que o constituinte focalizado precisa se mover para uma projeção específica na estrutura sintática, a fim de sinalizar para o componente prosódico a entoação necessária. Quando esse movimento acarreta desalinhamento da ordem linear típica da língua (SVO em PB, por exemplo), a derivação da ordem na focalização in situ é dada a partir de movimento do TP remanescente para uma projeção mais alta. Deixando de lado os problemas específicos de cada proposta, assumamos que essa solução seja a mais adequada. Assim, a sentença em (190a) deveria, a priori, ter a representação como (190b)205: (189) a. A Gina fez café [de noite]F. b.
205
Para fins de simplicidade, iremos representar apenas a focalização em CP, adotada pela cartografia como locus da focalização contrastiva.
| 202 Representações como (190b), embora lancem mão de um mecanismo um tanto “barroco” de derivação sintática – não fica muito clara a motivação desse movimento de remanescente de TP, a não ser derivar a ordem (o que é uma argumentação circular206) – ainda assim não geram nenhuma agramaticalidade. No entanto, como derivaríamos a sentença (191) abaixo? (190) O irmão [da Rosa]F comprou a casa da esquina. No exemplo acima, o foco é um complemento nominal – complemento do núcleo N de NP, em uma configuração sintática como (192) abaixo: (191)
Nessa configuração, a focalização (considerada por nossa abordagem como exaustividade) toma como conjunto pressuposicional o conjunto de pessoas de quem o homem que comprou a casa da esquina poderia ser irmão, e a função Exaust(x) exaure esse conjunto, mantendo apenas Rosa como elemento. Assim, parece bem inadequado representar a sentença (191) como, por exemplo (193): (192)
206
ForceP ru ru Forceº FocP wo DPi ru 6 Focº TP O irmão da Rosa [F] 6 ti comprou a casa da esquina
Circular no sentido de que normalmente se assume que a ordem linear de uma sentença é resultado dos movimentos sintáticos que ocorrem (ordem é consequência), e, nesse caso, o movimento seria motivado pela ordem (ordem seria causa), o que acarretaria em a ordem ser causa e consequência ao mesmo tempo. Mesmo que se assumisse que o material movido é tópico, e que o movimento seria dirigido por um hipotético “traço de tópico”, isso não parece se sustentar em todos os casos.
| 203 A estrutura em (193) não nos parece adequada justamente porque, do modo como está disposta, o conjunto pressuposicional seria o de todas as pessoas que poderiam ter comprado a casa da esquina (e não as pessoas cujo irmão poderiam ter comprado a casa da esquina). Para fugir de exemplos sobre relações familiares, tomemos a sentença (194) como exemplo: (193) A destruição [de Roma]F marcou o início da Idade Média. (Nenhuma outra destruição marcou o início da Idade Média) Com a sentença acima, sendo focalizada do modo como é, temos como conjunto pressuposicional as destruições que poderiam marcar o início da Idade Média. Essa sentença ainda seria verdadeira caso outra coisa tenha marcado, igualmente, o início da Idade Média: (194) A deposição de Rômulo Augusto marcou o início da Idade Média. Na coexistência das duas sentenças, ambas podem ser verdadeiras, mesmo se focalizarmos o PP [de Roma]. No entanto, se a focalização tomar como escopo todo o DP de (194), a verdade da sentença (195) acarretará na falsidade de (194): (195) [A destruição de Roma]F marcou o início da Idade Média. (Nada mais marcou o início da Idade Média) Logo, a deposição de Rômulo Augusto não marcou o início da Idade Média. Assim, se assumirmos o espírito da Cartografia Sintática, a representação mais adequada para derivar a interpretação de (191) é (197): (196)
| 204 Na estrutura acima, apenas o foco se move para FocP207, o que resultaria na leitura desejada. No entanto, esse movimento possui um problema fatal: o DP sujeito é uma ilha sintática da qual o PP não poderia sair. Ilhas sintáticas (Ross, 1967) são caracterizadas pela impossibilidade de movimento. Note que se substituíssemos o foco por um wh (cujo movimento é realizado na sintaxe visível), a sentença seria totalmente degradada208: (197) a. *[De quem]i o irmão ti comprou a casa da esquina? b. *[De que]i a destruição ti marcou o início da Idade Média? Dessa forma, nos encontramos em uma encruzilhada: de um lado, se assumirmos que a focalização de ilhas envolve a focalização de todo o DP que as contém, não conseguimos derivar as condições de verdade que se aplicariam (um problema em LF); por outro lado, se assumirmos que apenas a ilha se move, estaríamos cometendo uma violação crítica na sintaxe. Uma terceira opção seria assumir que o foco se move apenas em LF (a.k.a. movimento encoberto), o que tornaria o foco in situ semelhante aos demais quantificadores: a vantagem dessa proposta é que a restrição de ilhas não se aplica a movimento em LF (cf. Huang, 1982), o que pode ser demonstrado pela gramaticalidade de (199), em que o quantificador [tudo] está em uma ilha sintática: (198) A destruição de tudo marcou o início da Idade Média. O quantificador [tudo] se move em LF para CP. Se as restrições de ilhas sintáticas se aplicassem em LF, (199) deveria ser agramatical; como não é, temos como conclusão que tais restrições não se aplicam em LF. O problema dessa proposta já está esboçado no capítulo 1 desta dissertação: o movimento apenas em LF não consegue tornar a focalização visível para PF, o que acarretaria em o componente prosódico não “saber” que o núcleo do sintagma entoacional deve ser o foco, e não a última palavra prosódica (o que ocorre nas sentenças sem foco)209. A única conclusão lógica dessa argumentação é a de que a focalização in situ, pelo menos nas sentenças em que o foco recai sobre ilhas sintáticas, não pode envolver movimento.
207
Aqui tanto faz se é todo o PP que se move ou so o DP [a Rosa]. Porém, como de maneira geral se propõe que movimento em PB acarreta pied piping, preferimos representar a solução do movimento de todo o PP. 208 É possível que haja alguma relação entre a função sintática do DP e a extração de dentro de ilhas. DPs objeto parecem ser mais “tolerantes” à extração: (i) [Do que]i o João acompanhou a demolição ti? Uma outra opção seria seguir a proposta de Mioto (2001) e afirmar que o constituinte já vem do léxico com o traço de foco marcado, o que, como vimos na seção 4.1.1., não pode ser o caso. 209
| 205 Propor que apenas para esse caso haja uma estrutura específica é, a nosso ver, uma saída ad hoc indesejável. Como derivar unicamente, então, todos os “tipos de foco”? Veremos nossa proposta na próxima seção. 4.4.Nossa proposta sintática para a focalização in situ Como temos visto desde o capítulo 2, nossa hipótese é a de que a tipologia de foco é invisível a nível sintático, sendo estabelecida apenas através da pragmática. Nossa ideia é, portanto, que a gramática codifique um traço de foco único, necessário para a interpretação de exaustividade que a focalização estabelece, diferenciando sentenças focalizadas das neutras (foco amplo). Além disso, assumindo que o foco se comporta de maneira semelhante aos quantificadores, faz-se necessário, como consequência lógica, que eles figurem em uma posição em CP. Como apresentamos brevemente na discussão sobre o trabalho de Cruschina (2012), algumas línguas (como possivelmente o siciliano) optam pelo movimento de foco para CP antes de Spell-Out – salvo casos em que o movimento viole algum princípio da gramática, enquanto outras (como o turinês) aceitam que o movimento do foco ocorra somente em LF. O PB parece ser uma língua do segundo tipo, já que é perfeitamente possível focalizar um constituinte in situ (afinal, esse é o tema desta dissertação). Além disso, nossa análise para o PB demonstra que, além da característica quantificacional do foco, parece que existe também um outro aspecto estritamente semântico na focalização: a exaustividade inerente à focalização prosodicamente marcada. Conforme discutido na seção 2.3.1., a focalização prosódica de constituintes altera as condições de verdade da sentença justamente por envolver um tipo de exaustividade. Essa exaustividade difere daquela veiculada por advérbios como “só”, “apenas”, etc., pois enquanto estes podem exaurir um conjunto universo, a focalização apenas pode exaurir um conjunto pressuposicional definido no contexto. Essa exaustividade relativizada, por ser veiculada exclusivamente pela prosódia, precisa estar codificada na sintaxe, pois, se assumimos o modelo T da arquitetura da gramática proposto pela Teoria Gerativa, não é possível que um conteúdo semântico (i.e., visível em LF) veiculado exclusivamente pela fonologia (mais especificamente, pela prosódia) não esteja codificado na sintaxe (no nosso caso, através de um traço sintático). Percebemos, então, que há duas facetas na focalização que dependem de codificação sintática: de um lado, há o aspecto quantificacional do foco, que se materializa sintaticamente pelo movimento do foco para CP, que ocorreria, em PB, na sintaxe encoberta, e cuja proposta de análise pode seguir o que é proposto para o alçamento de quantificadores. Por outro lado, há
| 206 a exaustividade, e nessa seção vamos apresentar nossa proposta de análise para a veiculação desse traço na sintaxe. Aqui há dois caminhos possíveis de serem seguidos: podemos assumir que exaustividade e quantificação são aspectos diferentes do foco (e teríamos que analisar como o SC dá conta desses dois aspectos de maneira separada) ou podemos considerar que a quantificação atestada na focalização é consequência da exaustividade. Nesse segundo ponto de vista, poderíamos analisar a exaustividade como inserindo um quantificador do tipo “existe um único” (∃!), e o movimento do foco para CP se dá justamente para que essa relação de quantificação ocorra. Nesta dissertação, iremos apresentar a implementação teórica das duas soluções, para depois analisarmos os prós e contras de ambas.
4.4.1. Solução 1: exaustividade e quantificação como aspectos separados Se interpretamos a exaustividade independentemente da quantificação, precisamos dar conta de como o traço [E] é valorado. Normalmente, se propõe que a valoração de traços ocorre através de Agree entre sonda e alvo. Assim, na proposta de Chomsky (2001) para valoração do traço de caso/traços-phi, por exemplo, temos a seguinte solução: (199)
TP
ei DPj ru
O João i[φ] u[caso]
beijoui u[φ] EPP
VP ty tj ty
ti
DP
5
A Maria
A solução de Chomsky possui como pressuposto a ideia de que “os fatos empíricos deixam claro que há traços flexionais não interpretáveis (por LF) que entram em relações de concordância com traços flexionais interpretáveis” (Chomsky, 2001, p. 3. Tradução nossa)210. No exemplo acima, Chomsky assume, então, que esses traços flexionais (chamados de traçosphi) são interpretáveis em DPs (já que veiculam informações semânticas típicas de nomes, como gênero, número, etc.) e não interpretáveis no núcleo T. Como afirmamos no capítulo 1, traços não interpretáveis não são “digeridos” por LF, de modo que eles precisam ser eliminados da derivação antes de chegarem a essa interface. No caso dos traços-phi, essa eliminação vem através de Agree da sonda em T com o alvo em DP. Porém, a simples existência de traços não“The empirical facts make it clear that there are (LF-)uninterpretable inflectional features that enter into agreement relations with interpretable inflectional features.” 210
| 207 interpretáveis não garante o movimento: Chomsky assume algumas exigências para o movimento. Inicialmente o núcleo T, por exemplo, precisa garantir a existência de um especificador, o que é feito através do traço EPP (de Extended Projection Principle); além disso, Chomsky assume uma Condição de Ativação, um princípio que advoga que, para a existência do movimento, é necessário que o DP a ser movido esteja visível211. Isso é garantido pela presença de traços não interpretáveis no constituinte a ser movido. Chomsky resume essa ideia assumindo que existiriam, portanto, três tipos de traços não interpretáveis: (i) traços que funcionam como sonda de traços interpretáveis (no exemplo (206), o traço u[φ]); (i) traços que determinam se há espaço para movimento (no exemplo, EPP); e (iii) traços que selecionam o constituinte a ser movido (no exemplo, u[caso]). Dessa forma, uma configuração como (201) abaixo é necessária para que haja movimento: (200)
ZP
ei XPi ty
[uZ] [iF]
Z YP [uF] ty EPP XP ty ti Y HP Move
Nessa abordagem, o que faz com que o movimento não ocorra é a inexistência do traço EPP, indisponibilizando posição para o movimento, e a inexistência de traço não interpretável no alvo, que o tornaria invisível para movimento (mais especificamente, para Agree) As considerações acima se aplicariam a movimento sintático. Propostas que assumem movimento de foco interno a DP (como Aboh (2004) e Quarezemin (2012)) – propondo um núcleo FocP abaixo de D – deveriam se adequar a essa configuração. No entanto, não parece que isso ocorra, pois a estrutura de D não parece possuir uma configuração como (201): se assumimos que o traço de foco de FocP interno ao DP é não interpretável, e o traço de foco de NP é interpretável, NP não seria ativado para movimento; se o traço não interpretável de foco está em NP, o núcleo D não seria uma sonda para atrair NP. Para que uma proposta dessa natureza seja validada, deveríamos assumir a existência de um outro traço não-interpretável, sem nenhuma evidência independente, o que não é muito adequado.
211
Na realidade, a Condição de Ativação se aplica a Agree. No entanto, como a operação de Agree necessariamente precede Move (embora seja possível Agree sem Move), se o constituinte não estiver visível, logo ele não poderá ser movido.
| 208 E se fosse possível derivarmos a focalização interna a DP apenas usando Agree? Essa é a nossa solução 1 para a focalização in situ: assumamos que o núcleo D possua um traço não interpretável de exaustividade212, e que exista uma projeção fP que seleciona um NP focalizado como complemento. Além disso, consideremos que, para que Agree ocorra, não é necessário que se aplique a Condição de Ativação, de modo que apenas a existência do traço interpretável de foco no NP faz com que a sonda de D o “veja” e estabeleça a relação de Agree213. Isso faz com que o traço de D seja valorado e depois eliminado em Spell-Out. Em resumo, teríamos, para a focalização in situ, a seguinte configuração: (201) a. O João beijou a Maria b.
Na representação acima, a projeção fP é a responsável pela veiculação do foco. Seu núcleo é dotado do traço interpretável de foco, e é sondado pelo traço não interpretável de foco de D. A relação de Agree se estabelece, o traço de D é valorado e a derivação continua até SpellOut. Na esteira do que foi abordado no capítulo 2 desta dissertação, a projeção fP é responsável pela inserção da função Exaust(x). Após o Spell-Out, ocorre o movimento encoberto de todo o DP para Spec de CP, para elaboração da relação de quantificação do foco214:
212
Esse traço é não interpretável em D justamente por não ser inerente a ele, mas enfeixado ao D. Essa argumentação é dada por Bošković (2007), como veremos adiante. 214 Optamos pela representação por adjunção a CP por essa ser a representação comumente adotada para o alçamento de quantificador. 213
| 209 (202)
CP
ei
DPi
5
A Maria
CP
ty
C TP Ø ei DPk ty 5 T VP O João beijouj 6 tk tj ti
A proposta acima resolve o problema da focalização in situ de ilhas sintáticas: o DP interno à ilha veicula exaustividade dentro do próprio DP, e o movimento de LF do foco para CP, por não sofrer restrições de ilhas215, pode ocorrer naturalmente: (203) a. Pré-Spell-Out
215
Ver Huang (1982) e a discussão na página 203.
| 210 b. Pós-Spell-Out CP wo DPk CP 5 ru a Rosa Ø TP qp DPi ru ty T VP D NP comprouj ru O ty ti ru N PP tj DP irmão ty 6 P tk a casa da esquina de
Mesmo com as vantagens dessa análise, podemos levantar duas questões a respeito de sua correção: primeiro (e mais óbvio), a configuração de Agree acima estabelecida viola a Condição de Ativação, proposta por Chomsky (2001). Sobre esse assunto em específico, na próxima seção iremos nos dedicar a analisar a proposta de Bošković (2007), que abre mão da Condição de Ativação para Agree. A segunda questão diz respeito à real necessidade de propor uma projeção fP: não seria mais econômico assumir que o traço de foco se manifesta diretamente em NP, ao invés de “inventar” uma nova projeção? À primeira vista, parece que realmente é desnecessária a inclusão de uma projeção funcional de foco em DP. No entanto, essa solução passa a fazer mais sentido (e, inclusive, ser necessária) quando consideramos que elementos que não são DPs também podem ser focalizados, como uma das frases do nosso experimento prosódico: (204) Minha irmã trabalhou ontem
(Inferência: dentre um conjunto de ações, contextualmente relevantes, que minha irmã poderia efetuar, ela apenas trabalhou.)
Como derivar (205) a partir da proposta que estamos delineando neste trabalho? Uma solução seria assumir os pressupostos da Morfologia Distribuída e propor que a projeção fP pode se combinar diretamente com núcleos categorizadores. Quando isso ocorre, apenas um elemento é focalizado (excluindo seus complementos e adjuntos), em uma configuração semelhante a (206) abaixo:
| 211 (205)
Assim sendo, há duas opções: ou f é inserido logo acima do núcleo categorizador (como acima e em (207) abaixo), e, nesse caso, apenas um elemento é focalizado, ou f é inserido mais acima, tomando todo o constituinte (como (208)): (206) a. [DP O [irmão]F da Rosa] comprou a casa da esquina b.
(207) a. [DP O irmão da Rosa]F comprou a casa da esquina b.
A solução proposta acima não poderia ser adotada em uma teoria baseada no movimento obrigatório do foco para uma projeção de FocP, seja em posição baixa, seja em CP. Como nossa proposta consegue dar conta de mais dados, e possui uma implementação com menos parafernalha teórica, assumimos que seja mais adequada para dar conta da focalização in situ do que as propostas normalmente apresentadas na literatura. Nos próximos parágrafos nos deteremos a analisar o primeiro problema levantado, sobre a Condição de Ativação, e como é possível defender que ela não se aplica a Agree.
| 212 4.4.1.1. Movimento na perspectiva de Bošković (2007) e a Condição de Ativação O trabalho de Bošković tem como objetivo analisar os successive-cyclic movements, que são movimentos cíclicos motivados pela necessidade de constituintes serem extraídos de fases. Um exemplo clássico de movimento cíclico é o movimento de elementos wh de dentro de sentenças encaixadas, como (209) abaixo: (208) O que o João disse que a Maria comeu? Desde bem cedo na Teoria Gerativa se postulou que elementos wh (como [o que] na sentença acima) precisam “parar” em pontos da derivação para não violar a Condição de Subjacência216, de modo que a representação mais adequada de (219) é (210): (209)
Na representação em (210), o elemento wh, gerado na sentença encaixada, precisa “parar” na periferia de CP da encaixada para poder ser extraído para o CP da sentença matriz217. Como vimos no capítulo 1, o movimento do wh para o CP matriz pode ser explicado pela existência de um traço EPP em C e por um traço [Q] não interpretável no wh e existente apenas no núcleo C matriz (o que torna o wh visível para movimento). Considerando todas as vertentes do PM, Bošković afirma que há, na verdade, duas interpretações possíveis: a primeira, baseada em trabalhos como Takahashi (1994), lança mão do Minimize Chain Links Principle (MCLP),
216
Grosso modo, a Condição de Subjacência proíbe que um constituinte movido passe por cima de mais de um CP. Assim, se o wh do exemplo não parasse no CP intermediário, ao pousar em spec de CP da sentença matriz, iria ultrapassar mais de um CP, gerando a violação. 217 Em uma teoria de fases, é necessário que o wh movido pare em mais locais (no Spec de cada um dos nós de fase). No entanto, vamos considerar apenas o CP intermediário, para simplificar a explicação.
| 213 que requer que os links de cadeias (ligação entre um constituinte movido e sua variável) sejam os menores possíveis218. Assim, um elemento wh, por exemplo, deve parar em toda projeção CP existente, para que os links da cadeia gerada com o movimento sejam os menores possíveis. Nessa abordagem, o movimento cíclico em posições intermediárias não é motivado por checagem de traços: o wh movido em (210), por exemplo, não se move para a projeção intermediária de CP encaixado porque esse núcleo C tem algum traço específico que precise ser valorado, mas o movimento ocorre para respeitar MCLP. Um detalhe importante dessa análise é que, como não há necessidade de movimento cíclico para checagem de traço, o wh só se move após o Merge do CP da sentença matriz, cujo núcleo irá disparar o movimento, que, somente a partir de então, irá ser dirigido por MCLP219. A segunda proposta de análise de movimentos cíclicos parte do princípio de que todo movimento deve respeitar Last Resort220: o movimento cíclico também ocorre para checagem/valoração de traços. Assim, no exemplo (210), o núcleo de CP intermediário é dotado de um traço EPP, que garante a existência de um especificador em CP e o movimento do wh encaixado para esse especificador: posteriormente, a existência do EPP no CP matriz, aliado à existência de um traço [Q] não interpretável no wh, garante o movimento ulterior do wh. Essa proposta foi adotada amplamente no modelo de fases (Chomsky, 2001): como CP é uma fase, o constituinte movido precisa pousar em seu especificador para estar visível para movimento posterior221: isso é garantido pelo traço EPP do núcleo de CP. O problema que Bošković aponta como óbvio é o lookahead: assumindo que CPs normalmente não são projeções de EPP (a especificação de EPP para tais projeções se dá exclusivamente para garantir movimentos cíclicos), para que o núcleo C da encaixada seja especificado para EPP, é necessário que se saiba, de antemão, que um constituinte deverá ser extraído de dentro da fase. Uma proposta teórica que se pretende derivacional (apresentar como as operações sintáticas ocorrem em ordem “passo-a-passo”) não pode apresentar problemas dessa natureza: como o SC da linguagem “sabe” que haverá movimento se o “responsável” pelo movimento nem entrou na estrutura ainda? Conceitualmente, a segunda solução é mais desejável, por eliminar a formação de cadeias, simplificando o modelo222. No entanto, como a solução por checagem de traços em Apenas para deixar mais claro: no exemplo, a cadeia é formada por (o que, t’i, ti), e temos dois links, aos quais se aplica MCLP: (o que, t’i) e (t’i, ti). 219 O MCLP foi proposto dentro de uma versão do PM em que o movimento não era motivado por traços EPP, mas pela checagem de traços não interpretáveis. Ver Hornstein et. al (2013, pp. 23–32) para uma explicação desse modelo de checagem de traços. 220 Ver página 43 para definição. 221 Essa necessidade é formalizada na Condição de Impenetrabilidade de Fases (Phase Impenetrability Condition) 222 Bošković fornece argumentos empíricos contra as duas análises. Para mais informações desses argumentos, indicamos o leitor a consultar a referência. 218
| 214 posições cíclicas também tem problemas, é preciso solucionar esse problema de lookahead. Para tal, Bošković propõe uma reformulação da teoria de movimento. Inicialmente, Bošković analisa a Condição de Ativação. O autor sugere que essa condição se aplica apenas a Move, e que, na verdade, ela não é uma restrição independente, mas é consequência lógica do sistema. Vejamos um exemplo: (211) abaixo é a representação da derivação de (210) em um estado intermediário: (210)
CP ru <> ru C TP que ei DPm ru 4 T VP a Maria comeup ru tm ru V DP tp 5 o que i[wh] u[Q]
Nesse ponto da derivação é possível saber se o DP será movido? “De fato, nós sabemos”, afirma Bošković (p. 609). A presença de um constituinte dotado de traço não interpretável é suficiente para determinar o movimento se definirmos o princípio de Last Resort nos seguintes termos: (211) Last Resort (revisitado) X se move se e somente se, sem o movimento, a estrutura sofrerá crash (com crash avaliado localmente) (Bošković, 2007, p. 610. Tradução nossa)223 O movimento do wh encaixado se torna obrigatório, porque, caso isso não ocorra, a fase encabeçada por vP irá para Spell-Out com um traço não interpretável, gerando crash na derivação. Assim, o SC “sabe” que o wh encaixado precisa se mover sem apelar para a formação de cadeias e sem necessitar de checagem de traço no CP intermediário (e sem lookahead). Assim, a Condição de Ativação não é um princípio, mas decorre naturalmente de Last Resort. Nessa abordagem, após Merge do CP matriz, o wh encaixado se move para seu Spec, sonda o traço interpretável do núcleo de C, efetua Agree, valora seu traço e a derivação é salva.
223
“X undergoes movement iff without the movement, the structure will crash (with crash evaluated locally)”
| 215 No entanto, e se tivéssemos uma configuração como abaixo (apresentada em (24) e repetida abaixo para conforto do leitor)?: (212)
Essa estrutura deveria sofrer crash, YP não estaria visível para a sonda X, já que não respeita a Condição de Ativação. Por não haver estrutura acima para movimento de X, esse núcleo não valora seu traço e, quando ocorrer Spell-Out, a derivação irá sofrer crash. Daí Bošković afirmar que a Condição de Ativação não se sustenta para Agree. Isso é conceitualmente adequado na proposta dele, já que, na realidade, a Condição de Ativação deixa de ser um princípio (de fato, deixa de “existir”) e se torna uma mera consequência do modelo proposto (ou, como o autor coloca, se mantém como teorema). Assim, na configuração em (213), o núcleo X sonda YP, sofre Agree, valora seu traço e a sentença é salva.224 No caso da focalização, essas considerações são relevantes, e podem fornecer uma explicação de por que é possível que o PB apresente tanto sentenças com focalização in situ quanto sentenças com fronteamento: (213) a. A Flávia vai comprar UM CARRO. b. UM CARRO a Flávia vai comprar. (Inferência: Dentre um conjunto de coisas compráveis pela Flávia definido contextualmente, ela irá comprar apenas um carro.) Há um problema claro na nossa abordagem ao considerarmos essas duas sentenças. Ora, se assumirmos que a focalização in situ envolve Agree interno a DP e que o movimento do DP [um carro] em (214) é motivado pela focalização, porque sentenças como essas sequer existem na língua? Se o traço não interpretável de foco no DP foi valorado em fP, esse constituinte não deveria se mover. Como explicar? A solução pode partir do seguinte: no PB, é possível que, em algumas derivações, a projeção fP não esteja disponível na estrutura interna do DP. Quando isso ocorre, o DP não pode valorar seu traço não interpretável de foco internamente.
224
Um detalhe importante dessa análise é que Agree não se submete à Condição de Impenetrabilidade de Fases. Bošković fornece uma série de argumentos para mostrar que, de fato, Agree pode “enxergar” dentro de fases.
| 216 Assumamos, também, que, mesmo com nossas críticas à abordagem cartográfica, em certa medida as assunções estejam corretas, e na camada CP haja uma projeção de FocP, cujo núcleo possa receber o traço f. A configuração, então, seria algo como (215): (214)
Nessa configuração, o DP focalizado precisa se mover para Spec de FocP. Dessa posição, ele sonda o núcleo Focº, valora seu traço e salva a sentença. O resultado em PF é a ordem de constituintes em (214b), com fronteamento225. Dessa forma, a diferença entre focalização in situ e fronteamento em PB envolve a seleção (ou não) de fP na numeração. Quando fP está disponível na numeração, o foco se manifesta in situ; quando não, o foco se manifesta fronteado. Um questionamento que poderia ser feito a essa solução diz respeito à inadequação que sentenças com fronteamento apresentam, mesmo em contextos de exaustividade. Vejamos um exemplo: (215) Contexto: há um conjunto definido de coisas que a Flávia poderia comprar. a. O que a Flávia vai comprar mês que vem? b. A Flávia vai comprar UM CARRO mês que vem (e nada mais dentro do cj.) c. #UM CARRO a Flávia vai comprar mês que vem (e nada mais dentro do cj.) À primeira vista, o exemplo acima milita a favor da diferenciação entre focos. No entanto, nos parece que a inadequação de (216c) existe por motivos pragmáticos: note que, no modelo que estamos desenvolvendo, embora exaustividade seja o único traço codificado na sintaxe, não estamos assumindo que uma tipologia de focos não exista na pragmática. É perfeitamente possível que o componente pragmático da linguagem (não da gramática) “saiba” a diferença entre a introdução de um referente e o contraste entre elementos. Da mesma forma, 225
Uma solução mais simples para essa questão seria assumir que o foco pode se comportar como whs, e sofrer movimento para CP na sintaxe visível. Deixamos em aberto quais das duas soluções adotar, de modo que estudos futuros podem decidir qual das duas abordagens é mais correta.
| 217 exaustividade não pressupõe, necessariamente, contraste (nem o contrário, como vimos na abordagem de Moraes (2006), apresentada na seção 3.3.4.). Como a diferença entre fronteamento e focalização in situ, dentro da nossa proposta, é uma questão de numeração (se fP entra ou não na derivação), é possível que o contexto pragmático influencie a escolha dos elementos que entrarão na derivação. Isso não é heterodoxo, ainda mais se levarmos em conta a possibilidade de variação diafásica (de acordo com o contexto), como a que ocorre em (217) abaixo: (216) a. João encontrou o pai de seu pai. b. João encontrou seu avô paterno Por que (217a) é escolhida em alguns contextos, e (217b) é escolhida em outros? Semanticamente falando, as sentenças são equivalentes: elas possuem exatamente as mesmas condições de verdade. É simplesmente uma questão de escolha dos itens que irão compor a derivação. Embora não tentaremos desenvolver uma teoria sobre a numeração, estamos apenas pontuando que a inadequação pragmática de sentenças com fronteamento em contextos de perguntas wh pode ser explicada pela escolha feita na numeração e não têm a ver com impossibilidades gramaticais.
4.4.2. Solução 2: quantificação como consequência da exaustividade A discussão empreendida na seção anterior toma como pressuposto teórico que a exaustividade deva ser tratada de forma separada da quantificação típica da focalização. No entanto, é possível que assumamos que, na realidade, a quantificação atestada em sentenças com constituintes focalizados seja apenas uma consequência semântica da própria exaustividade veiculada na focalização. Se a presença do traço de exaustividade, além de inserir a função Exaust(x) – como vimos no capítulo 2 –, tem como resultado a inserção de um quantificador do tipo “existe um único” (∃!), então a relação quantificacional já está explicada, e o movimento encoberto para CP deve ocorrer por esse motivo. Nessa abordagem, não há valoração de traços: não há traço não-interpretável em D, de modo que o traço (interpretável) [E] de f não coloca problemas para a derivação, e é interpretado naturalmente pelas interfaces. A própria implementação teórica nessa segunda solução é diferente: ao invés de ser uma projeção interna à estrutura do DP (ou de v), podemos assumir que f é um quantificador adjungido, em uma configuração como (218) abaixo:
| 218 (217)
Na configuração em (218), f está adjungido a XP (que, por sua vez, está encaixado em YP). O resultado é que f tem escopo sobre XP, e apenas XP entra na relação de “existe um único”. O traço [E] de f é lido em PF, permitindo que o subcomponente prosódico atribua o núcleo de ι a XP, do mesmo modo que a existência de f acarreta o movimento de XP em LF. Vejamos um exemplo concreto: abaixo apresentamos a representação da frase (202): (218) a. O João beijou [a Maria]F b.
Em (219), o DP [a Maria] é interpretado como exaustivo por estar no escopo de f. Após Spell-Out, o DP ainda se move para CP, para estabelecer a relação de quantificação sobre a sentença: (219)
| 219 Uma vantagem clara dessa abordagem é o fato de que f, por não projetar sua categoria, pode se adjungir a projeções mínimas ou máximas, o que explica com muita facilidade casos como os expressos em (206-208) – Compare (221-223b) com (206, 207b-208b): (220) a. Minha irmã [V trabalhou]F ontem. b.
(221) a. [DP O [irmão]F da Rosa] comprou a casa da esquina b.
(222) a. [DP O irmão da Rosa]F comprou a casa da esquina b.
Em (221b), f se adjunge diretamente ao núcleo categorizador v, de modo que apenas o verbo é focalizado; em (222b), com a focalização apenas no NP [irmão], a solução é dada pela adjunção de f ao núcleo categorizador n; por fim, em (223b), com a focalização sobre todo o DP [o irmão da Rosa], a solução é adjungir f diretamente ao DP. Dessa forma, é muito simples explicar tais dados. Quanto à assimetria entre focalização in situ e fronteamento (que, na solução 1, justificamos pela ausência de fP em DP), a explicação seria a opcionalidade de aplicar o movimento para CP antes de Spell-Out, de maneira semelhante ao que se assume para a opcionalidade de movimento de whs interrogativos em PB.
A escolha entre a solução 1 e 2 depende da análise das vantagens e desvantagens de cada uma. Por um lado, a solução 1, que desassocia exaustividade e quantificação, abre a possibilidade de que haja línguas nas quais o foco, embora envolva quantificação, não envolva exaustividade. Por exemplo, a questão discutida nas páginas 196-198 desta dissertação, sobre
| 220 uma assimetria entre foco informacional e contrastivo apontada no siciliano por Cruschina (2012) foi abordada como uma provável distinção entre foco quantificacional sem exaustividade e foco quantificacional com exaustividade. Por outro lado, faz sentido assumir que a exaustividade, por resultar em uma relação de “existe um único x”, envolva quantificação. A implementação teórica da solução 2 é mais econômica do ponto de vista substantivo e metodológico, pois envolve menos passos para a derivação da sentença e menos “parafernalha teórica”: a inexistência da necessidade de valoração de um traço de exaustividade em D elimina, de uma vez só, um construto teórico (o próprio traço de D) e uma etapa derivacional (a operação de Agree que deveria existir entre f e D). No entanto, a junção de exaustividade e quantificação talvez seja inadequada para explicar a focalização de verbos: enquanto a quantificação de um elemento nominal é perfeitamente possível, não parece muito claro como se daria a quantificação estabelecida por um verbo226. Por fim, a solução 2 incorre em um problema relacionado à definição de c-comando: dependendo da definição adotada, quando f se adjungir ao sujeito, ele irá c-comandar toda a sentença, culminando em ter escopo sobre toda a sentença e não envolver, portanto, exaustividade apenas sobre o sujeito. Por fim, há a questão translinguística: resta saber se, por exemplo, línguas com foco morfológico apresentam propriedades distribucionais que pesem em favor de uma ou outra proposta. Esse tipo de investigação depende de estudos mais aprofundados. 4.5.Resumo do capítulo Neste capítulo empreendemos uma(s) análise(s) sintática(s) para a focalização in situ no PB. Em resumo, a discussão teve os seguintes pontos altos:
1. A sintaxe não enxerga diferenças entre tipos de foco, sendo que todos os argumentos a favor dessa diferenciação podem ser explicados por necessidades de interface independentes (como exigências de peso de constituintes e fraseamento); 2. Propostas que analisam a focalização in situ através de movimento falham em explicar por que ilhas sintáticas podem ser focalizadas, mesmo sem poder sofrer movimento;
Uma possibilidade seria o verbo introduzir uma variável de evento, estabelecendo uma relação como “existe um único evento e, do tipo w, no conjunto pressuposicional C, que inclui os eventos x, y, z, etc., tal que a sentença é verdadeira para e e somente para e”. No entanto, é necessário um aprofundamento maior da questão para nos certificar se tal relação é possível. 226
| 221 3. Duas soluções sintáticas são possíveis para explicar a focalização in situ: a diferença entre as duas está em considerar (ou não) a quantificação como intrínseca à exaustividade veiculada pela focalização. 4. Quanto à primeira solução: a.
A proposta de Bošković (2007) para movimentos cíclicos pode ser adotada para a focalização in situ, que envolveria Agree, e não Move;
b.
A focalização in situ, independente do constituinte focalizado, pode ser derivada a partir da operação de Agree entre o núcleo D, que pode ser especificado para um traço não interpretável de foco, e um núcleo funcional f, possuidor de um traço interpretável de foco;
c.
A operação descrita em b explica a veiculação da exaustividade presente na focalização. A relação de quantificação desenvolvida pelo foco (e argumentada em trabalhos como Rizzi (1997)) ocorre pelo movimento do foco em LF, à maneira do alçamento de quantificador. Como movimento em LF não está sujeito à Restrição de Ilhas, a derivação não gera agramaticalidade;
d.
A variação entre focalização in situ e fronteamento de constituinte pode ser explicada pela ausência de fP na estrutura interna de DP. Quando isso ocorre, o DP é obrigado a se mover para valorar traço na camada CP.
5. Quanto à segunda solução: a.
O núcleo f introduz um quantificador que se adjunge ao elemento focalizado, seja ele projeção mínima ou projeção máxima.
b.
A solução em a explica com muito mais simplicidade a possibilidade de focalizar sintagmas (como [DP o irmão da Rosa]F) ou apenas uma palavra (como [DP o [irmão]F da Rosa]).
c.
Nessa abordagem, a assimetria existente entre focalização in situ e fronteamento é creditada a uma opcionalidade de aplicar o movimento para CP antes ou depois de Spell-Out.
No próximo capítulo, iremos apresentar um resumo geral do que foi discutido nesta dissertação, apontar consequências da nossa proposta e abrir um leque de estudos que podem ser desenvolvidos no futuro com vistas a corroborar (ou refutar) as hipóteses e/ou as análises semântica / prosódica / sintática aqui empreendidas.
| 222 5 CONSIDERAÇÕES FINAIS SOBRE A FOCALIZAÇÃO IN SITU Neste trabalho, assumimos a ideia de que a focalização, necessariamente codificada na gramática, coloca questões importantes para a Gramática Gerativa. Na medida do possível, tentamos responder algumas dessas questões e lançar luz em outras. Neste capítulo iremos apresentar (i) um resumo das considerações feitas aqui, além de (ii) apontar consequências da nossa análise e (iii) colocar propostas de estudos futuros sobre a semântica, a prosódia e a sintaxe da focalização. 5.1.Resumo da discussão Na seção 1.3. colocamos 5 questões que tentariam ser respondidas ao longo deste trabalho. Retomemo-nas aqui, uma a uma, para propor, em poucas palavras, algumas respostas:
I.
Por que é possível dizer que a focalização possui efeitos em LF?
Podemos afirmar que a focalização possui efeitos em LF por dois motivos: primeiro, é bastante consensual no meio linguístico que o foco estabelece uma relação de quantificadorvariável, além de apresentar características típicas de quantificadores (como visto na seção 2.3.2.). Além disso, a focalização apresenta a propriedade de exaurir um conjunto pressuposicional definido no contexto, influenciando nas condições de verdade de uma sentença. Nossa análise desse fato (estabelecida na seção 2.3.1.) aponta que a focalização introduz uma função de exaustividade (Exaust(x)), que toma como argumento o conjunto pressuposicional e o exaure, mantendo apenas o elemento focalizado. Esses dois aspectos são relevantes em LF, e precisam estar codificados nesse nível de representação. Uma questão que fica em aberto, no entanto, é se a quantificação é produto da exaustividade ou se ambos os aspectos são independentes.
II.
Assumindo que a focalização possua efeitos em LF, cada tipo de focalização é lido de maneira diferente ou podemos dizer que há um traço semântico em comum que seria o único relevante em LF?
Conforme nossa análise semântica demonstra, em contextos de resposta a uma pergunta wh, é possível que seja produzido um foco (in situ ou ex situ) tanto com interpretação exaustiva quanto sem tal leitura. Afirmamos que, quando o “foco” é produzido sem a interpretação
| 223 exaustiva, não há nada que torne necessário que o constituinte focalizado seja lido em LF de maneira diferente da que seria caso não estivesse focalizado at all. Dessa forma, o foco chamado “informacional” se difere do chamado “contrastivo” apenas pela pragmática, pois, semanticamente, o foco informacional (quando não envolve exaustividade) não possui nenhuma diferença em relação ao foco amplo. Como apontado por Menuzzi (2012), a fronteira entre o que é informacional e o que é contrastivo muitas vezes não se apresenta de maneira clara, de modo que propor um tratamento estritamente semântico para essa diferença pragmática (e, por consequência, tentar codificar isso em algo como um traço sintático) é uma tarefa um tanto inadequada. Dessa forma, assumimos que os focos informacional e contrastivo não se diferenciam em LF porque LF “enxerga” apenas a exaustividade, que pode ser veiculada tanto pelo foco contrastivo (em contexto de contraste) quanto pelo foco informacional (em contexto de resposta a uma pergunta wh), desde que haja prosódia específica. Quanto ao foco “mirativo”, argumentamos que a interpretação “semântica” normalmente proposta para tal (Bianchi et al., 2016) é, na realidade, computada no componente pragmático.
III.
Há estruturas prosódicas fonologicamente diferentes para diferentes tipos de foco (de modo que tal diferença deva ser lida por PF)?
Nossa análise prosódica revelou que, embora haja algumas diferenças entre foco informacional e contrastivo, na maior parte dos casos houve uma certa confusão na produção / percepção dos tipos de foco: ora a produção se assemelhava ao foco amplo (sem marcação prosódica), ora se assemelhava ao foco contrastivo (marcado pela alteração do acento nuclear do sintagma entoacional). Essa variação na produção (e percepção) nos leva a crer que, na verdade, a diferença fonologicamente relevante (para os fins que estamos analisando neste trabalho) é entre sentenças neutras – que incluiriam foco amplo e informacional – e sentenças focalizadas (exaustivamente). Essa diferença se manifesta pela especificação do núcleo do sintagma entoacional, feita pela sintaxe através do traço de exaustividade. O subcomponente prosódico é capaz de ler esse traço e atribuir o núcleo de ι de acordo com essa especificação. Por fim, o foco mirativo, embora tenha envolvido uma característica particular (tons geralmente altos), pode ser explicado como a manifestação ou de uma característica pragmática ou de um aspecto paralinguístico – nesse caso, a emoção de surpresa.
| 224 IV.
Se há uma estrutura específica, que estrutura é essa?
Como argumentamos na seção 3.5., a característica mais relevante nas produções do foco (exaustivo) foi o deslocamento do acento nuclear do sintagma entoacional, cuja materialização consistiu tanto na atribuição de um acento específico sobre o constituinte focalizado (seja esse acento ascendente, descendente ou simples) e, mais proeminentemente, na presença de deaccenting do material pós-focal.
V.
Haver estrutura diferente implica dizer que há movimento sintático? Caso sim, a focalização in situ apresenta os mesmos tipos de restrições impostas a operações de movimento sintático?
Na nossa análise sintática da focalização in situ, advogamos pela inexistência de movimento sintático (pelo menos antes de Spell-Out). Duas soluções foram propostas: a primeira, que se baseia na adaptação, feita por Bošković (2007), à teoria de movimento, propõe que Agree não esteja sujeito à Condição de Ativação. Caso o autor esteja no caminho certo, podemos derivar a focalização in situ apelando para a existência de um núcleo funcional fP interno ao DP focalizado, que entra em relação de Agree com o núcleo D, que, na nossa proposta, seria dotado de um traço não interpretável de foco (exaustividade). A relação de quantificação estabelecida pelo foco se dá pelo movimento do constituinte focalizado em LF. Essa solução evita violações de extração de ilhas sintáticas, que não afetam constituintes focalizados (como argumentado na seção 4.3.). A segunda solução, mais simples, não envolve Agree, mas sim a adjunção de f ao constituinte focalizado (seja ele uma projeção máxima ou mínima). Essa segunda solução possui como pressuposta a ideia de que a quantificação atestada na focalização é resultado direto da exaustividade veiculada pelo foco. Estudos mais aprofundados precisam ser efetuados a fim de constatar essa relação.
Essas 5 questões resumem, de maneira geral, nossa empreitada efetuada nesta dissertação. No entanto, podemos verificar uma questão conceitual importante que precisa ser respondida, levando em conta nossa proposta: Nosso experimento prosódico constatou uma ampla variedade de produções na realização dos diversos tipos de foco. Trabalhos sobre a fonologia entoacional das sentenças (Féry, 2017; Ladd, 2008) apontam que a prosódia pode veicular aspectos (i) gramaticais, (i) pragmáticos e (iii) paralinguísticos. Se propormos que o
| 225 subcomponente prosódico interpreta PF, como enquadrar essas considerações na arquitetura da gramática? Tentaremos apresentar uma resposta a essa pergunta na próxima seção. 5.2.Uma aproximação sobre a “arquitetura da linguagem” Como pontuamos na Introdução desta dissertação, a Gramática Gerativa propõe um modelo de arquitetura da gramática conhecido como modelo T, apresentado na Figura 1 e reproduzido abaixo para conforto do leitor:
Figura 40: Arquitetura da gramática no modelo minimalista Fonte: Hornstein, Nunes, & Grohmann, 2013:p.73
Nesse modelo, PF é enviada para o componente fonológico, para linearização (e, conforme defendemos na seção 3.1., atribuição da estrutura prosódica). O componente LF, como argumentamos na seção 2.1., envolve aspectos estritamente semânticos, de modo que o componente pragmático está de fora da arquitetura do que chamamos de gramática – e deve mesmo estar, já que atribuir efeitos pragmáticos à gramática da linguagem humana no mínimo torna impossível a sustentação do Princípio da Uniformidade de Chomsky (ver página 32 desta dissertação). No entanto, como vimos acima e no capítulo 3, a pragmática parece possuir efeitos importantíssimos na determinação da curva entoacional das sentenças. Da mesma forma, diversos trabalhos sobre semântica e pragmática argumentam que a pragmática de uma sentença envolve uma “leitura” da informação semântica. Tendo em vista essa discussão, como poderíamos entender a relação que a pragmática estabelece com a gramática de uma língua? Mais especificamente, como seria uma “arquitetura da linguagem” levando em conta essas questões? A Figura 41 abaixo apresenta nossa proposta de como isso se daria:
| 226
N = {Ai, Bj, Ck ... }
GRAMÁTICA
Select; Merge; Move Spell-Out
PF
Linearização; Fraseamento; Inserção segmental; LF
Semântica
Pragmática
C.I
A.P
Estrutura Prosódica
Implementação fonética
LINGUAGEM
Figura 41: Proposta de “arquitetura da linguagem” Fonte: Elaboração própria
No esquema acima, temos uma diferença entre o que é gramatical (delineado em termos do modelo T proposto pela Gramática Gerativa) e o que é não gramatical, que envolvem os componentes de interface (chamados por Chomsky de sistema Conceitual-Intencional (C.I.) e sistema Articulatório-Perceptual (A.P.). Nesse modelo, LF (uma representação sintática) é enviada para o sistema CI, para interpretação. Nesse sistema, ainda ocorre a atuação da pragmática, que dotará o enunciado de nuances de sentido a depender da situação comunicativa em questão. De outro lado, a estrutura (sintática) PF é enviada para o componente fonológico aplicar operações de linearização, atribuição de estrutura prosódica, inserção segmental, etc., resultando em uma estrutura prosódica organizada, com núcleos acentuais já definidos – além da representação fonológica dos segmentos227. É nesse ponto que entra a nossa implementação:
227
Deve-se considerar que a abordagem da Morfologia Distribuída (Halle & Marantz, 1993; Marantz, 1997) considera um modelo de arquitetura da gramática levemente diferente do qual estamos apresentando aqui. No entanto, no que concerne à discussão que estamos empreendendo, não há diferença de qual modelo adotar. Utilizamos o modelo apresentado em Hornstein et. al (2013) para simplificar a explicação.
| 227 a estrutura prosódica estabelece interface com o componente pragmático, que, por sua vez, influencia a natureza dos acentos tonais atribuídos aos núcleos determinados previamente. Nessa proposta, a gramática da língua apenas determina para o componente fonológico onde se encontram os núcleos acentuais: a natureza fonológica deles é dada internamente (pelo próprio subcomponente prosódico) e em interação com o componente pragmático da linguagem. Isso dá conta da variação atestada, por exemplo, entre sentenças focalizadas exaustivamente e que, no nosso experimento, possuíam acentos tonais diferentes (embora percepção igual quanto à exaustividade). A formalização teórica dessa determinação da localização do núcleo acentual pode ser dada em termos de traços: o traço de exaustividade é lido pelo subcomponente prosódico e, por meio desse traço, o subcomponente “saberia” onde atribuir o núcleo do sintagma entoacional. Após a determinação dos acentos tonais, a sentença é enviada para implementação fonética. O modelo que estamos apresentando nesta seção consegue dar conta da relação que a gramática da língua estabelece com os demais aspectos constituintes da linguagem humana sem ferir o modelo T da arquitetura da gramática e mantendo os pressupostos teóricos e o espírito do Programa Minimalista. Por exemplo, se assumíssemos que a gramática estabelece a natureza dos acentos tonais atribuídos à estrutura prosódica (semelhantemente ao que é sugerido por Bocci (2013)), seríamos obrigados a incluir na gramática da língua, por exemplo, a noção de contraste sem exaustividade proposto por Moraes (2006), abordada na seção 3.3.4., ou mesmo ironia, sarcasmo e outras características pragmáticas que são claramente codificadas na entoação de uma frase. A inclusão de tais elementos na estrutura sintática não nos parece muito adequado228. Por isso esse modelo tem a proposta de dar conta de aspectos estritamente semânticos veiculados pela entoação (como exaustividade) mantendo fidelidade ao que tem sido proposto como organização dos elementos da gramática. No entanto, há um problema no qual esse modelo incorre: a incomensurabilidade entre os componentes. Estamos assumindo que a pragmática seja um componente capaz de ler e aplicar operações em cima de um conteúdo semântico (o que requer que esse componente seja capaz de interpretar elementos como escopo, índices, variáveis, etc.), ao mesmo tempo em que influencia a atribuição de acentos tonais (o que exige que o componente consiga interpretar elementos como sílaba, sintagma fonológico, acento, etc.). Não fica muito claro o porquê de a pragmática ser um componente tão versátil assim, já que semântica e fonologia são dois níveis da linguagem que apresentam características diametralmente opostas. Assim, é necessário o Tais aspectos também não podem ser relegadas à função paralinguística – não parece razoável equiparar aspectos pragmáticos com, por exemplo, a fisiologia do aparelho fonador que influencia na entoação. 228
| 228 refinamento dessa proposta, especialmente desenvolver uma teoria da pragmática que seja capaz de explicar essa versatilidade. 5.3.Pesquisas futuras Nossa proposta para a focalização in situ abre oportunidades para o desenvolvimento de mais trabalhos acerca do tema da focalização, tanto em PB quanto em outras línguas. Apresentamos abaixo algumas questões que permanecem em aberto e demandam estudos mais aprofundados:
1. Análise de sentenças clivadas, pseudoclivadas e demais estratégias de focalização dentro dessa perspectiva: o que dirige o movimento de constituintes clivados? Seria possível analisar tais construções de maneira semelhante ao que propomos para o fronteamento? 2. Ainda sobre tais sentenças, seria possível que uma análise dessas construções lance luz sobre qual solução dada nesta dissertação está correta? 3. Análise da ordem VS no italiano, analisada por Belletti (2004a) como uma instância de foco informacional. No nosso modelo, foco “informacional” sem exaustividade não envolve movimento. Então como derivar de forma independente a ordem VS nessa língua? 4. Línguas com focalização morfológica poderiam ser analisadas a partir de alguma das propostas elaboradas aqui? Em outras palavras, a distribuição do morfema de foco nesse tipo de línguas pode determinar qual solução está correta? 5. Análise da prosódia de sentenças com advérbios focalizadores: haveria alguma relação entre sentenças com advérbios focalizadores e a focalização in situ? 6. Investigação de como explicar, a partir da nossa proposta, a relação íntima que parece haver entre a natureza dos acentos tonais e perguntas totais. Nossa análise descarta a ideia de que a natureza dos acentos tonais seja, de alguma forma, determinada pela sintaxe. No entanto, em perguntas totais há uma relação bastante direta entre padrão entoacional e interpretação de pergunta. Como seria possível explicar isso dentro do nosso paradigma? 7. Análise mais aprofundada da focalização de verbos. Haveria a possibilidade de quantificação na focalização de verbos? É interessante que clivadas de verbos sempre assumem uma forma nominal (geralmente infinitivo – “Foi quebrar o que
| 229 ele fez com o brinquedo”). Como seria a derivação dessas sentenças? Essa análise pode, igualmente, fornecer pistas sobre qual solução que apresentamos aqui está mais correta.
Como podemos ver, embora estudos de focalização sejam fartos na literatura, ainda há muito conhecimento a ser desenvolvido sobre esse assunto, especialmente partindo dos pressupostos que assumimos neste trabalho. Nosso objetivo, portanto, foi lançar luz nessa questão, apontando para a necessidade de uma análise mais abrangente do fenômeno da focalização, que, embora complexo e inexoravelmente envolva aspectos semânticos, prosódicos, sintáticos e pragmáticos, deve se enquadrar em uma teoria geral da linguagem.
| 230 REFERÊNCIAS Aboh, E. O. (2004). Topic and focus within D. Linguistics in the Netherlands, 21, 1–12. https://doi.org/10.1075/avt.21.04abo Araújo, F. M. de. (2015). Foco em português: uma discussão sobre contrastividade. Universidade Federal do Paraná. Avelar, J. O. de, & Galves, C. (2016). From European to Brazilian Portuguese: a parameter tree approach. Cadernos de Estudos Ligüísticos, 58(2), 237–256. Beckman, M. E., & Gayle, A. E. (1997). Guidelines for ToBI labelling. (Ohio State University, Ed.), Ms. http://www.cs.columbia.edu/~agus/tobi/labelling_guide_v3.pdf. Acesso em: jun. 2018. Beckman, M. E., & Hirschberg, J. (1994). The ToBI Annotation Conventions. Ms. (Ohio State). https://www.ling.ohio-state.edu/~tobi/ame_tobi/annotation_conventions.html. Acesso em jun. 2018. Beckman, M. E., & Pierrehumbert, J. B. (1986). Intonational structure in Japanese and English. Phonology Yearbook, 3, 255–309. Belletti, A. (2004a). Aspects of the Low IP Area. In L. Rizzi (Ed.), The Structure of IP and CP. The Cartography of Syntactic Structures, vol. 2. New York: Oxford University Press. Belletti, A. (2004b). Structures and beyond: The cartography of syntactic structures. (A. Belletti, Ed.), The Cartography of Syntactic Structures (Vol. 3). Oxford: Oxford University Press. https://doi.org/10.1353/lan.2008.0047 Bianchi, V., Bocci, G., & Cruschina, S. (2016). Focus fronting, unexpectedness, and evaluative implicatures. Semantics and Pragmatics, 9(3), 1–54. https://doi.org/10.3765/sp.9.3 Bocci, G. (2013). The Syntax-Prosody Interface: A cartographic perspective with evidence from Italian. (W. Abraham & E. van Gelderen, Eds.). Philadelphia: John Benjamins. Boersma, P., & Weenink, D. (2018). Praat: doing phonetics by computer. Bošković, Ž. (2007). On the Locality and Motivation of Move and Agree : An Even More Minimal Theory. Linguistic Inquiry, 38(4), 589–645.
| 231 Carnaval, M. (2017). Foco informacional e foco contrastivo no Português do Brasil: uma abordagem prosódica. Universidade Federal do Rio de Janeiro, Rio de Janeiro. Carnie, A. (2013). Syntax: a generative introduction. London: Wiley-Blackwell. Cheng, B. L. L. (2003). Wh -in-situ. GLOT International, 7(4), 103–109. Chomsky, N. (1957). Syntactic Structures. Hague: Mouton. Chomsky, N. (1965). Aspects of the theory of syntax. Massachusetts: MIT Press. Chomsky, N. (1972). Deep structure, surface structure and semantic interpretation. In D. D. Steinberg & L. A. Jakobovits (Eds.), Semantics: An Interdisciplinary Reader in Philosophy, Linguistics, and Psychology (pp. 62–119). Cambridge: Cambridge University Press. Chomsky, N. (1975). Reflections on language. New York: Random House. Chomsky, N. (1981). Lectures on government and binding. Dordrecht: Foris. https://doi.org/10.1515/9783110884166 Chomsky, N. (1986). Knowledge of Language: Its Nature Origin and Use. New York: Praeger. Chomsky, N. (2000). Minimalist Inquiries: The Framework. In D. Michaels, J. Uriagereka, S. J. Keyser, & R. Martin (Eds.), Step by Step: Essays on minimalist syntax in honor of Howard Lasnik (pp. 89–156). Cambridge: MIT Press. Chomsky, N. (2001). Derivation by phase. In I. Kenstowicz (Ed.), Ken Hale: a life in language (p. 1:52). Cambridge: MIT Press. Chomsky, N. (2004). Beyond explanatory adequacy. In A. Belletti (Ed.), Structures and Beyond: The cartography of syntactic structures. Oxford: Oxford University Press. Chomsky, N. (2015). The Minimalist Program. Cambridge: MIT Press. https://doi.org/10.15713/ins.mmj.3 Cinque, G. (1999). Adverbs and Functional Heads: A Cross-Linguistic Perspective. Oxford: Oxford University Press.
| 232 Cinque, G., & Rizzi, L. (2008). The Cartography of Syntactic Structures. The Oxford Handbook of Linguistic Analysis, 2. https://doi.org/10.1093/oxfordhb/9780199544004.013.0003 Cooper, W. E., Eady, S. J., & Mueller, P. R. (1985). Acoustical aspects of contrastive stress in question–answer contexts. The Journal of the Acoustical Society of America, 77(6), 2142–2156. https://doi.org/10.1121/1.392372 Crawley, M. J. (2013). The R Book, 2nd edition. Chichester: Wiley. https://doi.org/10.1007/978-0-387-78171-6 Cruschina, S. (2012). Discourse-Related Features and Functional Projections. DiscourseRelated Features and Functional Projections. Oxford: Oxford University Press. https://doi.org/10.1093/acprof:oso/9780199759613.001.0001 Cunha, C. de S. (2005). Corpus ALiB: uma base de dados para pesquisas atuais e futuras. In C. de S. Cunha (Ed.), Estudos geo-sociolinguísticos (pp. 67–81). Rio de Janeiro: Programa de pós-graduação em Letras Vernáculas da UFRJ. d’Alessandro, C., & Mertens, P. (1995). Automatic pitch contour stylization using a model of tonal perception. Computer Speech and Language, 9(3), 257–288. https://doi.org/10.1006/csla.1995.0013 É. Kiss, K. (1998). Identificational focus versus information focus. Language, 74(2), 245– 273. Eady, S. J., & Cooper, W. E. (1986). Speech intonation and focus location in matched statements and questions. The Journal of the Acoustical Society of America, 80(2), 402– 415. https://doi.org/10.1121/1.394091 Erteschik-Shir, N. (2007). Information structure: the syntax–discourse interface. New York: Oxford University Press. Fernandes, F. R. (2007). Ordem, focalização e preenchimento em português: sintaxe e prosódia. Uniersidade Estadual de Campinas. Retrieved from http://www.tycho.iel.unicamp.br/~tycho/pesquisa/monografias/FERNANDES_FRDr.pdf Féry, C. (2017). Intonation and prosodic structure. New York: Cambridge University Press. Frota, S. (2000). Prosody and Focus in European Portuguese: Phonological Phrasing and Intonation. London: Garland Publishing.
| 233 Frota, S. (2002). Nuclear falls and rises in European Portuguese: A phonological analysis of declarative and question intonation. Probus, 14(1), 113–146. https://doi.org/10.1515/prbs.2002.001 Frota, S., & Vigário, M. (2001). Efeitos de peso no Português Europeu. In Saberes no Tempo - Homenagem a Maria Henriqueta Costa Campos (pp. 315–333). Lisboa: Colibri. Goldman, J.-P. (2011). EasyAlign: an automatic phonetic alignment tool under Praat. In InterSpeech. Firenze. Grosz, P. G. (2011). On the Grammar of Optative Constructions. Amsterdam: John Benjamins. Guesser, S., & Quarezemin, S. (2013). Focalização, cartografia e sentenças clivadas do português brasileiro. Revista Linguística, 9(1), 188–208. Retrieved from http://www.revistalinguistica.letras.ufrj.br/index.php/revistalinguistica/article/view/26/21 7 Guesser, S., & Trianon, R. B. E. (no prelo). (n.d.). Clivadas, pseudoclivadas, português brasileiro e abordagem cartográfica. In Clivagem e relativização no PB: sntaxe, variação, diacronia e experimentação. Guimarães, M. (2017). Os fundamentos da teoria linguística de Chomsky. Petrópolis: Vozes. Haegeman, L., & Zanuttini, R. (1991). Negative heads and negative operators: The Neg criterion. Syntactic Theory and First Language Acquisition - Crosslinguistic Perspectives: Volume 1 - Heads, Projections and Learnability, 8, 233–251. Halle, M., & Marantz, A. (1993). Distributed Morphology and the Pieces of Inflection. The View from Building 20: Essays in Honor of Sylvain Bromberger, (hereafter DM), 111– 176. Heim, I., & Kratzer, A. (1998). Semantics in Generative Grammar. Language (Vol. 75). Oxford: Blackwell Publishers. https://doi.org/10.2307/417746 Hirst, D. (1987). La représentation linguistique des systèmes prosodiques : une approche cognitive. Université de Provence. Hirst, D. (2011). The analysis by synthesis of speech melody: from data to models. Journal of Speech Sciences, 1(1), 55–83. Retrieved from http://www.researchgate.net/publication/228409777_THE_ANALYSIS_BY_SYNTHES IS_OF_SPEECH_MELODY_FROM_DATA_TO_MODELS/file/504635173b4dbe2dbf.
| 234 pdf Hirst, D., & Di Cristo, A. (1998). A survey of intonation systems. In D. Hirst & A. Di Cristo (Eds.), Intonation Systems: A Survey of Twenty Languages (pp. 1–44). Cambridge: Cambridge University Press. Hirst, D., & Espesser, R. (1993). Automatic modelling of fundamental frequency using a quadratic spline function. Travaux de l’Institut de Phonétique d’Aix, 15, 71–85. Hornstein, N., Nunes, J., & Grohmann, K. (2013). Understanding Minimalism. Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9781107415324.004 Huang, C. T. J. (1982). Logical Relations in Chinese and the theory of grammar. Massachusetts Institute of Technology. Huang, C. T. J. (1989). Pro-drop in Chinese: a generalized control theory. In The null-subject parameter (pp. 185–214). Dordrecht: Kluwer Academic Publishers. Husson, F., Lê, S., & Pagès, J. (2017). Exploratory Multivariate Analysis by Example Using R. Boca Raton: CRC Press. https://doi.org/10.1111/j.1751-5823.2011.00159_19.x Jackendoff, R. S. (1974). Semantic Interpretation in Generative Grammar. Massachusetts: MIT Press. Kayne, R. (1994). The Antisymmetry of Syntax. Cambridge: MIT Press. https://doi.org/10.1007/978-94-007-1570-7 Kinsella, A. R. (2009). Language evolution and syntactic theory. New York: Cambridge University Press. Kratzer, A. (1991). Modality. In A. von Stechow & D. Wunderlich (Eds.), Semantics: An international handbook ofcontemporary research (pp. 639–650). Berlim: Mouton de Gruyter. Kratzer, A. (2012). Modals and Conditionals. Oxford: Oxford University Press. https://doi.org/10.1093/acprof:oso/9780199234684.001.0001 Ladd, D. R. (1983). Phonological Features of Intonational Peaks. Language, 59(4), 721–759. Ladd, D. R. (2008). Intonational Phonology. Cambridge: Cambridge University Press.
| 235 Larson, R. K. (1988). On the Double Object Construction. Linguistic Inquiry, 19(3), 335–391. Lasnik, H., & Stowell, T. (1991). Weakest crossover. Linguistic Inquiry, 22(4), 687–720. Laurence, S., & Margolis, E. (2001). The poverty of the stimulus argument. British Journal for the Philosophy of Science, 52(2), 217–276. https://doi.org/10.1093/bjps/52.2.217 Levinson, S. C. (1983). Pragmatics. Cambridge: Cambridge University Press. Liberman, M. (1975). The Intonational System of English. Massachusets Institute of Technology. Lieberman, P. (1966). Intonation, perception and language. Massachussets Institute of Technology. Marantz, A. (1997). No escape from syntax: Don’t try morphological analysis in the privacy of your own lexicon. University of Pennsylvania Working Papers in Linguistics, 4(2), 201–225. Retrieved from http://web.mit.edu/marantz/Public/Download/Penn- Final.pdf Mathôt, S., Schreij, D., & Theeuwes, J. (2012). OpenSesame: An open-source, graphical experiment builder for the social sciences. Behavior Research Methods, 44(2), 314–324. https://doi.org/10.3758/s13428-011-0168-7 May, R. (1985). Logical Form: Its Structure and Derivation. Linguistics Inquiry Monographs. Cambridge: MIT Press. McCarthy, J. J. (2007). What Is Optimality Theory? Language and Linguistics Compass, 93, 260–291. https://doi.org/10.1111/j.1749-818X.2007.00018.x McCarthy, J. J., & Prince, A. (1995). Faithfulness and Reduplicative Identity. University of Massachusetts Occasional Papers in Linguistics 18: Papers in Optimality Theory, 249– 384. Menuzzi, S. (2012). Algumas observações sobre Foco, Contraste e exaustividade. Revista Letras, 86, 95–121. Retrieved from http://ojs.c3sl.ufpr.br/ojs2/index.php/letras/article/viewArticle/29909 Mertens, P. (2004). The Prosogram : Semi-Automatic Transcription of Prosody based on a Tonal Perception Model. In B. Bel & I. Marlien (Eds.), Proceedings of Speech Prosody 2004 (pp. 23–26). Nara (Japan).
| 236 Mioto, C. (2001). Sobre o sistema CP no português brasileiro. Revista Letras, (56), 97–139. Mioto, C. (2003). Focalização e quantificação. Revista Letras, 61, 169–189. Retrieved from http://www.letras.ufpr.br/documentos/pdf_revistas/mioto.pdf Moraes, J. A. de. (n.d.). Prosódia e suprassegmentos. Moraes, J. A. De. (2006). Variações em torno de tema e tema. Anais Do IX Congresso Nacional de Lingüística e Filologia, IX(17). Nespor, M., & Vogel, I. (2007). Prosodic phonology: with a new foreword. Studies in Generative Grammar. Ockham, G. de. (1495). Quaestiones et decisiones in IV libros Sententiarum, cum centilogio theologico. Lyons: Johann Trechsel. Disponível em: https://ia600607.us.archive.org/17/items/A336059bis/A336059bis.pdf. Partee, B. H. (1995). Lexical Semantics and Compositionality. In L. R. Gleitman & M. Liberman (Eds.), Invitation to Cognitive Science, Part I: Language (pp. 311–360). Cambridge: MIT Press. Pierrehumbert, J. B. (1980). The phonology and phonetics of English intonation. Massachusetts Institute of Technology. https://doi.org/10.1177/003368828401500113 Pollock, J.-Y. (1989). Verb Movement, Universal Grammar, and the Structure of IP. Linguistic Inquiry, 20(3), 365–424. https://doi.org/10.2307/4178634 Prince, A., & Smolensky, P. (1993). Optimality Theory : Constraint Interaction in Generative Grammar. Boulder: Tech Report. https://doi.org/10.1017/S0272263106220060 Prince, E. F. (1978). A Comparison of Wh-Clefts and it-Clefts in Discourse. Language, 54(4), 883–906. Quarezemin, S. (2009). Estratégias De Focalização No Português Brasileiro. Universidade Federal de Santa Catarina, Florianópolis. Quarezemin, S. (2012). Sujeito e objeto focalizados nas sentenças SVO do português brasileiro. Fórum Linguístico, 9(3), 203–214. https://doi.org/10.5007/19848412.2012v9n3p203 Ribeiro, N. L. (2015). Processamento Do Foco Prosódico Em Clivadas Invertidas Reduzidas.
| 237 ReVEL, 10(Special Edition), 317–341. Rizzi, L. (1990). Relativized Minimality. Cambridge: MIT Press. Rizzi, L. (1996). Residual verb second and the wh-criterion. In A. Belletti & L. Rizzi (Eds.), Parameters and functional heads: essays in comparative syntax (pp. 63–90). New York: Oxford University Press. Rizzi, L. (1997). The Fine Structure of the Left Periphery. In L. Haegeman (Ed.), Elements of Grammar (pp. 281–337). Springer Netherlands. https://doi.org/10.1007/978-94-0115420-8_7 Rizzi, L. (2001). Relativized minimality effects. In M. Baltin (Ed.), The handbook of contemporary syntactic theory (pp. 89–110). New Jersey: Wiley-Blackwell. Retrieved from papers3://publication/uuid/A7E1854F-F5D4-4433-914C-D9AAD3BF8641 Rizzi, L. (2004). The structure of CP and IP: the cartography of syntactic structures, volume 2. New York: Oxford University Press. Rizzi, L. (2006). On the Form of Chains: Criterial Positions and ECP Effects. In L. Cheng & N. Corver (Eds.), Wh-Movement: Moving on (pp. 97–133). Cambridge: MIT Press. Rizzi, L., & Bocci, G. (2017). The left periphery of the clause – Primarily illustrated for Italian. In Blackwell Companion to Syntax, II edition. Oxford: Blackwell Publishers. Rizzi, L., & Cinque, G. (2016). Functional Categories and Syntactic Theory. Annual Review of Linguistics, 2(1), 139–163. https://doi.org/10.1146/annurev-linguistics-011415040827 Roisenberg, G., & Menuzzi, S. (2008). Pressuposição, exaustividade e denegação nas clivadas. VIII Encontro Do CELSUL. Retrieved from http://www.geocities.ws/smenuzzi/download/exaustividade_celsul_2008.pdf Rooth, M. (1992). A theory of focus interpretation. Natural Language Semantics: An International Journal of Semantics and Its Interfaces in Grammar, 1(1), 75–116. https://doi.org/10.1007/BF02342617 Ross, J. R. (1967). Constraints on variables in Syntax. Massachusetts Institute of Technology. Saussure, F. de. (2006). Curso de Linguistica Geral. São Paulo: Cultrix.
| 238 Selkirk, E. (1984). Phonology and Syntax: The Relation between Sound and Structure. Cambridge: MIT Press. Selkirk, E. (1986). On derived domains in sentence phonology. Phonology Yearbook, 3, 371– 405. https://doi.org/10.1017/S0952675700000695 Selkirk, E. (1996). The Prosodic Structure of Function Words. In J. L. Morgan & K. Demuth (Eds.), Signal to Syntax: Bootstrapping from Speech to Grammar in Early Acquisition (pp. 187–213). Mahwah, New Jersey: Lawrence Erlbaum. https://doi.org/10.1002/9780470756171.ch25 Selkirk, E. (2011). The syntax–phonology interface. In J. Goldsmith, J. Riggle, & A. C. L. Yu (Eds.), The Handbook of Phonological Theory Second Edition (pp. 435–484). Oxford: Blackwell Publishers. Serra, C. (2009). Realização e percepção de fronteiras prosódicas no Português do Brasil: fala espontânea e leitura. Universidade Federal do Rio de Janeiro. Silvestre, A. P. dos S., & Cunha, C. de S. (2013). Pelos cantos do Brasil: A variação entoacional da asserção neutra em Natal, Rio de Janeiro e Porto Alegre. Letrônica, Porto Alegre, 6(1), 179–195. Strawson, P. F. (1950). On Refering. Mind, 59(235), 320–344. Retrieved from http://links.jstor.org/sici?sici=00264423%28195007%292%3A59%3A235%3C320%3AOR%3E2.0.CO%3B2-U Strawson, P. F. (1964). Identifying reference and truth‐values. Theoria, 30(2), 96–118. https://doi.org/10.1111/j.1755-2567.1964.tb00404.x Takahashi, D. (1994). Minimality of Movement. University of Connecticut. Tenani, L. E. (2002). Domínios prosódicos no português do Brasil: implicações para a prosódia e para a aplicação de processos fonológicos. Universidade Estadual de Campinas. Tescari Neto, A. (2017). A posição dos advérbios focalizadores na hierarquia universal The position of focusing adverbs in the universal hierarchy. Revista de Estudos Da Linguagem, Belo Horizonte, 25(1), 44–84. https://doi.org/10.17851/2237.2083.25.1.535558 Truckenbrodt, H. (1999). On the Relation between Syntactic Phrases and Phrases Phonological. Linguistic Inquiry, 30(2), 219–255.
| 239 Vallduvi, E. (1990). The Informational Component. University of Pennsylvania, Pennsylvania. Wedgwood, D. (2005). Shifting the focus : from static structures to the dynamics of interpretation. Current research in the semantics/pragmatics interface. Oxford: Elsevier. https://doi.org/10.1556/ALing.59.2012.4.5 Xu, Y. (2005). Speech melody as articulatorily implemented communicative functions. Speech Communication, 46(3–4), 220–251. https://doi.org/10.1016/j.specom.2005.02.014 Zubizarreta, M. L. (1998). Prosody, Focus and Word Order. Massachusets: MIT Press. (Guesser & Trianon, n.d.)
| 240
ANEXOS (João Antonio de Moraes, n.d.)
| 241 ANEXO I: FALAS E CONTEXTOS DO TESTE DE PRODUÇÃO FRASE 1 (Rafael chega na casa de Informante, vê a louça na pia e pergunta o que aconteceu)
Rafael:
[Informante], o que aconteceu na cozinha?
Informante:
A Gina fez café de noite.
FRASE 2 (Informante descobre que o irmão da Rosa comprou uma casa de esquina, mas ficou surpreso(a) de ter sido o irmão da Rosa que tenha comprado, porque todo mundo achava que seria o irmão do João que iria comprar a casa. Ele conta isso para Rafael)
Informante:
Rafael, não é possível. O irmão da Rosa comprou a casa da esquina!
FRASE 3 (Rafael e Informante estão conversando. Rafael soube que a Flávia vai fazer uma compra no próximo mês, mas não sabe o que é)
Rafael:
[Informante], o que a Flávia vai comprar no mês que vem?
Informante:
A Flávia vai comprar um carro mês que vem
FRASE 4 (Rafael e Informante estão conversando. Rafael afirma que o Paulo vai ser pai, mas Informante o corrige)
Rafael:
[Informante], eu fiquei sabendo que o Paulo vai ser pai! Que bom, né?
Informante:
Não, Rafael. O Gustavo vai ser pai. Quem te disse que era o Paulo?
| 242 FRASE 5 (Rafael e Informante se encontram depois de um tempo sem se ver)
Rafael:
E aí, [Informante], tudo bem com você? Novidades?
Informante:
Tudo ótimo, Rafael. Minha irmã trabalhou ontem. Fiquei chateado por ser domingo.
FRASE 6 (Rafael e Informante se encontram depois de um tempo sem se ver)
Rafael:
E aí, [Informante], quanto tempo! E as novidades?
Informante:
Quanto tempo! O irmão da Rosa comprou a casa da esquina. Você soube?
FRASE 7 (Informante conta para Rafael que Flávia vai comprar um carro. Ele está surpreso que ela tenha comprado justamente um carro, porque ela não tem dinheiro)
Informante:
Rafael, você não vai acreditar. A Flávia vai comprar um carro mês que vem!
FRASE 8 (Rafael e Informante estão conversando)
Rafael:
[Informante], eu soube que alguém na tua família vai ser pai, é verdade? Quem é?
Informante:
O Gustavo vai ser pai. Tá todo mundo muito feliz lá em casa.
FRASE 9 (Rafael e Informante estão conversando. Rafael afirma que a irmã de Informante foi viajar, mas ele(a) o corrige)
Rafael:
[Informante], eu soube que sua irmã foi viajar ontem. Como ela está?
Informante:
Não, Rafael. Minha irmã trabalhou ontem. Quem te disse que ela foi viajar?
| 243 FRASE 10 (Rafael e Informante estão conversando. Rafael afirma que Gina fez café de manhã, mas Informante o corrige)
Rafael:
[Informante], a Gina fez café de manhã, né? Você pode me dar um pouco?
Informante:
Ela não fez de manhã não, Rafael. A Gina fez café de noite. Deve estar frio, você quer mesmo assim?
FRASE 11 (Rafael e Informante se encontram depois de um tempo sem se ver) Rafael:
Oi, [Informante]! Como vão as coisas? Alguma novidade?
Informante:
Oi, Rafael! Tudo ótimo. Tenho uma novidade boa. A Flávia vai comprar um carro mês que vem
FRASE 12 (Informante está contando para Rafael sobre Gustavo, amigo de ambos que disse que nunca iria ser pai. [Informante] ficou surpreso(a) de que logo o Gustavo seria pai)
Informante:
Rafael, adivinha só! O Gustavo vai ser pai!
FRASE 13 (Rafael chega na casa de Informante e vê que tem café na cafeteira. Sabendo que foi a Gina quem fez o café, pergunta a ele(a) quando ela fez)
Rafael:
[Informante], a Gina fez café quando?
Informante:
A Gina fez café de noite.
FRASE 14 (Rafael e Informante estão conversando)
Rafael:
[Informante], eu vi sua postagem no Facebook, mas não entendi direito. O que a sua irmã fez ontem?
Informante:
Minha irmã trabalhou ontem. O chefe dela ligou dizendo que era urgente, mas eu fiquei chateado porque era folga dela.
| 244 FRASE 15 (Rafael e Informante estão conversando)
Rafael:
Oi, [Informante], tudo bem?
Informante:
Tudo bem, Rafael, e você? Quais as novidades?
Rafael:
Tudo ótimo sim. O irmão do Paulo comprou aquela casa da esquina, você soube?
Informante:
Não foi o irmão do Paulo não, Rafael. O irmão da Rosa comprou a casa da esquina. Ele me contou.
FRASE 16 (Rafael e Informante estão conversando. Rafael afirma que Flávia vai comprar uma casa mês que vem, mas Informante o corrige)
Rafael:
[Informante], eu soube que a Flávia vai comprar uma casa mês que vem. De onde ela tirou dinheiro?
Informante:
Não, Rafael. A Flávia vai comprar um carro mês que vem. Onde você ouviu que seria uma casa?
FRASE 17 ([Informante] fala para Rafael surpreso que sua irmã trabalhou ontem. Ele não esperava que ela fosse trabalhar porque tinha prometido que iria passear com ele)
Informante:
Rafael, adivinha só. Minha irmã trabalhou ontem! A gente tinha combinado de passear!
FRASE 18 (Informante fala para Rafael surpreso(a) que a Gina tenha feito café logo de noite)
Informante:
Rafael, você não sabe. A Gina fez café de noite! Pelo gosto eu achava que ela tinha feito de manhã
| 245 FRASE 19 (Rafael e Informante estão conversando)
Informante:
Rafael, você soube que compraram a casa da esquina?
Rafael:
Eu sei que foi o irmão de alguém que comprou, só não sei de quem.
Informante:
O irmão da Rosa comprou a casa da esquina. Você conhece ele?
FRASE 20 (Rafael e Informante se encontram depois de um tempo sem se ver)
Informante:
Oi, Rafael! Tudo bem?
Rafael:
Tudo bem, [Informante]. E você? Quais são as novidades?
Informante:
Eu tô ótimo. O Gustavo vai ser pai. Você soube?
| 246 ANEXO II: TERMO DE CONSENTIMENTO ASSINADO PELOS PARTICIPANTES DE AMBOS OS TESTES TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO Você está sendo convidado a participar da pesquisa “FOCALIZAÇÃO IN SITU NO PORTUGUÊS DO BRASIL, SINTAXE, SEMÂNTICA E PROSÓDIA”, de responsabilidade de Rafael Berg Esteves Trianon, aluno de mestrado da Universidade Federal do Rio de Janeiro. O objetivo desta pesquisa é caracterizar os aspectos prosódicos, semânticos e sintáticos no foco in situ no português brasileiro. Assim, gostaria de consultá-lo(a) sobre seu interesse e disponibilidade em cooperar com a pesquisa. Você receberá todos os esclarecimentos necessários antes, durante e após a finalização da pesquisa, e lhe asseguro que o seu nome não será divulgado, sendo mantido o mais rigoroso sigilo mediante a omissão total de informações que permitam identificá-lo(a). Quaisquer dados provenientes de sua participação na pesquisa, tais como questionários, entrevistas e mídias de gravação, ficarão sob a guarda do pesquisador responsável pela pesquisa. A coleta de dados será realizada por meio da resposta a perguntas relacionadas a inputs auditivos que você ouvirá. É para este procedimento que você está sendo convidado a participar. Sua participação na pesquisa não implica em nenhum risco. Espera-se com esta pesquisa colaborar para a descrição mais detalhada de aspectos que são específicos a cada língua, em especial nessa pesquisa, ao português brasileiro Sua participação é voluntária e livre de qualquer remuneração ou benefício. Você é livre para recusar-se a participar, retirar seu consentimento ou interromper sua participação a qualquer momento. A recusa em participar não irá acarretar qualquer penalidade ou perda de benefícios. Se você tiver qualquer dúvida em relação à pesquisa, você pode me contatar através do telefone 21-973089829 ou pelo e-mail [email protected]. ________________________________ Assinatura do (a) participante
________________________________ Assinatura do (a) pesquisador (a)
Rio de Janeiro, ___ de __________de _______.
| 247 ANEXO III: RESULTADOS DO TESTE DE PERCEPÇÃO POR TIPO DE FOCO Estímulos AV_AMP_INF1 AV_AMP_INF3 AV_AMP_INF4 AV_AMP_INF5 AV_CON_INF1 AV_CON_INF3 AV_CON_INF4 AV_CON_INF5 AV_INF_INF1 AV_INF_INF3 AV_INF_INF4 AV_INF_INF5 AV_MIR_INF1 AV_MIR_INF3 AV_MIR_INF4 AV_MIR_INF5 CN_AMP_INF1 CN_AMP_INF3 CN_AMP_INF4 CN_AMP_INF5 CN_CON_INF1 CN_CON_INF3 CN_CON_INF4 CN_CON_INF5 CN_INF_INF1 CN_INF_INF3 CN_INF_INF4 CN_INF_INF5 CN_MIR_INF1 CN_MIR_INF3 CN_MIR_INF4 CN_MIR_INF5 OD_AMP_INF1 OD_AMP_INF3 OD_AMP_INF4 OD_AMP_INF5 OD_CON_INF1 OD_CON_INF3 OD_CON_INF4 OD_CON_INF5 OD_INF_INF1 OD_INF_INF3 OD_INF_INF4 OD_INF_INF5 OD_MIR_INF1
Respostas Amplo Contr. Inf. Mir. Total 9 1 10 0 20 7 3 9 0 19 10 2 7 0 19 11 1 7 0 19 4 9 5 3 21 2 8 9 1 20 2 10 5 3 20 10 3 8 0 21 6 2 11 1 20 3 5 11 1 20 4 2 15 0 21 12 0 7 0 19 11 2 6 0 19 0 12 1 8 21 0 14 0 7 21 5 5 2 7 19 8 1 6 5 20 8 5 7 1 21 6 5 3 5 19 9 1 4 6 20 4 13 3 0 20 0 14 4 3 21 1 15 3 2 21 4 7 5 5 21 1 15 4 1 21 1 17 0 3 21 5 7 7 2 21 13 1 5 1 20 11 1 8 0 20 3 15 1 1 20 9 3 1 6 19 14 0 3 3 20 13 1 3 4 21 9 0 7 5 21 14 0 5 0 19 11 0 4 6 21 6 2 6 6 20 0 13 1 7 21 2 9 0 9 20 7 10 1 3 21 14 2 3 2 21 14 1 1 5 21 10 0 7 2 19 8 1 9 2 20 16 0 4 1 21
| 248 OD_MIR_INF3 OD_MIR_INF4 OD_MIR_INF5 SJ_AMP_INF1 SJ_AMP_INF3 SJ_AMP_INF4 SJ_AMP_INF5 SJ_CON_INF1 SJ_CON_INF3 SJ_CON_INF4 SJ_CON_INF5 SJ_INF_INF1 SJ_INF_INF3 SJ_INF_INF4 SJ_INF_INF5 SJ_MIR_INF1 SJ_MIR_INF3 SJ_MIR_INF4 SJ_MIR_INF5 VB_AMP_INF1 VB_AMP_INF3 VB_AMP_INF4 VB_AMP_INF5 VB_CON_INF1 VB_CON_INF3 VB_CON_INF4 VB_CON_INF5 VB_INF_INF1 VB_INF_INF3 VB_INF_INF4 VB_INF_INF5 VB_MIR_INF1 VB_MIR_INF3 VB_MIR_INF4 VB_MIR_INF5 Total Geral
6 10 2 10 8 13 2 5 2 1 3 3 0 4 15 5 1 0 6 12 3 8 9 4 1 6 5 8 0 2 6 11 3 1 1 493
2 3 1 0 2 0 0 10 15 14 9 6 15 9 3 1 11 9 0 1 8 1 0 8 14 5 7 0 8 10 1 1 5 7 9 433
7 2 0 3 6 6 3 5 3 3 0 8 3 6 2 2 2 0 2 6 6 10 12 8 1 9 5 13 7 4 12 7 2 8 5 406
6 5 18 7 5 1 16 1 1 2 8 4 3 2 1 11 7 12 13 2 4 0 0 0 3 1 4 0 5 5 2 1 11 5 6 299
21 20 21 20 21 20 21 21 21 20 20 21 21 21 21 19 21 21 21 21 21 19 21 20 19 21 21 21 20 21 21 20 21 21 21 1631
| 249 ANEXO IV: RESULTADOS DO TESTE DE PERCEPÇÃO POR EXAUSTIVIDADE
Estímulo AV_AMP_1_INF1 AV_AMP_1_INF3 AV_AMP_1_INF5 AV_AMP_2_INF4 AV_CON_2_INF4 AV_CON_2_INF5 AV_CON_3_INF1 AV_CON_3_INF3 AV_INF_1_INF4 AV_INF_1_INF5 AV_INF_2_INF1 AV_INF_2_INF3 AV_MIR_1_INF3 AV_MIR_1_INF4 AV_MIR_2_INF5 AV_MIR_3_INF1 CN_AMP_1_INF1 CN_AMP_1_INF5 CN_AMP_2_INF3 CN_AMP_2_INF4 CN_CON_1_INF4 CN_CON_2_INF1 CN_CON_2_INF3 CN_CON_2_INF5 CN_INF_1_INF3 CN_INF_1_INF5 CN_INF_2_INF4 CN_INF_3_INF1 CN_MIR_2_INF4 CN_MIR_3_INF1 CN_MIR_3_INF3 CN_MIR_3_INF5 OD_AMP_2_INF3 OD_AMP_2_INF5 OD_AMP_3_INF1 OD_AMP_3_INF4 OD_CON_1_INF1 OD_CON_1_INF3 OD_CON_1_INF4 OD_CON_2_INF5
Exaustivo
NãoExaustivo
9 6 4 6 13 10 11 11 12 11 8 12 13 14 13 5 9 12 10 9 18 15 20 18 17 13 11 17 9 12 19 13 12 8 8 11 11 18 15 17
12 15 17 15 8 11 9 10 9 10 12 8 8 6 8 14 12 9 11 10 3 4 1 3 3 7 10 3 11 8 2 7 8 11 13 9 10 3 6 4
Total Geral 21 21 21 21 21 21 20 21 21 21 20 20 21 20 21 19 21 21 21 19 21 19 21 21 20 20 21 20 20 20 21 20 20 19 21 20 21 21 21 21
| 250 OD_INF_2_INF5 OD_INF_3_INF1 OD_INF_3_INF3 OD_INF_3_INF4 OD_MIR_1_INF3 OD_MIR_1_INF5 OD_MIR_2_INF4 OD_MIR_3_INF1 SJ_AMP_1_INF1 SJ_AMP_1_INF3 SJ_AMP_2_INF5 SJ_AMP_3_INF4 SJ_CON_1_INF1 SJ_CON_1_INF5 SJ_CON_2_INF4 SJ_CON_3_INF3 SJ_INF_1_INF4 SJ_INF_1_INF5 SJ_INF_2_INF3 SJ_INF_3_INF1 SJ_MIR_1_INF5 SJ_MIR_3_INF1 SJ_MIR_3_INF3 SJ_MIR_3_INF4 VB_AMP_1_INF4 VB_AMP_2_INF3 VB_AMP_2_INF5 VB_AMP_3_INF1 VB_CON_2_INF5 VB_CON_3_INF1 VB_CON_3_INF3 VB_CON_3_INF4 VB_INF_2_INF1 VB_INF_2_INF4 VB_INF_2_INF5 VB_INF_3_INF3 VB_MIR_2_INF1 VB_MIR_2_INF3 VB_MIR_2_INF4 VB_MIR_2_INF5 Total Geral
16 9 11 12 7 13 11 8 10 11 11 12 15 15 16 18 13 10 16 14 7 9 15 18 7 9 5 6 19 15 18 9 12 8 15 17 7 14 10 17 965
5 9 9 8 11 7 10 12 11 10 9 9 6 6 4 3 7 11 5 7 11 11 6 3 14 11 16 13 2 6 3 11 8 11 5 3 12 7 11 3 666
21 18 20 20 18 20 21 20 21 21 20 21 21 21 20 21 20 21 21 21 18 20 21 21 21 20 21 19 21 21 21 20 20 19 20 20 19 21 21 20 1631