Durante a maior parte de sua vida, William Shakespeare foi o dramaturgo da casa de uma companhia de atores chamada King’s Men, que apresentou suas peças nas margens do rio Tamisa, em Londres.
Quando Shakespeare morreu em 1616, a empresa precisava de um substituto e se voltou para um dos dramaturgos mais prolíficos e famosos da época, um homem chamado John Fletcher.
Desde então, a fama de Fletcher diminuiu. Mas em 1850, um analista literário chamado James Spedding notou uma notável semelhança entre as peças e passagens de Fletcher em Henrique VIII de Shakespeare. Spedding concluiu que Fletcher e Shakespeare devem ter colaborado na peça.
A evidência vem de estudos das idiossincrasias linguísticas de cada autor e de como elas surgem em Henrique VIII. Por exemplo, Fletcher costuma escrever “eles” em vez deles. Ele também tendia a adicionar a palavra “senhor”, “parado” ou “ao lado” de uma linha de pentâmetro padrão para criar uma sexta sílaba extra.

Essas características permitiram a Spedding e outros analistas sugerir que Fletcher deveria estar envolvido. Mas exatamente como a peça foi dividida é altamente contestada. E outros críticos sugeriram que outro dramaturgo inglês, Philip Massinger, era na verdade o co-autor de Shakespeare.
É por isso que analistas e historiadores adorariam determinar, de uma vez por todas, quem escreveu quais partes de Henrique VIII.
Entre Petr Plecháč na Academia Tcheca de Ciências em Praga, que diz que resolveu o problema usando o aprendizado de máquina para identificar a autoria de mais ou menos todas as linhas da peça. “Nossos resultados apoiam muito a divisão canônica da peça entre William Shakespeare e John Fletcher proposta por James Spedding”, diz Plecháč.
A nova abordagem é direta em princípio. Os algoritmos de aprendizado de máquina são usados há alguns anos para identificar padrões distintos na forma como os autores escrevem.

A técnica usa um corpo do trabalho do autor para treinar o algoritmo e um corpo de trabalho menor e diferente para testá-lo. No entanto, como o estilo literário de um autor pode mudar ao longo de sua vida, é importante garantir que todas as obras tenham o mesmo estilo.
Depois que o algoritmo aprende o estilo em termos das palavras e padrões rítmicos mais usados, ele é capaz de reconhecê-lo em textos que nunca viu.
Plecháč segue exatamente essa técnica. Ele primeiro treina o algoritmo para reconhecer o estilo de Shakespeare usando outras peças escritas ao mesmo tempo que Henrique VIII. Essas peças são The Tragedy of Coriolanus, The Tragedy of Cymbeline, The Winter’s Tale e The Tempest.
Ele então treina o algoritmo para reconhecer o trabalho de John Fletcher usando peças que ele escreveu no momento: Valentinian, Monsieur Thomas, The Woman’s Prize e Bonduca.

Finalmente, ele solta o algoritmo de Henrique VIII e pede que ele determine o autor do texto, usando uma técnica de janela rolante para percorrer a peça.
Os resultados são interessantes. Eles tendem a concordar com a análise de Spedding de que Fletcher escreveu cenas no total de quase metade da peça.
No entanto, o algoritmo permite uma abordagem mais refinada que revela como a autoria às vezes muda não apenas para novas cenas, mas também no final das cenas anteriores. Por exemplo, no Ato 3, Cena 2, o modelo sugere uma autoria mista após a linha 2081 e descobre que Shakespeare assume completamente a linha 2200, antes do início do Ato 4, Cena 1.

Plecháč também treinou seu modelo para reconhecer o trabalho de Philip Massinger, mas encontra poucas evidências de seu envolvimento. “A participação de Philip Massinger é bastante improvável”, conclui.
Esse é um trabalho interessante que mostra como linguistas e analistas literários estão usando o aprendizado de máquina para entender melhor nosso passado literário.
No entanto, há muito trabalho pela frente. Por exemplo, quando os algoritmos de visão de máquina foram treinados para reconhecer o estilo artístico, os cientistas da computação descobriram rapidamente como extrair um estilo e aplicá-lo a outras imagens, usando uma técnica conhecida como transferência de estilo neural. Durante a noite, tornou-se possível dar a uma fotografia comum o estilo de Van Gogh ou Monet.