Big Data e Machine Learning: Classificação de Notícias Esportivas e Viés Cultural

Trabalhando com Big Data e Machine Learning: Classificação de Notícias Esportivas e o Viés Cultural-Esportivo Nacional

Na próxima Segunda-Feira – dia 22 de Junho, 17h horário de Brasília – eu participarei do Ciclo de Palestras Esporte e Sociedade: Desafios Contemporâneos que está sendo organizado pelo Centro de Estudos Olímpicos e Paralímpicos da Universidade Federal do Rio Grande do Sul. A minha palestra focará no meu mais recente projeto de pesquisa que visa analisar através de machine learning os padrões de publicação (hipóteses do agendamento e do enquadramento) de notícias esportivas.

No trabalho que vou apresentar eu foco em 10 diferentes meios de comunicação de massa (ESPN, Gazzetta dello Sport, Olé, Marca, L’Equipe, BBC Sport, Daily Mail, Daily Mirror, The Guardian, The Independent) onde eu analiso mais de 60,000 notícias (Março a Julho 2019) através de um modelo preditivo treinado com somente 3,099 notícias (4,8%). Esse modelo teve um índice de acerto entre 82% e 91%, utilizando-se de três algoritmos diferentes de machine learning (k-NN, Naive Bayes, e Deep Learning).

Junto a estes dados eu também vou trazer uma análise em relação ao gênero em todas as publicações no The Independent entre Maio 2019 e Maio 2020 (17,767 notícias). Nessa análise eu treinei o modelo com 2,256 notícias (12%) e obtive mais de 97% de acerto (Deep Learning) tanto para o esporte quanto para o gênero nestas notícias.

O meu argumento nessa apresentação é que existe uma hegemonia tanto em relação a quais esportes fazem parte do agendamento/enquadramento e também qual o gênero; e essa hegemonia se relaciona à mídia analisada, mas principalmente em relação ao país em que esse meio de comunicação de massa se faz presente.

Esse tipo de padrão de agendamento/enquadramento é o que eu chamo de viés cultural-esportivo nacional – um sexto filtro editorial considerando os cinco filtros tradicionais descritos pelo Edward Herman e Noam Chomsky em relação ao modelo de propaganda dos meios de comunicação de massa.

Por causa da predominância de um gênero (masculino) e normalmente de um esporte (futebol) meu argumento é que a produção dessas notícias se torna mecanizada (Walter Benjamin) e é feita de forma exaustiva (Sigfried Kracauer) – ou seja, as notícias passam a perder valor e se tornam rasas. De certa forma, essas notícias criam o evento em vez de reportar o evento (Daniel Boorstin).

Abaixo está o link da palestra no YouTube. Espero todos lá:

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s