Sapo lança site para explorar últimos 25 anos de notícias

O Sapo lançou recentemente um site que permite “viajar” em 25 anos de notícias em Portugal, através dos arquivos da agência Lusa e de artigos de diversos jornais como o Expresso e o SOL, a revista Visão, o Diário Económico, a Rádio Renascença, a SIC, entre outros, num total de sete milhões de notícias.

jornaisfotomarcossantos008Máquina do Tempo é o nome do site de pesquisa e repositório online dos principais media em Portugal, que foi desenvolvido pela Faculdade de Engenharia da Universidade do Porto em pareceria com o Sapo Labs. Esta ferramenta permite pesquisar por uma personalidade, ver todos os artigos em que essa pessoa foi referida, assim como aceder a uma lista de citações que os media fizeram e visualizar uma rede de relações com outras personalidades. Estão identificadas cem mil pessoas em sete milhões de textos.

Para além de pesquisar os nomes das personalidades, períodos ou momentos marcantes, o utilizador pode também consultar todos os dias o top de personalidades mais noticiadas e analisar a sua rede de ligações pessoais.

Por exemplo, uma pesquisa por Pedro Passos Coelho, mostra que este foi mencionado em 25402 artigos desde 28 de novembro de 2012, um período ao longo do qual o primeiro-ministro foi citado 3313 vezes pelos media. A teia de relações mostra que Paulo Portas é a ligação mais forte, o que significa que o Vice-Primeiro-Ministro é a figura que mais vezes surge em notícias que incluem o Primeiro-Ministro. António José Seguro e Aníbal Cavaco Silva são outros dos nomes frequentes a ele associados.

Benjamin Júnior é o responsável por este projeto e diz que um dos objetivos é incorporar fotografias e vídeos. “Quero que as pessoas possam navegar em 20 anos de fotos do Mário Soares”, exemplifica.

É necessário que elementos como textos ou fotografias tenham informação associada que os computadores possam interpretar, para que possam ser usados na Máquina do Tempo. No entanto, muitas das fotografias que o projeto quer mostrar não têm suficiente informação associada. Por esse motivo, a equipa da Máquina do Tempo está a desenvolver algoritmos para reconhecer rostos, padrões e objetos para que um computador consiga identificar automaticamente os intervenientes e tentar determinar a data de uma fotografia, a partir dos elementos fotografados e de eventual informação que exista nas legendas da imagem.

Esta ferramenta, que só foi recentemente disponibilizada, já tinha sido exibida em 2012 no Sapo Codebits, um evento de programação e tecnologia da PT.

A Máquina do Tempo permite também saber quais foram as personalidades mais frequentes nas notícias dos últimos dias.