Quem foi notícia? Explore os últimos 25 anos através do arquivo da LUSA e dos principais sites de notícias portugueses. Saiba mais

O Mundo Visto Daqui - Todos os artigos

    Ver rede

      Notícias em:

        404

        A página que procura não existe

        Rede Globalde ligações decentra em

        Esta é a rede global de personalidades rede mostra as ligações de nas noticias . Clique nos circulos para saber mais sobre as personalidades ou use a linha cronológica para escolher outras datas. Saiba mais aqui.

        NotíciasResultados de

        0 Notícias

          0 Citações

            Sem citações neste período.

            0 Ligações

            Ver rede de personalidades

              Top últimos 3 dias - Os mais referidos nas notícias

              • O que é a Máquina do Tempo?

                A Máquina do Tempo (http://maquinadotempo.sapo.pt) é uma ferramenta interativa que permite a navegação e exploração de notícias dos últimos 25 anos do arquivo da LUSA e dos principais sites de notícias portuguesas. Com esta ferramenta o utilizador pode fazer uma viagem no tempo, revisitando as personalidades e eventos mais marcantes da história portuguesa e internacional dos últimos anos, tal como estes foram retratados pelas notícias então publicadas.

                Como se usa?

                A Máquina do Tempo pode ser explorada de duas formas: escolhendo uma personalidade, ou escolhendo uma data específica. Ambas as opções estão disponíveis na página de entrada do site e na barra de topo que está em todas as páginas. Se não souber por onde começar, pode sempre escolher uma das sugestões apresentadas na página de entrada.

                As personalidades

                Ao escolher uma personalidade, o utilizador acede à página de perfil desta. Aí está reunido um conjunto de informações recolhido a partir das notícias em que ocorre o nome dessa personalidade:

                1. dados genéricos de perfil da personalidade

                  • nome

                  • último cargo ou profissão que exerceu

                  • fotografias (quando disponíveis)

                  • estatísticas globais, que incluem o número total de notícias em que a personalidade esteve presente, bem como os totais das suas citações e das suas ligações

                2. uma linha temporal, desde 1990 até aos dias de hoje, que representa permite ver a evolução do número de notícias em que a personalidade em questão foi mencionada ao longo do tempo.

                3. os conteúdos mais relevantes para o período temporal previamente selecionado, extraídos das notícias

                  • a lista das notícias (com acesso ao conteúdo original)

                  • citações da personalidade escolhida que ocorrem nessas notícias

                  • a lista das pessoas que ocorrem nessas notícias

                  • a lista de pessoas que ocorrem nessas notícias – a chamada "rede de ligações" da personalidade – que pode ser consultada num formato gráfico interativo em página própria, a chamada "página de rede"

                As redes de ligações

                Ao escolher uma data, sem pesquisar uma personalidade específica, o utilizador acede a uma página centrada numa rede interativa. Esta rede mostra as ligações entre personalidades mencionadas nas notícias do intervalo temporal definido. Sempre que duas ou mais personalidades são referidas na mesma notícia, os seus nomes são apanhados na rede e é estabelecida uma ligação entre elas.

                Como usar as redes

                De uma forma geral, estas redes permitem evidenciar as personalidades e as ligações mais frequentes nas notícias para um período temporal.

                As personalidades presentes na rede são representadas por círculos; quanto mais vezes uma determinada pessoa for referida em notícias, maior é o tamanho do círculo que a representa nesta rede. Quanto mais notícias referirem simultaneamente duas personalidades, mais forte é a sua ligação e mais espessa a linha que as une na rede.

                Um clique sobre um círculo permite o acesso a detalhes do perfil da personalidade escolhida (cargo/profissão que exerce no período temporal selecionado, uma fotografia e ainda a possibilidade de centrar a rede nessa pessoa).

                As cores dos círculos identificam o tema das notícias em que a personalidade é mais mencionada. O utilizador pode filtrar (remover ou acrescentar) as áreas temáticas disponíveis no menu lateral esquerdo. Ao retirar ou adicionar temas estará naturalmente também a retirar ou adicionar personalidades à rede.

                Para contextualizar e fundamentar as redes de ligações entre personalidades apresentadas na página da rede, mostramos sempre a lista de todas as notícias que foram usadas para construir a rede em questão. Esta lista surge logo abaixo da rede. Ao clicar em cada título de notícia o utilizador pode aceder ao conteúdo original (publicado dentro do site "Máquina do Tempo", se forem notícias do arquivo da LUSA; ou no site do órgão de media, caso sejam notícias dos principais jornais nacionais online).

                Como são geradas as redes e páginas de perfil?

                Toda a informação disponibilizada na "Máquina do Tempo" é recolhida, processada e apresentada de forma automática, sem qualquer intervenção humana, pelo que podem ocorrer erros. Contamos com o feedback dos utilizadores para identificar estes erros, de forma a que possamos corrigi-los com a maior brevidade, através do email maquinadotempo@lists.labs.sapo.pt.

                Compatibilidade com browsers

                A "Máquina do Tempo" está otimizada para ser usado nos browsers Chrome, Safari, Firefox e Internet Explorer 9 (ou versões superiores). A utilização do "Máquina do Tempo" está também adaptada aos dispositivos móveis e tablets, com algumas limitações ao nível da usabilidade para dispositivos de menores resoluções/dimensões.

              • A investigação na base da Máquina do Tempo

                A "Máquina do Tempo" é o resultado mais recente da investigação que tem sido realizada no laboratório SAPO/U.Porto, ao abrigo de um protocolo de colaboração entre a Universidade do Porto e a Portugal Telecom estabelecido em 2008. O laboratório está sediado na Faculdade de Engenharia da Universidade do Porto e tem sido dinamizado por docentes e investigadores do Departamento de Engenharia Informática. A coordenação do laboratório está a cargo de Eugénio Oliveira e Cristina Ribeiro, por parte da Universidade do Porto, e Celso Martinho e Benjamin Júnior por parte do SAPO.

                Ao longo de 5 anos, o laboratório SAPO/U.Porto acolheu projetos nas áreas da extração de informação de texto, análise de registos de interação, visualização de informação, pesquisa multimédia, análise de sentimentos, recomendação musical, deteção de opiniões nos media sociais, análise de relações em redes. Estes projetos exploram grandes coleções de dados, de que são exemplo as notícias, os blogues, as imagens jornalísticas, a música e os tweets. Todos os projetos tiveram a sua origem em trabalhos de investigação e resultaram quer em protótipos que ilustram o uso de tecnologias recentes quer em ferramentas que podem ser incorporadas em novos projetos ou ser oferecidas como serviços. O ambiente de investigação é estimulante pela proximidade dos desafios que os vários serviços do SAPO colocam.

                A "Máquina do Tempo" é baseada em tecnologias desenvolvidas no laboratório SAPO/U.Porto resulta do trabalho conjunto do laboratório e das equipas do SAPO. As tecnologias aplicadas no produto resultaram de vários projetos, alguns concluídos e outros em curso, nomeadamente os que se indicam a seguir (mais informação sobre os projetos nas páginas do laboratório).

                O projeto Verbatim teve início em 2008 e foi a primeira experiência, no universo do laboratório SAPO/U.Porto, com a exploração de coleções de notícias e o desenvolvimento de métodos para extração automática de personalidades e de citações. As notícias são textos com estruturas lexicais muito próprias que incluem, direta ou indiretamente, citações de ideias, frases ou opiniões de alguém. A estratégia seguida neste projeto partiu de uma análise lexical para a separação de frases, seguida da identificação do seu emissor. Os padrões linguísticos aplicados procuram determinar se a frase é uma citação. As frases classificadas como citações são normalizadas para eliminar variantes linguísticas e depois agrupadas para reduzir a repetição de citações extraídas de fontes diferentes.

                O projeto Verbatim foi iniciado por Luís Sarmento e Sérgio Nunes em 2008 e continuou a ser desenvolvido por Jorge Teixeira com a orientação científica de Eugénio Oliveira.

                O projeto Verbatim teve uma aplicação direta no serviço Voxx do SAPO, que mostra um panorama das personalidades presentes nas notícias através das citações que aparecem na comunicação social num dado período.

                O projeto Verbetes surgiu na sequência do "Verbatim", motivado pela necessidade de identificar com mais rigor os emissores originais das citações extraídas das notícias. No "Verbetes" faz-se a identificação e extração automática de nomes de personalidades e de cargos/profissões presentes nas notícias. Numa primeira fase o projeto desenvolveu um conjunto de algoritmos para a extração, a classificação e a fusão automática da informação recolhida a partir de notícias publicadas online recorrendo a padrões linguísticos. A qualidade dos resultados obtidos de forma totalmente automática decorre de um processamento em cascata, que começa na identificação de todas as expressões candidatas a nomes de entidades e de cargos e prossegue com a validação e classificação destas expressões, seguida da fusão de variantes lexicais. O resultado são estruturas que incluem o nome da personalidade, o cargo ou profissão, as datas da primeira e da última notícia onde o nome e cargo foram identificados e o número de vezes que isso aconteceu.

                A segunda abordagem para a identificação de nomes de personalidades em notícias é baseada em aprendizagem automática, usando o algoritmo de "Conditional Random Fields". Nesta abordagem os padrões são aprendidos automaticamente, o que alarga a aplicação do algoritmo e duplica o número de nomes de personalidades identificadas.

                O projeto "Verbetes" contribuiu para as fases mais avançadas do projeto Verbatim, ao fornecer as personalidades cujas citações são extraídas.

                O projeto Verbetes foi lançado por Luís Sarmento e Jorge Teixeira em 2010 e os trabalhos de continuação foram assegurados por Jorge Teixeira, no âmbito do trabalho de doutoramento sob a orientação de Eugénio Oliveira. Neste projeto colaboraram também os bolseiros Pedro Paixão (2011) e Luís Rei (2012) sob a orientação de Eugénio Oliveira.

                O Mundo Visto Daqui Interativo é uma ferramenta que permite visualizar e explorar as ligações entre personalidades mencionadas nas notícias num intervalo de tempo definido pelo utilizador. No centro da rede aparece uma personalidade em destaque e à sua volta as personalidades com as quais partilha menções em notícias no período referido. Quanto mais vezes uma personalidade for mencionada em notícias, maior é o tamanho do círculo que a representa nesta rede. Quanto mais notícias duas personalidades tiverem em comum, mais forte é considerada a sua ligação e mais espessa a linha que as une na rede.

                O Mundo Visto Daqui Interativo foi criado por Eduarda Mendes Rodrigues com base na investigação desenvolvida em 2012 no projeto REACTION em jornalismo computacional (UTA-Est/MAI/0006/2009, financiado pela FCT através do programa UTAustin-Portugal) e teve as colaborações de Jorge Teixeira, no tratamento de dados de notícias, e Nuno Baldaia, na visualização.

                Na Máquina do Tempo juntam-se as contribuições dos projetos de investigação mencionados acima com os dados dos vários parceiros do SAPO e com o desenvolvimento adicional dentro da empresa para a configuração de um produto.

                Os nomes de personalidades e de cargos/profissões extraídos automaticamente pelo "Verbetes" são usados em duas funções essenciais da "Máquina do Tempo": (i) construção da página de perfil da personalidade com informação relativa ao cargo/profissão da mesma; e (ii) identificação de nomes de personalidades em notícias para a sua inclusão na rede de personalidades.

                A identificação de citações, resultado do "Verbatim", é usada diretamente na "Máquina do Tempo". As citações diretas presentes nas notícias – frases e expressões proferidas por personalidades públicas, elas próprias mencionadas nas notícias – são a matéria de base para a construção da rede de personalidades.

                A análise e visualização de ligações entre personalidades, criadas para "O Mundo Visto Daqui Interativo", são a base para a interação proposta na "Máquina do Tempo", que lida com 100 mil personalidades identificadas em 3 milhões de notícias, totalizando cerca de 8 milhões de relações entre personalidades. A análise destas ligações permitiu a criação de redes de personalidades mencionadas nas notícias com base nas relações de coocorrência entre personalidades na mesma notícia. Se duas ou mais personalidades são mencionadas na mesma notícia, então existe uma relação de coocorrência entre as mesmas. Se esta relação se verificar também para outras notícias, então estamos na presença de uma relação potencialmente interessante. O desafio na criação e visualização das redes de personalidades está no elevado volume de informação em causa. A representação escolhida é o grafo com personalidades nos nós e ligações entre as personalidades nas arestas. A disposição dos nós e arestas pelo grafo é realizada com base num algoritmo de forças, o "Force-Atlas", que agrupa os nós cujas ligações são mais fortes, criando assim, sempre que possível, grupos de personalidades relacionadas. Estes grupos representam tipicamente personalidades com grande afinidade nas notícias. A frequência de uma personalidade nas notícias é também realçada através do tamanho dos nós, o que permite destacar personalidades com grande presença nas notícias.

                A partir dos algoritmos e protótipos produzidos nos projetos do laboratório SAPO/U.Porto, o desenvolvimento da interface web, da arquitetura de software e de hardware e de serviços web foi continuado nas equipas de desenvolvimento do SAPO.

                REFERÊNCIAS

                Jorge Teixeira, Luís Sarmento, Eugénio Oliveira. (2011) "A Bootstrapping Approach for Training a NER with Conditional Random Fields" Progress in Artificial Intelligence (LNAI 7026), 15th Portuguese Conference on Artificial Intelligence, pp. 664-678. EPIA 2011.

                Luís Sarmento, Sérgio Nunes, Jorge Teixeira, Eugénio Oliveira. "Propagating Fine- Grained Topic Labels in News Snippets". Proceedings of the WI-IAT 2009 Workshop on Intelligent Analysis and Processing of Web News Content (IAPWNC’09). Milan, Italy, 2009.

                Luís Sarmento, Sérgio Nunes. "Automatic Extraction of Quotes and Topics from News Feeds". Proceedings of the 4th Doctoral Symposium on Informatics Engineering (DSIE’09). Porto, Portugal, 2009.

              • Créditos:

                A Máquina do Tempo é produto da colaboração entre o laboratório SAPO/U.Porto, a equipa de desenvolvimento do SAPO e o SAPO Notícias. A usada na Máquina do Tempo foi desenvolvida no laboratório SAPO/U.Porto, coordenado por Eugénio Oliveira (DEI-FEUP e LIACC) e Cristina Ribeiro (DEI-FEUP e INESC TEC), e Celso Martinho e Benjamin Júnior (SAPO), e foi o resultado de vários projetos de investigação. A exploração da ligação entre notícias foi resultado de "O Mundo Visto Daqui Interativo", da responsabilidade de Eduarda Mendes Rodrigues (DEI-FEUP) e com a colaboração de Jorge Teixeira (laboratório SAPO/U.Porto e LIACC) na extração de informação de notícias e de Nuno Baldaia (laboratório SAPO/U.Porto) e Bruno Tavares (SAPO) na visualização interativa. A extração automática de nomes de personalidades e de cargos usa resultados do "Verbetes", um projeto lançado por Luís Sarmento (LIACC) e Jorge Teixeira que teve a colaboração de Pedro Paixão (MIEIC-FEUP) e Luís Rei (laboratório SAPO/U.Porto). A identificação de citações em notícias é resultado do projeto "Verbatim", lançado por Luís Sarmento e Sérgio Nunes (DEI-FEUP e INESC TEC), e que teve a colaboração de Jorge Teixeira. Do lado da equipa de desenvolvimento do SAPO, foi feito o desenvolvimento web por Bruno Tavares e o design por Sara Ribas.