Acervo digital e linked data: da memória jornalística às APIs abertas

12
http://www.tecccog.net/revista Brazilian Journal of Technology, Communication, and Cognitive Science Edição nº 1, Ano I - Setembro 2013 c c c *Jornalista. Docente nos cursos de Comunicação Social das Faculdades Integradas Rio Branco. Doutorando pela Universidade Metodista de São Paulo. E-mail: [email protected] Jornalismo. Memória. Pensamento computacional. Linked O artigo se apoia no conceito de pensamento computacio- nal para encorajar o cruzamento de conhecimentos entre comunicação social e ciências da computação a partir de um exemplo: acervos digitais. O texto propõe uma relação entre a importância da memória para produção jornalística e as discussões em torno da web de dados, impulsionada pelo desenvolvimento de modelos de publicação e de dados estruturados, método denominado linked data. Somado ao potencial oferecido por interfaces para programação de aplicativos (em inglês, APIs), veículos noticiosos podem se tornar plataformas, possibilitando o envolvimento entre jor- nalistas, programadores e usuários interessados em intera- gir com conteúdos. André Rosa de Oliveira * The article is based on the concept of computational think- ing to encourage the crossing of knowledge between media and computer science from an example: digital collections. The text proposes a relationship between the importance of memory for journalistic production and discussions around the web of data driven model development and publishing of structured data, a method called linked data. In addition to the potential offered by application programming interfaces (English, APIs), news outlets can become platforms enabling the participation among journalists, developers and users interested in interacting with content. Journalism. Memory. Computational thinking. Linked date Acervo digital e linked data: da memória jornalística às APIs abertas artigo Resumo Palavras-chave Abstract Keywords

Transcript of Acervo digital e linked data: da memória jornalística às APIs abertas

http://www.tecccog.net/revista

Brazilian Journal of Technology, Communication, and Cognitive Science

Edição nº 1, Ano I - Setembro 2013ccc

*Jornalista. Docente nos cursos de Comunicação Social das Faculdades Integradas Rio Branco. Doutorando pela Universidade Metodista de São Paulo. E-mail: [email protected]

Jornalismo. Memória. Pensamento computacional. Linked

O artigo se apoia no conceito de pensamento computacio-

nal para encorajar o cruzamento de conhecimentos entre

comunicação social e ciências da computação a partir de

um exemplo: acervos digitais. O texto propõe uma relação

entre a importância da memória para produção jornalística

e as discussões em torno da web de dados, impulsionada

pelo desenvolvimento de modelos de publicação e de dados

estruturados, método denominado linked data. Somado

ao potencial oferecido por interfaces para programação de

aplicativos (em inglês, APIs), veículos noticiosos podem se

tornar plataformas, possibilitando o envolvimento entre jor-

nalistas, programadores e usuários interessados em intera-

gir com conteúdos.

André Rosa de Oliveira *

The article is based on the concept of computational think-

ing to encourage the crossing of knowledge between media

and computer science from an example: digital collections.

The text proposes a relationship between the importance of

memory for journalistic production and discussions around

the web of data driven model development and publishing of

structured data, a method called linked data. In addition to

the potential offered by application programming interfaces

(English, APIs), news outlets can become platforms enabling

the participation among journalists, developers and users

interested in interacting with content.

Journalism. Memory. Computational thinking. Linked date

Acervo digital e linked data: da memória jornalística às APIs abertas

artigo

Resumo

Palavras-chave

Abstract

Keywords

2

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

1. Introdução: computação aplicada ao jornalismoDiscutir a prática jornalística é transitar por territórios complexos e indissociáveis. Em

um lado da balança, a função social do jornalismo, reconhecê-lo como instrumento de fiscali-

zação e contextualização da realidade, absolutamente necessário para a sociedade; no outro,

um mercado cujo cenário é marcado pela incerteza, rotinas e modelos de negócios incapazes

de movimentá-lo com qualidade. Mesmo sem perder seus valores, o jornalismo exige reflexões,

mudanças, novas habilidades e outras ações para garantir sua sobrevivência em um momento,

batizado por um relatório do Tow Center for Digital Journalism, de “pós-industrial” (ANDER-

SON ET AL 2012).

Paralelamente, todas as áreas do conhecimento humano atravessam um processo irre-

versível de digitalização informativa, impulsionado pelo acesso a ferramentas e infraestrutura

tecnológica. Computadores mais velozes permitem o armazenamento e organização de data

sets massivos, isto é, bases de dados que dificilmente conseguiriam ser relacionados outrora.

A relação destes dados podem revelar informações novas ou insuspeitas, fenômeno que po-

pularizou o termo big data em diversas áreas da ciência (BOYD; CRAWFORD, 2012), poten-

cializando o armazenamento e recuperação de “bases de dados do conhecimento humano” e

possibilitando repensar questões – inclusive das ciências humanas, delineando o conceito de

digital humanities (BERRY, 2011).

Ao analisar a necessidade das interseções entre tecnologia, comunicação social e ciência

cognitiva, LIMA JUNIOR (2013) reforça a tendência da ciência moderna: cruzar os campos

do conhecimento à procura de respostas para fenômenos complexos, explorando fronteiras

do conhecimento humano. Por outro lado, em contraponto à trilha proposta pelas digital hu-

manities e ao interesse na web pelas ciências humanas, é comum encontrar estas discussões

restritas em silos disciplinares (HALFORD ET AL, 2010).

A área da comunicação social, apesar de possuir visíveis nexos interdisciplinares,

não produziu conexões consolidadas no campo teórico ou prático com algumas áreas

importantes para a compreensão de sua atuação e seu impacto na sociedade (LIMA

JUNIOR, 2013, p. 113).

Este cenário revela possibilidades ainda pouco exploradas na comunicação social: a ado-

ção de um tipo de pensamento análogo ao da ciência da computação, capaz de abstrair e re-

solver problemas por meio de sistemas – não se trata de entender códigos e programar, mas

sim desenvolver a habilidade de pensar computacionalmente, algo fundamental para qualquer

indivíduo (WING, 2006).

Especificamente no jornalismo, a relação entre profissionais de redação e programado-

res se baseia no uso de bases de dados para produção de notícia, cuja origem remete ao jorna-

3

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

lismo de precisão (também conhecido por Computer-assisted Reporting – CAR), com Philip

Meyer nos anos 1960. Ele acredita que um jornalista precisa gerenciar, processar e analisar

dados. A necessidade em lidar com grande fluxo de dados, estruturados ou não, na busca da

notícia, reforça um conceito de jornalismo computacional (DANIEL E FLEW, 2010; HAMIL-

TON E TURNER, 2010).

Este artigo trata da relação entre jornalismo e seu público, cuja aproximação fortalece

seus valores, e do pensamento computacional, um caminho possível para reflexões e possi-

bilidades. Nesse sentido, o texto propõe um foco para esta discussão: a aplicação destes con-

ceitos em acervos digitais de veículos informativos. O ponto de partida é a valorização que se

faz desta memória - grosso modo, como na história, o presente pode se explicar por meio do

passado. Além de aproveitá-la a partir da lógica computacional, a presença da tecnologia pode

atrair usuários interessados em atuar ao lado de profissionais – sejam eles jornalistas ou pro-

gramadores.

2. Memória, acervos digitais e aberturaA importância dos computadores e dos bancos de dados para o jornalismo tem em Philip

Meyer um pioneiro. De lá para cá, exemplos como de José Roberto de Toledo, um dos funda-

dores da Associação Brasileira de Jornalismo Investigativo e entusiasta do método CAR (OLI-

VEIRA, 2010), ressaltam a importância do uso de computadores para gerenciar e obter infor-

mação a partir de bases de dados próprias.

No jornalismo, tais fontes de dados podem ser compostas por matérias publicadas (his-

tóricos) ou outras bases úteis, desde que com consistência nas informações disponíveis (dados

precisos e pertinentes), com o mínimo de ruído e redundância. O processo de digitalização

informativa e conexões em rede a partir dos anos 1990 possibilitou aos veículos impressos

“abrir uma janela” para a Internet – isto é, distribuir notícia por meio de navegadores e pági-

nas HTML.

No entanto, ainda que o método jornalístico preserve seus valores e tenha adotado tecno-

logias para distribuir notícia por outras plataformas além da web, combinar linguagens como

áudio e vídeo, ou ainda criar visualizações de dados e narrativas atraentes – como Snow Fall1

, a aclamada reportagem do The New York Times publicada em 2012 e vencedora do prêmio

Pulitzer, a produção rotineira de notícias é constituída para que se torne produto de consumo

instantâneo. Se no impresso, a ideia de que o jornal do dia seguinte se torna “papel para em-

brulhar peixe”, esta premissa permanece em rede.

Ao mesmo tempo, o processo de digitalização de acervos é um desafio. Em 2002, o proje-

to ProQuest Historical Newspapers2 anunciou a digitalização completa do acervo do The New

York Times, abrindo um serviço de consulta online a partir de sua primeira edição, em 1851.

Outros jornais históricos norte-americanos, incluindo edições descontinuadas, fazem parte do

1 Disponível em <http://www.nytimes.com/projects/2012/snow-fall/>, acesso em 5.jun.2013

2 Informações dis-poníveis em <http://www.proquest.com/en-US/cata-logs/databases/detail/pq-hist-news.shtml>, acesso em 5.jun.2013

4

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

projeto. No Brasil, apesar de grandes veículos contarem com acervo disponível para consultas,

a transformação do processo manual para o informatizado engatinha. O exemplo mais eficien-

te é o do Acervo Estadão3 , que disponibiliza as edições impressas do periódico desde 1875,

incluindo períodos censurados durante a ditadura.

Um dos pesquisadores mais interessados na questão da memória jornalística, o jornalis-

ta e professor Marcos Palacios, sintetiza este modelo: a construção da realidade pelo jornalis-

mo se baseia em um universo de significados disputados conflitivamente, ocupando um lugar

de memória ao lado de outros documentos - espécie de “rascunho histórico” a espera de um

historiador consolidar o texto final (PALACIOS, 2010, p. 41).

O autor aponta, no entanto, que o acervo de um veículo informativo não se limita a este

olhar externo. Ao mesmo tempo, o uso deste recurso para a produção jornalística é evidente.

Seu acionamento é comum para produção de conteúdos relacionados a efemérides e retrospec-

tivas. Ele também aparece de maneira recorrente em comparações e analogias para contribuir

com a construção de um retrato do presente. Por fim, há a relação entre veículos e seu público,

cada vê mais presente a partir da popularização de ferramentas sociais conectadas em rede.

Parte do discurso formulado nesta relação acaba incorporado aos produtos jornalísticos con-

temporâneos.

Se é fato que nem toda informação é jornalismo e que a atividade jornalística não se

confunde com o simples testemunho, é igualmente fato que a comunicação rizomática

e a liberação do polo emissor multiplicaram - a perder de vista – os lugares de memória

em rede (PALACIOS, 2010, p. 45).

Palacios usa o termo “lugar de memória” para definir um local onde as lembranças são

externalizadas – arquivos, repositórios de documentos, onde o jornalismo se insere. A palavra

memória (do latim memor oris, “que se lembra”) também aparece na biologia também aparece

na biologia, refere-se a um grupo de habilidades de aprendizado e retenção de experiências

que humanos e outros animais possuem. A mesma analogia serviu de inspiração para o ma-

temático John Von Neumman elaborar a arquitetura de computadores: ele se tornaria mais

rápido se instruções elementares fossem armazenadas em sua memória. O modelo proposto

por Neumann ainda é seguido pela maioria dos computadores atuais (LIMA JUNIOR, 2013,

p. 110).

A relação entre o computador e o cérebro proposta por Neumann nos anos 1950 talvez

seja o maior exemplo da importância em criar laços com áreas distintas do conhecimento,

fazendo conexões possíveis. Da mesma forma, ao definir o escopo da Ciência da Informação,

SARACEVIC (1996, p. 48) lembra que os problemas básicos de se compreender os problemas

3 Disponível em <http://acervo.esta-dao.com.br>, acesso em 5.jun.2013

5

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

relacionados a informação e comunicação não podem ser resolvidos no âmbito de uma única

disciplina.

A visão de que “a memória tem sua importância”, pode fazer sentido dentro dos limites

da comunicação social, como se não houvesse necessidade de comprovação. Mas ela perde

força num cenário de apropriação, pelo jornalismo, das técnicas das ciências da computação

– incluindo processos de armazenamento e recuperação da informação, englobando “aspectos

intelectuais da descrição de informações e suas especificidades para a busca, além de quais-

quer sistemas, técnicas ou máquinas empregados para o desempenho da operação” (MOO-

ERS, 1951, apud SARACEVIC, 1996, p. 44).

As tecnologias online não são uma panaceia que magicamente transformará as

notícias, carregando-as com alto teor de relevância social. Como ferramenta de auxílio

à profissão, a pesquisa em fontes digitais facilita o trabalho do jornalista na tarefa de

localização da informação. Um profissional não bem preparado para usar esse tipo

de processo encontrará problemas na verificação dos dados (LIMA JUNIOR, 2006, p.

122).

Assim, diante do fato de que a produção informativa disponibilizada em rede preocupa-

se mais com o imediatismo, há um potencial a ser explorado. Obviamente, relacionar comuni-

cação e tecnologia não se trata de uma tarefa simples.

O projeto Neptuno4, desenvolvido pelo Information Retrieval Group, ligado à escola

politécnica da Universidade Autónoma de Madrid, é um exemplo. Ele propôs a construção e

gestão do acervo digital do jornal Diari SEGRE, preocupando-se com a ontologia adequada, a

semântica das palavras-chaves, arquitetura e formas de navegação e visualização. Além da re-

dação e duas instituições (Universidad Autónoma de Madrid e Universitat de Lleida), o projeto

envolveu ainda uma empresa provedora de tecnologia. Como resultados da etapa inicial, além

de algumas respostas, surgiram mais perguntas.

O tamanho e complexidade das informações armazenadas, bem como as limitações de

tempo ao catalogar, descrever e ordenar informações de entrada, fazem dos acervos

digitais um corpus relativamente desorganizado e difícil de gerenciar. Nesse sentido,

compartilham as características e problemas da web, e as soluções propostas para a

web semântica são pertinentes aqui. (CASTELLS ET AL, 2004, tradução nossa)5.

A expressão “web semântica”, ideia que sustenta o projeto Neptuno, remete ainda a uma

outra possibilidade de aproximação entre profissionais do texto e do código pode ser dese-

nhada a partir de um dos valores jornalísticos já mencionados: a possibilidade de oferecer

informação e ferramentas a usuários interessados. O relatório do Tow Center for Digital Jour-

4 Informações em <http://ir.ii.uam.es/neptuno>, acesso em 11.jun.2013

5 Versão original: “The size and com-plexity of the stored information, and the time limitations for cataloguing, describing and or-dering the incoming information, make newspaper archives a relatively disorga-nised and difficult to manage corpus. In this sense, they sha-re many of the cha-racteristics and pro-blems of the WWW, and therefore the solutions proposed in the Semantic Web vision are pertinent here.”

6

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

nalism aponta que o modelo de produção voltado para o consumo imediato também se vê na

Internet, em detrimento a uma proposta mais flexível – ou, em suas palavras,

Em linha, conteúdo jornalístico pode ser produzido, adicionado, alterado e reutilizado

sempre. Para tirar proveito disso, o fluxo de trabalho precisa ser alterado para dar

suporte a estas novas capacidades tecnológicas e culturais. Criar um fluxo de trabalho

que reflita a produção de conteúdos digitais mais flexíveis refletirá em uma consequência

secundária: tornar rotinas rígidas de redação mais “hackeáveis” (ANDERSON ET AL,

2012, p. 71, tradução nossa)6.

A abordagem “hacker”, associada a práticas transparentes e participativas envolvendo

jornalistas e programadores e, metaforicamente, “softwerizar” e analisar o seu código-fonte, é

defendida por USHER E LEWIS (2012) como uma possibilidade para repensar ferramentas,

culturas e estrutura do jornalismo, incluindo não só o papel na transmissão de informação,

como também um repositório cultural de memória e valores.

3. Linked data e APIs abertasAo publicar informações diárias e digitalizar acervos, disponibilizando este conteúdo

na rede, veículos jornalísticos contribuem para a expansão do volume de informação na web.

Por meio de um navegador (browser), já é possível seguir por links e encontrar informação

por meio de páginas, documentos. Isso já indica a universalização da web concebida por Tim

Berners-Lee, mas não é tudo. Em seus planos, o desafio é tornar estes dados “legíveis por má-

quinas”, chegando ao conceito de web de dados – ou ainda, web semântica7. Desta proposta

desafiadora, emerge o conceito de linked data8.

Tecnicamente, linked data refere-se a dados publicados na web, de tal forma a ser

legível por máquinas. Seu significado é explicitamente definido, estão ligados a outros

conjuntos de dados externos e, por sua vez, podem ser ligados a partir de conjuntos de

dados externos (BIZER; HEATH; BERNERS-LEE, 2009, tradução nossa9).

De uma forma bem simples, podemos definir linked data como a possibilidade de co-

nectar conjunto de dados estruturados para conseguir responder consultas mais elaboradas.

Iniciativas para relacionar dados abertos representam um primeiro passo para a web de dados.

Para POLLERES ET AL (2010), estamos em um ponto de virada, graças ao uso e popularização

de padrões, metadados e ontologias comuns – elas incluem siglas como RDF, acrônimo para

Resource Description Framework, e similares como SPARQL, OWL e SKOS.

Apesar do entusiasmo da comunidade envolvida, em especial o Linked Data Open pro-

6 Versão original: “Online, journalis-tic content can be produced, added to, altered and reused forever. To take ad-vantage of this chan-ge, workflow will have to be altered to support these new technological and cultural affordances. Creating a work-flow that reflects the more flexible production of digital content will have the secondary conse-quence of making rigid newsroom routines more ‘ha-ckable’.”

7 O conceito original de Tim Berners-Lee pode ser explo-rado em <http://www.w3.org/2001/sw/>, acesso em 5.jun.2013

8 A versão brasileira do W3C utiliza a expressão “dados linkados” (<http://www.w3c.br/Pa-droes/WebSeman-tica>, acesso em 6.jun.2013). Não há, na norma culta da língua portuguesa, os verbos “linkar” ou “lincar”. Dessa forma, optamos pela versão original do termo

9 Versão original: “Technically, Linked Data refers to data published on the Web in such a way that it is machine-re-adable, its meaning is explicitly defined, it is linked to other external data sets, and can in turn be linked to from exter-nal data sets.”

7

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

ject10 , a grande maioria dos desenvolvedores rotineiros web ignora tecnologias semânticas:

existem poucos dados estruturados nestes padrões em meio a grande quantidade disponível,

sem contar outro volume de bases inconsistentes ou fora das especificações.

Há, no entanto, um forte esforço multidisciplinar em compartilhar dados na web de acor-

do com estes princípios. A partir de um objetivo maior (a web de dados), estas ações ajudam a

compor um espaço global, permitindo seu acesso e uso em aplicações diversas. Nesse contexto,

as interfaces para programação de aplicativos – ou, em inglês Application Programming In-

terface, API – possuem importância fundamental.

Estas APIs permitem a criação de programas capazes de “conversar” com seus servi-

ços e dados, resultando em softwares capazes de cruzar informações distintas - os chamados

mashups. Exemplos populares de APIs podem ser encontradas no Google Maps11 (a pioneira,

lançada em 2005), que permite a criação de visualizações a partir de dados de localização geo-

gráfica; ou no Twitter, cuja política de APIs gerou um ecossistema de aplicações relacionadas

a postagem e recuperação de mensagens na plataforma, apoiadas por uma comunidade de de-

senvolvedores.

A lógica de pensar em “jornalismo como software” conduz para organizações de mídia

abrirem suas próprias APIs. O jornal The New York Times e a National Public Radio, ambas

dos Estados Unidos, abriram este caminho em 2008. O diário britânico The Guardian lançou

sua Open Platform12 em março de 2009.

A API da NPR13 inclui áudios dos programas, textos e imagens publicados pelo site desde

1995. A área de desenvolvedores do The New York Times14 inclui datasets específicos (atuação

de congressistas, gastos em campanhas presidenciais) e algumas informações relacionadas ao

acervo (títulos, resumos e links relacionados aos textos do jornal desde 1851, metadados das

URLs mais populares).

O The Guardian, por sua vez, disponibiliza dados estruturados sobre temas gerais em seu

Data Store15, além de um mecanismo que permite acesso aos artigos publicados no site desde

1999. O diário está na vanguarda das iniciativas de jornalismo computacional, além de peça-

chave na iniciativa de dados abertos no Reino Unido – como no episódio envolvendo a análise

de documentos ligados à despesa de parlamentares britânicos (DANIEL E FLEW, 2010).

Ao analisar o impacto da adoção de APIs no The New York Times e no The Guardian,

PIETOSO (2009) destaca a autonomia técnica, mesmo para não-desenvolvedores, em criar e

reutilizar aplicações. Isso pode encorajar o envolvimento de uma audiência mais ampla, com-

posta por entusiastas interessados em mudanças no jornalismo. Além disso, jornalistas e pro-

gramadores sentem-se encorajados a encontrarem novas formas de distribuir conteúdos.

Na mesma linha, incluindo na abordagem a NPR e o USA Today, AITAMURTO E LEWIS

(2011) apontam aceleração do desenvolvimento de novos produtos, tanto internamente (a par-

tir de seu uso organizado e sistemático) quanto por meio de uma comunidade de desenvolve-

10 Mais informa-ções em <http://www.w3.org/wiki/SweoIG/TaskFor-ces/CommunityPro-jects/LinkingOpen-Data>, acesso em 10.jun.2013

11 Detalhes em <https://develo-pers.google.com/maps>, acesso em 11.jun.2013

12 Disponível em <http://www.guar-dian.co.uk/open-platform>, acesso em 11.jun.2013

13 Disponível em <http://www.npr.org/api/in-dex>, acesso em 11.jun.2013

14 Disponível em <http://developer.nytimes.com>, aces-so em 11.jun.2013

15 Disponível em <http://www.guardian.co.uk/data>, acesso em 11.jun.2013

8

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

dores, abrindo espaço para a elaboração de produtos para audiências de nicho, permitindo à

redação focar em outras prioridades.

Por fim, a pesquisadora Cindy Royal visitou a redação do The New York Times em junho

de 2009, com o intuito de conhecer a área de Interactive News Technology. O diálogo com os

profissionais, entre eles o então editor Aron Pilhofer, trouxe alguns apontamentos referentes a

relação entre jornalistas e programadores (ROYAL, 2010).

Os membros da equipe entendem que a combinação de habilidades de texto e programa-

ção são raros, mas com a perspectiva jornalística como pré-requisito, é possível desenvolvê-

las, especialmente a partir de autoaprendizagem, dentro do ambiente de trabalho. Além disso,

o departamento foi criado de modo a flexibilizar a criação e desenvolvimento de projetos, cons-

truindo uma filosofia pautada pela criatividade e inovação próprias da cultura open-source.

4. Considerações finaisHá uma expectativa de que os princípios do linked lata abram as portas dos silos informa-

tivos e habilitem os efeitos da rede. O bom uso das APIs na web – especialmente o caso do The

Guardian, que contabiliza mais de 3 mil usuários cadastrados em sua plataforma – mostrou o

poder de aplicativos que podem ser criados a partir da combinação de diversos conteúdos.

Assim, o cruzamento entre a comunicação social e a ciência da computação, que reflete

em posturas abertas (tomando como exemplo a disponibilização de acervos digitais seguindo

padrões de linked data), oferece uma oportunidade de estudo para a compreensão de proces-

sos e rotinas, bem como sua influência em mudanças na cultura jornalística.

No entanto, não faltam obstáculos. Culturalmente, há uma barreira entre profissionais

que tratam de conhecimentos tão distintos entre si (DAGIRAL; PARASIE, 2011; SNOW, 1959).

A possibilidade de abrir acervos digitais de periódicos, importantes fontes de negócio, podem

assustar: qual a lógica em “liberar a jóia da coroa”? A criação e manutenção de equipes inter-

disciplinares, responsáveis por indexar acervos usando padrões como RDF implicam em custo

e tempo – especialmente se não houver possibilidades computacionais de inserir estes dados

em arquivos digitalizados.

Como estímulo a práticas desta natureza, políticas de abertura de dados também estão

ligadas a estratégias de inovação abertas, que podem resultar em novos modelos de negócio

(AITAMURTO; LEWIS, 2011). Independente do posicionamento dos grupos de mídia, desen-

volvedores já trabalham para superar silos informativos pré-definidos, além de dados disponi-

bilizados de forma heterogênea ou fora dos padrões.

Longe das idiossincrasias de mercado, esta movimentação já acontece. Ex-jornalista do

The Washington Post, Adrian Holovaty é um profissional que, em sua carreira, enxergou a re-

lação entre computação e jornalismo como uma oportunidade. Anos após ter recebido US$ 1

milhão do Knight News Challenge para lançar seu EveryBlock.com, site pioneiro em informa-

9

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

ção hiperlocal, fez uma provocação em seu blog: afinal, dados podem se tornar jornalismo? É

jornalismo disponibilizar um banco de dados na rede? “Aqui, enfim, minha resposta definitiva,

em duas partes: 1. Quem se importa? 2. Espero que meus concorrentes percam o maior tempo

possível discutindo isso” (tradução nossa)16 .

Talvez experiências iniciadas no The New York Times ou no The Guardian abram inte-

resse para carreiras relacionadas a jornalismo computacional, estimulando aprendizado em

programação ou colaboração com programadores. Ainda que redações ou instituições de ensi-

no superior levem tempo para perceber a importância destas habilidades – ou esperem até as

interfaces tecnológicas as dispensarem, como já acontece com a criação de páginas HTML –, o

caminho para estes interessados é por conta própria. E não há nada de errado com isto.

16 Versão origi-nal: “It’s a hot topic among journalists right now: Is data journalism? Is it journalism to pu-blish a raw databa-se? Here, at last, is the definitive, two-part answer: 1. Who cares? 2. I hope my competitors waste their time arguing about this as long as possible.” Disponível em <http://www.holovaty.com/wri-ting/data-is-journa-lism/>, acesso em 5. jun.2013

10

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

Referências

AITAMURTO, T.; LEWIS, S. C. Open APIs and News Organizations: A Study of Open Innovation in Online JournalismInternational Symposium on Online Journalism. Aus-tin, TX: 2011

ANDERSON, C. W.; BELL, E.; SHIRKY, C. Post-Industrial Journalism: Adapting to the Present. Disponível em: <http://towcenter.org/research/post-industrial-journalism>.

BERRY, D. M. The computational turn: Thinking about the digital humanities. Culture Ma-chine, v. 12, p. 1-22, 2011.

BIZER, C.; HEATH, T.; BERNERS-LEE, T. Linked Data - The Story So Far. International Journal on Semantic Web and Information Systems (IJSWIS), 2009.

BOYD, D.; CRAWFORD, K. Critical questions for big data. Information , Communica-tion & Society, v. 15, n. 5, p. 662-679, 2012.

CASTELLS, P.; PERDRIX, F.; PULIDO, E. Neptuno: Semantic web technologies for a digital newspaper archive. 2004.

DAGIRAL, É.; PARASIE, S. Portrait du journaliste en programmeur: l’émergence d’une figu-re du journaliste “hacker”. Les Cahiers du Journalisme, n. 22/23, p. 144-155, 2011.

DANIEL, A.; FLEW, T. The Guardian Reportage of the UK MP Expenses Scandal: a Case Study of Computational Journalism. Communications Policy and Research Forum, november, 2010.

HALFORD, S.; POPE, C.; CARR, L. A manifesto for Web Science. Journal webscience, p. 1-6, 2010.

HAMILTON, J. T.; TURNER, F. Responsabilidad mediante algoritmos: reflexiones sobre la construcción automatizada de la información. Infoamérica ICR, v. 2, n. 2, p. 149-164, 2010.

LIMA JUNIOR, W. T. Jornalismo inteligente na era do data mining. Revista Líbero, n. 18, p. 119-126, 2006.

LIMA JUNIOR, W. T. Intersecções possíveis: tecnologia, comunicação e ciência cognitiva. Comunicação & Sociedade, v. 34, n. 2, p. 93-119, 2013.

OLIVEIRA, A. R. DE. Aproximação necessária entre a academia e o mercado. Revis-ta CoMtempo, v. 2, n. 2, p. 1-7, 2010.

PALACIOS, M. Convergência e memória: jornalismo, contexto e história. Matrizes, v. 4, n. 1, p. 37-50, 2010.

PIETOSO, C. R. Newspapers as Platforms: How Open APIs Can Impact Journa-lism. Dissertação de mestrado. London, UKCity University, , 2009.

POLLERES, A. et al. Can we ever catch up with the Web? IOS Press, p. 1-5, 2010.

ROYAL, C. The Journalist as Programmer: A Case Study of The New York Times Interactive News Technology DepartmentInternational Symposium on Online Journalism. Anais...Austin, TX: 2010

SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspectivas em Ciencia da Informação, v. 1, n. 1, p. 41-62, 1996.

11

Brazilian Journal of Technology, Communication, and Cogntive Science - Edição nº 1, Ano I - Setembro 2013ccc

SNOW, C. P. The Two Cultures and the Scientific Revolution. London: Cambridge University Press, 1959.

USHER, N.; LEWIS, S. C. Open source and journalism: Toward new frameworks for imagining news innovationPaper accepted for presentation to the Journalism Stu-dies Division of ICA, Phoenix, AZ. Anais...2012

WING, J. M. Computational thinking. Communications of the Association for Computing Machinery, v. 49, n. 3, p. 33-35, 1 mar. 2006.

Brazilian Journal of Technology, Communication, and Cogntive Sciece - Edição nº 1, Ano I - Setembro 2013

Expediente

Brazilian Journal of Technology, Communication, and Cognitive Scienceccc

Brazilian Journal of Technology, Communication, and Cognitive Science é produzida pelo Grupo de Pesquisa Tecno-logia, Comunicação e Ciência Cognitiva credenciado pelo Programa de Pós-graduação da Universidade MetodistaSão Paulo, v.1, n.1, ago.2013

A revista do TECCCOG é uma publicação científica semestral em formato eletrônico do Grupo de Pesquisa Tecno-logia, Comunicação e Ciência Cognitiva credenciado pelo Programa de Pós-graduação da Universidade Metodista. Lançada em setembrode 2013] tem como principal produzir métodos e conhementos sob uma perspectiva inter e transdisciplinar, a complexidade das relações entre Tecnologia, Comunicação e Ciência Cognitiva, e os seus impac-tos cognitivos na sociedade.

EditorWalter Teixeira Lima Junior

Comissão EditorialWalter Teixeira Lima Junior (Universidade Metodista de São Paulo) * Lúcia Santaella (Pontíficia Universidade Católica de São Paulo) * João Eduardo Kogler (Universidade de São Paulo) * Ronaldo Prati (Universidade Federal do ABC) * Ricardo Gudwin ( Universidade Estadual de Campinas) * João Ranhel (Universidade Federal de Pernambuco) * Eugenio de Menezes (Faculdade Cásper Líbero) * Reinaldo Silva (Universidade de São Paulo) * Marcio Lobo (Unive rsidade de São Paulo) * Vinicius Romanini (Universidade de São Paulo)

Conselho EditorialWalter Teixeira Lima Junior (Universidade Metodista de São Paulo) * Lúcia Santaella (Pontíficia Universidade Católica de São Paulo) * João Eduardo Kogler (Universidade de São Paulo) * Ronaldo Prati (Universidade Federal do ABC) * Ricardo Gudwin ( Universidade Estadual de Campinas) * João Ranhel (Universidade Federal de Pernambuco) * Eugenio de Menezes (Faculdade Cásper Líbero) * Reinaldo Silva (Universidade de São Paulo) * Marcio Lobo (Uni-versidade de São Paulo) * Vinicius Romanini (Universidade de São Paulo)

Assistente EditorialWalter Teixeira Lima Junior

Projeto Gráfico e LogotipoDanilo Braga * Walter Teixeira Lima Junior * Leandro Tavares Gonçalves

Revisão de textosMichele Loprete Vieira

Editoração eletrônicaEduardo Uliana

CorrespondênciaAlameda Campinas, 1003, sala 6.Jardim Paulista, São Paulo, São Paulo, BrasilCEP 01404-001

Websitewww.tecccog.net

TECCCOG