Knol, compartilhando conhecimento direto da fonte

Quarta-feira, Julho 23, 2008 7/23/2008 02:49:00 PM

Publicado por: Felix Ximenes, Diretor de Comunicações do Google Brasil

Há alguns meses anunciamos que estávamos testando um novo produto chamado Knol. Hoje estamos disponibilizando o Knol a todos. A web contém vastas quantidades de informações, e o Google ajuda a tornar grande parte delas disponíveis a qualquer pessoa que esteja conectada à Internet. É claro que nem tudo que vale a pena saber está na web atualmente. Embora a situação tenha melhorado com a proliferação de blogs e outras ferramentas de publicação on-line, uma enorme quantidade de informações permanece "trancada" na cabeça das pessoas: milhões de pessoas conhecem coisas úteis e bilhões mais poderiam se beneficiar com este conhecimento. Acreditamos que a maioria das pessoas deseja compartilhar o que sabem, e nosso objetivo é ajudá-las a fazer isso. Esse é o motivo de termos criado o Knol.

O princípio-chave por trás do Knol é a autoria. Cada knol terá um autor (ou um grupo de autores) que colocará seu nome por trás do conteúdo. É o knol dele, a voz dele.
Não estamos tentando formar uma enciclopédia. Estamos montando uma coleção de unidades de conhecimento, ou "knols", cada um dos quais contendo as tendências e opiniões de seus autores. Com o tempo, esperamos que muitos knols e seus autores sejam mencionados em publicações enciclopédicas. Também esperamos que existam múltiplos knols sobre o mesmo assunto. Com o Knol, estamos introduzindo um novo método para os autores trabalharem juntos no que chamamos "colaboração moderada."



A colaboração on-line tornou bastante conveniente criar grandes documentos com múltiplos autores. Estamos levando essa idéia mais além ao permitir que os autores aceitem sugestões de todos no mundo, permanecendo ainda assim no controle de seu contéudo. Afinal de contas, o nome deles está associado ao conteúdo!
Os Knols incluem sólidas ferramentas de comunidades e permitem muitos modos de interação entre leitores e escritores. As pessoas podem submeter comentários, classificação ou escrever uma crítica sobre um knol.
Dependendo do modelo de colaboração selecionado pelo autor, os leitores podem também fazer contribuições sugeridas, que o autor pode então decidir aceitar ou rejeitar.

Os Knols facilitam a inclusão de referências e links às informações adicionais. À escolha do autor, um knol pode incluir anúncios do programa AdSense do Google. Se um autor decidir incluir anúncios, o Google vai oferecer ao autor compartilhamento substancial dos lucros com a colocação desses anúncios.
Cada pessoa sabe alguma coisa. Veja sobre o que as pessoas como você estão escrevendo:
knol.google.com

Chegamos a 40 idiomas

Segunda-feira, Julho 21, 2008 7/21/2008 03:27:00 PM



Uma de nossas metas é oferecer a todos que usam o Google as informações que desejam, onde quer que estejam, na língua em que falam, e por meio do dispositivo que estejam usando. Uma imensa parte desta meta é tornar nossos serviços disponíveis no maior número de idiomas possível. E como você pode imaginar, isso não é tão fácil quanto simplesmente traduzir algumas linhas de texto.

Vejamos hebraico ou árabe, que são escritos da direita para a esquerda. Um falante de árabe pode buscar "copa mundial de futebol 2008" [كأس العالم 2008 لكرة القدم]. Parte da busca será escrita da direita para a esquerda em árabe, enquanto os números serão escritos da esquerda para a direita. Algumas vezes a diferença direita-para-a-esquerda pode significar ter que mudar todo o layout de uma página, como com o Gmail.

Ou vejamos o russo, em que as palavras mudam dependendo de sua colocação e papel em uma sentença. Em russo, por exemplo, "pizza em Moscou" é "пицца в Москве" mas "pizza perto de Moscou" é "пицца рядом с Москвой".

Há também todo o desafio de assegurar que as buscas sejam localmente relevantes. Para a maioria dos britânicos, "Cote d'Or" é um tipo de barra de chocolate; para os franceses, é primordiamente uma região daquele país. Nossos resultados de busca para os franceses e britânicos, assim, precisam refletir essa diferença para serem realmente relevantes.

Nossos esforços para tornar os produtos Google disponíveis no maior número de idiomas possível vêm de 2001, quando começamos o Google em seu idioma, que deixa voluntários traduzirem e editarem traduções de produtos Google em seus idiomas nativos.

À medida que mais e mais usuários, anunciantes e parceiros interagem com o Google em todo o mundo, a necessidade de produtos locais torna-se ainda mais óbvia. Em 2007, empreendemos uma iniciativa em toda a companhia para aumentar a disponibilidade de nossos produtos em múltiplos idiomas. Selecionamos os 40 idiomas lidos por mais de 98% dos usuários da Internet e fomos em frente, confiando grandemente em bibliotecas de fonte aberta como a ICU e outras tecnologias de internacionalização para criar os produtos. Você precisa de Busca na web em chinês ou Suporte on-line AdWords em espanhol? Talvez Notícias Google em hindi ou Google Acadêmico em coreano? Sem problemas.

Eis aqui uma idéia de onde chegamos:

Crescimento de versões em línguas locais:

* 30 em 30: Hoje temos mais de 30 produtos em mais de 30 idiomas, um avanço de 5 produtos em 30 idiomas há apenas um ano

* Em 2004, tínhamos 150 versões em línguas locais de diferentes produtos (p. ex. um produto local do Reino Unido, não apenas do mundo de fala inglesa); hoje temos mais de 1500

* De janeiro a março de 2008, lançamos 256 versões em línguas locais de diferentes produtos, em comparação com 55 no mesmo período de 2007

* Atualizamos para o Unicode 5.1 para garantir que possamos manipular qualquer caractere em que as pessoas lêem ou escrevem

A web somente é útil—ou utile, 便利, pożyteczny, ou nyttig, dependendo do idioma que você fala e do grau em que possa estar acessível em seu idioma. Esse é o motivo de estarmos tão entusiasmados por termos chegado até onde chegamos—e porque sabemos que ainda há muito trabalho a ser feito.

Um incentivo às mulheres na computação

Quinta-feira, Julho 17, 2008 7/17/2008 12:54:00 PM

No mais recente encontro da Sociedade Brasileira da Computação (SBC), em Belém-PA, uma pequena delegação feminina de googlers esteve presente para apresentar uma proposta inspiradora para o universo de mulheres da computação. Durante o encontro, foi anunciado um prêmio parar mulheres que estudam ciência da computação de engenharias.


A engenheira de software, Alice Bonhomme-Biais, do Google em Nova York, falou na manhã de terça-feira, 15 de julho, aos presentes do congresso sobre os desafios de trabalhar com uma ferramenta de busca comercial e, ao lado de Patricia Prieto, gerente de captação de talentos do Google para América Latina, anunciou o prêmio Google Brazil Women in Technology.

As inscrições poderão ser feitas entre os dias 21 de julho e 8 de setembro no site http://www.google.com/jobs/brazilwomen por mulheres de todo o país que estejam cursando graduação, mestrado ou doutorado em áreas ligadas à computação. Dez estudantes serão premiadas com laptops e visita ao escritório de engenharia do Google em Belo Horizonte (MG).

Patrícia Prieto, que estava lá em Belém, disse que foi muito boa a receptividade de todos em relação ao prêmio. “Professoras das universidades que participavam do Congresso nos parabenizaram pela iniciativa. Esperamos inspirar muitas mulheres que estão cursando essas áreas a não desistirem”, comentou.

Liberdade e Responsabilidade na Internet

Quarta-feira, Julho 16, 2008 7/16/2008 01:03:00 PM



A história nos ensinou que as pessoas têm muito que falar. Há séculos a humanidade produz diários, romances e jornais publicados. Hoje essa liberdade de expressão alcançou um nível quase inimaginável. Ninguém mais precisa de máquinas de impressão ou de um editor para que suas opiniões sejam ouvidas: as pessoas podem simplesmente publicar seu trabalho na Internet e transmiti-lo para o mundo.

O crescimento do chamado conteúdo gerado pelo usuário, da criatividade e da expressão individual na Internet é fenomenal. Os fatos falam por si: um blog é criado a cada segundo todos os dias; 13 horas de vídeo são colocados no YouTube, o maior site do mundo de compartilhamento de vídeos, a cada minuto; e mais de 25% dos internautas, cerca de 1 bilhão de pessoas, fazem parte de uma rede social – seja ela o Facebook nos Estados Unidos, o Bebo na Grã-Bretanha ou o Orkut aqui no Brasil.

Os benefícios dessa nova maneira de se comunicar são enormes. Milhões de pessoas em todo o mundo têm uma liberdade sem precedentes – liberdade para criar e comunicar-se, para organizar e influenciar, para falar e ser ouvido. Isso também ajuda a sociedade com um todo, pois quando as pessoas têm maior acesso à informação e exposição às opiniões de outros indivíduos, normalmente elas tomam decisões melhores.

No entanto, infelizmente nem todos utilizam a Internet como algo para o bem. Algumas vezes é uma questão de opinião, ou mesmo uma tradição local. Armas, por exemplo, são mais aceitáveis em algumas sociedades do que em outras. E a maneira como países diferentes lidam com o racismo e incentivo ao ódio varia de forma imensa. Na Alemanha, por razões históricas óbvias, é ilegal promover o Nazismo. Em outros casos, fica óbvio que o material deve ser removido e as pessoas que o vendem devem ser processadas e punidas.


Por isso, empresas como Google enfrentam desafios concretos, não só porque operam em mais de 100 países, mas também porque a forma como as pessoas utilizam nossa tecnologia evolui quase que diariamente. Nós tentamos constantemente estar um passo à frente dos criminosos que abusam de nossos serviços, e estamos sempre nos certificando de que haja um equilíbrio correto entre o direito de um indivíduo de se expressar e as opiniões de uma comunidade mais ampla.

É por essa razão que, no Brasil, nós estamos trabalhando fortemente com o governo e as autoridades locais para pôr em prática novas formas de proteção ao usuário. Nossa missão é procurar garantir que o Orkut não seja utilizado para atividades criminosas. Pedimos aos nossos engenheiros que estudassem como a tecnologia pode ajudar a evitar os abusos e possibilitar que promotores do Estado rastreiem os criminosos quando algum ato ilícito ocorrer. Nós queremos manter a integridade do Orkut para que milhões de brasileiros que amam o site possam continuar a utilizá-lo de forma segura e para o bem.

No geral, nós só mantemos informações sobre os "posts" no Orkut (incluindo o endereço do computador a partir do qual eles foram gerados) por 30 dias. Mas os promotores brasileiros estão convencidos de que esse tempo não é longo o suficiente para os casos suspeitos de má conduta. Assim, nós concordamos em manter os registros dos usuários brasileiros do Orkut por seis meses, o que dará às autoridades o tempo hábil que eles necessitam para coletar evidências e, se necessário, processar os responsáveis.

Nós também cumprimos nossa promessa feita diante do Senado Federal para desenvolver meios mais efetivos para fornecer as informações solicitadas pelas autoridades, de forma que possamos enviá-las aos promotores brasileiros o mais rápido possível.

Além disso, nós estamos trabalhando com a SaferNet – uma importante organização de proteção à criança – para ver como podemos trabalhar em parceria para evitar a disseminação de material nocivo. Juntos, desenvolvemos um sistema de aviso que possibilitará que a SaferNet nos alerte sobre uma suspeita de conteúdo ilegal quando ela aparecer. Uma equipe especial do Google verificará então a evidência fornecida e responderá à SaferNet, que poderá alertar o Ministério Público Federal. Nós acreditamos que isso ajudará a remover material ilegal mais rapidamente e possibilitará que os promotores busquem ordens judiciais para que os responsáveis possam ser identificados.

Ajudar as autoridades a rastrear e processar os responsáveis por esses crimes é importante, mas a prevenção é melhor do que a cura. Por isso, o Google vem trabalhando com afinco nos últimos dois anos para desenvolver novas ferramentas que ajudem a evitar que material ilegal seja colocado no Orkut. Essas inovações nos permitirão identificar e remover imagens inadequadas com mais eficiência – e a dissuadir outros a fazê-lo.

Obviamente, nenhum sistema é à prova de erros. Mas eu acredito que as mudanças que colocamos em prática ajudarão a combater o crime, ao mesmo tempo em que protegerão a liberdade de expressão da imensa maioria dos usuários do Orkut no Brasil – uma parcela que segue a lei e usa o Orkut para o bem.

Lidar com conteúdo controverso é um dos maiores desafios que enfrentamos como empresa. Nós sabemos que não temos todas as respostas. Também sei que no Brasil, como em muitos outros países, nós não temos um índice de 100% de acerto. No entanto, tentamos ser o mais transparente possível sobre a forma como tomamos decisões. E assumimos o compromisso de sempre manter os usuários do Orkut informados e envolvidos, trabalhar com as autoridades locais e aprimorar nossos atos e políticas.

Introdução ao Processo de Classificação do Google

Terça-feira, Julho 15, 2008 7/15/2008 07:29:00 PM

Em maio, Udi Manber apresentou nosso grupo de qualidade de busca responsável pela classificação dos resultados das consultas. Naquele post, Ubi apresentou várias equipes dentro da “Qualidade” (como gostamos de chamar o grupo), incluindo Classificação Principal, Busca Internacional, Interfaces com o Usuário, Avaliação, Webspam e outras equipes. Hoje eu gostaria de falar mais sobre uma daquelas equipes: A equipe de Classificação Principal.

Meu nome é Amit Singhal. Sou o Google Fellow encarregado da equipe de busca do Google. Trabalhei na área de busca nos últimos 18 anos tendo sido apresentado à busca em 1990 como estudante de pos graduação em ciência da computação. No mundo acadêmico, a área de busca é conhecida como Recuperação de Informação (ou RI). Após passar uma década como pesquisador de RI, vim para o Google em 2000 e trabalho com a busca desde então.

A busca do Google é um conjunto de algoritmos usados para encontrar os documentos mais relevantes para a consulta de um usuário. Fazemos isso em centenas de milhões de consultas por dia, a partir de um conjunto de bilhões e bilhões de páginas. Esses algoritmos são executados para cada consulta realizada na maioria dos serviços de busca do Google. Enquanto a busca de páginas Web é o nosso serviço mais usado e mais conhecido, os mesmos algoritmos também são usados - com algumas modificações - para outros serviços de busca do Google, incluindo Imagens, Notícias, YouTube, Mapas, Pesquisa de Produtos, Pesquisa de Livros e outros.

A pergunta mais comum que ouço sobre a classificação do Google é “como é que vocês fazem?". Obviamente, existem várias coisas que ajudam a criar um sistema de classificação tão moderno como o nosso e eu me aprofundarei na tecnologia por trás dele em um outro post. Hoje gostaria de compartilhar brevemente as filosofias por trás do processo de classificação do Google:

1) os resultados mais relevantes localmente servidos globalmente

2) manter a simplicidade

3) sem intervenção manual

A primeira filosofia é óbvia. Por causa de nossa paixão pela busca, queremos ter absoluta certeza de que todas as consultas dos usuários obtenham os resultados mais relevantes. Freqüentemente chamamos esse princípio de “nenhuma consulta será abandonada”. Sempre que fornecemos resultados inferiores ao ideal para qualquer consulta em qualquer idioma, em qualquer país - e o fazemos (busca não é de forma alguma um problema resolvido) - usamos isso como inspiração para melhorias futuras.

O segundo princípio também parece óbvio. Não é o desejo de todo arquiteto de sistema manter seus sistemas simples? Bem, conforme os sistemas de busca avançam, dada a grande variedade de consultas de usuários que precisamos responder em vários idiomas, é comum querer adicionar mais complexidade ao sistema para servir a fração incremental seguinte das consultas. Trabalhamos muito para que nosso sistema se mantenha simples sem comprometer a qualidade dos resultados. Esse é um esforço constante que vale à pena. Fazemos cerca de dez alterações de classificação toda semana e o grande fator considerado é a simplicidade na implementação de cada mudança. Nossos engenheiros entendem exatamente porque uma página foi classificada de certa maneira para uma dada consulta. Esse sistema simples e compreensível nos permitiu inovações rápidas, o que é visível! A filosofia de “manter a simplicidade” nos serve muito bem.

Nenhuma discussão sobre a classificação do Google seria completa sem que se fizesse a comum - porém equivocada! :) - pergunta: “O Google edita manualmente seus resultados?” Vou responder a essa pergunta usando a nossa terceira filosofia: "sem intervenção manual". No nosso ponto de vista, a Internet é feita por pessoas. Vocês são as pessoas que criam páginas e links para as páginas. Estamos usando toda essa contribuição humana através de nossos algoritmos. A ordenação final dos resultados é decidida por nossos algoritmos usando as contribuições da comunidade maior da Internet e não manualmente por nós. Acreditamos que o julgamento subjetivo de qualquer indivíduo é... bem... subjetivo, e as informações filtradas por nossos algoritmos do vasto volume de conhecimento humano codificado nas páginas da Internet e seus links é melhor do que a subjetividade individual.

A segunda razão pela qual temos um princípio contra o ajuste manual de nossos resultados é que, freqüentemente, uma consulta com resultados ruins é apenas um sintoma de uma melhoria em potencial a ser feita ao nosso algoritmo de classificação. Melhorar o algoritmo fundamental não apenas melhora aquela consulta, melhora toda uma classe de consultas e, na maioria das vezes, para todos os idiomas. Devo acrescentar, entretanto, que existem políticas claras para sites recomendados pelo Google e nós tomamos as devidas providências contra sites que, por quaisquer motivos, violam nossas políticas (ex.: exigências legais, pornografia infantil, vírus, malware, etc.).

Fique ligado no meu próximo post em que discutirei em detalhes as tecnologias por trás de nossa classificação e darei exemplos de várias técnicas modernas de classificação em ação. Nossa paixão pela busca está mais forte do que nunca, e devo dizer que, como um pesquisador de busca, tenho o melhor emprego do mundo. :-)

O que vem a seguir nesta série? 13, 33, 53, 61, 37, 28...

Quarta-feira, Julho 09, 2008 7/09/2008 12:58:00 PM

Numa noite de verão de 2000 eu me encontrava respondendo alguns e-mails de suporte a usuários por causa de dois novos recursos que tínhamos acabado de lançar: Pesquisa avançada e Preferências (na ocasião com o sugestivo nome "Idioma, Exibição, e Opções de Filtragem" :)). Ocupada preparando respostas sobre como configurar Safesearch ou mudar o número de resultados oferecidos como padrão, trabalhei na lista de e-mails. E então notei algo: O próximo e-mail tinha apenas um número ("37") na linha de assunto – sem mensagem de texto. Que forma estranha de spam, pensei. Por que alguém estaria motivado a enviar apenas um número? Procurei o endereço de e-mail do usuário para ver o que mais tinha sido enviado. Interessante. Muitos números: 33, 53 e então uma dica: "61, está ficando um pouco pesado, não?" Além do mais, a data de cada uma das mensagens parecia muito familiar. Então percebi que é porque as datas eram todas os dias nos quais eu tinha lançado várias mudanças na página inicial. "Ficando pesado?" – essa correspondia a um dos lançamentos de página inicial com mais texto que já fizemos.

Estaria o remetente contando palavras? De fato, olhei de novo, contei as palavras eu mesmo, e ele estava – uma versão humana manual de uma escala para a página inicial do
Google. Ele estava pesando em nossa página inicial e nos informando que estava ficando muito pesado. Um de seus primeiros e-mails tinha uma nota no corpo: "O que aconteceu com os tempos do 13?" – referindo-se à contagem de palavras na página inicial de 1999. Este mistério e sua revelação eram realmente interessantes, porque eu pensei sobre a página inicial e sobre como mantê-la simples o tempo todo. Entretanto, eu ainda não tinha pensado em olhar para ela através desta lente muito simples: apenas contar as palavras. Quanto menos, melhor.

Desde aquela noite, esta tem sido nossa disciplina, e todos que trabalham na página inicial e seu design conhecem o número atual: 28. (Esta é a contagem de palavras para a página básica se você n
ão estiver logged in; não há linha promocional sob a caixa de busca, você configurou Google como sua página inicial e portanto não recebe o link "Faça do Google a sua página inicial!" e conta "©2008 Google" como duas palavras). Assim, faremos uma alteração na página inicial acrescentando um link à nossa política de privacidade. Para o Google, a privacidade de nossos usuários vem em primeiro lugar. Confiança é a base de tudo que fazemos, portanto queremos que você esteja familiarizado e satisfeito com a integridade e atenção que damos aos seus dados pessoais. Acrescentamos este link à nossa página inicial e à nossa página de resultados para facilitar que você encontre informações sobre os nossos princípios de privacidade.

O novo link "Privacidade" vai para o nosso Centro de Privacidade, que foi renovado no início deste ano para ser mais direto e acessível, com vídeos e uma visão geral sem linguagem jurídica para assegurar que você entenda em termos básicos o que Google faz, não faz e não fará com relação à sua informação pessoal. Qual a relação da privacidade com a contagem de palavras da página inicial? Larry e Sergey me disseram que eu só podia acrescentar isso à página inicial se tirasse uma palavra – mantendo o “peso” da página inicial inalterado em 28. Considerando que o novo link de Privacidade fica melhor com termos de isenção de responsabilidade na página, pensei na linha de copyright, e aí removemos a palavra "Google" (sabendo que estava implícita, obviamente) e acrescentamos o novo link de privacidade ao lado.

Acreditamos que o fácil acesso à nossa informação de privacidade sem peso adicional na página inicial é uma clara vitória para nossos usuários e uma melhoria para nossa experiência. Você pode clicar aqui para visitar nosso Centro de Privacidade.

O Brasil no Mapa

Quarta-feira, Julho 02, 2008 7/02/2008 11:10:00 AM



É com muito prazer que anunciamos que o lançamento oficial do Google Maps Brasil.

Você deve estar se perguntando, mas como, se eu acesso o Google Maps desde 2007? A explicação é simples: finalmente o Google Maps saiu da versão "Beta" e, a partir de agora, vocês verão um link para o Maps no topo da página principal do Google.

Mas na prática, o que isso significa? Significa que nós do time de Mapas do Brasil estamos satisfeitos com a qualidade dos resultados de buscas que são gerados por nosso produto. Deseja saber onde fica um certo endereço? Digite algo como "Av. Bias Fortes 382, Belo Horizonte" e veja o resultado. Está planejando uma viagem e não sabe em que hotel ficar? Procure por "Hotéis próximo a Ipanema, Rio de Janeiro" e escolha um. Vai de carro e não sabe como chegar? Clique em "Como Chegar" e digite a origem e o destino e veja as informações passo a passo.

E isso é apenas uma amostra do que está disponível. Através do Google Maps, você pode acessar "Fotos" e resultados de busca por conteúdo criado por usuários, bem como criar e compartilhar conteúdo do seu próprio Mapa, utilizando a seção "Meus Mapas". Além disso você pode contribuir com o Google Maps, criando uma resenha sobre qualquer negócio; se você é dono do seu próprio negócio, mas não consegue encontrá-lo no Maps, adicione a sua empresa através da Central de Negócios do Google Maps.

No Mapa em 3D - Também lançamos a versão local do Google Earth. Nela você pode conhecer o mundo da maneira que já está acostumado. Além disso, estamos criando e recebendo conteúdo específico para o Brasil e em breve colocaremos todo esse material no ar. Por enquanto nós selecionamos alguns arquivos KML interessantes na Galeria do Google Earth para começar a sua viagem. E o melhor é que você não precisa confiar na nossa escolha! Os arquivos mais populares e mais acessados por usuários irão aparecer naturalmente no topo da lista, passando para vocês boas sugestões todos os dias.