cseo: uma ferramenta para análise técnica de seo em páginas web

Transcrição

cseo: uma ferramenta para análise técnica de seo em páginas web
CSEO: UMA FERRAMENTA PARA ANÁLISE TÉCNICA
DE SEO EM PÁGINAS WEB
Roger Santos <[email protected]>
Stanley Loh <[email protected]> – Orientador
Universidade Luterana do Brasil (Ulbra) – Curso de Análise e Desenvolvimento de Sistemas – Campus - Canoas
Av. Farroupilha, 8001 – Bairro São José – CEP 92425-900 – Canoas - RS
30 de novembro de 2011
RESUMO
Este trabalho tem por objetivo apresentar a ferramenta de software CSEO desenvolvida com a finalidade de
auxiliar profissionais ou interessados da área de SEO (Search Engine Optmization: otimização de conteúdo para
motores de busca). Técnicas de SEO são utilizadas para posicionar sites e páginas web no topo dos resultados de
mecanismos de buscas. O Software CSEO faz a análise dos códigos da página consultada através das regras de SEO
on-page e apresenta dicas e orientações sobre cada aspecto da mesma através de relatórios.
Palavras-chave: CSEO; Buscadores; SEO on-page.
ABSTRACT
Title: “CSEO: A TOOL FOR TECHNICAL ANALYSIS OF SEO ON WEB PAGES”
The aim of this work is to present a CSEO software tool, developed in this work, whose purpose is to help
professionals or other people interested in the area of SEO (Search Engine Optimization: optimization of contents
for search engines). Techniques of SEO are used to position sites and web pages on the top of results of search
mechanisms. The CSEO software makes the code analysis of seen page through rules of SEO on-page and presents
tips and orientations on each aspect of it through reports.
Key-words: CSEO; Search Engine; SEO on-page.
1
INTRODUÇÃO
Hoje é mais prático e rápido buscar um restaurante, hotel ou produto a partir de duas ou três palavras
em um sistema de busca, que mostrará o resultado em segundos, do que abrir um catálogo telefônico,
selecionar a letra inicial do que se necessita e ficar paginando até encontrar o que se busca. Ou ainda, abrir um
mapa e perder minutos atrás de uma localização necessária através de minúsculas letrinhas, gráficos etc.
Analisando desta forma é fácil notar que os mecanismos de busca têm um papel fundamental no dia a
dia de cada pessoa, em que cada vez mais se está “adotando” uma forma digital e prática de encontrar a
informação desejada, pois por mais simples que ela seja, as pessoas não querem investir muito tempo ou
esforços atrás dela.
Em contrapartida, as empresas que desenvolvem motores de busca investem valores significativos
para apresentar resultados cada vez mais relevantes a partir do menor número de palavras fornecidas pelo
usuário. Estar bem posicionado nos resultados de uma busca, além de garantir uma maior visibilidade do site,
também permite e estimula o tão esperado “clique do usuário” nos links resultantes da pesquisa.
Segundo um estudo feito pela empresa Eyetrack (EYETOOLS, 2006), a ferramenta utilizada para
analisar o comportamento de visibilidade do usuário da web, os percentuais de visibilidade dos resultados
orgânicos de busca são os seguintes (ENGE et al., 2010, p. 35):
 Posição 1 – 100%
 Posição 2 – 100%
 Posição 3 – 100%
 Posição 4 – 85%
 Posição 5 – 60%
 Posição 6 – 50%
 Posição 7 – 50%
 Posição 8 – 30%
1
 Posição 9 – 30%
 Posição 10 – 20%
A conclusão sobre a pesquisa é: as primeiras seis posições são consideradas posições de ouro, pois
são as que, na esmagadora maioria dos casos, são acessadas pelos usuários. Esta técnica ganhou o nome de
Golden Triangle (Triângulo Dourado), pois consiste em um mapa de temperatura aplicado no site que captura
as áreas mais e menos clicadas pelos usuários.
A Figura 1 exemplifica o estudo realizado pela Eyetrack, salientando as áreas mais clicadas (em
vermelho) e as áreas menos clicadas (em azul) em um resultado de busca orgânica no buscador Google, a
partir do fornecimento das palavras “digital câmera” cheapest.
Este estudo de pesquisa também mostrou que o posicionamento físico diferente dos resultados de
busca na tela resultava em padrões diferentes no monitoramento de olhares dos usuários. Ao visualizar uma
página de resultados padrão no Google, os usuários tinham a tendência a criar um padrão em forma de “F”
com o movimento de seus olhos, concentrando-se primeiro e por mais tempo no canto superior esquerdo da
tela, movendo-se verticalmente para baixo pelos dois ou três primeiros resultados; movendo-se
horizontalmente sobre a página até o primeiro resultado pago; movendo-se para baixo mais alguns resultados
verticais e, em seguida, mais uma vez horizontalmente até o segundo ou terceiro resultado pago. Esta forma
“F” de visualização se repetiu até as 5º e 6º posições do estudo. (ENGE et al., 2010, p. 31)
Figura 1 - Golden Triangle de um resultado de busca do site Google
Quanto aos demais resultados, a conclusão dos analistas da empresa Eyetrack foi: se os usuários
visualizam os resultados apresentados na parte de baixo da primeira página (leia-se resultados nas 7ª, 8ª, 9ª e
10ª posições), essas pessoas mudam para a página 2 dos resultados, as 11ª, 12ª e 13ª posições, o que não é tão
2
ruim, pois ainda estão dentro do Triângulo Dourado, porém com resultados menos relevantes.
A partir de um estudo feito pela iProspect e a Jupiter Research, notou-se que (ENGE et al., 2010, p.
33):





Os buscadores são o principal recurso que as pessoas utilizam para encontrar um site;
92% dos consumidores on-line utilizam os buscadores;
80% dos usuários não passam das 3 primeiras páginas de resultados;
62% não passam da primeira página de resultados em mecanismos de busca;
Bilhões de páginas disputam as primeiras posições.
Os estudos acima deixam claro que além dos buscadores serem ferramentas de extrema utilização e
importância, estar no topo das buscas é o objetivo de qualquer site que almeja ser visto e visitado pelo usuário.
O SEO possibilita exatamente isso: tratar um conteúdo web para que ele fique, visualmente, bem
posicionado, de preferência mais ao topo do resultado possível, contendo as informações necessárias que o
usuário está buscando naquele momento.
Algo importante a frisar é que não existe resultado a curto prazo. SEO é uma rotina, são estudos,
análises, métodos que determinarão as particularidades e o futuro de cada assunto tratado. Isso quer dizer que
cada assunto, página, produto, conteúdo etc. do web site é singular e, portanto, deve ser analisado
individualmente, pois por mais que se tenha produtos parecidos, de mesma marca, mesma cor, mesmo preço
etc., não existem coincidências, pois aquela página que foi visitada, aquele produto que foi visto, mesmo que
não tenha sido vendido, chamou a atenção por alguns instantes e, talvez por isso, e só por isso mereça uma
atenção especial.
Um clique em um resultado de um sistema de busca nunca é só um clique; a ação de clicar em uma
simples frase ou palavra pode garantir uma compra, conquistar um novo cliente, possibilitar uma
recomendação, fazer um contato, pedir um orçamento etc., pode possibilitar inúmeras condições, desde que o
site, página e/ou conteúdo, juntamente com os responsáveis pelo SEO, estejam preparados para isso.
Analisando o volume de informação dos sites na web e, portanto, a concorrência que existe entre eles
para estarem bem posicionados em uma busca, este trabalho apresenta a CSEO, uma ferramenta de software
que objetiva auxiliar profissionais ou interessados em SEO on-page a repararem falhas técnicas presentes nas
páginas web, conforme os seus relatórios, a fim de deixá-las semanticamente corretas para interpretação dos
buscadores e, consequentemente, um melhor posicionamento nos mesmos.
Uma vez que os seus resultados são baseados em regras e comportamentos dos próprios buscadores e
expertises destes profissionais, torna-se mais eficiente um resultado fundamentado em casos reais.
A partir do fornecimento do endereço da página escrito pelo usuário, a CSEO se encarrega de analisar
o seu código HTML (Hypertext Markup Language: linguagem de marcação de hipertexto), aplicando regras
previamente inseridas pelo seu desenvolvedor a fim de relatar os problemas, informações e soluções
encontradas.
2
REFERENCIAL TEÓRICO
Neste capítulo é explicitado o referencial teórico que permitiu que a ferramenta CSEO fosse
desenvolvida.
Inicialmente é abordada uma breve explicação sobre o funcionamento dos buscadores, seus objetivos e
a atuação dos mesmos, conforme estatísticas de estudos realizados por empresas mundialmente conhecidas.
Ao final do capítulo são apresentados os fatores relevantes e irrelevantes utilizados pelos buscadores
para determinar se um conteúdo deve ou não ser indexado e qual o seu valor para o mesmo.
2.1
Como os mecanismos de busca funcionam
Os mecanismos de busca seguem dois grandes objetivos (ENGE et al., 2010):
 Rastrear e indexar os bilhões de documentos acessíveis na web;
 Responder às pesquisas dos usuários mostrando resultados relevantes.
O indexamento de um conteúdo é feito através da varredura das páginas e, por conseguinte, dos seus
3
links. Este tipo de varredura é feita por robôs conhecidos como spiders, mas que também podem ser chamados
de crawlers, bots ou robots e são ferramentas especialistas para a captura de trechos de conteúdos existentes
na estrutura HTML destas páginas. Estes trechos são armazenados nos bancos de dados dos buscadores e
recebem uma pontuação para concorrerem em uma melhor posição nos resultados de uma busca com
conteúdos do mesmo assunto.
Assim que um site é indexado por um buscador, este receberá visitas periódicas dos robôs para a
captura e indexamento de novos conteúdos. Segundo afirmações reveladas pelo blog oficial do Google, em
2008 já existiam mais de 1 trilhão de páginas “únicas” sendo indexadas. (GOOGLE, 2008)
A relevância é o primeiro passo para que uma página esteja entre os resultados de uma pesquisa. Se
uma página não é relevante, ela será descartada dos resultados. A relevância de uma página é determinada
pelo seu conteúdo e pela vizinhança em que se encontra (quem o referencia, quem é referenciado etc.).
Em uma postagem no blog oficial do Google, Mike Cassidy, Diretor de Pesquisa e Gestão de Produto
do Google disse que os resultados das redes sociais vão influenciar no ranking, conforme as ligações e
influências da pessoa ou empresa pesquisada. (GOOGLE, 2011)
O fato é que os buscadores possuem um número incomensurável de informação retirada dia a dia de
quase toda a web, sendo que cada conteúdo, site, página etc. tem um valor específico para o sistema de busca,
que está em constante mutação para a apresentação dos resultados.
2.2
Como são exibidos os resultados dos sistemas de busca
Atualmente existem dois tipos de resultados em um sistema de busca:
Resultados orgânicos (naturais): Também conhecidos como resultados naturais e são mostrados por
inúmeros fatores como importância e relevância do conteúdo, semântica da estrutura do documento HTML,
tempo de existência do domínio, aplicação de técnicas de SEO etc. Este artigo será totalmente desenvolvido em
cima dos resultados orgânicos.
Resultados patrocinados: Como o próprio nome sugere, são resultados que estão sendo pagos para
serem exibidos de acordo com algum termo, palavra ou assunto buscado pelo usuário, que já havia sido
previamente escolhido e pago pelo patrocinador.
A diferença entre estes dois resultados em um sistema de busca é facilmente notada, na qual,
geralmente, os resultados patrocinados ficam sempre no topo ou em uma área de destaque colorida ou com
alguma borda, permitindo uma rápida e fácil visualização do retorno da busca.
O melhor posicionamento em um resultado patrocinado é dado para quem investir mais capital para
aquele conjunto de palavras ou frases, de modo que a concorrência é pura e simplesmente financeira.
Com relação ao retorno de uma busca orgânica, os resultados são uniformes e, portanto, posicionados
de acordo com a sua importância registrada no sistema de busca utilizado, sendo que quanto mais no topo
mais importante.
A Figura 3 exemplifica uma pesquisa através do buscador Google a partir das palavras “carro novo”,
retornando o tipo de resultado natural (gratuito, orgânico) e pago (patrocinado) para o mesmo conjunto de
palavras fornecidas.
4
Figura 2 - Resultados naturais (orgânicos) e pagos (patrocinados)
2.3
Fatores inerentes do SEO on-page
A empresa SEOmoz, uma das referências mundiais sobre SEO realiza pesquisas anuais com os
principais SEOs do mundo para determinar o que eles pensam ser os fatores de classificação mais importantes
para uma época, período etc.: (SEOMOZ, 2011)
2.3.1
Fatores on-page
São aqueles fatores que estão 100% relacionados à página web em questão, ou seja, trata-se do
conteúdo interno, tanto nas questões técnicas HTML quanto no próprio conteúdo que é exibido ao usuário.
 Significância do conteúdo da página que é exibido ao usuário (texto, imagem, anexo etc.);
 Título da página;
 Endereço da página;
 Uso correto de códigos HTML semânticos que auxiliam o sistema buscador;
 Quantidade de links;
 Qualidade dos links;
 Externalização ou globalização dos links.
2.3.2
Fatores off-page
São fatores em que não se há um controle absoluto, pois dependem dos outros usuários ou sistemas
que o referenciam. Podem ser citados os seguintes fatores:
 Quem o referencia;
 Qual conteúdo é referenciado;
 Quantos links são referenciados pelos outros usuários;
 Quais são os textos destes links que referenciam o conteúdo;
 Tempo de existência de um domínio.
5
Teoricamente um site ou página somente conseguirá obter um resultado off-page se pelo menos um
dos fatores on-page atingir certa excelência, pois um conteúdo será referenciado se ele contiver assuntos
atrativos que outros sites também tenham interesse em publicar.
O que não pode ser confundido é que on ou off-page não são os únicos fatores ou mais importantes,
mas sim a fatia inicial e constante de qualquer projeto SEO.
A ferramenta de software CSEO proposta a este artigo será inteiramente voltada para os processos de
SEO on-page.
2.4
Fatores irrelevantes do SEO on-page
São fatores em que os buscadores não levam em consideração devido à complexidade ou restrições
tecnológicas. Podem ser citadas:
2.4.1
Imagens sem descrição
Através de estudos atuais e aperfeiçoamentos, os buscadores estão cada vez mais próximos da
interpretação de imagens, porém, ainda não há um resultado considerado satisfatório para este assunto.
Estas ferramentas de busca até podem reconhecer a cor dos pixels e, a partir daí, determinar se uma
imagem contém conteúdo pornográfico de acordo com a quantidade de tons de pele existentes neles.
Entretanto, um mecanismo de busca não conseguirá dizer se uma determinada imagem é uma foto de
Bart Simpson ou uma casa, um barco etc. Portanto, a única maneira de tornar uma imagem interpretável é
através da sua descrição. (ENGE et al., 2010, p. 56)
Não existindo a descrição na imagem simplesmente esta será ignorada pelo buscador.
2.4.2
Flash
Os mecanismos de busca já estão extraindo informações textuais da tecnologia Flash, conforme
publicado no blog oficial do Google. (GOOGLE, 2008)
Entretanto, um dos grandes problemas encontrados nos arquivos Flash é que eles são muito
pictóricos, pois contém pouca ou nenhuma informação textual, fazendo, assim, com que o mecanismo procure
as devidas informações dentro dos arquivos HTML que os incorpora; não as encontrando, o buscador, por
conseguinte, acaba dando pouca ou nenhuma atenção para a página analisada.
2.4.3
Áudio e Vídeo
Outro problema comumente encontrado no funcionamento de um motor de busca é a questão da
interpretação de arquivos de áudio e vídeo.
Assim como nas imagens, não é fácil analisar os dados sintaticamente; portanto, não será fácil pontuar
ou extrair alguma informação destes tipos de arquivos.
Existem algumas exceções, na qual os buscadores conseguem capturar dados limitados, tais como
tags ID3, dentro de arquivos MP3, ou podcasts avançados em formato AAC com “notas de show” textuais.
Entretanto, é impossível descobrir que determinado vídeo contém um jogo de futebol e não um filme
caseiro. (ENGE et al., 2010, p. 57)
2.4.4
Arquivos executados no servidor, baseados no cliente
Outro tipo de informação que os buscadores não conseguem extrair é algo que seja executado
diretamente no servidor, ou mais especificamente, que o código final não seja legível aos olhos humanos.
Um bom exemplo a ser dado é a questão da metodologia AJAX (Asynchronous Javascript and XML:
Javascript e XML assíncronos) que tem como fundamento principal entregar e receber informações de um
servidor sem a necessidade do usuário atualizar todo o conteúdo da página.
O problema ocorre porque o conteúdo é recuperado por um script, que é executado no computador do
usuário, só depois de receber alguma ação feita pelo próprio usuário. O resultado desta negociação entre
usuário e servidor é a não existência de um código HTML inicial, fato este que prejudica o trabalho do
buscador que necessita analisar um código HTML inicialmente.
6
2.4.5
Embutimento de conteúdo externo
A questão dos conteúdos externos para o HTML não são unicamente dos sites de terceiros e sim uma
maneira de incluir um conteúdo, seja ele do mesmo site ou não, a partir da abertura de quadros/janelas no
código HTML analisado pelo buscador.
A abertura de quadros na página é uma técnica que tem por objetivo dividir o conteúdo, dando a
possibilidade de incluir, em uma destas divisões, outros sites que aparentam pertencer à estrutura atual da
página visitada.
Os buscadores desconsideram conteúdos importados de outros sites, uma vez que, para eles, se o
conteúdo foi feito por outro editor, então não deve receber créditos na estrutura atual capturada. (ENGE et al.,
2010, p. 58)
3
APRESENTAÇÃO DA FERRAMENTA CSEO
Neste capítulo é apresentada a ferramenta proposta, a CSEO, que objetivará entregar ao seu usuário
relatórios contendo alguns elementos HTML capturados do site de interesse com seus erros, acertos e
informações.
Para que se pudesse chegar a resultados maduros, a CSEO foi desenvolvida sob a ótica profissional,
levando em consideração o cenário de buscadores em 2011, obras do assunto tratado e profissionais da área.
Teoricamente foram apresentados os fatores condizentes ao SEO on-page que devem constar em uma
página HTML, levando em consideração elementos que possuem mais e menos relevância para um buscador.
O fundamento de uma página web é tornar estes fatores em códigos funcionais para que os buscadores
consigam interpretar e indexar de forma excelente o conteúdo tratado.
A ferramenta CSEO foi desenvolvida com o intuito de auxiliar profissionais ou interessados em SEO
on-page a obterem informações essenciais sobre determinada página web. Através dos seus conhecimentos
prévios em web, mas especificamente na linguagem HTML, o usuário que utilizar a ferramenta CSEO poderá
se beneficiar de relatórios de vários tipos de elementos, níveis e importâncias também analisadas pelos
buscadores.
Os relatórios gerados pela ferramenta tendem a agilizar e facilitar a extração de informações que,
talvez, não estejam tão explícitas nas páginas de interesse destes usuários, auxiliando-os à tomada de novas
decisões e/ou estratégias para o seu negócio.
3.1
3.1.1
Indicadores e técnicas de SEO on-page utilizadas pela CSEO
Título da página
Segundo estudos da empresa SEOmoz (SEOMOZ, 2011), o título é a única meta-informação que
influencia a classificação e a relevância de um resultado, tornando-se um objeto de muita ou máxima
importância para o SEO.
Para a CSEO, o título é o elemento mais importante, pois é a partir dele que outros elementos serão
avaliados positivamente ou negativamente.
Aplicam-se algumas técnicas para o título a partir dos estudos de SEO:
 Existência de um título: basicamente verifica se a página analisada contém um título ou se este
não está em branco. A omissão do título em uma página acarreta em um erro para um buscador,
pois é a primeira informação listada no resultado da busca.
Tamanho do título: 65 é o número máximo de caracteres recomendados, incluindo também os
espaços. Alguns autores (MESTRESEO, 2007) e (SEOMOZ, 2011) também sugerem algo entre
60 e 70 caracteres, mas normalmente quando um título é cortado em um resultado fica nos 65.
Atualmente o Google suporta até 70 caracteres.
 Utilização um caractere separador: a utilização de um separador de conteúdo é uma técnica
muito eficiente, pois a partir de uma pesquisa os buscadores irão procurar ocorrências destas
palavras em todo o corpo do documento e, principalmente, no título. As encontrando, o segundo
passo é descobrir em que página elas estão incluídas. Os separadores mais recomendados para esta
técnica são a barra vertical (|) também conhecida como pipe e o hífen (-), sendo que se pode
7
combiná-los de acordo com a leitura desejada. (ENGE et al., 2010, p. 244)
3.1.2
Descrição do documento
As metadescrições são principalmente usadas nas três situações a seguir (ENGE et al., 2010, p. 245):
 Para descrever o conteúdo da página de forma precisa e sucinta;
 Para servir como um “anúncio” de texto curto nos resultados da busca;
 Para exibir palavras-chave direcionadas, não para fins de classificação, mas para indicar um
conteúdo para os buscadores.
Na CSEO são adotadas as seguintes regras:
 Ser sucinto: atualmente o Google exibe até 160 caracteres, o Yahoo até 165 e o Bing mais de 200.
Preferencialmente, o limite é 160 caracteres para menos, incluindo os espaços.
 Palavras existentes no título: são comparadas palavras do título com as da descrição, a fim de
reportar se as informações do cabeçalho da página estão dentro do mesmo contexto.
3.1.3
Palavras-chave (keywords)
Um dos grandes problemas encontrados nos sites é a inserção de palavras-chave inconsistentes.
Atualmente é fácil notar gravíssimos erros sobre este fator:
 Muitos webmasters mais antigos pensam que uma vez inseridas está ok e não precisa alterar;
 “Achar” que as palavras que saíram da cabeça são as melhores;
 Colocar as mesmas palavras-chave em todas as páginas;
 Não atualizar as palavras conforme os termos mais buscados;
 Não usar uma ferramenta (recomenda-se utilizar as ferramentas dos próprios buscadores, uma vez
que eles são os detentores de todas as informações dos sites).
Não se deve exagerar no número de palavras, pois quanto mais palavras mais concorrência entre elas.
O recomendado é focar nas principais para cada assunto.
A CSEO faz comparações das palavras existentes no título e descrição com as palavras-chave, a fim
de reportar se as informações do cabeçalho da página estão dentro do mesmo contexto.
3.1.4
Links
Os links, assim como o título, são fatores de importância singular para um bom indexamento e
posicionamento.
É através dos links que a navegação realmente acontece em um site. Quando um outro site faz
referência a algum conteúdo é através de links, ou seja, é definitivamente um fator de transporte extremamente
importante para o SEO.
Aplicam-se as seguintes técnicas:
 Link vazio: os buscadores não gostam deste tipo de link, pois eles precisam continuar caminhando
pelo site e estes tipos de links travam boa parte dos seus processos, pois apontam para o nada.
 Limitar o número de links de uma página: Matt Cutts, especialista em Qualidade de Pesquisa do
Google, mencionou em um dos seus artigos a seguinte frase: “Keep the links on a given page to a
reasonable number (fewer than 100)” (CUTTS, 2009), que pode ser traduzida para o português
“Mantenha os links de uma determinada página em um número razoável (preferencialmente menor
que 100)”.
 Âncoras iguais com endereços diferentes: âncora é, basicamente, o conteúdo visual (texto ou
imagem) que uma pessoa aciona (clica) em um link. Teoricamente, uma âncora diz respeito a um
endereço (referência), portanto, se existem âncoras iguais referenciando conteúdos diferentes isto é
mal interpretado pelos buscadores, uma vez que estes analisam palavras-chave do que link com o
conteúdo “linkado”.
 Endereços iguais com âncoras diferentes: da mesma forma que a âncora, porém neste
procedimento os endereços são idênticos, entretanto, o contexto (âncora) do link exibe informações
totalmente distintas. Os buscadores podem avaliar este link de forma negativa a partir da
concorrência de palavras existentes nele.
8
3.1.5
Cabeçalhos dos conteúdos
É um recurso mal interpretado, na maioria dos casos, pelos desenvolvedores/webdesigners do HTML.
Isto acontece porque muitas pessoas que desenvolvem páginas consideram os cabeçalhos textos comuns e
acabam prejudicando muito a relevância de um determinado conteúdo para um buscador.
Visualmente, os cabeçalhos podem ter a mesma formatação de um outro texto, porém é de forma
semântica que eles realmente funcionam para o HTML e o grande ponto ganho com isso é que os buscadores
também utilizam desta semântica para capturar e pontuar as informações.
Existem seis níveis de cabeçalhos, sendo que os cabeçalhos com níveis 1 a 3 são os mais importantes e
relevantes para a página, e os 4 a 6 são menos relevantes, porém não ignorados. A CSEO analisa os seis níveis
de cabeçalhos de conteúdos.
3.1.6
Imagens
As imagens são recursos visuais que, por enquanto, os buscadores não conseguem interpretar, mas,
dão certa atenção, pois muitas vezes as imagens são âncoras de links.
Em um conteúdo, as imagens são recursos que podem chamar a atenção, ainda mais se tiverem um fim
publicitário, porém, como os buscadores são “cegos”, a maneira como eles interpretam o conteúdo das
imagens é através do atributo ALT inserido no código HTML da imagem.
Sendo assim, uma imagem para um buscador somente terá um valor caso ela possua o atributo ALT.
 Texto descritivo da imagem: é um atributo inserido no código da imagem que tem por objetivo
descrever o conteúdo da imagem de forma textual. Esta descrição serve tanto para os buscadores
interpretarem a mesma quanto para os deficientes visuais poderem navegar na página. Uma vez
que este atributo não é localizado, o buscador simplesmente ignora a imagem podendo negativar a
informação.
A CSEO analisa todas as imagens da página procurando pelo seu atributo ALT. Não o encontrando,
ela tenta localizar o texto mais próximo da mesma para salientar ao usuário se aquela informação capturada
diz respeito ao seu conteúdo.
3.1.7
Frames
Frame é um recurso da linguagem HTML que permite a incorporação de outros conteúdos (sejam
estes do mesmo site ou não) em alguma página.
Os buscadores desconsideram conteúdos importados de outros sites, uma vez que, para eles, se o
conteúdo foi feito por outro editor então não deve receber créditos na estrutura atual.
Seguindo as funcionalidades de um buscador, a CSEO analisa a presença de frames na página, porém
não analisa o seu conteúdo importado.
3.1.8
Densidade das palavras
A fim de ilustrar a quantidade de palavras presentes no documento analisado, a CSEO auxilia os
profissionais ou interessados capturando as informações textuais da página, tratando-as e as exibindo para que
este visualize as palavras com maior ocorrência.
Os buscadores possuem algoritmos que calculam o peso das palavras-chave e outros fatores ligados
aos sites armazenados em seus bancos de dados, possibilitando um melhor posicionamento nos resultados de
uma busca. Um dos mais conhecidos é o PageRank da empresa Google.
3.1.9
Códigos CSS (Cascading Style Sheets: folha de estilo em cascata)
São, resumidamente, códigos que possuem a formatação de uma página ou site, separando-os da
camada estrutural do HTML.
Os buscadores não analisam ou se deixam influenciar por códigos CSS para um melhor indexamento,
entretanto, a CSEO exibe estes códigos a fim de ilustrar ao interessado questões que podem impactar o
processamento da página através da quantidade ou tipo de incorporação dos mesmos no documento.
3.1.10 Códigos Javascript
É uma linguagem baseada em navegador que proporciona funcionalidades ligadas às ações do usuário,
9
como janelas de alerta, preenchimento obrigatório de campos em um formulário entre outras.
Os buscadores não analisam ou se deixam influenciar por códigos Javascript para um melhor
indexamento, entretanto, a CSEO exibe estes códigos a fim de ilustrar ao interessado questões que podem
impactar o processamento da página através da quantidade ou tipo de incorporação dos mesmos no
documento.
Um código Javascript mal escrito ou recursos AJAX podem impossibilitar a captura de informações
pelos buscadores.
3.2
Desenvolvimento da Ferramenta
A ferramenta de software CSEO foi desenvolvida com o intuito de auxiliar profissionais e interessados
da área de SEO on-page a obterem informações essenciais sobre determinada página web, ignorando o local
remoto de sua publicação, versão de código, semântica ou qualquer outro aspecto que possa influenciar na
interpretação do seu código fonte, bastando simplesmente possuir acesso à internet e um navegador.
Através de uma interface simplista, o usuário terá uma única tarefa que é informar o endereço da
página em questão que deverá ser analisada pela ferramenta. A Figura 4 ilustra parte da tela inicial da
ferramenta, salientando em vermelho a área onde é necessário informar o endereço da página que será o alvo
da análise.
Figura 3 - Tela inicial da ferramenta CSEO
O funcionamento interno da ferramenta, tais procedimentos, módulos e tecnologias serão abordados
nos capítulos subsequentes desta mesma seção do artigo.
3.3
Tecnologias utilizadas na CSEO
Este capítulo aborda as tecnologias adotadas no desenvolvimento da ferramenta de software CSEO.
3.3.1
PHP 5.3
PHP: Hypertext Preprocessor é uma linguagem de programação open source dinâmica e comumente
utilizada no desenvolvimento de aplicativos web.
A utilização desta tecnologia na ferramenta de software CSEO proporcionou vários ganhos quanto às
questões de tempo e recursos naturais da própria linguagem, que já são naturalmente direcionados para o
auxílio do desenvolvimento web.
Uma vez que a CSEO captura códigos HTML de um site genérico, fez-se necessário a utilização de
bibliotecas que auxiliassem a entrada destes códigos na estrutura da mesma. São citadas abaixo:
 CURL: biblioteca desenvolvida por Daniel Stenberg (STENBERG, 2011) que permite a conexão e
comunicação com tipos diferentes de servidores e também com tipos diferentes de protocolos. Na
ferramenta CSEO, a biblioteca CURL foi empregada para realizar dois objetivos:
- Captura do código fonte: resumidamente captura o código fonte da página inserida, analisa a
sua codificação e, se necessário, a converte para o tratamento em outras etapas da ferramenta.
- Análise do estado da página: para se fazer qualquer procedimento, inicialmente, é necessário
identificar se a página apontada para a análise realmente existe. Basicamente verifica-se o link
informado, se está on ou off line a partir do protocolo de estado 200 OK (W3C, 2011).
 DOM (Document Object Model): criado pelo W3C, DOM é um modelo multiplataforma que
representa como as marcações HTML, XHTML e XML são organizadas e lidas pelo navegador.
Uma vez interpretadas, estas marcações se transformam em elementos de uma árvore que se pode
manipular via API (TABLELESS, 2011). No desenvolvimento da ferramenta CSEO foi adotada a
classe de manipulação de objetos DOM, PHP Simple HTML DOM Parser (CHEN, 2011), que
proporcinou alta produtividade, uma vez que a ferramenta CSEO trabalha 100% baseada em
objetos DOM, esta classe auxiliou no desenvolvimento de todas as suas funcionalidades.
A Figura 4 exemplifica a disposição dos elementos HTML em uma árvore DOM.
10
Figura 4 – Exemplo de uma árvore DOM com elementos HTML. Fonte dev.opera.com
3.4
Módulos internos da ferramenta CSEO
Este capítulo explana os módulos desenvolvidos para a ferramenta CSEO que estão presentes no
funcionamento de cada fator (indicador) analisado pela ferramenta.
3.4.1
Módulo Checa Link
Responsável por verificar se o endereço fornecido pelo usuário encontra-se em estado 200 OK (online). Seu funcionamento ocorre através da biblioteca CURL que recebe o endereço fornecido, faz a requisição
do mesmo em até 10 segundos, retornando o estado do endereço. Este módulo está presente no início da
análise e definirá se o restante da aplicação continuará trabalhando ou não.
3.4.2
Módulo Fonte
Responsável por capturar e, se necessário, converter o charset de todo o código fonte do endereço
fornecido. Seu funcionamento se dá através da biblioteca CURL que recebe o endereço fornecido, faz a
requisição, captura o código fonte e por meio de técnicas de Expressão Regular (REGEXP) interpreta o seu
charset, analisando se o mesmo encontra-se em latin1 (ISO-8859-1).
Caso o charset capturado esteja em um formato diferente, o módulo tratará de convertê-lo para latin1.
A utilização da codificação latin1 possibilita novas tarefas como a separação, tratamento e análise de palavras
da língua portuguesa, que são realizadas em outros módulos da ferramenta.
Este módulo está presente no início da análise pela ferramenta e torna todas as demais análises
possíveis, pois armazena o código fonte tratado para que cada fator possa interpretar e relatar individualmente
suas informações.
3.4.3
Módulo Html2text
Responsável por converter o código fonte, previamente capturado, no formato texto, removendo todas
as formatações HTML, eliminando códigos Javascript e CSS. Este módulo utiliza a classe
class.html2text.inc.php desenvolvida por Jon Abernathy (ABERNATHY, 2011). Seu funcionamento ocorre
através de regras de Expressão Regular configuradas para a eliminação ou substituição de códigos das
tecnologias acima mencionadas.
Este módulo está presente no indicador de análise de densidade das palavras, que necessita receber o
documento sem formatação HTML para a separação, contagem e eliminação das palavras irrelevantes (Stop
words) para este fim.
3.4.4
Módulo Palavra
Responsável por capturar todas as palavras de alguns elementos analisados pela ferramenta CSEO.
Seu funcionamento se dá através da regra de Expressão Regular [:alpha:]\w+ que separa somente palavras
com letras presentes no alfabeto.
11
Este módulo está presente nos indicadores título, palavras-chave, descrição e densidade das palavras
analisados pela CSEO.
3.4.5
Módulo Remove Palavra
Responsável por eliminar as palavras irrelevantes dentro do documento utilizando-se de técnicas de
Stop words. Seu funcionamento se faz através de regras de Expressão Regular que estão configuradas para a
remoção de palavras com uma única letra (vogais e/ou consoantes), algumas preposições, conjunções e outras
palavras da língua portuguesa. Sua utilização ocorre no módulo de densidade das palavras.
3.4.6
Módulo Densidade
Responsável por capturar, analisar e somar palavras relevantes dentro do documento fornecido. Seu
funcionamento aparece através de técnicas de Expressão Regular configuradas para separar palavras
relevantes das irrelevantes e também remover informações duplicadas.
3.5
Módulos externos da ferramenta CSEO
Os módulos acima listados resumem o funcionamento interno da ferramenta CSEO para uma única ou
múltipla tarefa direcionada ao relatório do site ou página web apontada pelo usuário.
Este capítulo exemplifica o comportamento externo (para o usuário) da ferramenta CSEO, através dos
fatores mencionados no capítulo 3, com base no site ou página web que o usuário está informando na mesma.
A fim de manter uma igualdade visual, quanto às questões de relatório para o usuário, foram
utilizadas cores, formatos e símbolos que são universalmente conhecidos para determinados fins do mesmo.
Juntamente com estes padrões são reunidas informações de profissionais da área sobre determinada
explicação, de maneira que a CSEO não criou ou desenvolveu padrão algum para os seus relatórios, mas
utilizou padrões e comportamentos adotados por inúmeros profissionais da área neste artigo referenciados.
Estes padrões são:
3.5.1
Alerta
Reporta a omissão de uma informação ou prática de peso leve/mediano, mas não chega a ser um erro
que irá prejudicar o indexamento do site pelo buscador. Entretanto, algumas práticas em excesso podem
reduzir o peso de alguns fatores da página. No relatório da CSEO, um alerta tem por objetivo auxiliar com
técnicas ou práticas que possibilitarão uma melhor compreensão dos buscadores para o fator por ele
salientado.
Na ferramenta CSEO um alerta é representado por um retângulo em amarelo com a informação
relativa e também com um ícone triangular contendo o símbolo “!” (sinal gráfico de exclamação), comumente
utilizado para este fim. A Figura 6 ilustra um alerta hipotético exibido na ferramenta CSEO.
Figura 5 - Representação de um alerta da ferramenta CSEO
3.5.2
Erro
Reporta a omissão de uma informação ou prática de peso grave, chegando a ser prejudicial para a
eficácia no indexamento pelo buscador. No relatório da CSEO, um erro é algo que se deve levar em
consideração e também ser reparado o mais rápido possível, pois além de prejudicar o elemento onde foi e
encontrado o erro, também poderá prejudicar outros elementos e, certamente, a qualidade do documento na
sua totalidade.
Na ferramenta CSEO um erro é representado por um retângulo em vermelho com a informação
relativa e também com um ícone circular contendo o símbolo “X” (letra xis), comumente utilizado para este
fim. A Figura 7 ilustra um erro hipotético exibido na ferramenta CSEO.
Figura 6 - Representação de um erro da ferramenta CSEO
3.5.3
Informação
Reporta uma ou mais informações e/ou explicações sobre um mesmo elemento. Não acusa erro, alerta
ou sucesso e sim dados que, talvez, sirvam para o usuário aprimorar suas técnicas. Muitos destes dados não
12
estão explícitos no documento e, por isso, a CSEO os salienta a fim de auxiliar e agilizar a interpretação do
usuário para uma mudança ou permanência de estratégia.
Uma informação na CSEO é representada por um retângulo em azul com a informação relativa e
também com um ícone circular contendo o símbolo “I” (letra i), comumente utilizado para este fim. A Figura 8
ilustra uma informação hipotética exibida na ferramenta CSEO.
Figura 7 - Representação de uma informação da ferramenta CSEO
3.5.4
Sucesso
Reporta uma informação ou prática de sucesso, conformidade, auxiliando a eficácia no indexamento
pelo buscador. A CSEO não se detém somente em reportar erros ou alertas, mas também etapas de sucesso,
pois o usuário que a está utilizando deve ter ciência que também está caminhando na direção correta e isto
torna o serviço motivador.
Na ferramenta CSEO um sucesso é representado por um retângulo em verde com a informação
relativa, e também com um ícone circular contendo o símbolo “” (símbolo gráfico de verificado, checado),
comumente utilizado para este fim. A Figura 9 ilustra um sucesso hipotético exibido na ferramenta CSEO.
Figura 8 - Representação de um sucesso da ferramenta CSEO
Para este artigo científico foi utilizado o site oficial da Universidade Luterana do Brasil - ULBRA,
tendo como base a sua página inicial (http://www.ulbra.br), que além de abrigar os conteúdos relativos a todos
os seus subsites também é a landing page (página de entrada) da instituição e, por isso, deve estar preparada
para todos os tipos de usuários e buscadores.
A captura das telas abaixo ocorreu na data 16/11/2011, sendo que as mesmas dizem respeito aos
relatórios da ferramenta CSEO baseados no código fonte da página nesta mesma data. Estas telas tornam,
para este artigo, explícito o resultado final da ferramenta CSEO para um usuário e site genéricos, que, por sua
vez, estão baseados no capítulo 3. Portanto, o objetivo é explicar sucintamente os resultados coletados a partir
de suas telas.
Título
Figura 9 - Análise do título da página www.ulbra.br pela ferramenta CSEO
A Figura 10 exibe o resultado da análise do título feita, sendo explicitado dois quesitos:
 Extensão de caracteres: total de 5 caracteres de, no máximo, 65. Retornou sucesso.
 Presença de um caractere separador: ausência do caractere pipe (|) ou hífen (-). Retornou alerta,
mas não prejudicial.
13
Descrição
Figura 10 - Análise da descrição da página www.ulbra.br pela ferramenta CSEO
A Figura 11 exibe o resultado da análise da descrição feita, retornando uma mensagem de erro, pois a
ferramenta detectou a ausência do código da mesma na página.
Palavras-chave
Figura 11 - Análise das palavras-chave da página www.ulbra.br pela ferramenta CSEO
A Figura 12 exibe o resultado da análise das palavras-chave feita, retornando uma mensagem de erro,
pois a ferramenta detectou a ausência do código da mesma na página.
Links
Figura 12 - Análise dos links da página www.ulbra.br pela ferramenta CSEO
A Figura 13 exibe o resultado da análise dos links feita, sendo explicitado quatro quesitos:
14
 Total de links visíveis: total de 283 links de, no máximo, 100. Retornou alerta, podendo ser
prejudicial. Este relatório possibilita listar todos os links capturados.
 Âncoras duplicadas: total de 8. Retornou erro. Este relatório possibilita listar todos os links com
âncoras duplicadas.
 Endereços duplicados: total de 28. Retornou erro. Este relatório possibilita listar todos os links
com endereços duplicados.
 Links vazios: sem links vazios. Retornou sucesso. Este relatório possibilita listar todos os links
com endereços vazios.
Cabeçalhos dos conteúdos
Figura 13 - Análise dos cabeçalhos dos conteúdos da página www.ulbra.br pela ferramenta CSEO
A Figura 14 exibe o resultado da análise dos cabeçalhos dos conteúdos feitos (feita), sendo
explicitados seis elementos:
 H1: Total 1. Retornou sucesso.
 H2: Total 1. Retornou sucesso.
 H3: Total 3. Retornou sucesso.
 H4: Total 1. Retornou sucesso.
 H5: Total 0. Retornou alerta, mas não prejudicial.
 H6: Total 0. Retornou alerta, mas não prejudicial.
Imagens
Figura 14 - Análise das imagens da página www.ulbra.br pela ferramenta CSEO
15
A Figura 15 exibe o resultado da análise das imagens feita, sendo explicitados 4 quesitos:
 Total de imagens visíveis: total de 11. Retornou informação com todas as imagens. Este relatório
possibilita listar todas as imagens capturadas.
 Imagens sem o atributo ALT: total de 4. Retornou erro. Este relatório possibilita listar todas as
imagens sem ALT capturadas.
 Imagens com o atributo SRC. Retornou sucesso. Este relatório possibilita listar todas as imagens
com SRC capturadas.
 Imagens com os atributos width e height. Retornou sucesso. Este relatório possibilita listar todas
as imagens com width e height capturadas.
Frames
Figura 15 - Análise dos frames da página www.ulbra.br pela ferramenta CSEO
A Figura 16 exibe o resultado da análise dos frames feita, retornando uma mensagem de sucesso, pois
a ferramenta detectou a ausência do código do mesmo na página.
Densidade
Figura 16 – Densidade de palavras únicas da página www.ulbra.br pela ferramenta CSEO
A Figura 17 exibe o resultado da capturas de todas as palavras relevantes do documento, juntamente
com o seu número de vezes que consta no mesmo.
A Figura 17 não foi inserida na sua íntegra neste artigo, pois a CSEO capturou, no total, 595 palavras
e, portanto, ocuparia demasiado espaço.
16
CSS
Figura 17 - Análise de códigos CSS da página www.ulbra.br pela ferramenta CSEO
A Figura 18 exibe o resultado da análise dos códigos CSS feita, retornando uma mensagem de
informação, pois a ferramenta não trata de analisar internamente o funcionamento deste tipo de código, mas
salienta a sua presença. Uma subanálise feita pela ferramenta nesta etapa é a verificação se estes códigos estão
externos ou internos perante o documento analisado. No caso da Figura 18, a ferramenta encontrou somente 1
código CSS presente no documento e o positivou, pois notou que o mesmo está externo ao mesmo.
Javascript
Figura 18 - Análise de códigos Javascript da página www.ulbra.br pela ferramenta CSEO
A Figura 19 exibe o resultado da análise dos códigos Javascript feita, retornando uma mensagem de
informação, pois a ferramenta não trata de analisar internamente o funcionamento deste tipo de código, mas
salienta a sua presença. Uma subanalise feita pela ferramenta nesta etapa é a verificação se estes códigos estão
externos ou internos perante o documento analisado. No caso da Figura 19 a ferramenta encontrou 13 códigos
Javascript sendo 11 códigos externos e 2 internos, marcando-os positivamente e negativamente,
17
respectivamente.
4
VALIDAÇÃO DA FERRAMENTA
Para a validação da ferramenta e das informações geradas através desta, foram utilizados sites reais
desenvolvidos e/ou administrados pelo setor de Internet da Assessoria de Comunicação Social (ACS Internet)
da Universidade Luterana do Brasil.
A ACS Internet atualmente administra mais de 200 sites, sendo estes, na sua maioria, sites oficiais
dos cursos do campus Canoas, outras unidades Ulbra, eventos, vestibular, blogs etc. As tarefas relativas à
web como um todo, neste setor, são constantes e em ascensão diariamente, portanto decidiu-se escolher um
grupo onde, possivelmente, existiriam muitos tipos de testes com todos os tipos de mensagens que a
ferramenta CSEO possibilita.
Devido a algumas bibliotecas de tecnologia utilizadas pela ferramenta não foi possível hospedar a
mesma em um local terceirizado, funcionando esta em uma máquina local do grupo ACS Internet para fins de
teste e validação.
Tentou-se instalar a ferramenta em dois servidores distintos da Ulbra, mas devido a algumas políticas
institucionais de Firewall e Proxy do setor de TI da mesma não se pôde externalizar a ferramenta para testes
em sites de outras empresas.
Os testes com a ferramenta nos sites institucionais da Ulbra ocorreram no mês de novembro de 2011,
sendo que estes foram feitos conforme o padrão pessoal de cada usuário, a fim de deixar livre a utilização da
ferramenta para em seguida fazer a coleta de respostas para alguns questionamentos feitos pelo autor.
Foram levantados os seguintes questionamentos pelo autor:
1. A ferramenta CSEO atendeu as suas expectativas?
2. Qual foi o tempo médio de entrega dos resultados?
3. A ferramenta apresentou algum erro técnico durante o seu processamento?
4. A sua interface é amigável e inteligível?
5. Os seus relatórios são inteligíveis?
6. Você usaria a CSEO como uma ferramenta profissional nas suas atividades web?
7. A CSEO contribuiu no posicionamento de algum site nos buscadores?
Os questionamentos foram feitos a três setores interligados da ACS da Ulbra, sendo respondidos por 5
profissionais com distintas experiências:
 Daniela Dias Stiebe, coordenadora da ACS Internet;
 Julio Cesar Nascimento de Andrade, webdesigner da ACS Internet;
 Vitória Marcarini, estagiária da ACS Internet;
 Gabriel de Mello, jornalista da ACS Imprensa e entusiasta de serviços web;
 Marcos Beck, designer Gráfico da ACS Publicidade e Propaganda e entusiasta de serviços web.
Em média foram colhidas as seguintes respostas para os respectivos questionamentos:
1. 100% dos entrevistados disseram atender as suas expectativas.
2. 100% dos entrevistados disseram que o tempo de processamento estava dentro do previsto (em
média 5 segundos), visto que, para todos os testes, foi utilizado serviço de internet da Ulbra.
3. 100% dos entrevistados disseram não ter ocorrido erro técnico da ferramenta, sendo que:
• 80% leram as mensagens fornecidas e compreenderam porque determinada página não
pôde ser acessada;
• 20% leram após certo tempo as mensagens e, após, compreenderam.
4. 100% dos entrevistados disseram possuir uma interface amigável e de fácil compreensão, visto que
é uma ferramenta.
5. 100% dos entrevistados disseram ter compreendido os relatórios, sendo que:
• 75% dos elementos analisados eram conhecidos, portanto, já conheciam uma outra técnica
de SEO para este. As explicações dos relatórios só vieram a somar com as informações.
• 25% Desconheciam alguns elementos, entretanto, os relatórios foram muito explicativos.
6. 100% dos entrevistados disseram utilizar a ferramenta como um complemento profissional visto
que seus relatórios são muito próximos à interpretação de um resultado de busca.
18
7. Sem avaliação percentual visto que foi alegado que não houve tempo hábil para notar mudanças de
posicionamento após as alterações nos conteúdos.
Alguns entrevistados fizeram avaliações abertas, citadas abaixo, sobre as suas interpretações da
ferramenta.
Em se tratando de uma ferramenta para análise de SEO on-page, sim. A ferramenta CSEO
atende com adendo a este meio. (1ª pergunta)
Resumidamente sim. O fato de todos os relatórios possuírem uma explicação e fontes de
pesquisa tornam os relatórios mais seguros, pois navegando nas fontes referenciadas notase que nada foi inventado e sim desenvolvido a partir de estudos de profissionais
consagrados da área e casos de sucesso. (5ª pergunta)
Após analisar todos os relatórios e notar que a CSEO salientou muitos erros que não
estavam tão explícitos para nós, certamente usaríamos a CSEO como uma ferramenta
profissional, pois proporcionaria uma redução de tempo e simplicidade para técnicas que
certamente levaríamos certo tempo para aplicar. (6ª pergunta)
Devido ao pouco tempo de publicação após as alterações feitas, de acordo com as sugestões
da ferramenta, não foi possível notar muitas diferenças de posição nos buscadores, mas
notou-se que os títulos, descrições e alguns conteúdos ficaram mais claros e encontráveis
para algumas palavras-chave. Acredito que após algumas semanas subiremos algumas
posições visto que começamos a aparecer para alguns conjuntos de palavras que antes não
aparecíamos. (7ª pergunta)
5
CONCLUSÃO
Ao concluir este estudo se pôde notar a importância de um web site de apoio ao negócio e juntamente
com este as suas aplicações corretas de SEO.
A ferramenta proposta não foi desenvolvida com o intuito de substituir ou provar que é superior as
demais do mercado, mas somar como um recurso que também atinge resultados esperados pelos seus usuários.
Durante o desenvolvimento deste artigo e também da ferramenta CSEO foi possível aprofundar os
conhecimentos na área e, consequentemente, contribuir para a realização de algo funcional, utilizável e
conforme seus objetivos tornar prática, simples e objetiva a explicitação de informações sobre as páginas que,
talvez, se levaria algum tempo para descobri-las ou analisá-las.
Como toda ferramenta, tecnologia etc. a CSEO também não é uma ferramenta completa que realiza
todas as funções desejadas, mas durante o seu desenvolvimento ela foi sendo adequada ao comportamento dos
buscadores e novas técnicas de SEO, deixando claro que há uma necessidade contínua de atualização e estudo
da área para o aperfeiçoamento de qualquer ferramenta deste e de muitos outros meios da informática.
5.1
Limitações da Ferramenta
Tendo em vista o número incomensurável de páginas web com seus conteúdos, a CSEO atualmente
não atinge algumas funcionalidades tais como:
 Análise e interpretação correta de páginas em idiomas diferentes do Português;
 Análise de múltiplas páginas ao mesmo tempo;
 Análise interna de frames presentes na página capturada;
 Análise correta de palavras no módulo de densidade visto que existe um número muito grande de
verbos, preposições, conjunções etc. da língua portuguesa que deveriam estar presentes nas regras
de palavras irrelevantes (Stop words) da ferramenta.
5.2
Trabalhos Futuros
Como trabalhos futuros são sugeridas as seguintes funcionalidades:
 Análise de múltiplas páginas a fim de comparar os seus elementos e conteúdos;
 Possibilidade de interpretação e análise de páginas em outros idiomas diferentes do Português;
 Simulação das alterações sugeridas pela ferramenta em um resultado de busca;
 Fusão de recursos disponibilizados, como keywords, pelos buscadores com a ferramenta CSEO;
 Melhoria no módulo de Stop words como palavras da língua portuguesa e outros idiomas;
19
 Otimização de performance e recursos da linguagem PHP.
REFERÊNCIAS
ABERNATHY, Jon. PHP Class: HTML to Plain Text Conversion: chuggnutt.com. Disponível em:
<http://www.chuggnutt.com/html2text.php>. Acesso em: 10 jul. 2011.
CHEN, S. PHP Simple HTML DOM Parser. Disponível em: <http://simplehtmldom.sourceforge.net>.
Acesso em: 20 jul. 2011.
CUTTS, Matt. How many links per page?. Disponível em: <http://www.mattcutts.com/blog/how-manylinks-per-page>. Acesso em: 25 ago. 2011.
ENGE, Eric; SPENCER, Stephan; FISHKIN, Rand; STRICCHIOLA, Jessie. A Arte de SEO. São Paulo,
Ed. Novatec, 2010. p. 44.
ENGE, Eric; SPENCER, Stephan; FISHKIN, Rand; STRICCHIOLA, Jessie. A Arte de SEO. São Paulo,
Ed. Novatec, 2010. p. 56.
ENGE, Eric; SPENCER, Stephan; FISHKIN, Rand; STRICCHIOLA, Jessie. A Arte de SEO. São Paulo,
Ed. Novatec, 2010. p. 57.
ENGE, Eric; SPENCER, Stephan; FISHKIN, Rand; STRICCHIOLA, Jessie. A Arte de SEO. São Paulo,
Ed. Novatec, 2010. p. 58.
ENGE, Eric; SPENCER, Stephan; FISHKIN, Rand; STRICCHIOLA, Jessie. A Arte de SEO. São Paulo,
Ed. Novatec, 2010. p. 245-246.
EYETOOLS. Eyetracking consultants and Inventors of eyetracking heatmaps. Disponível em:
<http://www.eyetools.com/inpage/research_google_eyetracking_heatmap.htm>. Acesso em: 13 set. 2011.
GOOGLE. Official Google Blog: An update to Google Social Search. Disponível em:
<http://googleblog.blogspot.com/2011/02/update-to-google-social-search.html>. Acesso em: 17 ago. 2011.
GOOGLE. Official Google Blog: We knew the web was big. Disponível em:
<http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html>. Acesso em: 15 ago. 2011.
GOOGLE. Official Google Webmaster Central Blog: Improved Flash indexing. Disponível em:
<http://googlewebmastercentral.blogspot.com/2008/06/improved-flash-indexing.html>. Acesso em: 3 set.
2011.
MESTRESEO. SEO na Title Tag - Melhore os Títulos do seu Site | MestreSEO. Disponível em:
<http://www.mestreseo.com.br/tags-seo/seo-na-title-tag>. Acesso em: 8 mar. 2011.
SEOMOZ. 2011 Search Engine Ranking Factors. Disponível em: <http://www.seomoz.org/article/searchranking-factors>. Acesso em: 12 ago. 2011.
SEOMOZ. Title Tag SEO Best Practices - Meta Tag Optimization | SEOmoz. Disponível em:
<http://www.seomoz.org/learn-seo/title-tag>. Acesso em: 9 ago. 2011.
STENBERG, Daniel. cURL and libcurl. Disponível em: <http://curl.haxx.se>. Acesso em: 30 out. 2011.
TABLELESS. Entenda o que é o Document Object Model e tenha o DOM. | Tableless. Disponível em:
<http://tableless.com.br/tenha-o-dom>. Acesso em: 20 out. 2011.
W3C. HTTP - Hypertext Transfer Protocol Overview. Disponível em: <http://www.w3.org/Protocols>.
Acesso em: 30 out. 2011.
20