|
Otimização para sistemas de Busca é um conjunto de regras e métodos usados
para melhorar o posicionamento (PageRank™) de websites na listagem de resultados
das Máquinas de Busca e pode também ser considerado um subconjunto de regras
para o marketing em sistemas de Busca.
O termo SEO (do inglês, Search Engine Optimizers, Acrônimo SEO) também se
refere a indústria de consultoria, que trabalham na otimização de projetos
e websites de seus clientes. Alguns comentáristas, e também alguns profissionais
de SEOs, dividiram os métodos usados por seus praticantes em categorias
como os "SEO de chapéu branco" (geralmente utilizam métodos aprovados pelos
sistemas de busca, como a prática de construção de conteúdo e melhoria da
qualidade do site), ou "SEO de chapéu negro" (utilizam truques como "cloaking"
(camuflagem do conteúdo real da página) e spamdexing). O termo `spamdexing´
(originado da fusão de spam e indexing) refere-se a pratica de Spam direcionada
aos motores de busca.
Os praticantes de técnicas do Chapéu Branco dizem que os do Chapéu Negro
se valem de métodos que são vistos como tentativas de manipular o posicionamento
nos resultados das Máquinas de Busca a seu próprio favor. Praticantes do
Chapéu Negro dizem que todas as tentativas e técnicas utilizadas para manipular
o posicionamento são legítimas, e o tipo de técnica utilizada para se alcançar
o objetivo de melhorar o rank é irrelevante.
As Máquinas_de Busca indicam diferentes tipos de listagens nas páginas de
resultados, incluindo: publicidade paga nas páginas de resultados, (SERPs),
includíndo: conteúdo de publicidade paga por click, anúncios, pagamento
para inclusões em sistemas de busca e resultados de busca orgânica. As técnicas
utilizadas no SEO são concebidas para alavancar seus objetivos no seu website
melhorando o número e a posição de seus resultados nas busca orgânica para
uma grande variedade de palavras chave relevantes ao conteúdo do web site.
Estratégias de SEO podem melhorar tanto o número de visitações quanto a
qualidade dos visitantes, onde qualidade significa que os visitantes terminam
a ação esperada pelo proprietário do site (ex. comprar, assinar, aprender
algo). Os serviços de Otimização para Sistemas de Busca normalmente é oferecido
como um serviço autônomo, ou como parte de um projeto de Webmarketing, e
pode ser muito eficaz quando incorporado no início do desenvolvimento dos
projetos iniciais de um website.
Em termos de competição, com grande volume de termos para busca, o custo
de anúncios para pagamento por click pode ser bem expressivo. Um bom posicionamento
nos resultados orgânicos de busca pode fornecer o mesmo tráfego almejado
e ter um custo potencialmente mais baixo significativamente. Os proprietários
de websites devem optar por otimizar seus sites para a busca orgânica, se
o custo do otimização for menor do que o custo da publicidade paga.
Nem todos os sites têm objetivos idênticos para o otimização em sistemas
de busca. Alguns querem atingir todo o tipo de tráfego na rede, e podem
ser otimizados para incrementar a busca de frases comuns. Uma boa estratégia
para otimização nos sistemas de busca pode funcionar perfeitamente com sites
que tenham interesse em atingir um grande público-alvo, tais como Informativos
Periódicos, serviços de diretórios, guias, ou sites que exibem publicidade
com um modelo baseado em CPM. Em contraste, muitas empresas tentam otimizar
seus sites para um grande número de palavras-chave altamente específicas
que indicam a prontidão para venda. Otimizações deste tipo, tendo em vista
um amplo espectro de termos para busca pode impedir a venda de produtos
por gerar um grande volume de requisições com baixa-qualidade, com um custo
financeiro alto e resultando em pequeno volume de vendas. Focalizar a qualidade
do tráfego gera melhor qualidade nas vendas, permitindo que sua equipe de
vendas feche negócios mais rentáveis. A otimização para sistemas de busca
pode ser muito eficiente quando usada como parte de uma estratégia de Marketing.
Índice
* 1 Histórico
o 1.1 Início dos sistemas de busca
o 1.2 Sistemas de Busca Orgânica
* 2 O relacionamento entre profissionais de SEO e as máquinas de busca
* 3 Participando dos resultados nas listagens dos sistemas de busca
* 4 Método do Chapéu Branco
* 5 Método do Chapéu Negro
* 6 SEO and Marketing
* 7 Legal issues
* 8 Page Quality and Ranking
* 9 See also
* 10 Ligações externas
o 10.1 References
o 10.2 Guidelines
Histórico
Início dos sistemas de busca
Webmasters e responsáveis dos portais de conteúdo começaram a otimizar
seus sites para os sistemas de busca em meados de -1990s, porque os primeiros
motores de busca estavam iniciando a indexação do conteúdo na World_Wide_Web.
No início, os webmasters precisavam enviar o endereço do site aos vários
sistemas de busca existentes na Rede, para que programas como spiders, pudessem
"mapear" o site e armazenar as informações coletadas. O padrão e suporte
das Máquinas de Busca era mapear uma página da web inteira e selecionar
as chamadas palavras relacionadas na busca; então uma página com muitas
palavras diferentes ampliavam a combinação de resultados, e uma página da
web contendo uma relação de palavras como um dicionário teria como resultado
um grande número de combinações, conseqüentemente limitando os resultados
somente a nomes únicos. Os sistemas de busca então classificavam a informação
por tópicos, muitas vezes exibindo como resultado das buscas páginas já
expiradas, não existentes ou de conteúdo diferente ao que estava armazenado.
Como o número crescente de documentos online, e vários webmasters trabalhando
para aumentar o valor nos resultados em busca orgânica, os sistemas de buscas
mais populares começaram a classificar as páginas de resultados mais relevantes
em primeiro. Iste era o início de um atrito entre Sistemas de Busca e Webmasters
que continua até hoje.
Os primeiros motores de busca eram orientados pelos próprios webmasters.
Na ocasião, as versões existentes dos algoritmos utilizados nos sistemas
de busca confiaram aos webmasters e provedores de conteúdo a responsabilidade
no fornecimento das informações na forma de Categorias e o uso das Meta-Tag
para palavras-chave meta tags ou sistemas de busca que usavam arquivos de
índice como ALIWEB, fornecendo assim um guia para o índice de cada página.
Quando alguns webmasters começaram a abusar no uso das Meta-Tags, fazendo
com que as informações de Meta-Tags das páginas não correspondessem ao conteúdo,
os motores de busca abandonaram esta forma de obter informações através
de Meta-Tags e desenvolveram um sistema de ranking mais complexo utilizando
algoritmos, elevando a filtragem das palavras e elevando o número limitado
para palavras (anti-dicionário) e são mais diversas, incluindo:
* Texto dentro do Tag de título
* Nome de Domínio
* URL (de Universal Resource Locator) em português significa (Localizador
Uniforme de Recursos) diretórios e nomes de arquivos
* HTML element|HTML tags: cabeçalhos, negrito e textos com ênfase
* Keyword density Densidade das palavras
* Proximidade das Palavras-Chave
* Alt attributes Atributo em texto alternativo para images
* Textos dentro da Tag NOFRAMES
Pringle, em al. (Pringle et al., 1998) [1], também definiu um número de
atributos dentro da codificação HTML de uma página que freqüentemente eram
manipulados por provedores de conteúdo na Internet tentando melhorar a própria
classificação em motores de busca. Devido a fatores que estão praticamente
sob o controle exclusivo dos responsáveis por um site, os motores de busca
continuaram a sofrer abusos e tentativas de classificações manipuladas.
Para fornecer melhores resultados a seus usuários, os sistemas de busca
tiveram que se adaptar e assegurar que as Página de resultados mostrem sempre
os resultados mais relevantes durante uma procura, ao invés de páginas inúteis
cheias de palavras-chave e termos criados inescrupulosamente por webmasters
na tentativa de usá-las como iscas para exibirem webpages sem link ou conteúdo.
Estes fatos levaram ao nascimento de um novo tipo de motor de busca.
Sistemas de Busca Orgânica
Google foi iniciado por dois estudantes PhD da Universidade_de_Stanford,
Sergey Brin e Larry Page, e trouxe um novo conceito para avaliar páginas
da web. Este conceito, chamado PageRank™, foi importante para o início da
criação dos algoritmos do Google.
O PageRank™ trabalha principalmente com o fator link e usa a lógica deste
sistema de ligação entre páginas como se tivesse o valor de um voto para
a página em questão. O fato de uma página ser referenciada através de um
link funciona de forma a validar a existência do site e dar um valor mais
"digno" ao voto. O valor de cada link de referência varia diretamente baseado
no PageRank da página que faz referência ao link e funciona de forma inversa
no número de links de saídas de uma página.
Com ajuda de PageRank™, o Google provou ser muito eficiênte em oferecer
resultados relevantes nas páginas de resultados e tornou-se o sistema de
busca mais bem sucedido e popular.
Pelo motivo do sistema PageRank™ fazer a avaliação de websites através de
fatores externos ou fora do controle de pessoas em particular, o Google
sentiu que desta maneira poderia ser mais difícil de manipular a relevância
de uma página.
No entanto, webmasters já tinham desenvolvido ferramentas para manipulação
de link´s e esquemas para influenciar o sistema de busca Inktomi. Estes
métodos provaram ser igualmente aplicáveis aos Algoritmos do Google. Muitos
sites focalizaram suas ações em trocar, comprar, e vender links numa escala
imensa. A confiança do PageRank no sistema de link como um voto de confiança
para um valor da página foi subvertido como muitos webmasters procuraram
vender links simplesmente para influenciar o Google em enviar mais tráfego,
independentemente dos links serem realmente útil as visitantes humanos do
site.
Para complicar a situação, o suporte-de-busca omitia o mapeamento de uma
página web inteira para procurar as chamadas palavras-relacionadas nas páginas
web, e uma página web contendo uma listagem do tipo dicionário ainda combinaria
quase todas as buscas (exceto nomes especiais) alcançando alcançando um
link-rank mais alto. Páginas de dicionários e links para esquemas podem
distorcer severamente os resultados de uma página de resultados.
Já era tempo para o Google -- e outros motores de procura -- olharem para
algo mais distante sobre os fatores fora de controle humano. Havia outras
razões para desenvolver algoritmos mais inteligentes.
A Internet estava alcançando uma grande parcela de usuários não-técnicos,
que geralmente não conheciam técnicas avançadas de pesquisa que os ajudassem
a encontrar a informação que eles estavam buscando e além disso o volume
e complexidade dos dados indexados tiveram um enorme crescimento em relação
aos primórdios da Internet.
Alguns dos itens considerados no Algorítimo de Page Rank do google
* Idade do sítio(site)
* Há quanto tempo o domínio está registrado
* Idade do conteúdo
* Freqüência do conteúdo: regularidade com a qual novo conteúdo é adicionado
* Tamanho do texto: número de palavras acima de 200-250 (não afetava o Google
em 2005)
* Idade do link e reputação do sítio que o aponta
* Standard on-site factors
* Negative scoring for on-site factors (for example, a dampening for websites
with extensive keyword meta-tags indicative of having been optimized [^SEO-ed])
* Uniqueness of content
* Related terms used in content (the terms the search engine associates
as being related to the main content of the page)
* Google Pagerank (Only used in Google's algorithm)
* External links, the anchor text in those external links and in the sites/pages
containing those links
* Citations and research sources (indicating the content is of research
quality)
* Stem-related terms in the search engine's database (finance/financing)
* Incoming backlinks and anchor text of incoming backlinks
* Negative scoring for some incoming backlinks (perhaps those coming from
low value pages, reciprocated backlinks, etc.)
* Rate of acquisition of backlinks: too many too fast could indicate "unnatural"
link buying activity
* Text surrounding outward links and incoming backlinks. A link following
the words "Sponsored Links" could be ignored
* Use of "rel=nofollow" to suggest that the search engine should ignore
the link
* Depth of document in site
* Metrics collected from other sources, such as monitoring how frequently
users hit the back button when SERPs send them to a particular page
* Metrics collected from sources like the Google Toolbar, Google AdWords/Adsense
programs, etc.
* Metrics collected in data-sharing arrangements with third parties (like
providers of statistical programs used to monitor site traffic)
* Rate of removal of incoming links to the site
* Use of sub-domains, use of keywords in sub-domains and volume of content
on sub-domains… and negative scoring for such activity
* Semantic connections of hosted documents
* Rate of document addition or change
* IP of hosting service and the number/quality of other sites hosted on
that IP
* Other affiliations of linking site with the linked site (do they share
an IP? have a common postal address on the "contact us" page?)
* Technical matters like use of 301 to redirect moved pages, showing a 404
server header rather than a 200 server header for pages that don't exist,
proper use of robots.txt
* Hosting uptime
* Whether the site serves different content to different categories of users
(cloaking)
* Broken outgoing links not rectified promptly
* Unsafe or illegal content
* Quality of HTML coding, presence of coding errors
* Actual click through rates observed by the search engines for listings
displayed on their SERPs
* Hand ranking by humans of the most frequently accessed SERPs
Participando dos resultados nas listagens dos sistemas de busca
Novos sites não precisam ser necessariamente "enviados" aos sistemas
de busca para serem listados. Um simples link vindo de um website já estabelecido
fará com que os sistemas de busca visitem o novo site e inicie o mapeamento
do conteúdo. Isto pode levar alguns dias ou mesmo semanas para a indexação
do link existente em um site já indexado em todos os principais sistemas
de busca e spiders para iniciar a visitação e indexação do novo site.
Uma vez que os sistemas de busca encontrem o site dará início então ao mapeamento
das informações e páginas do site, contanto que todas as páginas usam as
tag´s de link com padrão <a href> hyperlinks. Links para páginas que são
acessíveis somente através de aplicativos em Flash ou Javascript podem não
ser encontrados pelos spiders.
Os Webmasters podem instruir os spiders para não indexar certos arquivos
ou diretórios através do arquivo padrão robots.txt como guia na raiz do
domínio. Os protocolos atuais para as máquinas de busca e spiders exige
que seja verificada a existência deste arquivo ao visitar um domínio, e
mesmo que um spyder ou motor de busca mantenha uma cópia oculta deste arquivo
para uso na próxima visita as páginas do site, não pode atualizar essa cópia
tão rapidamente quanto um webmaster . Os empresários da área de Desenvolvimento
Web podem usar estes recursos para prevenir que determinadas páginas tal
como carrinhos de compras ou outras páginas dinâmicas, conteúdo de uso específico
de operadores aparecerem em resultados sistemas de busca, assim podem manter
os spyder distantes de vertos arquivos.
Método do Chapéu Branco
Alguns métodos considerados próprios pelos sistemas de busca:
* Using a short, unique, and relevant title to name each page.
* Editing web pages to replace vague wording with specific terminology relevant
to the subject of the page, and that the audiences that the site was developed
for will expect to see on the pages, and will search with to find the site.
* Increasing the amount of original content on a site.
* Using a reasonably-sized, accurate description meta tag without excessive
use of keywords, exclamation marks or off topic terms.
* Ensuring that all pages are accessible via regular links, and not only
via Java, Javascript or Macromedia Flash applications or meta refresh redirection;
this can be done through the use of text-based links in site navigation
and also via a page listing all the contents of the site (a site map).
* Allowing search engine spiders to crawl pages of your site that you want
indexed without having to accept session IDs or cookies.
* Developing links via natural methods: Google doesn't elaborate on this
somewhat vague guideline. Dropping an email to a fellow webmaster telling
him about a great article you've just posted, and requesting a link, is
most likely acceptable.
* Participating in a web ring with other websites as long as the other websites
are independent, share the same topic, and are of comparable quality.
* Writing useful, informational articles and offering free reprint rights
for these, in exchange for a hyperlink pointing to your website.
Método do Chapéu Negro
Spamdexing é a tentativa de promoção de páginas através do uso irrelevante,
principalmente commerciais, através de técnicas decepcionantes e que fazem
uso dos algoritmos de forma abusiva. Muitos administradores de sistemas
de busca consideram qualquer tipo de técnica para otimização em sistemas
de e melhorar o page rank de um website como spamdexing. No entanto, em
tempo um consenso comum desenvolveu na indústria o que pode ser aceitável
e o que não é aceitável para reforçar uma colocação nos sistemas de busca
e melhoria de tráfego resultante.
|