Qualche giorno fa mi sono incuriosito per cercare di capire cosa vede Google in merito a commenti e script. Ho quindi creato una pagina dove pubblicavo parole non presenti nell’archivio di Google: invece di inserirle nell’HTML, le ho fatte uscire tramite diversi Javascript e anche via commento.
Dopo qualche giorno è possibile analizzarne i risultati. Premetto che per fare il test ho verificato due importanti cose:
Non dovevano esserci link a quella pagina contententi quelle parole, non dovevano essere parole presenti nel DB di Google.
Prove fatte nel test
1) Ho inserito una parola nel testo direttamente tramite javascript lineare in questo modo:
<script type="text/javascript">
document.write("Parola");
</script>
Risultato: la parola è stata indicizzata correttamente come se fosse nell’html tradizionale.
2) Ho inserito una parole nell’HTML in modo normale, così da verificare che la pagina fosse stata indicizzata.
Risultato: dopo 2 ore ho verificato e la pagina era già indicizzata.
3) Ho inserito una parola nella pagina, caricandola dopo che tutta la pagina è stata caricata, nel onload. Ecco l’esempio:
<script type="text/javascript">
window.onload=function(){
document.getElementById("parolina").innerHTML = "Parola";
}
</script>
<div id="parolina"></div>
Risultato: la parola non è stata indicizzata.
4) Ho inserito una parola nella pagina, caricandola come nell’esempio (1) ma con lo script in un file esterno. Esempio:
<script type="text/javascript" src="url..."></script>
Risultato: la parola non è stata indicizzata.
5) Ho inserito una parola nei commenti. Esempio:
<!-- parola -->
Risultato: non è stata indicizzata.
Tiriamo le somme
Tutto ciò che è presente nell’HTML, non all’interno dei commenti, viene indicizzato. Tutto ciò che è all’interno dei commenti o che viene caricato dinamicamente da file esterni o in modo asincrono (ajax) non viene assolutamente indicizzato.
Quindi, se avete uno widget in js, che carica news da fonti esterni all’onload, Google non ve lo indicizza. Se scrivete delle parole chiave nei commenti sperando di migliorare la vostra SEO power, scordatevelo.
In una parola? Mandostomatopia!
foto di GiacomoRaffo
Bello questo post Riccardo!, molto interessante!
Sappiamo che Google indicizza perfettamente il contenuto HTML di una pagina web e sappiamo pure che non indicizza contenuto Ajax (o almeno ci sono delle difficoltà che secondo me saranno presto eliminate).
Riflettendo sul discorso dei commenti, effettivamente, servono al proprietario del sito o al webmaster/designer/seo/ecc. che deve intervenire sui contenuti ma all’utente non serve assolutamente, quindi, la sua indicizzazione (o presunta ottimizzazione) è assolutamente inutile.
Il prossimo test sugli SWF? Io non ho tempo lo fai sempre tu? 😛
Pingback: http://bookmark.giorgiotave.it
Grazie Yuri. Purtroppo Ema ultimamente è un casino e soprattutto purtroppo il buon SWF l’ho da tempo abbandonato. Se vuoi lo faccio con Silverlight… 🙁
Accessibilità e ottimizzazione = HTML puro! Punto!
Ciao,
è un bel test… ma credo ci sia una risposta a quanto dici.
Nel senso che il crawler di Google immagazzina tutta la pagina, così come se fosse un client. Cioè un navigatore che in sostanza apre la pagina e salva il codice che vede.
Allo stesso modo i due differenti codici javascript:
document.write
e
document.getElementBy[ETC…]
si comportano di conseguenza nell’ottica del client, in quanto il primo va a SCRIVERE sulla pagina, il secondo no poichè cambia la proprietà di un elemento dinamicamente.
—
Inoltre le parole nei commenti erano già bypassate da Google da tempo, più o meno dal momento in cui si è passati da spammare di keyword i metatags al “content is the king”
—
Cmq sta di fatto che la tua analisi operativa e concreta è molto significativa e tornerò a visitarti con piacere 🙂
@andrea perchè non provi a fare lo stesso test, usando il getElementById (come nel mio esempio 3) però inline, non nel onload? Sarebbe interessante capire come funziona.
Chiaramente parliamo di finezze: se si lavora per qualità di contenuti, con un italiano ricco e corretto, gli obiettivi si centrano a prescindere, o quasi!
@Merlinox
ci proverò e ti faccio sapere 🙂
Ottimo @andrea , rimango in attesa allora!
Va da se che io sono x l’html puro, cmq x un cliente che mi aveva chiesto di indicizzare il proprio sito realizzato completamente in flash, ho trovato questo link che mi sembra un test piuttosto esaustivo relativamente agli swf http://www.googlerank.com/ita/guida-posizionamento/Google-flash.html , anche se il succo della questione rimane che gli swf sono difficilmente indicizzabili!!!!!
Meglio continuare con i test sugli script js … bravo Merlinox 😀
Grazie del link @DvD molto interesing, anche se ormai sono fuori da Flash da troppo tempo.
@Merlinox
ho messo la function inline qui: http://www.andreainfusino.com/directory-siti-web/
vedi il testo in bassissimo alla pagina, vediamo un pò 🙂
@andrea attendiamo i tuoi report 😉
Credo che l’unico modo per sfatare definitivamente alcuni miti SEO sia quello di sperimentarli, proprio come hai fatto tu. Complimenti!
Dal punto di vista scientifico non è possibile definire metodologie quando uno degli elementi in questione non ha (tutti) i comportamenti dichiarati.
L’unica cosa che è necessario fare è qualsiasi cosa possa favorirlo e non penalizzarlo.
Ottimo articolo Merlinox.
E’ da molto che ci sono le prove tangibili che Google esegue Javascript ed ha acquisito capacità di browsing evolute (ad esempio navigazione menu a tendina con select, compilazione di form, lettura contenuti testo in Flash, ecc.).
Più che le capacità di browsing dello spider (che hanno valenza solo sperimentale), è da capire quanto un link in Javascript sia diverso da uno in HTML, se passa PageRank…insomma se è un link “normale” come tutti gli altri.
Dalla mia esperienza mi sento di dire che i link in Javascript non passano ancora PageRank, e spero che non lo facciano mai (in fin dei conti l’accessibilità dovrebbe essere un valore per Google, no?)
Ottimo post, complimenti!
Siamo in un periodo di transizione. Sicuramente il concetto di Page Rank inizia ad arrugginirsi, verso un concetto più sociale che tenga in considerazione microblogging, social network, social bookmark… e soprattutto sarà necessario un algoritmo “intelligente” in grado di filtrarne la autenticità: un casino!
Ieri qualcuno issava la bandiera del addio pagerank anche se secondo me è prestino. Il leader di Facebook annuncia che ambisce a diventare il nuovo riferimento di ricerca. E noi siamo ancora ad aspettare il test di @Andrea!
Beh per quanto riguarda il PageRank, volevo aggiornarvi ocl seguente articolo… 😛
Scusate… ecco il link:
http://www.espertoseo.it/11766/comunicati-stampa/addio-pagerank-rimosso-dagli-strumenti-per-i-webmaster-di-google.html
[non riesco ad accorpare i messaggi in uno solo!]
@andrea si si lo citava anche @yuri via Twitter. Ma il test di cui parlavamo ieri l’hai checkato?
Ah!
Si ho messo online ma non ha ancora indicizzato la pagina.
Ogni tanto faccio la ricerca ma non mi esce niente… dobbiamo attendere un pò perchè nella pagina suddetta non c’è un alto traffico!
@andrea hai messo un’ancora html pura (sempre priva di serp) in modo da verificare se la pagina è già stata indicizzata o no? Altrimenti potresti aspettare per sempre senza sapere se non l’ha ancora indicizzata o se non l’ha proprio considerato.
@Merlinox
la pagina è già indicizzata e raggiungibile, tu dici di mettere un extra-link?
Assolutamente no @andrea . Se rileggi il mio post ho affiancato i vari esperimenti da una parola nel testo Html normale (es. “mistrofinappamento“). Quindi quella diventa la parola che controlli per vedere se ha indicizzato la pagina: se ha beccato quella deve aver beccato anche le altre, altrimenti significa che non le ha considerate. Capito?
giusto, hai ragione… quindi una parola non indicizzata e non esistente per fare il check
Secondo te non era così chiara la cosa? Magari ci scrivo un posticino dedicato. Che dici? Volevo dirti che la mia “mistrofinappamento” l’hanno già indicizzata. Quandi secondi?
No no era chiara… guardando il codice avevo già inseito una parola in html puro e semplice.
Ogni tanto mi perdo in qualche passaggio e me ne scuso con te se magari ti scrivo 1000 messaggi 🙂
Ho visto dal precedente link, beh è stato molto veloce è un ottimo segno e un buon risultato per te 🙂
ho provato con la home del mio sito, spero di avere più fortuna! 😛
Una vocina dentro di me @andrea mi dice che sarebbe meglio farlo in una pagina ex novo!
Pingback: SEO: creare un test
Pingback: SEO: setTimeout @merlinox
ciao, incredibile.. questo post è già un po vecchietto, ma non si finisce mai di imparare.. grazie del Test!
Grazie Antonio, però puoi dare una occhiata a questo che è più moderno: http://blog.merlinox.com/testseo-robots-e-bot/