Script: cosa vede Google



Google cane da tartufo!Qualche giorno fa mi sono incuriosito per cercare di capire cosa vede Google in merito a commenti e script. Ho quindi creato una pagina dove pubblicavo parole non presenti nell’archivio di Google: invece di inserirle nell’HTML, le ho fatte uscire tramite diversi Javascript e anche via commento.

Dopo qualche giorno è possibile analizzarne i risultati. Premetto che per fare il test ho verificato due importanti cose:

Non dovevano esserci link a quella pagina contententi quelle parole, non dovevano essere parole presenti nel DB di Google.

 

Prove fatte nel test

1) Ho inserito una parola nel testo direttamente tramite javascript lineare in questo modo:

<script type="text/javascript">
document.write("Parola");
</script>

Risultato: la parola è stata indicizzata correttamente come se fosse nell’html tradizionale.

 

2) Ho inserito una parole nell’HTML in modo normale, così da verificare che la pagina fosse stata indicizzata.

Risultato: dopo 2 ore ho verificato e la pagina era già indicizzata.

 

3) Ho inserito una parola nella pagina, caricandola dopo che tutta la pagina è stata caricata, nel onload. Ecco l’esempio:

<script type="text/javascript">
    window.onload=function(){
        document.getElementById("parolina").innerHTML = "Parola";
    }
</script>
<div id="parolina"></div>

Risultato: la parola non è stata indicizzata.

 

4) Ho inserito una parola nella pagina, caricandola come nell’esempio (1) ma con lo script in un file esterno. Esempio:

<script type="text/javascript" src="url..."></script>

Risultato: la parola non è stata indicizzata.

 

5) Ho inserito una parola nei commenti. Esempio:

<!-- parola -->

Risultato: non è stata indicizzata.

 

Tiriamo le somme

Tutto ciò che è presente nell’HTML, non all’interno dei commenti, viene indicizzato. Tutto ciò che è all’interno dei commenti o che viene caricato dinamicamente da file esterni o in modo asincrono (ajax) non viene assolutamente indicizzato.

Quindi, se avete uno widget in js, che carica news da fonti esterni all’onload, Google non ve lo indicizza. Se scrivete delle parole chiave nei commenti sperando di migliorare la vostra SEO power, scordatevelo.

In una parola? Mandostomatopia!

 

foto di GiacomoRaffo

Se trovi questo articolo su un blog diverso da “blog.merlinox.com” si tratta probabilmente di una copia non autorizzata. L’indirizzo originale di questo articolo è: Script: cosa vede Google scritto da .

29 Responses to Script: cosa vede Google

  1. yuri dice:

    Bello questo post Riccardo!, molto interessante!

  2. EmaWebDesign dice:

    Sappiamo che Google indicizza perfettamente il contenuto HTML di una pagina web e sappiamo pure che non indicizza contenuto Ajax (o almeno ci sono delle difficoltà che secondo me saranno presto eliminate).

    Riflettendo sul discorso dei commenti, effettivamente, servono al proprietario del sito o al webmaster/designer/seo/ecc. che deve intervenire sui contenuti ma all’utente non serve assolutamente, quindi, la sua indicizzazione (o presunta ottimizzazione) è assolutamente inutile.

    Il prossimo test sugli SWF? Io non ho tempo lo fai sempre tu? :P

  3. Pingback: http://bookmark.giorgiotave.it

  4. Merlinox dice:

    Grazie Yuri. Purtroppo Ema ultimamente è un casino e soprattutto purtroppo il buon SWF l’ho da tempo abbandonato. Se vuoi lo faccio con Silverlight… :(
    Accessibilità e ottimizzazione = HTML puro! Punto!

  5. andrea dice:

    Ciao,
    è un bel test… ma credo ci sia una risposta a quanto dici.
    Nel senso che il crawler di Google immagazzina tutta la pagina, così come se fosse un client. Cioè un navigatore che in sostanza apre la pagina e salva il codice che vede.

    Allo stesso modo i due differenti codici javascript:
    document.write
    e
    document.getElementBy[ETC...]
    si comportano di conseguenza nell’ottica del client, in quanto il primo va a SCRIVERE sulla pagina, il secondo no poichè cambia la proprietà di un elemento dinamicamente.

    Inoltre le parole nei commenti erano già bypassate da Google da tempo, più o meno dal momento in cui si è passati da spammare di keyword i metatags al “content is the king”

    Cmq sta di fatto che la tua analisi operativa e concreta è molto significativa e tornerò a visitarti con piacere :)

  6. Merlinox dice:

    @andrea perchè non provi a fare lo stesso test, usando il getElementById (come nel mio esempio 3) però inline, non nel onload? Sarebbe interessante capire come funziona.

    Chiaramente parliamo di finezze: se si lavora per qualità di contenuti, con un italiano ricco e corretto, gli obiettivi si centrano a prescindere, o quasi!

  7. andrea dice:

    @Merlinox
    ci proverò e ti faccio sapere :)

  8. Merlinox dice:

    Ottimo @andrea , rimango in attesa allora!

  9. DvD dice:

    Va da se che io sono x l’html puro, cmq x un cliente che mi aveva chiesto di indicizzare il proprio sito realizzato completamente in flash, ho trovato questo link che mi sembra un test piuttosto esaustivo relativamente agli swf http://www.googlerank.com/ita/guida-posizionamento/Google-flash.html , anche se il succo della questione rimane che gli swf sono difficilmente indicizzabili!!!!!

    Meglio continuare con i test sugli script js … bravo Merlinox :D

  10. Merlinox dice:

    Grazie del link @DvD molto interesing, anche se ormai sono fuori da Flash da troppo tempo.

  11. andrea dice:

    @Merlinox
    ho messo la function inline qui: http://www.andreainfusino.com/directory-siti-web/
    vedi il testo in bassissimo alla pagina, vediamo un pò :)

  12. Merlinox dice:

    @andrea attendiamo i tuoi report ;)

  13. Davide dice:

    Credo che l’unico modo per sfatare definitivamente alcuni miti SEO sia quello di sperimentarli, proprio come hai fatto tu. Complimenti!

  14. Merlinox dice:

    Dal punto di vista scientifico non è possibile definire metodologie quando uno degli elementi in questione non ha (tutti) i comportamenti dichiarati.
    L’unica cosa che è necessario fare è qualsiasi cosa possa favorirlo e non penalizzarlo.

  15. Andrea Vit dice:

    Ottimo articolo Merlinox.
    E’ da molto che ci sono le prove tangibili che Google esegue Javascript ed ha acquisito capacità di browsing evolute (ad esempio navigazione menu a tendina con select, compilazione di form, lettura contenuti testo in Flash, ecc.).
    Più che le capacità di browsing dello spider (che hanno valenza solo sperimentale), è da capire quanto un link in Javascript sia diverso da uno in HTML, se passa PageRank…insomma se è un link “normale” come tutti gli altri.
    Dalla mia esperienza mi sento di dire che i link in Javascript non passano ancora PageRank, e spero che non lo facciano mai (in fin dei conti l’accessibilità dovrebbe essere un valore per Google, no?)
    Ottimo post, complimenti!

  16. Merlinox dice:

    Siamo in un periodo di transizione. Sicuramente il concetto di Page Rank inizia ad arrugginirsi, verso un concetto più sociale che tenga in considerazione microblogging, social network, social bookmark… e soprattutto sarà necessario un algoritmo “intelligente” in grado di filtrarne la autenticità: un casino!

    Ieri qualcuno issava la bandiera del addio pagerank anche se secondo me è prestino. Il leader di Facebook annuncia che ambisce a diventare il nuovo riferimento di ricerca. E noi siamo ancora ad aspettare il test di @Andrea!

  17. andrea dice:

    Beh per quanto riguarda il PageRank, volevo aggiornarvi ocl seguente articolo… :P

  18. Merlinox dice:

    @andrea si si lo citava anche @yuri via Twitter. Ma il test di cui parlavamo ieri l’hai checkato?

  19. andrea dice:

    Ah!
    Si ho messo online ma non ha ancora indicizzato la pagina.
    Ogni tanto faccio la ricerca ma non mi esce niente… dobbiamo attendere un pò perchè nella pagina suddetta non c’è un alto traffico!

  20. Merlinox dice:

    @andrea hai messo un’ancora html pura (sempre priva di serp) in modo da verificare se la pagina è già stata indicizzata o no? Altrimenti potresti aspettare per sempre senza sapere se non l’ha ancora indicizzata o se non l’ha proprio considerato.

  21. andrea dice:

    @Merlinox
    la pagina è già indicizzata e raggiungibile, tu dici di mettere un extra-link?

  22. Merlinox dice:

    Assolutamente no @andrea . Se rileggi il mio post ho affiancato i vari esperimenti da una parola nel testo Html normale (es. “mistrofinappamento“). Quindi quella diventa la parola che controlli per vedere se ha indicizzato la pagina: se ha beccato quella deve aver beccato anche le altre, altrimenti significa che non le ha considerate. Capito?

  23. andrea dice:

    giusto, hai ragione… quindi una parola non indicizzata e non esistente per fare il check

  24. Merlinox dice:

    Secondo te non era così chiara la cosa? Magari ci scrivo un posticino dedicato. Che dici? Volevo dirti che la mia “mistrofinappamento” l’hanno già indicizzata. Quandi secondi?

  25. andrea dice:

    No no era chiara… guardando il codice avevo già inseito una parola in html puro e semplice.
    Ogni tanto mi perdo in qualche passaggio e me ne scuso con te se magari ti scrivo 1000 messaggi :)

    Ho visto dal precedente link, beh è stato molto veloce è un ottimo segno e un buon risultato per te :)

    ho provato con la home del mio sito, spero di avere più fortuna! :P

  26. Merlinox dice:

    Una vocina dentro di me @andrea mi dice che sarebbe meglio farlo in una pagina ex novo!

  27. Pingback: SEO: creare un test

  28. Pingback: SEO: setTimeout @merlinox

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

*

È possibile utilizzare questi tag ed attributi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>