Il Google OCR Test lo possiamo considerare finito. Il post è stato indicizzato, alcuni amici hanno contribuito a spingerlo in SERP ma nessun risultato.
Nell’immagine che segue lo vedete indicizzato: in seguito ho linkato la pagina su Tumblr dove il testo è stato riportato in Text-Plain. Non funziona nè con il JPG nè con il leggendario PDF (raster!). Attendiamo il futuro, non ci resta altro da fare.
Grazie a tutti
Su Punto Informatico leggo che Google sembra aver implementato nei suoi bot la capacità di fare OCR, cioè di trasformare testi in formato immagine, in testi in formato testo. OCR è l’acronimo di Optical Character Recognition e indica tutti quei software appunto in grado di interpretare il testo dentro normali immagini bitmap / raster.
A questo punto non mi resta che fare un test. Inserisco questa immagine dentro al mio blog: nell’immagine sono contenute parole non indicizzate da google, parole inesistenti.
E ora Google tocca a te: fra qualche giorno proviamo a cercare le paroline…
Ho usato un Arial, più facile di così! Sappi che ho già preventivamente cercato dai ragazzi di BloggerItaliani2.0 un OCR Online. Ho provato WeOcrServer e devo dire che non è andata affatto male.
[20081107-0954] Colgo la segnalazione di Sparazza, e creo pure una versione pdf su google pages. Fra qualche giorno riverifichiamo!
ps: se volete linkare questo post per favorire il test, vi prego di non usare la parole "finte" nei link: grazie!
Le ultime al bancone