Cuil sarà davvero il rivale di Google?

Uno sguardo al nuovo motore di ricerca, non esente da difetti nonostante il lancio a livello mondiale.

In questi giorni è stato annunciato in grande stile Cuil, il nuovo motore di ricerca creato da alcuni ex-dipendenti di Google. Presentato come il nuovo rivale, la notizia è stata ripresa a livello mondiale, tanto da vederlo citato anche sui maggiori quotidiani nazionali (vedi La Repubblica ed Il Corriere).

Ma Cuil è davvero così entusiasmante? La mia risposta è no. Si può notare un considerevole lavoro sull’interfaccia e sulle funzioni a disposizione dell’utente, ma quello che manca è l’accuratezza dei risultati. Una grave pecca per un motore di ricerca: se non è in grado di fornire agli utenti quello che cercano, non avrà lunga vita.

Vi basterà fare qualche prova per rendervi conto di come i risultati spesso seguano una logica incomprensibile, fornendo link a pagine del tutto inutili. E’ vero che ha solo pochi giorni di vita e servono delle prove sul campo per affinare i risultati forniti, ma non la ritengo una scusante valida.

Anche SEOmoz ha parlato del lancio di Cuil, in termini non esattamente entusiastici:

Cuil was foolish to launch now. Given the buzz they had and the potential to take market share (even a fraction of a percent is worth millions), they should have had lots of people like me running lots of tests like this, showing them how clearly far behind they were from the major engines. You only get one chance to make a first impression, and theirs was spoiled.

Il punto della discussione è proprio questo (traduco non alla lettera): annunciare Cuil adesso è stato un suicidio. Il ritorno avuto in questi giorni avrebbe permesso ai suoi creatori di guadagnare anche una piccola percentuale del mercato. Tutti gli utenti che hanno testato il motore di ricerca hanno invece avuto risultati insoddisfacenti. C’era una sola possibilità per impressionare i visitatori, ed è stata sprecata mostrando un motore di ricerca in fase embrionale, incapace di restituire risultati coerenti anche alle query più semplici.

La cosa poteva essere gestita diversamente: se ci sono margini di miglioramento sarebbe stato meglio lanciare una fase di beta privata, per poi aprire al pubblico (ed ai grandi media) con algoritmi di ricerca più efficienti.

Per quanto riguarda l’interfaccia, il lavoro fatto è comunque considerevole. Il look è molto curato, le pagine sono navigabili anche con javascript disabilitato, ed eseguendo una ricerca ci sono alcuni suggerimenti sui risultati correlati che meritano attenzione.

In conclusione, non so se Cuil sarà in grado di ritagliarsi una nicchia nel già combattuto mondo dei motori di ricerca, ma sicuramente dovrà passare diverso tempo prima di avere una seconda possibilità da parte degli utenti delusi in questi giorni.

Flash e i motori di ricerca

Il difficile rapporto tra Flash ed i motori di ricerca, analizzando i principali motivi per cui non dovrebbe essere usato per i contenuti.

Dopo l’annuncio di Google della migliorata indicizzazione dei contenuti Flash, diverse persone avranno pensato ad una rivoluzione del web.

In realtà le cose non stanno esattamente così, perchè Flash se utilizzato in maniera sbagliata continua ad avere grandi limiti. Ispirato da un articolo di SEOmoz, voglio approfondire il discorso mostrando le incompatibilità tra Flash ed i motori di ricerca.

1. Le URL non cambiano con i contenuti

A mio parere è uno dei difetti principali di Flash. Quante volte vi è capitato di navigare su un sito realizzato con questa tecnologia, vedere una pagina interessante e volerla linkare? Vi sarete sicuramente accorti che l’unica cosa possibile è indicare la URL della home fornendo le istruzioni per arrivare alla pagina desiderata: scomodo ed inefficiente.

2. Non si guadagnano link esterni

Questa è una conseguenza diretta del primo punto, ed una grave penalizzazione. Considerando che i motori di ricerca si basano anche sui link esterni per ordinare i risultati, realizzare un sito in Flash significa al massimo riuscire a posizionare la propria homepage e niente altro.

3. I testi spesso non sono formattati e ordinati

Molto dipende da chi ha realizzato il Flash, ma spesso i contenuti testuali non rispettano l’ordine logico con cui appaiono nella pagina. Inoltre è difficile trovare dei testi organizzati semanticamente, come accade nell’HTML.

4. Le regole SEO di base spesso non vengono seguite

E’ possibile realizzare delle animazioni Flash e, osservando alcune regole di massima, cercare di farle indicizzare correttamente. Un suggerimento potrebbe essere caricare i contenuti formattati tramite un xml esterno. Nella maggior parte dei casi però chi sviluppa non conosce o non segue queste indicazioni, rendendo impossibile il lavoro dei motori di ricerca.

5. Molti contenuti Flash non vengono comunque indicizzati

Anche rivolgendo la massima attenzione nella realizzazione di un Flash, non avrete garanzie che il vostro lavoro venga indicizzato dai motori di ricerca. Un esempio pratico riguarda Google, che non riesce ancora ad indicizzare i file .swf inclusi tramite SWFObject.

Conclusioni

Uno dei modi migliori per utilizzare Flash resta quello a scopo decorativo: realizzare animazioni ed effetti particolari spesso può essere fatto solo con questa tecnologia. E’ vero che Javascript ci ha riservato numerose sorprese a riguardo, ma non c’è niente di male ad usare Flash per questo.

L’importante è tenere presente che Flash non andrebbe mai utilizzato per i contenuti delle vostre pagine. Se non volete essere penalizzati nei risultati ottenuti, non usatelo per testi, titoli o menu di navigazione, anche se avete intenzione di fornire un’alternativa testuale.

Google non indicizza le URL .0

Comunicazione di Google: gli indirizzi web che finiscono in .0 non vengono indicizzati.

La notizia è recente e decisamente inaspettata: le url che finiscono in .0 sono sotto accusa, non vengono in nessun modo indicizzate da Google. La scoperta è stata fatta da SEOmoz, che in uno dei suoi ultimi post ha spiegato e documentato la vicenda.

Sono state anche messe a confronto le SERP di Google e Yahoo, ed alcune pagine con url di questo tipo indicizzate dal secondo erano del tutto assenti sul primo.

Se guardate ad esempio la pagina con indirizzo en.wikipedia.org/wiki/Windows_1.0 scoprirete che non è indicizzata su Google, ma attualmente esiste una pagina di Wikipedia, en.wikipedia.org/wiki/Windows_1.01 che rimanda ad essa, proprio per evitare il problema.

Se avete un sito, fate attenzione alle url con queste caratteristiche, non avere alcun accesso da Google è sempre un grave svantaggio.

Per tutti coloro che amministrano un sito su piattaforma WordPress comunque non ci sono problemi. Se avete personalizzato la struttura dei permalink, i titoli che finiscono in .0 vengono modificati eliminando il punto. Parole come “web 2.0” diventeranno automaticamente web-20 all’interno della url: anche in questo caso WordPress si dimostra un’ottima piattaforma di blogging.

Nuovo sito TIM: analisi generale

Uno sguardo tecnico al nuovo portale TIM, con particolare attenzione rivolta a grafica, accessibilità, SEO e codice delle pagine.

In questi giorni è stato lanciato il nuovo sito TIM, con nuove funzionalità ed una grafica più curata. Come ho fatto in passato con il sito Feltrinelli, voglio addentrarmi in una veloce analisi per evidenziare pregi e difetti di questa realizzazione.

Faccio notare che questo esame è incentrato soprattutto sull’homepage del sito e non pretende di essere dettagliato: per quello ci sono le analisi tecniche e gli studi di accessibilità, che hanno ben altre modalità.

Grafica: voto 7

Il sito TIM in questa nuova veste appare sufficientemente curato e apprezzabile. Non si è osato molto con i colori, l’unico elemento grafico che emerge sulla home è il banner Flash. Nel complesso comunque la prima impressione è stata positiva.

Accessibilità: voto 5

Al contrario di quello che molti potrebbero pensare, è stata rivolta una discreta attenzione all’accessibilità del sito, ma il lato dolente sono soprattutto le animazioni in flash.

Note positive:

  • Lo slider Javascript in homepage è accessibile anche con js disabilitato
  • Il sito è navigabile anche con le immagini disabilitate

Note negative:

  • Il flash principale sulla home non ha testo alternativo. Al momento appare il testo “Flash top testo sostitutivo”
  • Anche il flash della pagina 119 Area Clienti non ha contenuto alternativo, stessa cosa per altre sezioni
  • I link per ridimensionare il testo si basano su javascript, la funzione non è accessibile con js disabilitato

SEO: voto 3

Questo il punto dolente, ma per i siti famosi è un comportamento diffuso non curarsi del posizionamento: a molti basta puntare sul nome già conosciuto.
Ovviamente non sono d’accordo su questa pratica, perchè i vantaggi di avere un buon posizionamento sarebbero innumerevoli, soprattutto per le pagine diverse dalla home.

  • Gli url sono incomprensibili, la stessa home ha come indirizzo http://www.tim.it/consumer/homepage.do
  • Il title delle pagine è male utilizzato, ed alcune lo hanno uguale
  • Nessuna attenzione è stata rivolta all’ottimizzazione del codice HTML per i motori di ricerca, h1 e altri tag sono inesistenti
  • I meta tag keyword e description sono assenti

Codice XHTML e CSS: voto 4

  • Il div dei contenuti della pagina è successivo al div della sidebar destra
  • Sono presenti troppi CSS inline
  • Il codice XHTML non è semantico, in home non esiste h1, gli h2 sono solo alcuni titoli della sidebar, mentre i titoli dei contenuti principali sono semplici link a dentro dei div.
  • Sono presenti alcuni errori di validazione. Sono però pochi, e nel panorama italiano è cosa quasi da segnalare positivamente.

Conclusione: voto 5.5

Il nuovo sito TIM presenta pregi e difetti. Se meritano una nota positiva l’attenzione ad alcuni dettagli e la grafica, molti altri aspetti potevano essere curati meglio.

Fa piacere comunque vedere che per certi elementi l’accessibilità è stata tutelata, anche se ancora non è sufficiente.

Guida SEO: basi del posizionamento sui motori di ricerca

Alla scoperta di una nuova guida al posizionamento sui motori di ricerca, direttamente da Web Design from Scratch.

Tra i Feed RSS a cui sono iscritto c’è Web Design from Scratch, una risorsa aggiornata meno frequentemente di blog e magazine, ma che raggiunge sempre livelli di eccellenza nei suoi articoli.

E’ appena stata pubblicata una guida al posizionamento sui motori di ricerca, dal titolo SEO Basics, introduction to Search Engine Optimization. Il post è ben dettagliato ed affronta diversi punti, spiegando le basi dell’argomento. Non sarà niente di nuovo per chi già lavora in questo ambito, ma confrontare le proprie convinzioni e rimettersi in discussione credo sia sempre una buona pratica.

Per chi invece non ha alcuna nozione di SEO, è un ottimo punto di partenza per capire come muoversi con profitto.

Tra gli argomenti trattati ci sono:

  • La preparazione di una campagna di posizionamento sui motori di ricerca
  • L’analisi della concorrenza
  • Il funzionamento dei motori di ricerca
  • Come ottimizzare il proprio sito

Come nota conclusiva, segnalo che Web Design from Scratch è lo stesso sito che tempo fa aveva pubblicato la guida sullo stato dell’arte del Web Design, ancora validissima.

Penalizzazione Google: come recuperare PageRank

Google LogoNegli ultimi mesi molti siti sono stati penalizzati da Google: la causa principale sono i link a pagamento soprattutto se privi dell’attributo “nofollow”.

Anche questo sito ha subito una penalizzazione di PageRank per la presenza degli annunci testuali di Text Link Ads, ma dopo alcune novità sulla vicenda la situazione si è chiarita.

Leggo infatti su Master New Media che lo stesso Matt Cutts di Google è intervenuto pubblicamente per chiarire i dubbi di chi è stato penalizzato.

Cosa è successo? Semplicemente che una blogger americana, DazzlinDonna, si è lamentata sul suo blog con lo stesso Matt Cutts di essere ancora penalizzata dopo aver rimosso tutti i link a pagamento. Incredibile ma vero, Matt è intervenuto nei commenti del post aiutando Donna ed altri blogger a recuperare il loro PageRank con consigli decisamente utili.

Questa è la sintesi dei consigli per recuperare PageRank:

  • Eliminare i link a pagamento dall’intero sito
  • Mettere l’attributo “nofollow” su tutti i link presenti all’interno di articoli e recensioni a pagamento
  • Segnalare a Google che il proprio sito è in regola dall’apposita pagina

Dopo aver eliminato i link incriminati ho inviato la richiesta di reinclusione, ed in meno di 24 ore l’homepage di TomStardust.com risulta già con PR 6. Le pagine interne invece hanno ancora PR 0.

Aggiornerò questo post se ci saranno novità. Resta valida la discussione intorno alle decisioni di Google e ai metodi per eliminare concorrenti di AdSense, ma almeno adesso si è fatta piena chiarezza sulle penalizzazioni di PageRank.

Un ultimo consiglio: se il vostro sito dopo qualche mese è ancora penalizzato e siete sicuri di aver fatto tutto secondo le regole, provate a inviare una nuova richiesta di reinclusione.

Posizionamento sui motori di ricerca: qualche consiglio

Ogni tanto mi vengono chiesti consigli per il posizionamento sui motori di ricerca: a volte si tratta di siti amatoriali, in altri casi sono vetrine sul web di attività commerciali, ma sono comunque ben pochi i casi in cui si trova svolto un buon lavoro di ottimizzazione per Google ed affini.

Per chiunque abbia voglia di interessarsi all’argomento SEO, i punti fondamentali da cui partire sono senza dubbio:

  • validità del codice e rispetto degli standard descritti dal W3C
  • contenuti ben organizzati e strutturati, utilizzando codice semanticamente corretto

Iniziando da questa base è possibile ottenere buoni risultati, ma la cosa più importante da tenere presente è che un sito per essere trovato ha bisogno di contenuti da offrire. Molti contenuti. E’ per questo motivo che i blog sono così ben visti dai motori di ricerca: sono una fonte continua di notizie in continuo aggiornamento, ed il patrimonio che mettono a disposizione degli utenti aumenta continuamente, ad ogni post.

Non è però tutto così facile. Ci sono diverse tipologie di contenuti completamente invisibili ai motori di ricerca, inutili ai fini del posizionamento e controproducenti se usate su larga scala.

Vengono descritte benissimo nel post SEU, Search Engine Useless su Standardzilla, che riassumo in breve:

Iframes

Gli Iframe non sono validi usando doctype XHTML. Inoltre visualizzare dei contenuti in questo modo significa non sfruttarli pienamente, perchè gli spider dei motori di ricerca non leggeranno ciò che si trova all’interno della finestra dell’Iframe.

Flash

Il tanto discusso flash è spesso inutile ed impossibile da leggere per i motori di ricerca. Il bello è che il modo per far indicizzare comunque i contenuti ci sarebbe, ad esempio fornendo delle alternative accessibili. Inutile dire che non viene quasi mai usato in maniera corretta.

AJAX

Spesso sinonimo di Web 2.0, AJAX è una tecnologia da usare con cautela. Ne ho parlato anche in passato, riempire un sito di javascript per generare i contenuti è una pessima idea ai fini del posizionamento.

Video e Audio

Come immaginerete, tutto ciò che è video e audio non può essere indicizzato da Google (almeno per ora..). Per risolvere il problema basterebbe rispettare i requisiti per un sito accessibile, ovvero affiancare delle trascrizioni.

Cosa fare se un sito ha tutti questi elementi che non verranno mai letti da un motore di ricerca? Lavorare a posteriori non è mai facile, ma inizialmente puntare sulla pulizia del codice può aiutare molto. Utilizzare il corretto title sulle proprie pagine, eliminare i meta tag obsoleti, fare attenzione ai titoli e magari passare ad una doctype di tipo XHTML sono i primi passi da compiere.

E poi? Dopo questo sarà necessario iniziare a correggere gli errori commessi, sostituendo gli elementi incriminati o fornendo le alternative testuali adeguate, tenendo presente che considerare problemi del genere nelle prime fasi della progettazione avrebbe evitato molti problemi.

Come scrivere contenuti per il web

Web WritingMolto spesso quando si realizza un sito i contenuti sono sottovalutati. Capita che vengano inserite le solite frasi preconfezionate, senza particolare attenzione a quello che si scrive e alle parole chiave utilizzate. Vogliamo parlare di tutte le società che si dichiarano “giovane e dinamica”?

Ci sono anche le aziende che realizzano siti internet basandosi su dei CMS, consegnando al cliente un sito vuoto o quasi. Quante speranze ci sono che quel sito ottenga un buon posizionamento o faccia un’impressione positiva ai visitatori? Pochissime, soprattutto se i contenuti saranno scritti da una persona senza alcuna formazione in materia.

Oltre a conoscere la lingua italiana, un buon redattore dovrebbe avere anche avere buone doti tecniche come:

  • conoscenze di SEO
  • capacità di image editing, se l’editore ha la possibilità di inserire immagini e foto
  • basi di accessibilità, ad esempio per i contenuti alternativi delle immagini e per non veicolare informazioni solo tramite il colore

Entriamo nel dettaglio dell’analisi con alcuni suggerimenti.

Consigli pratici

Il primo punto fondamentale, da tenere sempre presente quando si scrive per il web, è che internet non è la carta stampata. Se un titolo scritto senza troppa attenzione su un giornale può passare inosservato, qui ha un peso enorme. Ci sono i visitatori, ma è importante considerare anche i motori di ricerca, ed un titolo ambiguo o privo delle keywords che ci interessano è sempre controproducente ai fini dell’indicizzazione.

Quando si scrive il contenuto di una pagina è fondamentale decidere in partenza quali siano le parole chiave che vogliamo posizionare. Queste andranno usate nel titolo della pagina, possibilmente nel titolo della finestra del browser (il tag <title>), ed all’interno del testo, magari con qualche sinonimo.

Da notare che questo discorso non è valido esclusivamente per i blog, anzi. I blog hanno il grande vantaggio di essere già molto amati dai motori di ricerca, mentre un sito web deve riuscire a farsi indicizzare in uno specifico campo senza avere tutti gli aggiornamenti frequenti di un diario online.

Attenzione però a non esagerare. E’ una questione delicata, perchè non bisogna incorrere nell’errore opposto, ovvero pensare solo a Google dimenticandosi della parte umana: i lettori. La difficoltà è proprio nel trovare il giusto equilibrio, per ottenere buoni risultati in ambito SEO e farsi apprezzare anche da chi naviga sul web. L’uso smodato di parole chiave è dannoso, poco utile per il visitatore e ad alto rischio ban da parte dei motori di ricerca.

Ecco quindi l’altro aspetto: su internet non si pubblica mai uno scritto autorevole, a meno che non vi chiamiate Jakob Nielsen (se non avete idea di chi sia devo cominciare a preoccuparmi per le mie battute geek). Bisogna sempre porsi al centro di un dialogo, di uno scambio con il visitatore, interagendo e rimanendo sempre disponibili per rispondere a tutte le richieste.

Cosa fondamentale da ricordare è che i testi devono essere ridotti al minimo, semplici ed essenziali. Una volta scritto un contenuto, dovrete tagliarlo, accorciarlo, e poi tagliarlo di nuovo finchè non raggiungerà la dimensione ideale. Solo così potrà essere diretto ed arrivare a colpire nel segno.

Per approfondire l’argomento vi consiglio:

Google non legge i commenti HTML

HTML commentUno dei dubbi tra coloro che si occupano di SEO riguarda il codice HTML commentato. C’è chi ritiene che gli spider dei motori di ricerca leggano comunque questi contenuti, soprattutto quando contengono dei link, e chi invece ritiene che i commenti siano ignorati.

Per rispondere a questo dubbio è stato portato avanti un test, ideato dall’utente claudioweb sul forum di Giorgio Taverniti.

E’ stata creata una pagina ottimizzata per una keyword fino a quel momento inesistente, e questa pagina è stata linkata in un sito con PR 5, tramite un link commentato.

Risultato: dal 24 Febbraio 2007 all’8 Agosto 2007 questa pagina non è ancora stata indicizzata da Google, sono passati degli spider, ma sono di motori di ricerca minori e praticamente ininfluenti.

Questo esperimento fa quindi capire che i commenti nel codice HTML vengono ignorati dai motori di ricerca, come era lecito aspettarsi.

I commenti, la censura e le keywords

Commento in forma di fumettoDa qualche tempo ho introdotto su questo sito la classifica dei maggiori commentatori tramite un plugin di WordPress. La cosa ha i suoi pro e contro, ma devo ammettere che sta servendo allo scopo che mi ero prefissato, ovvero quello di incentivare i visitatori a lasciare un segno della loro presenza. Sicuramente c’è chi è stato stimolato maggiormente dalla possibilità di avere un proprio link in homepage, ad altri la cosa non ha cambiato niente, ma comunque sia la partecipazione è salita.

Spero che ci siano anche altri motivi dietro a tutto questo, ma per il momento mi limito ad analizzare i fatti.

Oggi però un articolo sul blog di html.it ha sollevato una questione molto diffusa in tutta la blogosfera, che riguarda il modo di firmarsi nei commenti. Principalmente ci sono 3 correnti:

  • Chi si firma con il nickname o il nome
  • Chi usa il nick/nome seguito da qualche parola chiave collegata alla propria attività
  • Chi si firma esclusivamente con keywords, pensando esclusivamente ai motori di ricerca

In questo sito ho voluto evitare stratagemmi e lasciare più libertà possibile, anche perchè non mi piacciono le censure: non c’è moderazione dei commenti, i collegamenti non hanno il famigerato rel=”nofollow”, e non ho mai cancellato nessun intervento. Vorrei però cogliere l’occasione per dire la mia.

Ho lasciato questa libertà perchè io per primo non sopporto le imposizioni dall’alto, e provo fastidio quando devo aspettare per vedere pubblicato un commento nei blog altrui. Ci sono però alcune situazioni che ritengo fuori luogo, e capisco poco chi si firma con delle keywords sperando di venire indicizzato con maggiore successo da Google.

Secondo voi ha senso? E’ corretto presentarsi agli altri utenti in questo modo? Francesco de Francesco sottolinea come spesso sia pericoloso adottare certi metodi, anche perchè a lungo termine è la trasparenza che viene premiata, sia dagli utenti che dai motori di ricerca.

Ogni tanto bisognerebbe ricordare che internet è fatta per gli utenti, ed il primo obiettivo dovrebbe essere relazionarsi in maniera onesta e sincera con gli altri. Ci vuole molto per guadagnarsi la fiducia di qualcuno, un attimo per perderla.

In ogni caso non voglio cambiare niente ed ho intenzione di continuare a seguire la mia linea di pensiero, se da questa discussione uscirà qualcosa di costruttivo sarà tanto di guadagnato. Cosa ne pensate? A voi la parola!