Generatore di Meta tags

Meta tag Script 1.0

Tutti si domandano sempre .... come si fa a far rilevare ai motori di ricerca il proprio sito ? Bene esistono due strade:

1) ti registri nei vari motori di ricerca ... piu' paghi e piu' sei in alto .. o cosi' dicono, il mio consiglio e' registrarsi ma gratuitamente e' sempre utile e alcuni motori lo permettono ...

2) mettere del codice all 'interno della pagina html e farsi trovare ... infatti la maggior parte dei motori di ricerca analizza la rete attraverso dei programmi chiamati spider che analizzano periodicamente con una frequenza variante e si annotano le varie pagine che incontrano ma ( e qui viene il bello ) se nelle pagine incontrate non ci sono istruzioni per loro be' non si segnano la pagina e passano al sito successivo ..... i meta tag sono istruzioni per gli spider o robots ... non mi addentro nella spiegazione di ogni meta tag ma lascio qualche link a siti che si occupano di questi argomenti.

http://www.html.it/guida/html_58.htm

http://www.webfract.it/GUIDA/metaname.htm

http://www.webaiuto.it/guide/meta/index.php

http://www.mitama.it/marketing/i_meta_tag.shtml

http://www.turismo.veneto.it/avm/modules.php?name=News&file=article&sid=39

.. bene dopo esservi documentati capirete l'importanza di inserire i meta tag giusti ... e la cosa migliore e' inserirli in ogni pagina del sito ... nel mio caso avevo una 30ina di pagine da modificare e manualmente veniva lunga la cosa ed ecco l'idea .... creare uno script che calcoli alcuni meta tag in base al contenuto della pagina e sono rispettivamente ...

titolo della pagina
META NAME="TITLE" CONTENT= ....

descrizione della pagina ( lo script ricava le prime parole per un massimo di 100 caratteri )
<META NAME="DESCRIPTION" CONTENT=....

parole chiavi che gli utenti possono ricercare per trovarci ( lo script analizza il testo della pagina e ricava tutte le parole maggiori o uguali a tre caratteri escludendo le parole con caratteri di punteggiatura o simili , inoltre crea una seconda lista di parole ma raggruppate 2 a 2 prima partendo dalla prima parola e poi dalla seconda per capirci ecco un esempio ( o guardate l'html di questa pagina :) ...........

Testo: "Ciao sono maurizio e cerco nei motori di ricerca parole"
lista di parole: ciao, sono, maurizio, cerco, nei, motori, ricerca, parole, ciao sono, maurizio cerco, nei motori, ricerca parole, sono maurizio, cerco nei, motori ricerca, parole

in questo modo siamo trovati se qualcuno cerca due parole di senso compito con le virgolette tipo "ricerca parole" )
<META NAME="KEYWORDS" CONTENT=

Diversi meta tag sono sempre uguali per tutte le pagine tipo l'autore, frequenza di passaggio per lo spider o robots, indicazione per lo spider se fermarsi a quella pagina o proseguire per tutte le pagine linkate ec.. e quindi ecco l' esigenza di creare un file contenente i meta tag fissi da aggiungere a quelli dinamici, io ho messo questi:

<META HTTP-EQUIV=reply-to CONTENT="Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.">
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=iso-8859-1">
<META NAME="MSSmartTagsPreventParsing" CONTENT="true">
<META NAME="PRAGMA" CONTENT="no-cache">
<META NAME="RATING" CONTENT="General">
<META NAME="ROBOTS" CONTENT="index,follow">
<META NAME="LANGUAGE" CONTENT="Italian it">
<META NAME="REVISIT-AFTER" CONTENT="1 day">
<META NAME="OWNER" CONTENT="Boymix81">
<META NAME="AUTHOR" CONTENT="boymix81.altervista.org">
<META HTTP-EQUIV="CHARSET" CONTENT="ISO-8859-1">
<META NAME="COPYRIGHT" CONTENT="2004 boymix81.altervista.org">
<META NAME="CLASSIFICATION" CONTENT="Informatica, Internet">

e' abbastanza intuitivo il loro significato.

Se esistono già dei meta tag questi verranno sostituiti, l' unico caso in cui questo procedimento non verra' fatto sara' nel caso in cui il meta sara' un refresh .

Quello che ho voluto fare e' piu' di uno script ma uno strumento utile per chiunque ... mai usato i fogli di stile ? Poichè lo script una volta lanciato analizza tutta la cartella e sotto cartelle in cerca di file htm o html , ho pensato di centralizzare l' uso dei fogli di stile e cosi' ogni pagina analizzata conterra' un collegamento ad un unico foglio di stile, se volete togliere questa opzione bastera' cancellare qualche riga di codice nello script.

Gli spider o robots cercano sempre anche un particolare file chiamato robots.txt all 'interno della radice del sito, lo script si preoccupa di crearlo se non c'e' mettendo del codice che specifica quali motori di ricerca non accettare, ovviamente lo script accetta qualsiasi motore di ricerca.

Lo script e' fatto in bash scripting io lo avvio da una shell linux ( Debian ) , al suo interno contiene anche sottoscript in AWK e poiche' non sono riuscito a farlo in altro modo per togliere dei caratteri di ENTER inutili ho fatto un programmino in C

add_meta.sh -> scripting da lanciare nella root del sito ( in locale )

cut_enter.c , cut_enter -> sorgente in C e rispettivo file compilato eseguibile ( gcc -o cut_enter.c cut_enter da shell per compilare ) del programmino che toglie gli ENTER utilizzato per non avere enter nei meta tag

meta -> file di configurazione per i meta statici

per far funzionare lo script copiare i tre file nella radice del sito ed eseguirlo

#sh add_meta.sh

Ora che avete aggiornato le vostre pagine non dimenticate di scaricarle sul server !

In allegato tutti i sorgenti ...