Sitemap'ın öneminden ve nasıl üreteceğinizden daha önce bahsetmiştim (Dinamik sitemap.xml oluşturmak).

Sitemap.xml dosyanızı oluşturdunuz peki sonra?

Tabiki arama motorları servislerinin botları sitenize geldiğinde ilk olarak sitemap.xml'inizi bulmaya çalışacak, bulduğu zaman da site indeksini hızlıca çıkaracaktır. Fakat botlar sık sık sayfalarınızı gezse de sitemap.xml'inizi her zaman anlık olarak kontrol etmezler.

Arama motorlarının ping servisleri vardır ve bu servisleri kullanarak sitemap.xml'inizin güncellendiğini, hemen kuyruğa alınmasını istediğinizi belirtebilirsiniz. Bu uygulamayı birçok büyük web servisi, wordpress, blogger gibi blog hizmeti veren servisler, hatta kendi sunucunuza kuracağınız wordpress de bunu yapmaktadır.

Yeni bir içerik girildiği zaman sitenize yeni sayfalar eklenmiş, bazı varolan sayfaların da güncellenmiş olması anlamına gelmektedir. Arama motorlarının bu değişiklikleri hemen tarafamasını isterseniz az sonra anlatacağım ufak teknikle bunu yapabilirsiniz.

Ping servisleri

Arama motorlarının birçoğu ping servisini bir URL üstünden sitemap.xml dosyanızın adresini alarak yapar. Aslında bir çeşit kayıt olma işlemidir ama çok daha basit hali. Örneğin google'ın ping servisi
http://www.google.com/webmasters/sitemaps/ping?sitemap=
şeklindedir. Tabiki bu url'in sonuna sitenizin sitemap.xml dosyasının url'ini vererek bu adresi çağırmanız gerekir.

Şimdi kod üzerinde bir dizide popüler arama motorlarının ping servisleri ve yapılarını göreceksiniz. Zaten kodun yaptığı işi hemen anlayabilirsiniz. Basitçe sitemap.xml dosyanızı belirten urlleri "file" fonksiyonu ile almaya çalışıyoruz. Zaten bu url'ler ziyaret edildiği ve cevapları geldiği için bu servisler pinglenmiş olacak.
$services = array(
	'http://www.google.com/webmasters/sitemaps/ping?sitemap=

',

'http://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap=

',

'http://webmaster.live.com/ping.aspx?siteMap=

',

'http://www.bing.com/webmaster/ping.aspx?siteMap=

',

'http://submissions.ask.com/ping?sitemap=

'

); $mysitemapfile = 'http://mysite.com/sitemap.xml'; foreach($services as $service){ $url = str_replace('

', $mysitemapfile, $service);

@file($url); }
Hazırlayan : Mehmet Fatih YILDIZ
31 Aralık Perşembe ´09   —   13 Yorum
"Sitemap nedir önemi nedir" diyenler şuradan (Vikipedi: Site haritası) devam etsinler.

Şimdi gelelim öneminden çok üretilmesine. Basit bir xml aslında. Fakat eğer sürekli güncellenen yapıda bir siteniz var ise bu xml'i periyodik olarak yenilemeniz gerekir. Tabi ki yüzlerce sayfası olan bir sitede (örneğin blog) bu linklerin envanterini bir xml'de tutmak oldukça zor olacaktır.

Çoğu web uygulamasında sayfaların içerikleri veritabanında tutulan bilgilerin listelenmesi ve detay sayfalarından oluşmaktadır. Yazılar, Arşiv sayfaları, Fotograf sayfaları, Forumlar, forum konularının bulunduğu sayfalar vs. Bu sayfaları listeleyen/gösteren php dosyaları olduğunu düşünürsek sitemap.xml'i oluşturacak kodun bu içerikleri sadece adresleyerek listelemesini yapacak bir kod olduğunu söyleyebiliriz.

Bu içerikleri listeleyerek sadece o içeriklere ait sayfaların URL'lerini oluşturan bir php dosyası düşünün. Basitçe örnekleyeceğim.
Mesela forum adında bir tablonuz var ve bu forum'un site haritası için sadece URL'leri gerekli ve bunu oluşturan ufak bir kod vermek gerekirse :
// forum konularini veritabanindan alalim
$sorgu = mysql_query("select id from forum_konular order by tarih asc");

$forum_konu_adresleri = array();
while( $konu = mysql_fetch_assoc($sorgu) ){
	$forum_konu_adresleri[] = 'http://mfyz.com/?/konu/'. $konu[id] .'/';
}
bu kod, forum konularının sayfalarını URL dizisi olarak oluşturur. Yani 156 nolu forum konusuna erişilecek URLhttp://mfyz.com/?/konu/156/ şeklindeyse bu URL'i veritabanının yapısına göre oluşturduğunuzu düşünün.

Şimdi sitenizin diğer bölümlerini de bu URL listenize ekleyin. Bu liste 50.000 URL'e kadar olabilir, çünkü sitemap.xml dosyalarında en fazla 50.000 url indeksleyebilirsiniz.

Bütün url listenizi oluşturduğunuzda aşağıdaki yapıda bir XML oluşturmak için gerekli ufak php kodunu vereceğim.
Önce örnek bir sitemap.xml dosyasına bakacak olursak :
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.fem14.tr.gg/schemas/sitemap/0.9 
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
	<url>
		<loc>http://www.mfyz.com/adres1</loc>
		<lastmod>2007-10-10</lastmod>
		<changefreq>daily</changefreq>
		<priority>0.9</priority>
	</url>
	<url>
		<loc>http://www.mfyz.com/adres2</loc>
		<lastmod>2007-10-10</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.5</priority>
	</url>
</urlset>
Burada urlset nodu içinde url elementini ve loc, lastmod, changefreq, priority alt elementlerini görebilirsiniz. Şimdi basitçe elinizde olan sitedeki tüm sayfaları belirten URL dizisini dönüp bu XML'i oluşturabiliriz.

Eğer veritabanınınzda bu sayfaların oluşturulma tarihleri gibi bir bilgi saklıyorsanız XML'de bunu belirtmeniz iyi olacaktır. Bundan önemlisi changefreq ve priority'dir. changefreq belirttiğiniz url'deki sayfanızın değişme sıklığını arama motoruna söyler. Arama motoru da o değişiklik sürecine göre o sayfayı o periyodda tarayacaktır. Priority de o sayfanın sitenizdeki içerik etkisini ifade edebilir. Mesela forum sitenizin asıl içeriği olmayabilir, ya da fotograflar sitenizin içeriğine çok etkisi olabilir ve 0-1 arasında yüzdelik belirtir gibi öncelik belirtebilirsiniz.

Şimdi bir URL dizisini sitemap.xml dosyasına çevirecek php koduna bakarsak :
// begin xml content
$XML_Content = '<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.fem14.tr.gg/schemas/sitemap/0.9 '."\\n".
'http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">'."\\n";

foreach ($urllist as $url){
	// defaults
	$date     = date('Y-m-d');
	$freq     = 'monthly';
	$priority = '0.5';

	// setting values
	if( is_array($url) ){
		// custom params
		if( $url[date] )     $date     = $url[date];
		if( $url[freq] )     $freq     = $url[freq];
		if( $url[priority] ) $priority = $url[priority];
		$url = $url[url];
	}else{
		$url = $url;
	}

	// adding to xml content
	$XML_Content .= "\\t<url>\\n".
	"\\t\\t<loc>$url</loc>\\n".
	"\\t\\t<lastmod>$date</lastmod>\\n".
	"\\t\\t<changefreq>$freq</changefreq>\\n".
	"\\t\\t<priority>$priority</priority>\\n".
	"\\t</url>\n";
}

$XML_Content .= "</urlset>";
en son XML_Content değişkeninde sakladığınız içeriği
$file = fopen('sitemap.xml', 'w') ){
fwrite($file, $XML_Content);
fclose($file);
ile sitemap.xml dosyası olarak kaydedebilirsiniz. Bu işleri yaptırdığınız php dosyasını da sunucunuzun cron'una haftada veya ayda bir çalışacak şekilde ayarlarsanız site içeriğinizi düzenli olarak bu dosyada toplayabilirsiniz.

Siteye yeni bir içerik eklendiği zaman da bu betiğinizi tekrar çalıştırarak eklenen içeriği doğrudan sitemap.xml'inize ekleyebilirsiniz.

Google Webmaster Tools kullanarak bu sitemap.xml dosyanızı google botlarına düzenli kontrol etmesi için gönderebilir, google'ı pingleyerek bu dosyayı taramasını söyleyebilirsiniz. Arama motoru servislerini pinglemek ile ilgili konuyu başka bir yazıda anlatacağım.

Hazırlayan : Mehmet Fatih YILDIZ

Popüler Etiketler

newsletter mail internet statistics ubuntu ntfs fstab html windows linux xhtml css php javascript job wanda digital pharma hack wordpress google seo assets framework twitter widget ide editor phpstorm jetbrains deployment version control svn git less facebook connect api box jquery plugin blog rss gimp howto nasıl lifestream mfyz proje open source lisans xml nedir workspace spam medya bootstrap css3 iOS webkit web app app music mobile table iphone media optimizasyon form button auth http dokuman portfolio social share meta htaccess mod_rewrite url cookie language development style export apache route router firefox opengraph optimization fql örnek kod mysql pgsql sql mssql internet explorer download icon ikon grafik banner calendar logo generator js date tarih compile konsol mdb2 pear injection www subdomain redirect crossdomain login session terminal search apple macosx license chart link ajax server osx applications free network html5 subversion diff while compiler on-the-fly doritos kampanya tytz regex signature imza istatistik sosyal object ipad db database service kitap ui design ruffles developer startups zaman prepare execute analyse procedure parse tool browsers mootools ipucu sitemap kurulum query wireless ux icons ie browser subscription insanlar player ios itunes cms graph screen radio coding tebrik xmlhttprequest notebook laptop support kontrol yapıları if oyun cache app store store in-app purchase purchase verification storekit itunes connect integration switch textarea select code input