File Static Wikipedia



Bayangkan saja, file wikipedia html statik dalam bahasa indonesia, bentuk terkompresi 168MB jadi 3740MB, lha padahal file Wikipedia html yang bahasa Inggris itu 14Gigs, kalau diekstrak jadi segede apa ya?

kalau pengen yang imut2, bisa ambil dump xml wikipedia , baik dalam bahasa indonesia, bahasa inggris maupun bahasa lainnya. yang perlu anda ambil hanya file pages-articles.xml.bz2. beberapa bulan lalu saya ambil untuk idwiki sekitar 100Mb untuk enwiki sekitar 3gb. not bad lah:) kalau diwindows bisa dibaca pake wikiTaxi, untuk di linux belum nemu yang ok nih, pengen nyoba daluang nya om iang cuma belum menyempatkan diri

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s