Mengatasi duplikat konten blogspot tentang penyempurnaan HTML

Diposkan: 18 November, 2013
Sebelumnya perlu di ketahui terlebih dahulu tutorial ini untuk platform blogspot/blogger. Berbagai masalah sering terjadi terhadap blog kita ketika kita sign in di Google tools webmasters [ganti nama menjadi Google Search Consol], biasanya ada tentang penyempurnaan HTML. Seperti  pesan status dari Google Search Consol yang memberitahukan bahwa  adanya masalah pada konten dalam blog anda weehhh... Misalny tag judul yang ganda serta deskripsinya. Bila hal tersebut kita biarkan,  blog kita akan melemah seiring terjadinya penggandaan konten dan berjalannya waktu ke waktu.

Maka ada baiknya kita analisa apa saja yang menyebabkan duplicate tersebut dalam blog kita. Dan kita akan kenali jenis atau type halaman yang sering terjadi penggandaan termasuk duplicate (versi mobile, versi desktop, showcomment dan lain lain) terkecuali duplicate yang tidak dapat dihindari seperti halaman index selain home page.

Duplicate pada versi mobile, Desktop, domain (.in, .de, tw) dan showcoment.

Pada dasarnya  ketika kita tidak menghapus kode <b:include data='blog' name='all-head-content'/> maka duplicate seluler atau pun desktop showcomment atau pun subdomain blogspot (bila kita belum mengcustom domain sendiri) maka jarang terjadi. Code <b:include data='blog' name='all-head-content'/> element  ini seharusnya ada di bawah <head> karena kode tersebut mencakup beberapa fitur penting semisal :
  • Canonial link element, Meta tag blogger, Meta tag description, Link Favicon dan lain lain serta Tag tersebut memegang peranan penting untuk cruwel mesin pencari.
Pada posting sebelumnya kita telah menyinggung nyinggung tentang memastikan canonical link element. Dimana di post tersebut saya menjelaskan cara pengambilan canonical link di blogger. Apabila canonical link element hanya di ganti dengan data:blog.Url ketika meniadakan kode tersebut, maka blog di blogspot akan selalu di rundung masalah dengan cruwel mesin pencari, karena pemanggilan data:blog.Url ini tidak dapat memberikan Tag canonical link element di blogspot. Secara gampang kita ambil contoh pemasangan widget jejaring sosial (ketika kita mengganti defaultnya blogger) untuk berbagi tautan apabila kita hanya memasang data:post.Url maka akan memiliki tiga varian Url (mobile, desktop, canonical), bila blognya mengaktifkan mobile custom maka di ujung Urlnya akan ada(?m=1), jika saat berada di Url desktop akan ada (?m=0). 

Seharusnya Url yang akan di bagikan tersebut adalah yang canonical link bukan yang customissed, yang tidak terpengaruh oleh Url mobile dan desktop. Maka kita harus menambahkan menjadi data:post.canonicalUrl agar yang di bagikan tersebut adalah Url asli (canonical link element).
Sampai disini kita anggap duplicate (versi mobile, versi desktop, showcomment, domain blogspot) telah selesai dengan Canonical link element yang tepat dan benar,  Jika masih yaaaa.. mau tidak mau kita memanfaatkan <b:include data='blog' name='all-head-content'/>.

Selanjutnya melangkah mengatasi duplicate title tag pada halaman index (folder directory search).

Duplikat Konten Karena Halaman Label

Pada dasarnya halaman label adalah type halaman yang dikumpulkan berdasarkan label yang kita buat. Mengapa halaman label menyebabkan duplicate? Karena judul atau title kita tidak berubah pada halaman, saat halaman label berikutnya (pembaruan laman label). 

Contoh format url index label :
  • http://copygocopy.blogspot[dot]com/search/label/Trik%20mobile%20blogs/max-results=5
  • http://copygocopy.blogspot[dot]com/search/label/Trik%20mobile%20blogs?updated-max=2012-12-11T04:22:00-08:00&max-results=5&start=5&by-date=false
Dari ke dua varian Url di atas judul atau title tidak pernah berubah, maka bila pada kondisi tersebut mesin pencari di bolehkan mengindex konten kita, tentu saja akan terjadi penggandaan judul/title (kemungkinan description ikut tergandakan bila kita memanfaatkan default blogger). Maka dari itu pada laman label tidak boleh mesin pencari mengindex konten blog kita. Bila kita tidak ingin terduplicate title tags.

<b:if cond='data:blog.searchLabel'>
Robots nofollow atau noindex harus tampil
</b:if>

Duplicate kontent halaman Search atau pencarian Query

Mungkin ini jarang terjadi duplicate konten pada halaman pencarian atau hasil penelusuran Query di blog. Secara garis tipis halaman penelusuran Query adalah type kumpulan posts yang di kumpulkan berdasarkan kata kunci bila tersedia Query. Dan kemungkinan besar akan terjadi duplicate title bila mesin pencari di bolehkan mengindex kontent kita, mengapa? Alasannya adalah seperti halnnya halaman label, akan terjadi duplicate title / judul pada laman berikutnya (laman pembaruan Query). Contoh format Url
  • http://copygocopy.blogspot[dot]com/search?q=dengan
  • http://copygocopy.blogspot[dot]com/search?q=dengan&updated-max=2012-12-25T04:20:00-08:00&max-results=20&start=9&by-date=false
Dari ke dua Url di atas judul atau title tidak berubah pada laman berikutnya, Maka dari itu pada kondisi seperti ini  mesin pencari jangan di izinkan mengindex konten blog kita.

<b:if cond='data:blog.searchQuery'>
Robots nofollow atau noindex harus tampil
</b:if>

Duplicate konten karena halaman archives

Type halaman archives halaman kumpulan posts yang di kumpulkan berdasarkan archives pada bulan dan tahun. Contoh dalam bulan oktober 2013 berapa postingan kita posting posts dan seterusnya. Sepengatahuan penulis blog ini waktu blog ini terindext type halaman archivesnya, Archives tidak menyebabkan duplicate Title atau judul, selagi kita memasang title tag dengan benar dan tepat kecuali. Sebagai contoh taruhlah title tag tersebut standart blogger (<title><data:blog.Pagetitle/></title>). 

Mengapa? Karena pada halaman archives title atau judulnya selalu berubah ubah sesuai archives pada bulan dan tahunnya masing masaing. Dan pada halaman navigasi next page (pembaruan laman) link tersebut mengarah ke halaman index directory search (search?update..........). Tetapi bila ada suatu kasus pada laman archives terjadi duplicate title atau judul bahkan hilang judulnya berarti ada yang tidak tepat pada penggunaan Title tagsnya atau Canonical link element.

Namun kalau archives di klaim sebagai duplicate content maka adalah Iya, Karena laman archives adalah posts yang dikumpulkan berdasarkan bulan dan tahun. Dan apabila kita tidak memanfaatkan fitur readmore atau jumplink sebagai pemotong (full posts) maka akan terbuka full posts berdasarkan bulan dan tahunnya terdapat berapa posts (contentnya) yang sama pada halaman singel posts article. Dan di samping itu unsur penekanan (nama) judul / title ada pada bulan dan tahun, Contoh title atau Judul :
  • Desember 2012 (judul bar browser)
  • http://copygocopy.blogspot[dot]com/2012_12_01_archive.html
  • Juni 2013 (judul bar browser)
  • http://copygocopy.blogspot[dot]com/2013_06_01_archive.html

Tetapi apabila kita risi ataupun tidak menginginkan content archive kita tidak terindex maka kita bisa memanfaatkan meta robots.

<b:if cond='data:blog.pageType == &quot;archive&quot;'>
Robots nofollow atau noindex harus tampil
</b:if>

Duplicate halaman directory  /search

Type halaman directory search ini menyebabkan terjadinya duplicate title yang susah di hindari, Biasanya ada pada laman pembaruan posts sewaktu kita berada pada home page dan akan melihat posting lama / Older posts. Maka judul atau titlenya sama  dengan beranda / homepage atau bahkan jika pernah mengubah title tag tidak tepat maka judulnya justru akan hilang.  Kecuali sudah menggantinya title dengan memanfaatkan Conditional tag <b:if cond='data:blog.pageName == &quot;&quot;'> jelasnya ketika kekosongan judul nama content. Contoh format Url :
  • http://copygocopy.blogspot[dot]com/search
  • http://copygocopy.blogspot[dot]com/search?updated-max=2013-06-28T05:45:00%2B07:00&max-results=5
Maka pada kondisi seperti ini mesin pencari jangan di bolehkan mengindex konten blog kita. Dan kita dapat mencegah dengan meta robot seperti ini.


<b:if cond='data:blog.pageName == &quot;&quot;'>
Robots nofollow atau noindex harus tampil
</b:if>

Solusi atau mengatasi duplicte content di blogspot

Dari uraikan di atas maka kita tahu dimana terjadi duplicate content atau title / judul yang tidak dapat (susah) di hindari.  Maka disini akan membagi cara mengatasi duplicate content di blog blogger dengan dua metode yang mungkin bisa anda manfaatkan salah satu metode :

  1. Mengatasi duplicate content memanfaatkan meta Robots di tanamkan di dalam template.
  2. Mengatasi duplicate content melalui dashbord Aktifkan tag header robots khusus dan Robot txt khusus.

1. Metode pertama yaitu menggunakan meta robots di template

Dari beberapa uraian yang kita jelaskan di atas terjadi duplicate content seperti : label, pencarian query, pembaruan laman kita bisa memanfatkan Conditional tag index di kecualikan pada halaman Beranda atau Home Page.

<b:if cond='data:blog.homepageUrl != data:blog.url'>
<b:if cond='data:blog.pageType == &quot;index&quot;'>
Robots nofollow atau noindex harus tampil
</b:if>
</b:if>

Tetapi apabila risi dengan terindexnya archives di mesin pencari seperti Google, Bing dan Yahoo, maka copy gabungan code di bawah ini tempatkan di bawah kode <head> di template blog blogger anda.


<!-- SEO pageType search_engine noindex content_blogs.. -->
<b:if cond='data:blog.homepageUrl != data:blog.url'>
<b:if cond='data:blog.pageType == &quot;index&quot;'>
<meta content='noindex, nofollow' name='robots'/>
<b:else/>
<b:if cond='data:blog.pageType == &quot;archive&quot;'>
<meta content='noindex, nofollow' name='robots'/>
</b:if>
</b:if>
</b:if>
<!-- End -->

2. Metode kedua yaitu menggunakan  Robots txt.

Masuk ke dashboard, klik setelan, klik Preferensi penelusuran, Temukan yang seperti gambar di bawah ini.



Pasang robots di bawah ini tempatkan seperti gambar di atas, Jangan lupa edit tulisan background berwarna merah lalu simpan.

User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Allow: /

Sitemap: http://copygocopy.blogspot.com/sitemap.xml
Sitemap: http://copygocopy.blogspot.com/sitemap-pages.xml


Catatan pembaruan :
Jadi ketika mendaftarkan blog yang anda buat menggunakan Blogger ke mesin pencari web, bila diminta sitemap.xml, kasih seperti dibawah ini. Dan perlu diperhatikan jika blognya belum mengkustom domain, yang didaftarkan adalah yang versi [com], bukan yang [co.id] atau yang versi negara lain.

#Sitemap untuk posting blogspot:
http://copygocopy.blogspot.com/sitemap.xml

#Sitemap untuk laman(halaman) blogspot:
http://copygocopy.blogspot.com/sitemap-pages.xml

Beberapa bulan lalu yang Team Blogger(Googler) membuatkan sitemap untuk laman. Sehingga robot.txt bisa disesuaikan ulang lagi.

Dan diantaranya poin penting adalah Canonical Link Element yg ada attribute rel canonicalMenguji memastikannya triknya seperti ini, dan HTMLnya di template kurang lebih seperti ini.

Dari robot txt tersebut mengintruksikan bahwa Url dari folder akar (directory /search) mesin pencari tidak di bolehkan mengindex konten blog kita. Mulai dari directory /search (search/label.., search?update-max..., search?q=Query dan seterusnya) atau bisa dikatakan halaman index kecuali home page.

Agar halaman archives tidak terindex oleh mesin pencari, geser ke bawah serta Aktifkan tag header robot khusus. Selanjutnya tinggal sesuaikan seperti gambar di bawah ini pada baris archives dan penelusuran :



Centangi noindex, nofollow, noarchive lalu simpan perubahan. Jadi cara mengatasinya duplicate content di blog blogger bila title tags dan canonical link element tepat, maka kita hanya tidak membolehkan mesin pencari mengindek konten pada kondisi halaman Index kecuali homepage dan halaman arcives.

Sehingga konsepnya halaman yang dioptimasikan atau di bolehkan mesin pencari mengindek konten blog kita hanya ada 3 jenis type halaman :
  1.  Home page / beranda.
  2.  Laman singel posts / full post artikel (kecuali).
  3.  Laman static page (kecuali).
  4. Laman (404).
Pengecualian ini pada halaman singel posts / full post artikel dan laman static page yaitu. Apabila kita membuat post ataupun laman static kontennya yang kita buat sifatnya adalah privasi..?, tentunya hal ini di balikkan lagi pada masing masing pengguna. Sisa menyesuaikan seperti gambar di bawah ini.



Centangi noindex, nofollw, noarchive lalu simpan perubahan. Bila tidak menginginkan diantara 1, 2, 3 post atau laman static tidak terindek oleh mesin pencari lalu simpan.

Dan bila mana tidak bekerja maka dari dua metode tersebut di gabungkan.

Untu melihat hasilnya, tentu saja memerlukan waktu, jika konten blognya banyak mungkin membutuhkan yang lumayan. Serta mesin pencari semisal google akan mengatur indexnya lagi.

Sedangkan sampai saat ini, blog ini tidak lagi ada duplicate content, description, tag judul yang hilang dan lainya.


Sumber gambar : 
  Google Webmasters Tools siteUrl : http://copygocopy.blogspot[dot]com/

------------------------------------------------
#Dierbaharui ulang 16-12-2015

7 komentar

  1. Komentar ini telah dihapus oleh administrator blog.

    BalasHapus
  2. ini baru komplit, semoga 200+ error yang melanda blogku bisa teratasi, terima kasih mas

    BalasHapus
  3. Pertama tama saya ucapkan Terimakasih banyak kepada anda,setelah pemasangan , dibawah head,seta robots.txt dan Tag tajuk robot khusus..duplikat kontennya berkurang meskipun sisa bebrapa,
    mau tanya nich bolehkah dalam robots txt ditambahkan Disallow: /?m=1 , Disallow: /?m=0 , Disallow: /*?m=1 , Disallow: /*?m=0...Terimakasih

    BalasHapus
    Balasan
    1. Kan defaultnya robots.txt sudah di pasangkan dari Blogger, jika di nonaktifkan robots.txt khusus.
      coba saja akses blog ini, blog ini kita nonaktifkan robots.txt khususnya, tapi masih adakan :

      http://copygocopy.blogspot.com/robots.txt

      Dan sisanya mencentang yang di bawahnya Tag tajuk robot khusus, centang saja nofollow dan noindex pada bagian [Laman Arsip dan Penelusuran:]. Sebaiknya jangan, Nanti di hasil penelusuran Google saat di smartphone description akan di ganti dengan --> Deskripsi untuk hasil ini tidak tersedia karena robots.txt situs ini - pelajari lebih lanjut.
      Sedangkan url yg di crewel dengan akhiran ?m=1, ?m=0, ?showComment={....}, ?variable={...} di info Google webmaster --> Google Search Consol. Berarti di template blognya tersebut tidak ada canonical link element URL yg di tandai dengan rel='canonical', bisa juga lebih dari satu dalam 1 laman. Atau atributte relnya saja yang canonical namun linknya tidak canonical. Kamu pastikan di HTML template blog kamu ada tag :

      <b:include data='blog' name='all-head-content'/>

      Atau jika tidak menginginkan tag di atas dengan alasan alasan tertentu, ngambil canonical link element Blogger nya seperti gini. Ini wajib ada, Hukumnya fardhu ain eeeeeeeetss...!!!, jika ingin tidak tejadi duplikat dalam Google mengcrewel link Blog [?m=1 & ?m=0].

      <link expr:href='data:blog.canonicalUrl' rel='canonical' />

      Sedangkan untuk meta dan yang lainnya sesuaikan sendiri. Dan kamu pastikan Tag (title / judul) di tiap laman blog selalu berbeda dan ada. Khususnya di laman : Beranda, Laman posting, Laman Page statis, Laman arsip.

      Logikanya di HTML template Blog seperti ini, Ini Hanya contoh saja.
      -------------------
      <html>
      <head>
      <meta content='menyesuaikan dengan template yang di pakai.....' name='viewport'/>
      <title>Judul</title>
      // Semua data blog yang di atas...
      <b:include data='blog' name='all-head-content'/>
      //.........
      </head>
      <body>
      //.........
      </body>
      </html>
      -------------------
      Logika kedua tidak menginginkan tag data name='all-head-content', alasannya apa kita juga kurang paham.
      -------------------
      <html>
      <head>
      <meta content='menyesuaikan dengan template yang di pakai.....' name='viewport'/>
      <title>Judul</title>
      // Belum Semua data blog yang di atas ...
      <link expr:href='data:blog.canonicalUrl' rel='canonical' />
      // tag meta & link yang lainnya sesuaikan sendiri ...
      // ....
      </head>
      <body>
      //.........
      </body>
      </html>
      ------------------
      Namun kalau menurut saya pribadi, dengan meniadakan tag ini hanya akan menyusahkan yang ngeblog sendiri dan akan belepotan tentunya. Sebagai contoh :
      Tidak bisa memanfaatkan Open ID blognya, padahal di settingan blog sudah di izinkan komen menggunakan Open ID, karena tidak ada seperti link seperti ini
      <link rel="openid.server" href="http://www.blogger.com/openid-server.g" />
      <link rel="openid.delegate" href="http://namablog.blogspot.com/" />
      dan masih banyak lainnya lagi...
      Dan perlu di ketahui sebelumnya nantinya yang akan di index oleh mesin pencari web hanya:
      Laman Beranda, Laman Posting (banyak), Laman Static Page (20 laman jika dipakai semua), Laman tidak di temukan (404).

      Mudahan bisa membantu....

      Hapus
  4. Apakah tips ini masih berlaku tahun 2017? dan apakah template ini Sitemap: http://www.dukunsantet.com/ work di tahun 2017, soalnya banyak error

    BalasHapus
    Balasan
    1. Masih, Sitemap untuk Blogspot(Blogger) ya gitu-gitu aja. Terjadi perubahan dari yg mengelola BLOG saja, perubahan hanya protocolnya atau domainnya (yg di inanginya / diganti).

      Kecuali dari Blogger ada penambahan directory selain (posting dan laman) yg bisa untuk menulis artikel seperti (posting dan laman)..

      Hapus
  5. Terima kasih totorilnya, sanga bermanfaat dan salam sukses dan sejahera. amin

    BalasHapus