Refleksi: Oktober 2005
Minggu 09 Oktober 2005
Dari SGML hingga XML
Format HTML (Hypertext Markup Language), yang memungkinkan kita untuk mengakses halaman-halaman web, sebenarnya memiliki sejarah yang lumayan panjang. Jauh sebelum internet dan World Wide Web (WWW) berkembang, kita sudah mengenal apa yang disebut sebagai Standard Generalized Markup Language (SGML). SGML adalah bahasa pemrograman khusus untuk pemformatan teks yang digunakan oleh industri penerbitan dan multimedia untuk mengatasi masalah yang timbul akibat inkompatibilitas antara aplikasi untuk keperluan editing, pemformatan naskah, dan basis data (database).
Seperti halnya pada HTML, dokumen yang tersimpan dalam format SGML memiliki informasi yang disebut markup, yang menunjukkan bagaimana teks harus diatur. Sebagai contoh, awal sebuah bab dimulai dengan tanda “<chapter>” sementara akhir bab ditandai dengan “</chapter>”. Penanda – yang dikenal sebagai “tag” – ini menuntun komputer untuk menghasilkan format keluaran (output) yang diinginkan. SGML juga menyediakan tag-tag untuk manipulasi teks, misalnya untuk menentukan jenis dan ukuran font yang digunakan, maupun efek khusus seperti cetak tebal (bold) atau cetak miring (italic).
SGML bermula dari format yang disebut Generalized Markup Language (GML) yang dikembangkan oleh IBM pada dekade 1960-an. Pada saat yang bersamaan dengan dikembangkannya GML, dikembangkan pula standar GenCode oleh Graphics Communications Association untuk keperluan sistematisasi pemformatan teks antara sistem typesetting yang berbeda. Baik elemen dari GML maupun GenCode kemudian diimplementasikan dalam SGML.
Sementara itu, format HTML sendiri baru mulai dikembangkan pada 1989 sebagai format standar untuk dokumen pada layanan WWW (yang saat itu masih berupa embrio). HTML adalah turunan langsung dari SGML. Baik HTML maupun SGML pada dasarnya memiliki struktur yang relatif sama. Yang membedakan hanyalah elemen hyperlink pada HTML yang tidak hanya mengacu ke dokumen lokal, melainkan ke dokumen di webserver yang terhubung melalui protokol HTTP. Konsep hyperlink sendiri sebetulnya sudah dipakai pada layanan pendahulu WWW yang disebut Gopher. Hanya saja, dokumen-dokumen pada Gopher masih sepenuhnya berbasis teks. Adalah Tim-Berners Lee (kita kenal sebagai “bapak” WWW) yang pertama kali mengintegrasikan multimedia dalam dokumen HTML sehingga lahirlah WWW seperti yang kita nikmati saat ini.
Menarik juga untuk diungkapkan disini bahwa istilah “hypertext” pada HTML pertama kali digunakan pada 1965 oleh ilmuwan komputer AS, Ted Nelson, untuk menjelaskan informasi tekstual yang dapat diakses secara non-linear. Ia menggunakan awalan “hyper” untuk menjelaskan kecepatan dan fasilitas dimana pengguna dapat “meloncat” ke dan dari bagian-bagian tertentu pada teks.
Belakangan, format HTML dikembangkan lagi menjadi format XML (Extensible Markup Language). XML menganut konsep yang berbeda dengan HTML. Apabila HTML merupakan bahasa yang mendeskripsikan sebuah halaman, maka XML mendeskripsikan sebuah objek. Alih-alih memberitahu browser dimana menempatkan sesuatu dan bagaimana menampilkannya dalam sebuah halaman, XML justeru menginformasikan kepada browser tentang apa yang harus ditampilkannya. Dengan demikian, browser dapat memahami hal-hal semacam fungsi atau tujuan dari elemen teks yang menyusun sebuah halaman.
Tidak seperti HTML yang hanya memanfaatkan tag-tag standar, XML memungkinkan penulis dokumen untuk mendefinisikan tag-tagnya sendiri. Misalnya, dalam website sebuah toko buku, programmer dapat mendefinisikan tag-tag yang merujuk kepada judul buku, pengarang, penerbit, dan harga sebuah buku. Informasi dalam tag ini lantas bisa diolah lebih lanjut, misalnya dengan menentukan format tampilan untuk judul buku pada halaman web bersangkutan, atau dihubungkan dengan aplikasi database tertentu. Dengan kata lain, XML adalah informasi tentang informasi, atau dalam istilah teknisnya, meta-information.