Refleksi: September 2006
Senin 25 September 2006

Konstanta Hubble

Dalam ilmu astronomi, kita mengenal apa yang disebut sebagai hukum Hubble (Hubble’s Law). Hukum ini menyatakan bahwa pergeseran merah dari cahaya yang datang dari galaksi yang jauh adalah sebanding dengan jaraknya. Hukum ini pertama kali dirumuskan oleh Edwin Hubble pada tahun 1929.

Kita sudah pernah belajar tentang efek pergeseran Doppler, dimana kenyataan bahwa galaksi-galaksi bergerak saling menjauh memberikan sebuah gambaran tentang alam semesta yang mengembang yang apabila diekstrapolasikan ke waktu lampau akan berpangkal pada peristiwa sebuah dentuman besar (big bang) yang menandai terbentuknya alam semesta. Hubble membandingkan jarak ke galaksi dekat dengan pergeseran merah mereka, dan menemukan hubungan yang linear. Perkiraannya tentang suatu konstanta perbandingan ini dikenal dengan nama konstanta Hubble (dan sekarang juga dikenal sebagai "parameter Hubble" karena ternyata hal ini bukanlah sekedar konstanta, melainkan suatu parameter yang tergantung pada waktu yang menandakan perluasan alam semesta yang dipercepat), sebenarnya meleset dengan faktor 10.

Lebih jauh lagi, jika seseorang menggunakan pengamatan Hubble yang asli dan kemudian memakai jarak yang paling akurat dan kecepatan yang sekarang diketahui, ia akan memperoleh suatu grafik scatter plot yang acak tanpa hubungan yang jelas antara pergeseran merah dengan jarak. Sekalipun demikian, hubungan yang hampir linear antara pergeseran merah dan jarak dikuatkan oleh pengamatan setelah Hubble. Hukum ini dapat dinyatakan sebagai berikut:

v = H0 D

dimana v adalah pergeseran merah, biasanya dinyatakan dalam km/s (kecepatan di mana galaksi menjauhi kita, untuk menghasilkan pergeseran merah ini melalui efek Doppler), H0 adalah parameter Hubble (pada pengamat, seperti dilambangkan dengan indeks 0), dan D adalah jarak sekarang dari pengamat ke galaksi, yang diukur dalam megaparsek: Mpc.

Kita dapat menurunkan hukum Hubble secara matematis jika ia menganggap bahwa alam semesta mengembang (atau menyusut) dan menganggap bahwa alam semesta adalah homogen, yang berarti bahwa semua titik di dalamnya adalah sama.

Selama sebagian besar dari paruh kedua abad ke-20, nilai dari H0 diperkirakan berada di antara 50 dan 90 km/s/Mpc. Nilai dari konstanta Hubble sudah merupakan topik kontroversi yang cukup lama dan pahit antara Gérard de Vaucouleurs yang menyatakan bahwa nilainya adalah 100 dan Allan Sandage yang menyatakan bahwa nilainya adalah 50. Proyek Hubble Key benar-benar melakukan perbaikan penting dalam menentukan nilai ini dan pada bulan Mei 2001 mempublikasikan perkiraanya sekitar 72+/-8 km/s/Mpc. Pada tahun 2003 satelit WMAP menyempurnakan lebih jauh menjadi 71+/-4, menggunakan cara yang sama sekali berbeda, berdasarkan pada pengukuran anisotropi pada radiasi latar belakang gelombang mikro kosmik. Angka ini kemudian dikoreksi lagi pada Agustus 2006. Berdasarkan data dari Observatorium Sinar X Chandra, nilai konstanta hubble ditetapkan pada angka 70 (km/s)/Mpc, +2.4/-3.2.

Konstanta Hubble adalah “konstan” dalam arti bahwa konstanta ini dipercaya bisa dipakai untuk semua kecepatan dan jarak pada masa sekarang. Nilai dari H (yang biasa disebut sebagai parameter Hubble untuk membedakannya dengan nilai sekarang, konstanta Hubble) berkurang terhadap waktu. Jika kita menganggap bahwa semua galaksi mempertahankan kecepatannya relatif terhadap kita dan tidak mengalami percepatan atau perlambatan, maka kita memiliki D = vt dan oleh karena itu H = 1/t, di mana t adalah waktu sejak dentuman dahsyat (Big Bang). Rumus ini dapat digunakan untuk memperkirakan usia alam semesta dari H.

Namun pengamatan akhir-akhir ini menunjukkan bahwa gerak galaksi dipercepat menjauhi kita, yang berarti bahwa H > 1/t (tetapi tetap saja berkurang terhadap waktu) dan perkiraan 1/H0 (antara 11 dan 20 milyar tahun) sebagai usia alam semesta adalah terlampau kecil.

- Diposting oleh Dhani @ 22:56

Senin 18 September 2006

Seputar Tersingkirnya Pluto

Keputusan IAU untuk mencoret Pluto dari jajaran planet sedikit banyak berpengaruh pula pada isi situs ini. Beberapa entri di bagian Astronomi, khususnya di halaman Apa dan Siapa dan Tahukah Anda yang merujuk Pluto sebagai sebuah planet kini telah direvisi. Namun demikian, untuk artikel-artikel lepas maupun entri jurnal ini yang terkait dengan Pluto tidak akan dikoreksi; tetap dibiarkan sebagaimana adanya.

Bagi pengunjung setia situs ini (saya tidak tahu, entah ada atau tidak), soal Pluto dan status keplanetannya sebenarnya bukan cerita baru. Hal itu sudah berkali-kali dibahas di situs maupun jurnal ini. Sekitar lima tahun lalu, waktu membahas soal Objek Sabuk Kuiper, saya sempat menulis bahwa:
“…Ini adalah kenyataan yang ironis mengingat pencarian planet kesepuluh dari sistem tata surya kita malahan membuat daftar yang sudah ada terancam berkurang satu…”
Sementara itu, waktu membahas secara agak rinci soal isu “planet kesepuluh” pada posting tanggal 3 April 2004 sudah saya tegaskan pula bahwa:
”…Soal keberadaan planet kesepuluh sebenarnya tidak sesederhana hitung-hitungan matematika: 9+1=10. Sejak penemuan objek Sabuk Kuiper pada 1992, kita tahu bahwa Pluto bukanlah anggota terluar dari tata Surya. Yang jadi persoalan, seandainya keluarga objek Sabuk Kuiper tidak bisa digolongkan sebagai planet, maka Pluto juga harus dicoret dari keluarga planet. Jadi, jumlah planet penghuni tata surya seharusnya cuma delapan, bukan sembilan, apalagi sepuluh. Sebaliknya, apabila keluarga Sabuk Kuiper juga bisa digolongkan sebagai planet, maka jumlah planet akan membengkak, tidak cuma sepuluh tapi bisa mencapai lusinan…”
Perkembangan terakhir berkenaan dengan status keplanetan Pluto ternyata mendukung asumsi diatas. Jadi, peristiwa terdepaknya Pluto dari “klub” planet sebenarnya bukan hal yang kelewat aneh atau mengejutkan sehingga tidak ada urgensinya untuk dibahas lagi di halaman ini.

- Diposting oleh Dhani @ 00:33

Minggu 17 September 2006

Filter Spam Bayesian (2)

Masih cerita soal filter spam Bayesian. Kelebihan dari filter spam Bayes adalah ia dapat dilatih berdasarkan kebutuhan penggunanya. Seringkali spam yang diterima oleh seseorang ternyata berkaitan dengan aktifitas onlinenya. Sebagai contoh, seorang pengguna mungkin ter-subscribe pada sebuah newsletter online yang dianggap sebagai spam. Sepintas, newsletter ini mengandung kata-kata yang umum terdapat dalam semua newsletter, seperti judul newsletter bersangkutan dan email pengirimnya. Filter spam bayesian selanjutnya akan menetapkan probabilitas yang lebih besar berdasarkan pola yang spesifik dari aktifitas pengguna bersangkutan.

Email legitim yang diterima oleh pengguna cenderung memiliki perbedaan. Sebagai contoh, dalam lingkungan sebuah perusahaan, nama perusahaan dan nama seorang klien atau pelanggan akan sering muncul. Filter dapat memberi nilai probabilitas yang lebih rendah pada email yang mengandung nama-nama tersebut.

Probabilitas tiap kata adalah unik untuk setiap pengguna, dan dapat berubah sewaktu-waktu dengan adanya koreksi apabila filter keliru melakukan klasifikasi terhadap sebuah email. Hasilnya, akurasi filter spam Bayesian akan terus meningkat dari waktu ke waktu.

Kemampuan ini sangat membantu, misalnya untuk menghindari terjadinya “false positives”, ketika filter keliru mengidentifikasi mail yang legitim sebagai spam. Sebagai contoh, walaupun email yang mengandung kata “Viagra” seringkali dianggap sebagai spam, filter Bayesian tidak langsung menandai mail yang mengandung kata “Viagra” sebagai spam, namun juga memperhatikan kata-kata penting lainnya yang merupakan indikasi mail yang legitim. Nama seorang rekan dalam pesan email bersangkutan misalnya, merupakan indikasi yang kuat bahwa mail tersebut bukan spam, sehingga filter akan mengabaikan penggunaan kata “Viagra”.

Namun demikian, akhir-akhir ini ada kecenderungan para spammer memanfaatkan trik-trik tertentu untuk mengecoh filter spam. Salah satunya adalah dengan memasukkan kata-kata acak yang biasanya bukan merupakan bagian dari spam untuk mengurangi skor spam dari filter. Dalam beberapa kasus, trik ini cukup efektif untuk memperdayai filter Bayesian. Sebagai solusinya, beberapa jenis filter spam telah mengkombinasikan filter spam Bayesian dengan suatu pre-defined rule untuk memperoleh akurasi yang lebih tinggi.

- Diposting oleh Dhani @ 23:20

Kamis 07 September 2006

Filter Spam Bayesian (1)

Dewasa ini, spam adalah salah satu masalah terbesar di internet. Kita sebagai pemakai internet tentu sudah tidak asing lagi dengan email sampah berisi promosi yang sering “mampir” ke mailbox kita itu. Dalam jumlah sedikit, spam sebenarnya bukan persoalan yang kelewat serius. Tinggal tekan tombol [del], habis perkara. Lain lagi ceritanya kalau kita sampai menerima spam dalam jumlah yang bejibun tiap hari. Kalau sudah begini, akan banyak waktu yang dihabiskan untuk menyortir dan menghapus sekian banyak email secara manual.

Untungnya, dewasa ini telah dikembangkan berbagai algoritma untuk memfilter spam secara otomatis oleh perangkat lunak, baik di level MUA maupun MTA. Salah satu algoritma yang cukup handal untuk menghalau spam adalah algoritma Bayes. Algoritma ini bekerja memanfaatkan metode statistika Bayesian untuk mengklasifikasikan dokumen dalam katagori tertentu berdasarkan tingkat keterpercayaannya.

Algoritma Bayesian dinamai sesuai nama Thomas Bayes (1702-1761)—yang pertama kali mengajukan persoalan statistik yang kini dikenal sebagai teorema Bayes. Istilah Bayesian sendiri baru muncul sekitar tahun 1950-an. Sebelumnya, teorema Bayes banyak dipakai dalam berbagai bidang, mulai dari perhitungan matematis orbit benda langit, statistika medis, hingga bidang hukum.

Teknik filter spam dengan metoda Bayesian (selanjutnya disebut filter Bayesian) pertama kali diajukan oleh M. Sahami, dkk pada 1998. Namun metoda ini baru mendapat prhatian pada 2002 ketika diulas oleh Paul Graham dalam sebuah paper. Selanjutnya, filter Bayesian mulai populer sebagai sebuah metode untuk membedakan spam dengan email regular. Dewasa ini filter Bayesian diimplementasikan pada berbagai perangkat lunak email yang populer dan di perangkat filter server-side semacam SpamAssassin serta beberapa perangkat lunak mail server.

Filter Bayesian bekerja dengan menerapkan teorema Bayes pada isi email. Teorema Beyes, dalam konteks spam, menyatakan bahwa kemungkinan sebuah email adalah spam, ditunjukkan oleh keberadaan beberapa kata tertentu didalamnya, adalah sama dengan kemungkinan untuk menemukan kata yang sama dalam sebuah email spam, dikalikan dengan kemungkinan bahwa sebuah email adalah spam, dibagi dengan kemungkinan untuk menemukan kata yang sama dalam sembarang email. Dalam “bahasa” matematis, pernyataan itu dapat diungkapkan lewat persamaan berikut:

Pr(kata|spam).Pr(spam)
Pr(spam|kata) = ------------------------
Pr(kata)

Masing-masing kata memiliki kemungkinan sendiri-sendiri untuk muncul di sebuah email spam dan di email yang legitim. Contohnya, kata “Viagra” sering muncul pada email spam, dan jarang muncul di email lainnya. Filter Bayesian sebenarnya tidak memiliki pengetahuan tentang hal ini. Filter tersebut harus “dilatih” terlebih dahulu untuk dapat mengenali keberadaan kata ini sebagai indikasi bahwa sebuah email adalah spam. Untuk melatih filter tersebut, pengguna dapat mengindikasikan secara manual mengenai status sebuah email, apakah itu spam atau bukan. Untuk setiap kata dari tiap email yang telah dipelajarinya, filter akan mengatur probabilitas untuk setiap kata yang muncul baik di email spam maupun yang legitim dalam basis datanya. Dengan demikian, filter spam Bayesian dapat belajar bahwa mail yang mengandung kata “Viagra” memiliki probabilitas lebih tinggi sebagai spam ketimbang email lainnya yang tidak mengandung kata itu.

Setelah dilatih, probabilitas kata (dikenal sebagai fungsi kemungkinan [likelihood functions]) akan dipakai untuk menghitung probabilitas dalam pengkatagorian sebuah email berdasarkan kandungan kata-kata tertentu didalamnya. Setiap kata dalam email berkontribusi pada probabilitas spam. Kontribusi ini dikenal sebagai probabilitas posterior (posterior probability) yang kemudian dihitung menggunakan teorema Bayes. Berikutnya, probabilitas spam dihitung berdasarkan semua kata dalam email, dan apabila hasil perhitungan melampaui ambang batas tertentu (katakanlah 95%), maka filter akan menandai sebuah email sebagai spam. Email yang bertanda spam dapat dipindahkan secara otiomatis ke folder “Junk” atau langsung dihapus secara otomatis.

- Diposting oleh Dhani @ 22:57