Selamat datang di Information IT Telkom

Information Retrieval

April 30, 2011 1 comment

This is a blog about information retrieval from ITTelkom (Institut Teknologi Telkom) college.

1. Information retrieval

Information retrieval adalah suatu metode untuk pencarian kembali suatu informasi.

2. Institut Teknologi Telkom

Institut Teknologi Telkom atau biasa disebut ITTelkom / IT Telkom merupakan suatu institusi pendidikan yang concern di bidang teknologi informasi. IT Telkom/ ITTelkom dulunya bernama Sekolah Tinggi Teknologi Telkom (STTTELKOM), diprakarsai oleh PT Telkom yang kesulitan mencari tenaga ahli di bidang IT, akhirnya membentuk suatu yayasan pendidikan telkom yang melahirkan sekolah sekolah salah satunya Institut Teknologi Telkom.

Advertisements

Information retrieval it telkom: Mengumpulkan hasil Twitter dan hasil Web

April 29, 2011 9 comments

Berikut merupakan hasil analisis yang dilakukan oleh Jaime teevan, Daniel Ramage, Meredith Ringel Morris dalam paper “a comparison of microblog search and web search” tentang bagaimana mereka mengumpulkan hasil twitter dan hasil web berkaitan dengan information retrieval :

Untuk memperkirakan content Twitter untuk query-query yang ada di dalam sampel yang saat itu dikeluarkan, dilakukan crawl terhadap delapan juta posting yang disediakan oleh aliran spritzer Twitter selama satu minggu. Aliran spritzer adalah aliran umum yang berisi pesan sampel dari semua posting Twitter publik. Susunannya adalah ditentukan oleh Twitter. Dari sini kita mencoba tweets yang berisi 50 pencarian common queries yang paling populer untuk analisa lebih lanjut. Jumlah potensi hasil per query berkisar antara ratusan hingga puluhan ribu.

Hasil pencarian Twitter berbeda dengan hasil pencarian web di seluruh isi dari setiap hasil yang disajikan kepada pengguna dalam daftar hasil. Sebaliknya, hasil pencarian web biasanya disajikan sebagai daftar hyperlink, masing-masing dengan potongan algoritma yang diekstraksi dari teks yang dirancang untuk membantu pencari dalam memilih hyperlink yang akan dikunjungi (meskipun dalam beberapa kasus potongan dapat sepenuhnya memenuhi kebutuhan informasi pengguna). Untuk merepresentasikan hasil pencarian web, dilakukan ekstraksi terhadap judul teks dan ringkasan dari semua hasil yang disajikan oleh Bing dari query log kepunyaan mesin pencari untuk query yang sama dari periode waktu yang sama. Sementara, tweets secara kualitatif berbeda dari potongan Web, keduanya berasal dari bentuk dasar tekstual yang oleh pencari disajikan melalui hasil sistem pencarian yang dianggap relevan, dan menjamin persamaan.

Term-term yang sangat umum dan sangat langka disaring dari setiap set hasil query-spesifik, seperti praktek standar untuk jenis analisis yang dilakukan. Secara khusus, dilakukan penyaringan terhadap 20 term yang paling umum dan muncul kurang dari tiga hasil. Setelah penyaringan, 42 dari 50 hasil set query awal setidaknya memiliki 100 hasil not-empty dari Twitter dan Web, untuk mencari perbedaan di Twitter dan hasil pencarian Web untuk query-query tersebut dibutuhkan eksplorasi lebih lanjut.

salam,

mahasiswa kelas Information Retrieval ITTelkom, 2011

on Information retrieval it telkom: Mengumpulkan hasil Twitter dan hasil Web

Information retrieval IT Telkom: Perbedaan Bahasa dalam Hasil Pencarian

April 29, 2011 3 comments

Berikut merupakan hasil analisis yang dilakukan oleh Jaime teevan, Daniel Ramage, Meredith Ringel Morris dalam paper “a comparison of microblog search and web search” tentang sub bab perbandingan antara bahasa hasil pencarian antara twitter search dan web search berkaitan dengan information retrieval :

Perbedaan paling dekat antara Twitter dan set hasil Web terletak pada jumlah informasi yang tersedia yang mengikuti sebuah query. Jumlah rata-rata per-query dari kata-kata dalam hasil Twitter adalah 19,55, sedangkan hasil potongan Web adalah 33,95. Panjang tweets yang relatif pendek mencerminkan perilaku postingan Twitter di hadapan sistem yang mempunyai batas 140 karakter. Sebaliknya, panjang potongan Web yang relatif lebih panjang mencerminkan tujuan dari mesin pencari untuk mendukung kebutuhan penggunanya dalam pencarian Web. Karena potongan Web dihubungkan dengan halaman web, lebih banyak konten dapat ditemukan dengan mengikuti (follow) link yang ada. Hasil Twitter, sebaliknya, menyediakan teks lengkap dari pencocokan tweets dan biasanya dibaca secara keseluruhan dalam daftar hasil.

Karena set hasil Web dan Twitter dikumpulkan untuk query yang sama, diharapkan mereka akan berisi konten dasar yang sama. Dan, memang, banyak term umum yang disahre, misalnya, baik tweets maupun potongan Web untuk term penyanyi Lady Gaga cenderung berisi term musik (8% dari tweets, 27% dari potongan Web). Tapi dengan analisis kuantitatif yang lebih luas, dapat diamatibahwa real-time dan dinamika sosial Twitter tidak menghasilkan pola bahasa yang cukup berbeda dari yang ada di potongan pencarian Web.

ttd.

Information retrieval IT Telkom: Perbedaan Bahasa dalam Hasil Pencarian

Information Retrieval it telkom: Twitter Search

April 29, 2011 14 comments
Information retrieval : twitter search

Information retrieval : twitter search

Kami akan menjelaskan sedikit hal tentang twitter search. Sebelum itu kami akan menjelaskan tentang apa itu twitter? Twitter adalah suatu microblog service, yang berfungsi untuk menjaring teman di dunia maya dan melakukan pertukaran informasi sesama teman dalam jaringan atau bahkan sharing informasi kepada publik. Informasi yang diberikan oleh user kepada twitter akan disimpan, dan nantinya akan digunakan sebagai data yang akan diretrieve oleh twitter search engine. Dari situlah twitter search bekerja.

Twitter search melakukan information retrieval terhadap twit twit yang ada, pada twitter sudah dilakukan penggolongan seperti # untuk menerangkan topik tertentu, misalnya:

#informationretrieval | #twittersearch | #ittelkom | #ir | dan lain lain,

juga penggolongan berdasarkan pendapat orang tertentu, menggunakan @, misalnya:

@zusniadisya @ridharamadhansyah @dhearizkiyunia @windakristihansari @gerryherdianto dan lain lain,

Sekian dulu penjelasan kami tentang twitter search dan information retrieval berdasarkan apa yang kami baca dan kami pelajarin tentang information retrieval dan twitter search dari paper paper yang ada.

ttd.

Information Retrieval ittelkom: Twitter Search

Information retrieval di Twitter

April 28, 2011 2 comments

Microbloging service seperti twitter tidak hanya digunakan untuk menjalin relasi tetapi juga digunakan para penggunanya untuk “berkicau” , yaitu memberikan informasi kepada teman dalam jaringan atau bahkan kepada public. Hal ini menunjukkan bahwa pengguna sebenarnya juga menggunakan microblog untuk mencari informasi.  Konten dari microblog berbeda dengan konten yang ada di web. Microblog memiliki jumlah konten yang terbatas yaitu hanya sampai 140 karakter, namun frekuensinya tinggi, dan kontennya cenderung tidak berubah setelah di terbitan.  Sedangkan web pages memiliki konten yang cenderung lebih besar, tetapi penambahan kontennya cenderung lebih lambat, dan setelah dilakukan posting biasanya akan dilakukan updating. Perbedaan inilah yang melatarbelakangi mengapa Jaime teevan dkk melakukan penelitian ini, membandingkan antara microblog search dan web search. Tujuannya agar ke depan, didapatkan design web search yang bekerja sama dengan social media.

Information retrieval adalah melakukan pencarian kembali suatu informasi yang biasanya diterapkan pada search engine, dimana search engine ini dibangun dengan prinsip komprehensif, sederhana, dan powerfull. Bagi user, search engine yang baik adalah yang retrieve informasinya cepat. Sedangkan bagi engine sendiri, yang diutamakan adalah ketepatan bukan kecepatan.

Bila digambarkan,

User : powerfull–> cepat –> relevan

Developer : relevan –> cepat –> powerfull

Pada twitter search pun kurang lebih sama, yang berbeda adalah tentang motivasi pencarian, bagaimana cara mencarinya, dan apa yang dicari. Adapun teknik information retrieval yang digunakan bergantung pada developer masing masing engine.

information retrieval it telkom: mengapa orang melakukan pencarian pada twitter

April 28, 2011 3 comments

Survey yang dilakukan terhadap pengguna twitter oleh peneliti microsoft, mengungkap beberapa alasan mengapa pengguna melakukan pencarian twitter. Beberapa diantaranya adalah

  • pertama untuk mendapatkan informasi real-time dan informasi terkait suatu berita pada suatu waktu tertentu.
  • Kemudian alasan lain adalah pencarian mengenai informasi social terhadap seorang tertentu, terkadang pengguna ingin mengetahui informasi tentang seseorang bahkan komunitas tertentu terkait suatu hal. Misalnya, pencarian tentang pendapat komunitas Microsoft terhadap suatu produk Microsoft.
  • Alasan terakhir adalah pencarian mengenai suatu topic tertentu, seperti tentang astronomi, science, dll, juga mengenai pendapat public terhadap topic tertentu yang banyak dibicarakan, terkadang pengguna juga menggunakan pencarian twitter untuk mencari twit yang telah lampau.

Mungkin ada banyak hal lain terkait dengan motivasi seseorang melakukan pencarian di twitter search bukan pada web search. Seperti diketahui twitter pun bisa melakukan suatu pencarian seperti halnya web search, twitter mengadopsi information retrieval terhadap kumpulan twit yang telah diterbitkan oleh penggunanya. Lalu melakukan string matching terhadap query yang diberikan pada twitter search untuk disamakan dengan kumpulan twit yang ada.

ttd.

information retrieval ittelkom (institut teknologi telkom): mengapa orang melakukan pencarian pada twitter

Mengenai Blog

April 28, 2011 1 comment

Blog ini merupakan penerapan ilmu perkuliahan Information Retrieval IT Telkom 2011  dan juga tugas besar mata kuliah Information retrieval 2011 mengenai OSE terhadap blog  Tugas Besar Matakuliah Information Retrieval CS4323 IT Telkom (  Information Retrieval IT Telkom ) ini.

Blog ini diprakarsai oleh beberapa mahasiswa IT Telkom (Institut Teknologi Telkom) angkatan 2007 tahun ajaran 2010-2011 semseter genap.  Adapun mahasiswa-mahasiswa IT Telkom tersebut adalah

  1. Ridha Ramadansyah
  2. Gerry Herdianto
  3. Winda Kristihansari
  4. Dhea Rizki Yunia
  5. Zusni Adisya

Mahasiswa mahasiswa tersebut sama-sama mengikuti perkuliahan information retrieval di tahun 2011 dan juga satu tim dalam tugas besar mata kuliah Information retrieval 2011 ini di kampus IT Telkom. Sebagai informasi, kampus IT Telkom berlokasi di Bandung, lebih tepatnya di jalan telekomunikasi no 1 dayeuh kolot Bandung.