Archive

Posts Tagged ‘retrieval’

paper information retrieval : Pendekatan Peringkat / Ranking untuk Pencarian Microblog

May 4, 2011 10 comments

Paper information retrieval ini membahasa tentang Peringkat microblogs, seperti tweets, sebagai hasil pencarian untuk query adalah sebuah tantangan, antara lain karena dari jumlah microblogs yang dihasilkan secara real time, serta panjang pendek masing-masing microblog. Berbagi pesan singkat (microblogs) melalui jejaring sosial online merupakan komponen penting dari Real Time Web (RTW). Dari perspektif konsumsi informasi, ini merupakan tren dan berita terbaru secara real time dari banyak sumber dengan sudut pandang yang beragam merupakan daya tarik tersendiri bagi para pembaca seperti microblogs. Menyaring Real Time Web untuk menemukan microblogs paling menarik adalah tantangan penting. dari paper information retrieval ini dapat diketahui, Masalah peringkat microblogs bisa dilihat melalui dua perspektif: 1) peringkat microblogs, 2) peringkat para pengarang microblogs, dan keduanya berkaitan erat. Salah satu tantangan dalam penelitian tentang strategi peringkat untuk microblogs adalah tidak tersedianya data dasar kebenaran untuk mengukur efektivitas. Karena itu dikembangkan sebuah antarmuka web pencarian yang memungkinkan end-user untuk mencari Twitter dan kemudian memberikan penilaian preferensi berpasangan. Rangking pada microblog tidak menjamin bahwa tweet yang tampil di atas pada posisi atas.
Pada paper information retrieval ini, Ada 2 pendekatan strategi perankingan: 1) ranking berdasarkan pengarang dari microblog search, 2) pengukuran ranking untuk microblog. Pada tahap pertama perankingan pengarang dilakukan penilaian terhadap pengarang berdasar jumlah tweet yang mereka postkan. Idenya adalah publisher yang aktiv kemungkinan informasi darinya lebih bernilai daripada yang tidak. Kemudian dilakukan perhitungan menggunakan follower rank dari pengarang. Selanjutnya dilakukan perangkingan terhadap microblog, pada perankingan ini di ikut sertakan perhitungan terhadap pengarang.

Information retrieval it telkom: Mengumpulkan hasil Twitter dan hasil Web

April 29, 2011 9 comments

Berikut merupakan hasil analisis yang dilakukan oleh Jaime teevan, Daniel Ramage, Meredith Ringel Morris dalam paper “a comparison of microblog search and web search” tentang bagaimana mereka mengumpulkan hasil twitter dan hasil web berkaitan dengan information retrieval :

Untuk memperkirakan content Twitter untuk query-query yang ada di dalam sampel yang saat itu dikeluarkan, dilakukan crawl terhadap delapan juta posting yang disediakan oleh aliran spritzer Twitter selama satu minggu. Aliran spritzer adalah aliran umum yang berisi pesan sampel dari semua posting Twitter publik. Susunannya adalah ditentukan oleh Twitter. Dari sini kita mencoba tweets yang berisi 50 pencarian common queries yang paling populer untuk analisa lebih lanjut. Jumlah potensi hasil per query berkisar antara ratusan hingga puluhan ribu.

Hasil pencarian Twitter berbeda dengan hasil pencarian web di seluruh isi dari setiap hasil yang disajikan kepada pengguna dalam daftar hasil. Sebaliknya, hasil pencarian web biasanya disajikan sebagai daftar hyperlink, masing-masing dengan potongan algoritma yang diekstraksi dari teks yang dirancang untuk membantu pencari dalam memilih hyperlink yang akan dikunjungi (meskipun dalam beberapa kasus potongan dapat sepenuhnya memenuhi kebutuhan informasi pengguna). Untuk merepresentasikan hasil pencarian web, dilakukan ekstraksi terhadap judul teks dan ringkasan dari semua hasil yang disajikan oleh Bing dari query log kepunyaan mesin pencari untuk query yang sama dari periode waktu yang sama. Sementara, tweets secara kualitatif berbeda dari potongan Web, keduanya berasal dari bentuk dasar tekstual yang oleh pencari disajikan melalui hasil sistem pencarian yang dianggap relevan, dan menjamin persamaan.

Term-term yang sangat umum dan sangat langka disaring dari setiap set hasil query-spesifik, seperti praktek standar untuk jenis analisis yang dilakukan. Secara khusus, dilakukan penyaringan terhadap 20 term yang paling umum dan muncul kurang dari tiga hasil. Setelah penyaringan, 42 dari 50 hasil set query awal setidaknya memiliki 100 hasil not-empty dari Twitter dan Web, untuk mencari perbedaan di Twitter dan hasil pencarian Web untuk query-query tersebut dibutuhkan eksplorasi lebih lanjut.

salam,

mahasiswa kelas Information Retrieval ITTelkom, 2011

on Information retrieval it telkom: Mengumpulkan hasil Twitter dan hasil Web

Information retrieval IT Telkom: Perbedaan Bahasa dalam Hasil Pencarian

April 29, 2011 3 comments

Berikut merupakan hasil analisis yang dilakukan oleh Jaime teevan, Daniel Ramage, Meredith Ringel Morris dalam paper “a comparison of microblog search and web search” tentang sub bab perbandingan antara bahasa hasil pencarian antara twitter search dan web search berkaitan dengan information retrieval :

Perbedaan paling dekat antara Twitter dan set hasil Web terletak pada jumlah informasi yang tersedia yang mengikuti sebuah query. Jumlah rata-rata per-query dari kata-kata dalam hasil Twitter adalah 19,55, sedangkan hasil potongan Web adalah 33,95. Panjang tweets yang relatif pendek mencerminkan perilaku postingan Twitter di hadapan sistem yang mempunyai batas 140 karakter. Sebaliknya, panjang potongan Web yang relatif lebih panjang mencerminkan tujuan dari mesin pencari untuk mendukung kebutuhan penggunanya dalam pencarian Web. Karena potongan Web dihubungkan dengan halaman web, lebih banyak konten dapat ditemukan dengan mengikuti (follow) link yang ada. Hasil Twitter, sebaliknya, menyediakan teks lengkap dari pencocokan tweets dan biasanya dibaca secara keseluruhan dalam daftar hasil.

Karena set hasil Web dan Twitter dikumpulkan untuk query yang sama, diharapkan mereka akan berisi konten dasar yang sama. Dan, memang, banyak term umum yang disahre, misalnya, baik tweets maupun potongan Web untuk term penyanyi Lady Gaga cenderung berisi term musik (8% dari tweets, 27% dari potongan Web). Tapi dengan analisis kuantitatif yang lebih luas, dapat diamatibahwa real-time dan dinamika sosial Twitter tidak menghasilkan pola bahasa yang cukup berbeda dari yang ada di potongan pencarian Web.

ttd.

Information retrieval IT Telkom: Perbedaan Bahasa dalam Hasil Pencarian

Information Retrieval it telkom: Twitter Search

April 29, 2011 14 comments
Information retrieval : twitter search

Information retrieval : twitter search

Kami akan menjelaskan sedikit hal tentang twitter search. Sebelum itu kami akan menjelaskan tentang apa itu twitter? Twitter adalah suatu microblog service, yang berfungsi untuk menjaring teman di dunia maya dan melakukan pertukaran informasi sesama teman dalam jaringan atau bahkan sharing informasi kepada publik. Informasi yang diberikan oleh user kepada twitter akan disimpan, dan nantinya akan digunakan sebagai data yang akan diretrieve oleh twitter search engine. Dari situlah twitter search bekerja.

Twitter search melakukan information retrieval terhadap twit twit yang ada, pada twitter sudah dilakukan penggolongan seperti # untuk menerangkan topik tertentu, misalnya:

#informationretrieval | #twittersearch | #ittelkom | #ir | dan lain lain,

juga penggolongan berdasarkan pendapat orang tertentu, menggunakan @, misalnya:

@zusniadisya @ridharamadhansyah @dhearizkiyunia @windakristihansari @gerryherdianto dan lain lain,

Sekian dulu penjelasan kami tentang twitter search dan information retrieval berdasarkan apa yang kami baca dan kami pelajarin tentang information retrieval dan twitter search dari paper paper yang ada.

ttd.

Information Retrieval ittelkom: Twitter Search

Information retrieval di Twitter

April 28, 2011 2 comments

Microbloging service seperti twitter tidak hanya digunakan untuk menjalin relasi tetapi juga digunakan para penggunanya untuk “berkicau” , yaitu memberikan informasi kepada teman dalam jaringan atau bahkan kepada public. Hal ini menunjukkan bahwa pengguna sebenarnya juga menggunakan microblog untuk mencari informasi.  Konten dari microblog berbeda dengan konten yang ada di web. Microblog memiliki jumlah konten yang terbatas yaitu hanya sampai 140 karakter, namun frekuensinya tinggi, dan kontennya cenderung tidak berubah setelah di terbitan.  Sedangkan web pages memiliki konten yang cenderung lebih besar, tetapi penambahan kontennya cenderung lebih lambat, dan setelah dilakukan posting biasanya akan dilakukan updating. Perbedaan inilah yang melatarbelakangi mengapa Jaime teevan dkk melakukan penelitian ini, membandingkan antara microblog search dan web search. Tujuannya agar ke depan, didapatkan design web search yang bekerja sama dengan social media.

Information retrieval adalah melakukan pencarian kembali suatu informasi yang biasanya diterapkan pada search engine, dimana search engine ini dibangun dengan prinsip komprehensif, sederhana, dan powerfull. Bagi user, search engine yang baik adalah yang retrieve informasinya cepat. Sedangkan bagi engine sendiri, yang diutamakan adalah ketepatan bukan kecepatan.

Bila digambarkan,

User : powerfull–> cepat –> relevan

Developer : relevan –> cepat –> powerfull

Pada twitter search pun kurang lebih sama, yang berbeda adalah tentang motivasi pencarian, bagaimana cara mencarinya, dan apa yang dicari. Adapun teknik information retrieval yang digunakan bergantung pada developer masing masing engine.

information retrieval it telkom: mengapa orang melakukan pencarian pada twitter

April 28, 2011 3 comments

Survey yang dilakukan terhadap pengguna twitter oleh peneliti microsoft, mengungkap beberapa alasan mengapa pengguna melakukan pencarian twitter. Beberapa diantaranya adalah

  • pertama untuk mendapatkan informasi real-time dan informasi terkait suatu berita pada suatu waktu tertentu.
  • Kemudian alasan lain adalah pencarian mengenai informasi social terhadap seorang tertentu, terkadang pengguna ingin mengetahui informasi tentang seseorang bahkan komunitas tertentu terkait suatu hal. Misalnya, pencarian tentang pendapat komunitas Microsoft terhadap suatu produk Microsoft.
  • Alasan terakhir adalah pencarian mengenai suatu topic tertentu, seperti tentang astronomi, science, dll, juga mengenai pendapat public terhadap topic tertentu yang banyak dibicarakan, terkadang pengguna juga menggunakan pencarian twitter untuk mencari twit yang telah lampau.

Mungkin ada banyak hal lain terkait dengan motivasi seseorang melakukan pencarian di twitter search bukan pada web search. Seperti diketahui twitter pun bisa melakukan suatu pencarian seperti halnya web search, twitter mengadopsi information retrieval terhadap kumpulan twit yang telah diterbitkan oleh penggunanya. Lalu melakukan string matching terhadap query yang diberikan pada twitter search untuk disamakan dengan kumpulan twit yang ada.

ttd.

information retrieval ittelkom (institut teknologi telkom): mengapa orang melakukan pencarian pada twitter

Paper Information Retrieval: Mencari Informasi Melalui Twitter

April 28, 2011 8 comments

Paper Information Retrieval: Mencari Informasi Melalui Twitter. Microbloging service seperti twitter tidak hanya digunakan untuk menjalin relasi tetapi juga digunakan para penggunanya untuk “berkicau” , yaitu memberikan informasi kepada teman dalam jaringan atau bahkan kepada public. Hal ini menunjukkan bahwa pengguna sebenarnya juga menggunakan microblog untuk saling berbagi informasi.  Konten dari microblog berbeda dengan konten yang ada di web. Microblog memiliki jumlah konten yang terbatas yaitu hanya sampai 140 karakter, namun frekuensinya tinggi, dan kontennya cenderung tidak berubah setelah di terbitan.  Sedangkan web pages memiliki konten yang cenderung lebih besar, tetapi penambahan kontennya cenderung lebih lambat, dan setelah dilakukan posting biasanya akan dilakukan updating. Perbedaan inilah yang melatarbelakangi mengapa penelitian Paper Information Retrieval ini mencoba mengomparasi antara microblog search dan web search. Diharapkan, agar ke depan didapatkan design web search yang dapat bekerja sama dengan social media.

Survey yang dilakukan terhadap pengguna twitter, Paper Information Retrieval mengungkap beberapa alasan mengapa pengguna melakukan pencarian twitter. Beberapa diantaranya adalah yang pertama untuk mendapatkan informasi real-time dan informasi terkait suatu berita pada suatu waktu tertentu. Kemudian alasan lain adalah pencarian mengenai informasi social terhadap seorang tertentu, terkadang pengguna ingin mengetahui informasi tentang seseorang bahkan komunitas tertentu terkait suatu hal. Misalnya, pencarian tentang pendapat komunitas Microsoft terhadap suatu produk Microsoft. Alasan terakhir adalah pencarian mengenai suatu topic tertentu, seperti tentang astronomi, science, dll, juga mengenai pendapat public terhadap topic tertentu yang banyak dibicarakan, terkadang pengguna juga menggunakan pencarian twitter untuk mencari twit yang telah lampau.

Tidak hanya untuk menjalin komunikasi sesama teman atau kerabat, twitter juga media untuk bertukar infromasi.

Pada blog ini akan dibahas tentang pencarian informasi melalui twitter dan perbandingan nya dengan pencarian melalui web search.

Topik topik yang dibahas pada Paper Information Retrieval, antara lain:

  1. Mengapa orang melakukan pencarian pada twitter
  2. Information Retrieval di Twitter