Home > information retrieval, information retrieval it telkom, institut teknologi telkom, ittelkom, teknik informatika, twitter search, Uncategorized > Information retrieval it telkom: Mengumpulkan hasil Twitter dan hasil Web

Information retrieval it telkom: Mengumpulkan hasil Twitter dan hasil Web

Berikut merupakan hasil analisis yang dilakukan oleh Jaime teevan, Daniel Ramage, Meredith Ringel Morris dalam paper “a comparison of microblog search and web search” tentang bagaimana mereka mengumpulkan hasil twitter dan hasil web berkaitan dengan information retrieval :

Untuk memperkirakan content Twitter untuk query-query yang ada di dalam sampel yang saat itu dikeluarkan, dilakukan crawl terhadap delapan juta posting yang disediakan oleh aliran spritzer Twitter selama satu minggu. Aliran spritzer adalah aliran umum yang berisi pesan sampel dari semua posting Twitter publik. Susunannya adalah ditentukan oleh Twitter. Dari sini kita mencoba tweets yang berisi 50 pencarian common queries yang paling populer untuk analisa lebih lanjut. Jumlah potensi hasil per query berkisar antara ratusan hingga puluhan ribu.

Hasil pencarian Twitter berbeda dengan hasil pencarian web di seluruh isi dari setiap hasil yang disajikan kepada pengguna dalam daftar hasil. Sebaliknya, hasil pencarian web biasanya disajikan sebagai daftar hyperlink, masing-masing dengan potongan algoritma yang diekstraksi dari teks yang dirancang untuk membantu pencari dalam memilih hyperlink yang akan dikunjungi (meskipun dalam beberapa kasus potongan dapat sepenuhnya memenuhi kebutuhan informasi pengguna). Untuk merepresentasikan hasil pencarian web, dilakukan ekstraksi terhadap judul teks dan ringkasan dari semua hasil yang disajikan oleh Bing dari query log kepunyaan mesin pencari untuk query yang sama dari periode waktu yang sama. Sementara, tweets secara kualitatif berbeda dari potongan Web, keduanya berasal dari bentuk dasar tekstual yang oleh pencari disajikan melalui hasil sistem pencarian yang dianggap relevan, dan menjamin persamaan.

Term-term yang sangat umum dan sangat langka disaring dari setiap set hasil query-spesifik, seperti praktek standar untuk jenis analisis yang dilakukan. Secara khusus, dilakukan penyaringan terhadap 20 term yang paling umum dan muncul kurang dari tiga hasil. Setelah penyaringan, 42 dari 50 hasil set query awal setidaknya memiliki 100 hasil not-empty dari Twitter dan Web, untuk mencari perbedaan di Twitter dan hasil pencarian Web untuk query-query tersebut dibutuhkan eksplorasi lebih lanjut.

salam,

mahasiswa kelas Information Retrieval ITTelkom, 2011

on Information retrieval it telkom: Mengumpulkan hasil Twitter dan hasil Web

  1. April 30, 2011 at 5:11 am

    oohh beda ya kirain sama aja, nice info

  2. Run DMP
    April 30, 2011 at 5:50 am

    ane mau posting gmana caranya gan?

  3. April 30, 2011 at 5:58 am

    Run DMP :

    ane mau posting gmana caranya gan?

    posting apan nya gan? comment apa content blog?klo komen bisa klo content blog oooo tidak bisa🙂 btw terimakasih sudah meramaikan

  4. Run DMP
    April 30, 2011 at 5:59 am

    bikin konten dong

    gw mau bikin konten….mau bikin sosialisasi

  5. April 30, 2011 at 6:22 am

    Run DMP :

    bikin konten dong

    gw mau bikin konten….mau bikin sosialisasi

    sosialisasi apan toh mas?

  6. April 30, 2011 at 6:30 am

    udah gw taroh blog roll punya lo do.. mana link blog gw…

  7. Run DMP
    April 30, 2011 at 7:18 am

    sosialisasi SSBRC (Senang Senang Bahagia Remi Championship)

  8. April 30, 2011 at 1:33 pm

    foodgrade :

    udah gw taroh blog roll punya lo do.. mana link blog gw…

    mantap dree!

  9. May 17, 2011 at 1:16 pm

    ayo gencarkan lagi promosinyaa…

  1. No trackbacks yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: