Information Retrieval

Wikipedia menjelaskan information retrieval merupakan suatu bidang studi yang berhubungan dengan mencari dokumen, untuk informasi dalam dokumen, dan untuk metadata tentang dokumen, serta yang mencari database relasional dan World Wide Web. Ada tumpang tindih dalam penggunaan istilah pengambilan data, pengambilan dokumen, pengambilan informasi, dan pengambilan teks, tetapi masing-masing juga memiliki tubuh sendiri sastra, teori, praksis, dan teknologi. IR adalah interdisipliner, didasarkan pada ilmu komputer, matematika, ilmu perpustakaan, ilmu informasi, arsitektur informasi, psikologi kognitif, linguistik, dan statistik.

Berikut merupakan perkembangan information retrieval dari masa masa seperti yang dikutip dari wikipedia,

Sebelum 1900-an

1880-an: Herman Hollerith menciptakan rekaman data pada media mesin yang dapat dibaca.
1890 Hollerith kartu, kunci dan tabulasi pukulan yang digunakan untuk mengolah data Sensus AS 1890.

1940-1950

1940-an: Masalah-masalah dihadapi militer AS pengindeksan dan pengambilan dokumen perang penelitian ilmiah yang diambil dari Jerman.

1945: Vannevar Bush As We May Think muncul di Atlantic Monthly.
1947: Hans Peter Luhn (penelitian insinyur di IBM sejak 1941) mulai bekerja pada sistem kartu punch mekanik berbasis untuk mencari senyawa kimia.

1950: Tumbuh kekhawatiran di Amerika Serikat untuk sebuah “kesenjangan ilmu” dengan Uni Soviet termotivasi, pendanaan mendorong dan memberikan latar bagi sastra mekanik mencari sistem (Allen Kent et al.) Dan penemuan pengindeksan kutipan (Eugene Garfield).
1950: The “temu kembali informasi” istilah tampaknya telah diciptakan oleh Calvin Mooers.
1951: Philip Bagley dilakukan percobaan awal dalam pengambilan dokumen terkomputerisasi dalam sebuah tesis master di MIT [2].
1955: Allen Kent bergabung Case Western Reserve University, dan akhirnya menjadi direktur Pusat Dokumentasi dan Komunikasi Penelitian. Tahun yang sama, Kent dan koleganya menerbitkan kertas di Amerika Dokumentasi menggambarkan presisi dan tindakan recall serta merinci suatu “kerangka” yang diusulkan untuk mengevaluasi sistem IR yang meliputi metode sampling statistik untuk menentukan jumlah dokumen relevan tidak diambil.
1958: Konferensi Internasional Informasi Ilmiah Washington DC termasuk pertimbangan sistem IR sebagai solusi untuk masalah yang diidentifikasi. Lihat: Prosiding Konferensi Internasional tentang Informasi Ilmiah, 1958 (National Academy of Sciences, Washington, DC, 1959)
1959: Hans Peter Luhn menerbitkan “Auto-pengkodean dokumen untuk pengambilan informasi.”

1960:

Awal 1960-an: Gerard Salton mulai bekerja pada IR di Harvard, kemudian pindah ke Cornell.
1960: Melvin Earl (Bill) Maron dan John Lary Kuhns [3] menerbitkan “Pada relevansi, pengindeksan probabilistik, dan pengambilan informasi” dalam Journal of ACM 7 (3) :216-244, Juli 1960.
1962:
Cyril W. Cleverdon menerbitkan temuan awal dari studi Cranfield, mengembangkan suatu model untuk evaluasi sistem IR. Lihat: Cyril W. Cleverdon, “Laporan Pengujian dan Analisis sebuah Investigasi ke Efisiensi Perbandingan Pengindeksan Sistem”. Koleksi Cranfield Penerbangan, Inggris Cranfield,, 1962.
Kent diterbitkan Analisis Informasi dan Retrieval.
1963:
Weinberg laporan “Ilmu, Pemerintah dan Informasi” memberikan artikulasi penuh gagasan “krisis informasi ilmiah.” Laporan itu dinamai Dr Alvin Weinberg.
Yusuf Becker dan Robert M. Hayes diterbitkan teks pada pencarian informasi. Becker, Joseph; Hayes, Mayo Robert. Penyimpanan informasi dan pengambilan: alat, elemen, teori. New York, Wiley (1963).
1964:
Karen Spärck Jones menyelesaikan tesis nya di Cambridge, sinonim dan Semantic Klasifikasi, dan bekerja terus linguistik komputasi yang berlaku untuk IR.
Biro Standar Nasional mensponsori simposium berjudul “Asosiasi Statistik Metode Dokumentasi Mekanik.” Beberapa sangat signifikan kertas, termasuk referensi pertama G. Salton ‘s diterbitkan (kami percaya) ke sistem SMART.
pertengahan 1960-an:

National Library of Medicine dikembangkan MEDLARS Kedokteran Sastra Analisis dan Retrieval System, database dapat dibaca oleh mesin besar pertama dan sistem batch-retrieval.
Proyek Intrex di MIT.
1965: JCR Licklider diterbitkan Perpustakaan Masa Depan.
1966: Don Swanson terlibat dalam penelitian di University of Chicago pada Persyaratan untuk Masa Depan Katalog.

1960-an: F. Wilfrid Lancaster menyelesaikan studi evaluasi sistem MEDLARS dan menerbitkan edisi pertama teks tentang pencarian informasi.

1968:

Gerard Salton diterbitkan Otomatis Informasi Organisasi dan Retrieval.
John W. Sammon, Jr ‘s RADC laporan Tech “Beberapa Matematika Informasi Penyimpanan dan Retrieval …” diuraikan model vektor.

1969: Sammon “A pemetaan linier untuk analisis struktur data” (IEEE Transaksi di Komputer) adalah proposal pertama untuk antarmuka visualisasi untuk sistem IR.

1970

awal 1970-an:

Pertama online sistem-NLM AIM-Twx, MEDLINE; Lockheed’s Dialog; Orbit SDC’s.
Theodor Nelson mempromosikan konsep hypertext, diterbitkan Komputer Lib / Dream Machines.

1971: Nicholas Jardine dan Cornelis J. van Rijsbergen menerbitkan “Penggunaan clustering hierarkis dalam temu balik informasi”, yang diartikulasikan dengan “hipotesis cluster.” (Informasi Penyimpanan dan Retrieval, 7 (5), hal 217-240, Desember 1971)
1975: Tiga publikasi sangat berpengaruh oleh Salton sepenuhnya diartikulasikan pemrosesan nya vektor kerangka kerja dan model diskriminasi istilah:

A Theory Indexing (Masyarakat Matematika Industri dan Terapan)
A Theory Pentingnya Term dalam Analisis Teks Otomatis (JASIS ay. 26)
Sebuah Ruang Vector Model untuk Pengindeksan Otomatis (CACM 18:11)

1978: Pertama ACM SIGIR konferensi.
1979: CJ van Rijsbergen diterbitkan Information Retrieval (Butterworths). Berat penekanan pada model probabilistik.

1980

1980: Pertama internasional ACM SIGIR konferensi, bersama dengan kelompok British Society Komputer IR di Cambridge.
1982: Nicholas J. Belkin, Robert N. Oddy, dan Helen M. Brooks mengusulkan ASK (anomali Negara Pengetahuan) sudut pandang untuk pengambilan informasi. Ini merupakan konsep penting, meskipun alat analisis otomatis mereka ternyata akhirnya mengecewakan.
1983: Salton (dan Michael J. McGill) diterbitkan Pengenalan Modern Information Retrieval (McGraw-Hill), dengan penekanan pada model vektor.
1985: Blair dan Maron mempublikasikan: Sebuah Evaluasi Efektivitas Retrieval untuk Dokumen-Temu-Full Teks Sistem
pertengahan 1980-an: Upaya untuk mengembangkan versi pengguna akhir sistem IR komersial.

1985-1993: Kunci makalah dan sistem eksperimental untuk antarmuka visualisasi.
Bekerja oleh Donald B. Crouch, Robert R. Korfhage, Matius Chalmers, Anselmus Spoerri dan lain-lain.

1989: Pertama World Wide Web proposal oleh Tim Berners-Lee di CERN.

1990

1992: Pertama TREC konferensi.
1997: Publikasi Korfhage’s Information Penyimpanan dan Retrieval [4] dengan penekanan pada sistem point visualisasi dan multi-referensi.
akhir 1990-an: Web search engine pelaksanaan banyak fitur sebelumnya hanya ditemukan di sistem IR eksperimental. Search engine menjadi Instansiasi yang paling umum dan mungkin terbaik model IR, penelitian, dan implementasi.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: