Sunday, March 31, 2013

Menjadi Pribadi yang Berani dan Teliti

menjadi pribadi berani dan telitiDalam menghadapi tantangan hidup ini keberanian mutlak sangatlah diperlukan, keberuntungan akan berpihak kepada orang-orang yang berani.  Namun jangan salah ketelitian juga sama pentingnya, sehingga pekerjaan yang kita kerjakan hasilnya akan memuaskan serta akan meminimalisir tingkat kerugian.
Kisah berikut bisa dijadikan pelajaran tentang bagaimana penting-nya Menjadi Pribadi yang Berani dan Teliti. 
Di sebuah ruang kuliah, seorang profesor kedokteran memberikan kuliah perdananya. Para mahasiswa baru itu tampak serius. Mata mereka terpaku menatap profesor, seraya tangan sibuk mencatat. “Menjadi dokter, butuh keberanian dan ketelitian,” terdengar suara sang profesor. “Dan saya harap kalian dapat membuktikannya.” Bapak itu beranjak ke samping. “Saya punya setoples cairan limpa manusia yang telah direndam selama 3 bulan.” Profesor itu mencelupkan jari ke dalam toples, dan memasukkan jari itu ke mulutnya. Terdengar teriak-teriak kecil dari mahasiswa itu. Mereka terlihat jijik. “Itulah yang kusebut dengan keberanian dan ketelitian,” ucap profesor lebih meyakinkan.
“Saya butuh satu orang yang bisa berbuat seperti saya. Buktikan bahwa kalian ingin menjadi dokter.” Suasana aula mendadak senyap. Mereka bingung: antara jijik dan tantangan sebagai calon dokter. Tak ada yang mengangkat tangan. Sang profesor berkata lagi, “Tak adakah yang bisa membuktikan kepada saya? Mana keberanian dan ketelitian kalian?”
Tiba-tiba, seorang anak muda mengangkat tangan. “Ah, akhirnya ada juga yang berani. Tunjukkan pada teman-temanmu bahwa kau punya keberanian dan ketelitian.” Anak muda itu menuruni tangga, menuju mimbar tempat sang professor berada. Dihampirinya stoples itu dengan ragu-ragu. Wajahnya tegang, dan perasaan jijik terlihat dari air mukanya.
Ia mulai memasukkan jarinya ke dalam toples. Kepala menoleh ke samping dengan mata yang menutup. Teriakan kecil rasa jijik kembali terdengar. Perlahan, dimasukkannya jari yang telah tercelup lendir itu ke mulutnya. Banyak orang yang menutup mata, banyak pula yang berlari menuju kamar kecil. Sang professor tersenyum. Anak muda itu tersenyum kecut, sambil meludah-ludah ke samping.
“Aha, kamu telah membuktikan satu hal, anak muda. Seorang calon dokter memang harus berani. Tapi sayang, dokter juga butuh ketelitian.” Profesor itu menepuk punggung si mahasiswa. “Tidakkah kau lihat, aku tadi memasukkan telunjuk ke toples, tapi jari tengah yang masuk ke mulut. Seorang dokter memang butuh keberanian, tapi lebih butuh lagi ketelitian.”
Sahabat, berhati-hatilah. Hidup memang butuh keberanian. Tapi, jangan sepelekan ketelitian. Cermati langkahmu, waspadai tindakanmu. Hati-hati saat “mencelupkan jari” dalam toples kehidupan. Kalau tidak, “rasa pahit” yang akan kita temukan.
Untuk mengasah keberanian dan ketelitian, berfokuslah pada  kekuatan, bukan pada kelemahan. Hindarkan diri Anda dari jebakan untuk memboroskan kehidupan dengan upaya berperang melawan kelemahan pribadi. Karena sebetulnya, dengan memaksimalkan peran kekuatan-kekuatan pribadi kita ke dalam kesibukan membangun karir dan bisnis, kita tidak menyediakan cukup waktu bagi kelemahan untuk menjadi penghambat. Jangan izinkan kelemahan-kelemahan untuk menghambat perjalanan menuju kualitas hidup yang ingin Anda capai.
Copy from: salamsuper[dot]com

Wednesday, March 13, 2013

The Accident Waiting to Happen

The Accident Waiting to Happen
Kecelakaan yang sedang menunggu terjadi ..
berarti kecelakaan itu belum terjadi …
Bahasan disini bukan hanya tentang kecelakaan ..
Tentang yang buruk atau yang menakutkan
Tetapi juga tentang … The success waiting to happen
Kalau kecelakaan bisa terjadi, berarti sukses juga bisa terjadi.
Sebab akibat yang kita bicarakan secara universal dalam bahasan ini .. dilihat baik menghasilkan kebaikan, dilihat buruk menghasilkan keburukan
Kecelakaan adalah masalah yang terjadi yang tidak diketahui sebelumnya.

Jika kita tidak tahu sebelumnya dan terjadi serta belum menghasilkan kegentingan, Maka disebut kecelakaan
Jika kita bersedih, maka kita akan melihat sisi buruk dari kejadian.
Kejadian terdapat dua sisi, Yaitu…derita dan harapan
Jika kita bersedih…
Maka akan fokus pada deritanya saja, dan tidak melihat kebaikannya.
Tidak ada kata-kata yang tidak didengar, tidak ada tindakan yang tidak disaksikan.
Tuhan Maha Tahu
Tuhan ada dimana-mana
Jika ada keburukan yang segera dirasakan, oleh orang yang melakukan keburukan,
berarti ada kebaikan yang segera dirasakan oleh orang-orang yang mendahulukan kebaikan.
Yang berulang di hati akan menjadi ANDA
Jika Anda mengatakan kata-kata yang baik, Anda akan menjadi pribadi yang cantik & anggun.
Berapa banyak orang yang melatih dirinya untuk menjadi orang yang direndahkan, yang tidak diinginkan …
Bagaimana caranya berhenti menjadi diri yang direndahkan??
Caranya adalah …
Jangan ijinkan apapun yang tidak baik berulang.
“Jika Anda mengeluhkan sesuatu, periksalah sebab yang Anda keluhkan. Gantilah kebiasaan buruk dengan kebiasaan baru yang lebih baik.”
Kecelakaan itu baik.. karena Tuhan mengetahuinya.
Masalah adalah rahmat yang belum kita mengerti tujuannya.
Yang kelihatan adalah kesulitannya,
Jika kita betul-betul beriman..
Maka kita percaya bahwa kejadian itu baik,
Maka di dalam kecelakaan atau masalah yang diharapkan dari Anda adalah tetap bersikap baik
Banyak orang menyebabkan  terjadinya kecelakaan atau adanya masalah, dan mengambil jalan pintas yang buruk.
Sehingga yang tadinya melihat kecelakaan sebagai laknat, menjadi kemuliaan yang berhasil dengan baik.
“Tidak ada pilihan kecuali menjadi orang yang lebih baik”
Banyak orang bangga dengan dirinya yang berisi awalan, padahal satu tindakan saja yang berhasil.
Jadi ambil satu saja karena Tuhan itu Maha Penyayang.
Kalau Anda lakukan sesuatu dengan ikhlas dan sungguh-sungguh, dan ketika salah Tuhan akan membenarkan.
Jadi..lakukan apapun ..
Bukan yang Anda lakukan yang membuat Anda kaya, tetapi Tuhan lah yang membuat kita kaya
Maka berharaplah kepada Tuhan.
“Awal dari sebuah kebahagiaan adalah senyum”
Emosi itu baik ..
Emosi adalah rahmat ..
Emosi baik merupakan bahan dasar seseorang menjadi berkharisma.
Berarti orang yang berkharisma itu menggunakan emosi yang baik.

Kesimpulan:
Kecelakaan adalah akibat dari berlanjutnya keburukan.
Kebanyakan orang tahu kalau itu buruk, tetapi sulit sekali rasanya meninggalkan keburukan.
Karena …
Tidak tertarik pada kebaikan, menemukan kenikmatan dalam keburukan, karena tidak merasa baik.
Sebagian nasehat adalah peringatan terakhir
Karena kita telah melanjutkan keburukan, sampai pada titik rasa sakit.
Kebiasaan baik yang diteruskan bukan lagi kewajiban, tapi sudah menjadi kecintaan.
Apakah Anda melanjutkan kebaikan yang tidak lagi menjadi beban, tetapi menjadi pilihan dari kecintaan hati Anda.
Karena paling indah adalah berhasil melakukan sesuatu yang Anda cintai, dan didalam melakukannya Anda dihargai dengan hati yang damai, dengan cinta yang tulus dari keluarga dan dari sesama.
Kemudian dengan nama yang harum, karena peran Anda memuliakan kehidupan sesama,
yang bahkan batu pun bersyukur karena ada Anda.
Demikian rangkuman singkat MTGW dengan topik The Accident Waiting to Happen, semoga bermanfaat.
© 2013, Nurlela Hasanah. All rights reserved.
from : salamsuper[dot]com

Sunday, March 10, 2013

Belajar Mengasah Sabar

Sahabat SalamSuper.com, kami yakin diantara sahabat pernah mendengar ungkapan bahwa “Sabar sih sabar, tapi sabar juga kan ada batasnya”. Jika memang kesabaran ada batasnya, seberapakah batasan kesabaran itu?
Semestinya kesabaran itu tidak berbatas. Ia seluas langit, sedalam perut bumi. Ia merupakan peralihan udara yang dibentuk menjadi satu perbuatan.
Seperti pada kisah motivasi yang kami angkat berikut ini, semoga kisah motivasi ini memberikan semangat bagi kita, untuk belajar mengasah sabar dalam menghadapi hidup ini.
Belajar Mengasah Sabar
Di suatu sore hari pada suatu desa kecil, ada seorang yang sudah tua duduk bersama anak nya yang masih muda yang baru saja diwisuda akan kelulusannya pada perguruan tinggi ternama di kota itu. Mereka duduk berbincang-bincang di halaman sambil memperhatikan suasana di sekitar mereka. Saat mereka berbincang-bincang, datang seekor burung hinggap di ranting pohon. Si ayah lalu menunjuk jari ke arah burung itu sambil bertanya,
“Nak, apakah benda hitam itu?” “Burung gagak, Ayah”, jawab si anak.
Ayah-nya mengangguk-anggukkan kepala, namun tak berapa lama kemudian, sang ayah mengulangi pertanyaan yang sama. Si anak menyangka ayahnya kurang mendengar jawabannya tadi, lalu menjawab dengan sedikit keras.
“Itu burung gagak, Ayah!”
Tetapi kemudian tak berapa lama si ayah kembali bertanya dengan pertanyaan yang sama.
Si  anak  merasa sedikit  bingung  dengan  pertanyaan  yang  sama diulang-ulang, lalu menjawab dengan lebih kuat,
“BURUNG GAGAK!!” Si ayah terdiam seketika.
tidak  lama kemudian, sang  ayah sekali lagi mengajukan  pertanyaan  yang serupa hingga membuat si anak hilang kesabaran dan menjawab dengan nada tinggi dan kesal kepada sang ayah,
“Itu gagak, Ayah.” Tetapi agak mengejutkan si anak, karena si ayah sekali lagi membuka mulut hanya untuk bertanya hal yang sama. Dan kali ini si anak benar-benar hilang sabar dan menjadi marah.
“Ayah!!! Saya tak tahu Ayah paham atau tidak. Sudah 5 kali Ayah bertanya soal hal tersebut dan saya sudah juga memberikan jawabannya. Apa lagi yang Ayah mau saya katakan????
Itu burung gagak Ayah….., burung gagak”, kata si anak dengan nada yang begitu marah.
Kemudian si   ayah   lalu   bangun   menuju   ke   dalam   rumah   meninggalkan   si   anak   yang kebingungan.Kemudian si ayah keluar dengan sebuah buku di tangannya. Dia mengulurkan buku itu kepada anaknya yang masih geram dan bertanya-tanya. Ternyata buku tersebut adalah sebuah diary lama.
Sambil menunjuk pada suatu lembaran pada buku si ayah berkata, “Coba kau baca apa yang pernah Ayah tulis di dalam diary ini,”.
Si anak setuju dan membaca paragraf yang berikut.
“Hari ini aku di halaman melayani anakku yang genap berumur lima tahun. Tiba-tiba seekor gagak hinggap di pohon. Anakku terus menunjuk ke arah gagak dan bertanya,
“Ayah, apa itu?” Dan aku menjawab, “Burung gagak.”
Walau bagaimana pun, anakku terus bertanya soal yang serupa dan setiap kali aku menjawab dengan jawaban yang sama. Sehingga 25 kali anakku bertanya demikian, dan demi rasa cinta dan sayangku, aku terus menjawab untuk memenuhi perasaan ingin tahunya. Aku berharap hal ini menjadi suatu pendidikan yang berharga untuk anakku kelak.”
Setelah selesai membaca paragraf tersebut si anak mengangkat muka memandang wajah si Ayah yang kelihatan sayu. Si Ayah dengan perlahan bersuara,
“Hari ini Ayah baru bertanya kepadamu soal yang sama sebanyak 5 kali, dan kau telah hilang kesabaran serta marah. Engkau telah dewasa anakku. Asahlah kesabaranmu. karena itu adalah salah satu kunci meraih suksesmu”
Lalu si anak seketika memerah karena malu. Ia bersimpuh di kedua kaki ayahnya meminta maaf atas apa yg telah ia perbuat.
Sahabat sekalian,
Kesabaran adalah turunan dari cinta. Ia merupakan kesederhanaan sikap. Saking sederhananya, orang sabar kerap dianggap sebagai seorang yang bodoh. Tetapi, jangan dikira kesabaran itu tidak memiliki daya. Daya inilah yang akan mampu meletakkan diri kita yang sesungguhnya.
Dalam hidup, kesabaran adalah salah satu point penting untuk meraih kesuksesan. Anda ingin sukses dalam pendidikan, maka sabarlah dalam belajar. Cernalah pelajaran satu demi satu. Ingin sukses dalam berkarir, bersabarlah dalam menyumbangkan produktifitas terbaik. Ingin sukses dalam kehidupan dunia agar berhadiahkan surga? maka bersabarlah dalam mentaati perintah sang Khaliq dan bersabar dalam beribadah, serta bersabar menahan diri untuk tidak melanggar laranganNYa.
Semoga kita termasuk golongan orang-orang yang sabar….Amin..
© 2013, admin. All rights reserved.
Belajar Mengasah Sabar is a post from: salamsuper[dot]co

Metode, Cara Kerja dan Algoritma IR


1.      Metode / Algoritma Yang digunakan dalam melakukan IR (Information Retrieval)
a).  Model Boolean (BIR Boolean Information Retrieval)
Model ini merupakan model IR sederhana yang berdasarkan atas teori himpunan dan aljabar boolean. Boolean sendiri pertama kali dikembangkan oleh seroang ilmuan matematika bernama George Boole (1815-1864). Yang dikemukakan sebagai suatu struktur logika aljabar yang mencakup operasi Logika AND, OR dan NOR, dan juga teori himpunan untuk operasi union.
Didalam struktur data, Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar atau salah). Sehingga didalam IR, logika boolean berarti bahwa data yang di crawler sesuai atau tidak antara variable – variablenya.
Kelebihan Model Boolean
  • Mudah Untuk di Implementasikan
  • Konsep Yang Terstruktur
Kekurangan Model Boolean
  • Pencocokan yang tepat dapat mengambil dokumen terlalu sedikit atau terlalu banyak.
  • Sulit untuk pengindexkan, beberapa dokumen yang lebih penting dari pada yang lain kadang berada dibawah dokumen yang tidak penting.
  • Sulit untuk menerjemahkan query ke dalam ekspresi Boolean
  • Semua istilah sama-sama berbobot
  • Lebih seperti pengambilan data dari pencarian informasi
Struktur Data dan Algoritmanya
Jika dilihat dari sudut pandang matematika atau sudut pandang praktis, BIR (boolean Information Retrieval) adalah logika yang paling mudah.  Namun secara logika dan struktur data tidak semudah hal yang diutarakan diatas. Algoritma BIR diantaranya adalah Hash Table, Steeming dan lain lain. Diabawah merupakan rekaman bagaimana cara kerja Hash Tabel salasatu algoritma dalam BIR

b). Model Vector Space (VSM)
Model Vector Space adalah Model dalam IR yang berbasis token untuk memungkinkan partial matching dan pemeringkatan dokumen (pengindexan). Dengan prinsip dasar dokumen menjadi sebuah token yang kemudian ti kumpulkan menjadi t(n) token-token, kemudian Query menjadi vector token yang berfungsi untuk mencari token-token yang berhubungan dengan melihat kesamaan vektor dokumen dan query berdasarkan jarak vektor.
Kelebihan Vector Space Model (VSM)
  1. Adanya peringkat pengambilan informasi
  2. Menampilkan referensi yang sesuai kebutuhan
  3. Penyocokan secara partial.
Kekurangan Vector Space Model (VSM)
  • Menganggap informasi adalah independen
  • Bobot pemahaman(istilah) tidak lagi diperlukan.
Cara Kerja VSM dan Algoritmanya.
Pada VSM, setiap dokumen dan  query dari pengguna direpresentasikan  sebagai ruang vektor berdimensi n.  Biasanya digunakan nilai bobot istilah (term weigthing) sebagai nilai dari vektor pada dokumen nilai 1 untuk setiap istilah yang  muncul pada vektor query.
Pada model ini, bobot dari query dan dokumen dinyatakan dalam bentuk  vektor, seperti: Q = (wq1, wq2, wq3, . . . ,wqt) dan Di= (wi1, wi2, wi3, . . . , wit) Dengan wqj dan wij sebagai bobot istilah Tj dalam query Q dan dokumen Di. Dengan demikian dokumen yang lebih panjang dengan jumlah istilah yang lebih banyak memiliki kemungkinan lebih besar untuk dianggap relevan dengan istilah-istilah query tertentu dibandingkan dokumen-dokumen yang lebih pendek. Sehingga pada kebanyakan lingkungan penemu-kembalian, vektor dokumen ternormalisasi lebih disukai namun proses normalisasi vektor querytidak diperlukan karena ukurannya yang umumnya pendek dan perbedaan panjang antar-query relatif kecil.
c). Model Probabilistic
Model Probabilitas didasarkan pada Prinsip Ranking Probabilitas, yang menyatakan bahwa sistem pencarian informasi yang seharusnya berdasarkan peringkat probabilitas dokumen mereka yang relevan dengan query, mengingat semua bukti yang tersedia [Belkin dan Croft 1992].
Olehkarena itu dalam metode probabilitas ini, suatu dokumen yang sering di temukan dan diindexing ulang merupakan dokumen yang paling relevan dari kata kunci, sehingga akan selalu muncul ketika katakunci itu di queue.
2. Perbedaan cara kerja Precision versus Recall adalah :
a). Precision disebut juga kepresisan atau kecocokan antara permintaan informasi dengan jawaban terhadap permintaan informasi itu sendiri, artinya persis atau cocok dokumen tersebut untuk keperluan pencari informasi, bergantung pada seberapa relevan dokumen tersebut bagi si pencari.suatu perbandingan ratio jumlah isi dokumen yang relevan dengan jumlah seluruh dokumen yang terambil oleh sistem baik relevan maupun tidak relevan. 
Contoh : 
  Tabel Rumus 

Relevan
Tidak Relevan
Total
Ditemukan
a (hits)
b (noise)
a+b
Tidak ditemukan
c (misses)
d (reject)
c+d
Total
a+b
c+d
a+b+c+d
 
Tabel contoh precision

Relevan
Tidak Relevan
Total
Ditemukan
60
30
90
Tidak ditemukan
15
5
20
Total
90
20
110
 Precision = [a/ (a+b)] x 100
[60/(60+30)]x100 = 66.7 %

 b). Recall (remember, recollect, remind) menemukan kembali informasi yang sudah tersimpan dari proporsi jumlah dokumen yang dapat ditemukan-kembali oleh sebuah proses pencarian dengan perbandingan  jumlah dokumen relevan yang didapatkan sistem dengan jumlah seluruh dokumen relevan yang ada dalam  dokumen.
  Tabel Rumus

Relevan
Tidak Relevan
Total
Ditemukan
a (hits)
b (noise)
a+b
Tidak ditemukan
c (misses)
d (reject)
c+d
Total
a+b
c+d
a+b+c+d

Tabel contoh precision

Relevan
Tidak Relevan
Total
Ditemukan
60
30
90
Tidak ditemukan
15
5
20
Total
90
20
110
Recall = [a/ (a+c)] x 100
[60/(60+15)]x100 = 80 %
3.  Algoritma Web-Crawler sederhana
Web-Crawler sering juga disebut Web Spider atau Web Robot merupakan web aplikasi atau program komputer atau script automatic yang berfungsi mengumpulkan atau mencari informasi dari berbagai halaman web atau blog yang ada di internet secara perodik dan sistimatis. Web crawler  fungsi utamanya adalah untuk melakukan penjelajahan serta pengambilan halaman-halaman situs, dari hasil pengumpulan situs.
Cara Kerja Web Crawler :
a). Mengunduh (download)  halaman web : melakukan pengunduhan halaman web berdasarkan URL yang diberikan kemudian file di simpan di basisdata, kemudian dimanupulasi untuk di index atau untuk diarsip dengan mengunakan pengarsipan otomatis.
b). Memprasing halaman web yang telah diunduh dan mengambil semua link :  memprasing ke seluruh halaman web yang sudah diunduh dan mengambil link-link dihalaman lain kemudian didepinisikan dengan sebuah penanda HTML.
c). Setiap link yang diambil diulangi proses : melakukan proses bentuk pengulangan (rekursif) dalam hal ini mengunakan dua metode yaitu :
(1). Depth First yaitu menikuti jalur samapai selesai sebelum mencoba jalur yang lain,  dengan mengunakan algoritma ini menemkan link pertama pada halaman pertama kemudian halaman yang berasosiasi dengan link tersebut menemukan link pertama dan berulang sampai terakhir samapi semuanya dikunjungi.
(2). Breadth First yaitu pengujian setiap link pada sebuah halaman sebelum memproses halaman selanjutnya, dengan mengunakan algoritma ini akan menelusuri setiap link pada halaman pertama kemudian menelusuri kembali sampai pada level link yang pernah dikunjungi.
Dalam Web Crawler harus melakukan tolak ukur antara lain :
a). Pengendalian Query similaritas  : sebuah query  mengendalikan crawler  dan didefinisikan pentingnya sebuah halaman sebagai similaritas texttual diantara halaman web dan query.
b). Menghitung banyaknya link halaman web, maka banyak nya link halaman yang keluar semakin berharga karna merupakan direktori web, contoh kasus di blogspot semakian banyak link dan menyukai Google+ maka semakin blog tersebut terindex, tolak ukur ini biasa disebut Forward Link Count .
c). Banyaknya link dari halaman web makan secara intutif  sebuah halaman web yang dilinkan dengan banyak halaman yang menjadi referensi. tolak ukuran ini sering disebut juga Backlink Count.
d). Halaman web sebagai lokasi sebagai conoh, URL yang ber ujung ".COM" lebih berguna dari URL lainya, tolak ukur ini biasa disebut Location Matric.
d). Menetapkan semua link yang sama contoh kasus : sebuah link yahoo dihitung dengan link individu, jika link yahoo  lebih penting maka link yahoo lebih tinggi, tolak ukur ini biasa disebut PageRank
Dari penjelasan diatas google sudah menerapkan web Crawler https://www.google.co.id/
Berikut merupakan Algoritma Web Crawler yang Sederhana.
Q <—- S0
DO WHILE NOT (isQueueEmpty(Q))
u <—- Dequeue (Q)
d(u) <—- Fetch(u)
CALL Store(D,(d(u),u))
L <—- Parse (d(u))
FOR EACH v IN L
CALL Store (E,(u,v))
IF NOT (v € D OR v € Q)
THEN Enqueue (Q,v).
END FOR
END DO
Penjelasan dari algoritma diatas.
Ketika Queue Kosong maka diminta untuk melakukan pengisian Queue, ketika ada maka diambil dari data store kemudian ditampilkan. Secara sederhana algoritma diatas memerintahkan seperti demikian.

Pengertian, Cara Kerja dan Masa depan Information Retrieval


Pengertian, Cara Kerja dan Masa Depan Information Retrieval
1. Information Retrieval (IR) atau sering disebut “temu kembali infromasi” adalah ilmu yang mempelajari prosedur-prosedur dan metode-metode untuk menemukan kembali infromasi yang tersimpan dari berbagai sumber (resources) yang relevan atau koleksi sumber informasi yang dicari atau dibutuhkan. Dengan tindakan  index (indexing), panggilan (searching), pemanggilan data kembali (recalling).
Dalam pencarian data, beberapa jenis data dapat ditemukan diantaranya texts, table, gambar (image), video, audio. Adapun tujuan dari Infromation Retrieval ialah untuk memenuhi informasi pengguna dengan cara meretrieve dokumen yang relevan atau menguragi dokumen pencarian yang tidak relevean.

Definisi Information Retrieval
Secara Konsep sederhana IR merupakan proses mencari, dan kemudain mendapatkan apa yang dicari itu. Jika kita titik beratkan kepada prosesnya maka didalamnya akan terungkap bagaimana perjalanan informasi yang diminta,  menjadi infromasi yang diberikan. Menurut beberapa ahli IR didefinisikan sebagai berikut :
Menurut Kowalaski :
Informasi Retrieval adalah konsep sederhana dalam pencarian yang dilakukan oleh seseorang. seperti contoh ketika user akan mencari informasi yang dia butuhkan, maka sistem menerjemahakan kepada bentuk statment yang kemudian di eksekusi oleh sistem pencari.
William Hersh Menyatakan :
Information Retrieval adalah “bidang di persimpangan ilmu informasi dan ilmu komputer.  Berkutat dengan pengindeksan dan pengambilan informasi dari sumber informasi heterogen dan sebagian besar-tekstual. Istilah ini diciptakan oleh Mooers pada tahun 1951, yang menganjurkan bahwa diterapkan ke “aspek intelektual” deskripsi informasi dan sistem untuk pencarian (Mooers, 1951). “
Kutipan Dari Wikipedia :
Wikipedia menjelaskan Information Retrieval (IR) adalah seni dan ilmu mencari informasi dalam dokumen, mencari dokumen itu sendiri, mencari metadata yang menjelaskan dokumen, atau mencari dalam database, apakah relasional database itu berdiri sendiri atau database hypertext jaringan seperti Internet atau intranet, untuk teks , suara, gambar, video atau data.
Dari ketiga rujukan definisi diatas, sudah jelas dimaksudkan bahwa information retrevial adalah bidang keilmuan dalam Teknologi informasi yang menjelaskan tentang “Pencarian dan Pengambilan Kembali Informasi”.
Keilmuan ini mengungkapkan bagaimana metode metode pencarian informasi yang dilakukan oleh end user dari gudang gudang penyimpanan yang bersekala besar, contoh sederhananya adalah media penyimpanan kita sendiri.
Terkadang ketika semakin banyak data yang kita simpan dalam sebuah media penyimpanan tak jarang kita akan lupa dimana kita meletakan data yang kita simpan tadi, sehingga kita melakukan proses pencarian data yang kita lupa tadi, bisa dengan menggunakan tools pencarian atau bisa dengan memeriksa satu persatu tempat penyimpanan data kita.
Dalam studi kasus yang lebih kompleks, penerapan IR adalah Search Engine (Mesin Pencari) seperti google, yahoo, bing dll. SE merupakan implementasi yang sangat kompleks dari IR
Cara Kerja Information Retrieval (IR)
Untuk menemukan informasi relevan yang kita cari, maka dibutuhkan kata kunci (Keyword, Query) yang sesuai dengan informasi yang ingin didapat, lebih baik lagi jika kita memahami penggunaan kata kunci yang tepat, karena dengan keyword yang seusai maka proses pencarian dalam index di mesin IR akan cepat, sehingga korpus yang sesuai dengan kata kunci yang dimasukan akan ditampilkan kembali kepada si end user.
  • Keyword, Query : adalah inputan kata kunci pencarian yang diberikan pengguna kepada Mesin Pencari (Search Engine) misalnya : Google, Yahoo, Being, Ask dll.
  • Indexing : proses penyusunan index dari seluruh dokumen pada korpus, yang terdiri dari kata-kata (token)
  • Korpus : adalah kumpulan dokumen yang disalin ke mesin SE misalnya Google “menjepret” seluruh halaman website yang bisa diakses umum (tanpa login terlebih dahulu) kemudian menyalinnya ke SE di servernya.
Bagaimana mesin IR menyalin dokumen-dokumen yang berada di dunia maya? Mesin IR memiliki robot (BOT) sejenis program yang bisa disebut juga dengan crawler, program tersebutlah yang kemudian berfungsi untuk menyalin dokumen atau informasi yang berada di salah satu sumber misal website/blog ke server IR tersebut.
Kemudian cara kerja Information Retrieval (IR) dapat dijelaskan sebagai berikut :
v  Tokenisasi (tokenizing) atau word token adalah : Pemisahan deret kata dalam kalimat, paragrap menjadi potongan kata tunggal (termed word) serta menghilangkan karakter-karakter dalam tanda baca dan mengubah kumpulan termed menjadi huruf kecil (lower case). Contoh : "saya belajar Information Retrieval" maka akan dihasilkan : "saya", "belajar", "information", "retrieval".
v  Stopword removal atau seleksi / penyaringan (filtration) adalah: tahapan untuk mempersentasikan suatu dokumen dapat mendeskripsikan isi dari suatu dokumen untuk membedakan isi dokumen lain, dalam suatu istilah (term) akan mencari jumlah dokumen yang diangap paling relevan didalam suatu inputan (query), suatu term yang sering ditampilkan atau digunakan diangap sebagai stopword. Contoh : Operator Logika and, or, not, dan sebaginya. Maka stopword tersebut akan menghapus, karna frekuwnsi dari kemunculan trem terlalu sering.
v  Pembuatan kata dasar (stemming) adalah : konversi dari trem ke bentuk akar (root) atau bentuk umum, biasanya dalam dokumen yang mirip atau sama (sinonim) atau bisa menemukan kata-kata yang terkait dalam sebuah dokumen. Contoh : kita memasukan kata "menemukan" maka query akan merekomendasikan, "memperoleh", "mengetahui", "memiliki", "mendapatkan" dan setrusnya.
v  Proses pembobotan setiap term dalam dokumen (term weighting) yaitu dalam tahapan pembobotan term skema dalam pembobotan dipilih berdasarkan pembobotan lokal, global atau kedua-duanya (term frequency dan global inverse document frequency).

Ada tiga hal yang menjadi dasar cara kerja mesin IR yaitu Proses Crawling, Proses Indexing dan Proses Surving.
a).  Proses Crawling
Crawling adalah suatu pekerjaan yang dilakukan oleh googlebot (biasa dikenal juga dengan istilah robot, atau spider bisa di sebut juga crawler) dalam menjelajahi halaman-halaman website untuk di indeks pada google server.
Googlebot terdiri dari set komputer yang berjumlah besar yang memang difungsikan untuk meng-crawling website-website. Dalam melakukan tugasnya, googlebot menggunakan suatu algoritma komputer dalam menentukan situs apa saja yang akan di crawling, seberapa sering, dan berapa banyak halaman yang akan di indeks.
Proses crawling dalam suatu website dimulai dari mendata seluruh url dari website, menelusurinya satu-persatu, kemudian memasukkannya dalam daftar halaman pada google indeks, sehingga setiap kali ada perubahan pada website, akan terupdate secara otomatis.
b).  Proses Indexing
Indexing adalah proses pengumpulan kata-kata atau kalimat pada suatu halaman web oleh googlebot yang telah ter-crawling sebelumnya. Dalam prosesnya, konten inilah yang digunakan oleh google sebagai sumber pencarian untuk selanjutnya ditampilkan sebagai hasil pencarian berdasarkan kata kunci (keywords) yang kita cari.
Namun perlu diingat bahwa tidak semua konten dapat diproses oleh googlebot ini. Umumnya konten tersebut adalah link url, judul, tag, nama file, tipe file, isi halaman (tidak semua) dan beberapa informasi halaman lainnya.
c).   Proses Surving
Surving adalah suatu proses dalam menampilkan suatu halaman tertentu merujuk kepada kata kunci yang dimasukkan oleh pengguna. Keterhubungan antara bagaimana hasil akan ditampilkan dengan kata kunci ditentukan oleh kurang lebih 200 faktor.
Salah satu faktor penentu yang terkenal yang digunakan untuk menampilkan hasil pencarian adalah page rank. Dengan page rank, suatu halaman ditampilkan sesuai dengan urutan dengan cara “halaman yang terbanyak di akses ditampilkan pertama“.
Ketiga proses tersebut di atas dilakukan dalam waktu yang sangat cepat dan disajikan kepada pengguna ditambah dengan penjelasan jumlah penemuan dll.
Masa Depan IR

Berikut merupakan sejarah perkembangan information retrieval dari masa ke masa (dikutip dari Wikipedia)
Tahun 1880-an : Herman Hollerith menciptakan rekaman data pada media mesin yang dapat dibaca.
Tahun 1890 Hollerith kartu, kunci dan tabulasi pukulan yang digunakan untuk mengolah data Sensus AS 1890.
Tahun 1940-an: Masalah-masalah dihadapi militer AS pengindeksan dan pengambilan dokumen perang penelitian ilmiah yang diambil dari Jerman.
Tahun 1945: Vannevar Bush As We May Think muncul di Atlantic Monthly.
Tahun 1947: Hans Peter Luhn (penelitian insinyur di IBM sejak 1941) mulai bekerja pada sistem kartu punch berbasis mekanik untuk mencari senyawa kimia.
Tahun 1950: Tumbuh kekhawatiran di Amerika Serikat untuk sebuah “kesenjangan ilmu pengtahuan” dengan Uni Soviet termotivasi, pendanaan mendorong dan memberikan sarana mencari sistem (Allen Kent et al.) Dan penemuan pengindeksan kutipan (Eugene Garfield).
Tahun 1950: Istilah  “Information Retrieval” telah diciptakan oleh Calvin Mooers.
1951: Philip Bagley melakukan percobaan awal dalam pengambilan dokumen terkomputerisasi dalam sebuah tesis master di MIT.
1955: Allen Kent bergabung dengan Case Western Reserve University, dan akhirnya menjadi direktur Pusat Dokumentasi dan Komunikasi Penelitian. Tahun yang sama, Kent dan koleganya menerbitkan hasil penelitian di Amerika yang menjelaskan secara rinci dan proses recall serta menjelaskan suatu “kerangka” yang diusulkan untuk mengevaluasi sistem IR yang meliputi metode sampling statistik untuk menentukan jumlah dokumen relevan yang tidak diambil.
1958: Konferensi Internasional Informasi Ilmiah Washington DC mempertimbangkan sistem IR sebagai solusi untuk masalah yang diidentifikasi.
1959: Hans Peter Luhn menerbitkan “pengkodean dokumen secara otomatis untuk pengambilan informasi.”
1960-an: Gerard Salton mulai bekerja pada IR di Harvard, kemudian pindah ke Cornell.
1960: Melvin Earl (Bill) Maron dan John Lary Kuhns menerbitkan “Relevansi, pengindeksan probabilistik, dan IR” dalam Journal pada ACM
1962: Cyril W. Cleverdon menerbitkan temuan awal dari studi Cranfield, mengembangkan suatu model untuk evaluasi sistem IR. Lihat: Cyril W. Cleverdon, “Laporan Pengujian dan Analisis sebuah Investigasi ke Efisiensi Perbandingan Pengindeksan Sistem”. Koleksi Cranfield Penerbangan, Inggris Cranfield,, 1962.
Kent diterbitkan Analisis Informasi dan Retrieval.
1963: Weinberg laporan “Ilmu, Pemerintah dan Informasi” memberikan artikulasi penuh gagasan “krisis informasi ilmiah.” Laporan itu dinamai Dr Alvin Weinberg.
Yusuf Becker dan Robert M. Hayes menerbitkan teks pada pencarian informasi. Becker, Joseph; Hayes, Mayo Robert. Penyimpanan informasi dan pengambilan: alat, elemen, teori. New York, Wiley (1963).
1964: Karen Spärck Jones menyelesaikan tesis nya di Cambridge, Klasifikasi sinonim dan Semantic, dan bekerja pada linguistik komputasi yang dipersiapkan untuk IR.
Biro Standar Nasional mensponsori simposium berjudul “Asosiasi Statistik Metode Dokumentasi Mekanik.” Beberapa penemuan sangat signifikan, termasuk referensi pertama G. Salton ‘s diterbitkan. National Library of Medicine dikembangkan oleh MEDLARS Kedokteran, Sastra, Analisis dan Retrieval System, database dapat dibaca oleh mesin besar pertama dan sistem batch-retrieval.
1965: JCR Licklider menerbitkan Perpustakaan Masa Depan.
1966: Don Swanson terlibat dalam penelitian di University of Chicago pada Persyaratan untuk Katalog Masa Depan.
1960-an: F. Wilfrid Lancaster menyelesaikan studi evaluasi sistem MEDLARS dan menerbitkan edisi pertama teks tentang pencarian informasi.
1968: Gerard Salton menerbitkan Otomatis Informasi Organisasi dan Retrieval.
John W. Sammon, Jr ‘s RADC melaporkan Tech “Matematika Informasi Penyimpanan dan Retrieval …” diuraikan model vektor.
1969: Sammon “A pemetaan linier untuk analisis struktur data” (IEEE Transaksi di Komputer) merupakan proposal pertama untuk antarmuka visualisasi untuk sistem IR.
awal 1970-an : Pertama online sistem-NLM AIM-Twx, MEDLINE; Lockheed’s Dialog; Orbit SDC’s. Theodor Nelson mempromosikan konsep hypertext, diterbitkan Komputer Lib / Dream Machines.
1971: Nicholas Jardine dan Cornelis J. van Rijsbergen menerbitkan “Penggunaan clustering hierarkis dalam temu balik informasi”, yang diartikulasikan dengan “hipotesis cluster.”
1975: Tiga publikasi sangat berpengaruh oleh Salton sepenuhnya diartikulasikan pemrosesannya menggunakan vektor kerangka kerja dan model untuk Pengindeksan Otomatis.
1979: CJ van Rijsbergen diterbitkan Information Retrieval (Butterworths). Berat penekanan pada model probabilistik.
1980: Pertama internasional ACM SIGIR konferensi, bersama dengan kelompok British Society Komputer IR di Cambridge.
1982: Nicholas J. Belkin, Robert N. Oddy, dan Helen M. Brooks mengusulkan sudut pandang untuk pengambilan informasi. Ini merupakan konsep penting, meskipun alat analisis otomatis mereka ternyata akhirnya mengecewakan.
1983: Salton (dan Michael J. McGill) menerbitkan Pengenalan Information Retrieval Modern (McGraw-Hill), dengan penekanan pada model vektor.
1985: Blair dan Maron mempublikasikan: Sebuah Evaluasi Efektivitas Retrieval untuk Dokumen-Temu-Full Teks Sistem
pertengahan 1980-an: Upaya untuk mengembangkan versi pengguna akhir sistem IR komersial.
1985-1993: Kunci makalah dan sistem eksperimental untuk antarmuka visualisasi.
Bekerja oleh Donald B. Crouch, Robert R. Korfhage, Matius Chalmers, Anselmus Spoerri dan lain-lain.
Pada tahun 1989 ditemukannya World Wide Web (WWW) oleh Tim Berners-Lee, awal kebangkitan information retrieval, sejak itu internet menawarkan berbagai pasilitas seperti email, ftp, dan berbagi berita (news).
akhir 1990-an: Web search engine mengeluarkan banyak fitur baru yang sebelumnya hanya ditemukan di sistem IR eksperimental. Search engine menjadi Instansiasi yang paling umum dan menjadi model IR terbaik.
Dilihat dari sejarah dan perkembangannya maka, IR dimasa depan akan lebih memiliki peran yang sangat penting untuk memenuhi kebutuhan masyarakat dalam kehidupan sehari-hari.


Berikut adalah perkembangan IR mendatang agar dapat menyesuaikan kebutuhan masyarakat tentang perlunya informasi :
a). Information Overload:
     - Bagaimana mengolah informasi  yang sangat banyak
     - Tidak semua informasi benar dan sesuai kebutuhan
     - Fokus terhadap pengembangan filter dan aggregator.
     - Search Box tersebar
b). Web masa akan datang
     - Semua model  web akan mengikuti Google dan Facebook
c). Revolusi Media
    - Format publikasi media akan melalu internet
    - Penerbit dan distributor akan menjadi raja informasi
    - Seluler /moble akan menjadi pesaing berat media Pers
    - Media  pers akan melintasi batas negara dan budaya
    - Ponsel dan GPS akan menciptakan technologi baru (revolusi technologi)
    - Jaringan Internet, komunikasi dan mobile  akan menjadi alat utama bisnis.
    - Siapa pun yang mengeguasai technologi akan menguasai dunia.