Search This Blog

Monday, July 5, 2010

Instalasi Swish-e 2.4.7 di ubuntu 8.04 LTS

Sebelumnya saya pernah menulis tentang pencarian file di operating system Windows dengan menggunakan service Windows Indexing. Masih dengan ide yang sama, saya coba explore tentang metode indexing di operating system Linux, pada artikel ini saya menggunakan distro Ubuntu 8.04 LTS.

Setelah saya googling, salah satu aplikasi yang mampu melakukan indexing di Linux adalah aplikasi SWISH-E http://swish-e.org/

Disini saya hanya akan menulis tentang cara melakukan instalasi, konfigurasi dan ujicoba indexing dan searching. Edisi berikutnya (kalau ada waktu) saya akan posting tentang pencarian untuk tipe file yang lain, pencarian melalui jaringan, dll.

Langkah-langkah yang saya tulis pada artikel ini dengan asumsi komputer anda telah terkoneksi ke internet (online), jika anda offline, silahkan download package-nya dulu dan lakukan instalasi.

Penjelasan symbol:

# artinya anda sebaiknya menggunakan account superuser (root)

$ artinya anda sebaiknya menggunakan account user

Instalasi dan konfigurasi Swish-e:

  1. Lakukan instalasi Ubuntu 8.04 LTS, dowload link http://www.ubuntu.com/desktop/get-ubuntu/download

  2. Setelah itu, jangan lupa melakukan update dan install build-essential Ubuntu, caranya:

    • # apt-get update

    • # apt-get install build-essential

    • Jika ingin Ubuntu anda bisa berkomunikasi dengan windows menggunakan protokol SFTP atau FTP, silahkan install ssh, caranya : # apt-get install ssh

  1. Setelah instalasi Ubuntu selesai, saatnya instalasi Swish-e. Perlu diketahui ada beberapa package yang perlu diinstal lebih dulu sebelum Swish-e, sedangkan package yang lain boleh diinstal setelah Swish-e. Package yang perlu diinstal sebelum Swish-e : Libxml2 dan Zlib. Package yang bisa dinstall setelah Swish-e : SWISH::API Perl Module, Indexing Dokumen PDF, Indexing Dokumen MS Word, Indexing Dokumen Excel, dll.

  2. Install Libxml2

  1. Install Zlib

    • $ wget http://zlib.net/zlib-1.2.5.tar.gz

    • $ gzip -dc libxml2-2.7.7.tar.gz | tar xof -

    • $ cd libxml2-2.7.7

    • $ ./configure

    • $ make

    • $ make check

    • $ sudo su

    • # make install

    • exit

    • $

  1. install swish-e 2.4.7

        All 4 tests passed
==================
    • $ sudo su

    • # make install

    • # exit

    • $

  1. Cek hasil instalasi Swish-e

    • $ swish-e -V

      ============

      SWISH-E 2.4.7

      ============

      Jika ada error yang menyebutkan bahwa gagal melakukan loading shared library, contoh: “error while loading shared libraries: libswish-e.so.2”, artinya Ubuntu anda belum bisa mengenali file library Swish-e. Biasanya karena file-file instalasi tidak ditempatkan pada folder default Swish-e. Agar bisa dikenali oleh Ubuntu:

      • masuk ke folder library Swich-e, default ada di # /usr/local/lib.

      • Ketik perintah berikut: # ldconfig

      • Coba lagi $ swish-e -V, sampai tidak ada error yang muncul berarti instalasi anda sukses.

  1. Install SWISH::API Perl Module

    • $ cd swish-e-2.4.7

    • $ cd perl

    • $ perl Makefile.PL

    • $ make

    • $ make test

    • $ sudo su

    • # make install

    • # exit

    • $

  1. SWISH-E dan SWISH::API Perl Module sudah terinstall penuh. Package Swish-e hanya melakukan indexing untuk file-file HTML, XML dan text file. Untuk tipe file yang lain perlu dilakukan instalasi package-nya masing-masing. Sekarang kita akan mencoba melakukan indexing file HTML.

    • Buat 2 folder misalnya “my-htmls” dan “indexes” di bawah folder local, caranya: $ mkdir my-html-docs dan $ mkdir indexes

    • simpan 1 buah file di folder my-html-docs yang nantinya akan diindex. Saya ambil 1 file dari http://swish-e.org/docs/install.html dan disimpan di folder tersebut

    • masuk ke folder indexes: $ cd indexes dan buat 1 buah file dengan nama my-html.conf: $ touch my-html.conf

    • Edit file yang baru dibuat: $ vim my-html.conf

    • Tekan tombol “Insert” di keyboard untuk bisa menulis data berikut di file tersebut:

      IndexDir ../my-html-docs/

      IndexOnly .html

      IndexFile ./my-html.index

      Untuk keluar dari edit mode dan menyimpan perubahan file tersebut, tekan tombol “ESC” dan ketik :wq lalu tombol “Enter”.

      Untuk keluar dari edit mode tetapi tidak ingin menyimpan perubahan file tersebut, tekan tombol “ESC” dan ketik :q! lalu tombol “Enter”.

      IndexDir menunjukkan folder dimana Swish-e akan mencari file yang nantinya diindex. IndexOnly menunjukkan extension file yang akan diindex, contoh di atas hanya file html saja. IndexFile menujukkan lokasi dimana file hasil index tersebut disimpan.

    • Perintahkan swish-e untuk melakukan indexing, caranya:

      $ swish-e -c my-html.conf

    • Proses indexing selesai dan bisa dilanjutkan dengan proses searching.

  1. Searching

    Contoh: akan dilakukan pencarian kata “install” di folder my-html-docs dan hanya akan dikeluarkan 3 buah file saja. Perintahnya:

    $ swish-e -f my-html.index -m 3 -w install

    Silahkan dilihat hasilnya.

Thursday, July 1, 2010

Pencarian isi file dengan Windows Indexing Service melalui Jaringan

Windows menyediakan Windows Indexing Service untuk mempercepat pencarian dokumen-dokumen anda. Lihat link berikut ini untuk melakukan konfigurasi agar Windows Indexing Service anda berjalan efisien dan tidak mengganggu performansi komputer:

Konfigurasi Windows Indexing Service

Setelah melakukan konfigurasi, muncul pertanyaan berikutnya:
Bagaimana agar pencarian bisa dilakukan dari komputer lain?



Big Picture

Untuk menjawab pertanyaan tersebut, gambaran besar yang terpikirkan ada 2 model, yaitu:

Search Companion (SC) : tools search desktop bawaan windows, bisa diakses melalui Start – Search atau tombol Search di Windows Explorer. Banyak tools search desktop yang sudah dikembangkan (free dan berbayar) contohnya Windows Desktop Search, Google Desktop Search, Yahoo Desktop Search, dll.

Model 1 adalah model yang paling sederhana dalam pencarian isi file melalui jaringan. Model ini cocok apabila ada pengelompokkan katalog tertentu untuk setiap user atau group user, misalnya katalog marketing (folder marketing) untuk group user marketing, dst. Sedangkan jika tidak ada pengelompokkan katalog yang jelas, model ini akan menghasilkan index yang sama di setiap komputer user (negatif poin). Sebaliknya model 2 bisa mengatasi kelemahan yang muncul di model 1.

Windows Indexing Service - Alias

Beruntung karena Windows Indexing Service memungkinkan untuk menambahkan shared folder dalam katalog, sehingga jika anda menambahkan shared folder ke dalam "Directories" indexing, maka semua user yang memiliki akses ke shared folder tersebut bisa melakukan pencarian dengan cepat.

Berikut ini garis besar konfigurasinya:

  1. Buat share folder dan atur hak akses user yang boleh melihat isi folder tersebut. Share folder ini nantinya akan dimasukkan dalam daftar "Directories" indexing.
  2. Konfigurasi Windows Indexing Service pastikan share folder (no 1) dimasukkan dalam "Directories"
  3. Setting "Network Share Alias" agar ditambahkan secara otomatis pada saat melakukan indexing, caranya:
    • Klik kanan "Index Local On Local Machine" dan pilih "Properties".
    • Centang "Add Network Share Alias Automatically" yang ada di tab "Tracking"
    • Klik kanan katalog yang sudah anda buat dan pilih "Properties".
    • Pada tab "Tracking" ada 2 pilihan:
      • "Add Network Share Alias Automatically". Jika anda centang pilihan ini, berarti penambahan Network Share Alias tidak tergantung dari setingan "Index Local On Local Machine".
      • "Inherit above settings from Service", artinya katalog ini tergantung dari setingan "Index Local On Local Machine". Saran saya pilih yang ini saja.
  4. Restart Windows Indexing Service dan biarkan idle beberapa saat.
  5. Anda bisa lihat pada list "Directories" akan ada tambahan folder yang sama, namun data aliasnya terisi. Folder ini menunjukkan shared folder
  6. Buka Search Companion dari komputer client (pastikan user ini memiliki akses ke folder yang dishare di no 1)
  7. Isi "Look in" sesuai dengan nama alias share folder, \\nama_server\nama_folder.
  8. Masukkan kata kunci yang ingin dicari pada kolom "A word or phrase in the file"
  9. Tekan tombol "Search"