Kamis, 26 Juni 2008

PERKEMBANGAN PENGINDEKSAN SUBYEK DAN KOSA KATA INDEKS

PERKEMBANGAN PENGINDEKSAN SUBYEK DAN KOSA KATA INDEKS

Perkembangan:

1.
Pengindeksan konsep
(Assigned indexing)

-->
Pengindeksan kata
Derived indexing


2.
Pengindeksan pralaras
(Pre-coordinated indexing)

-- >
Pengindeksan pascalaras
Post-coordinated indexing


3.
Bahasa indeks
Indexing language
(Controlled vocabulary atau
kosakata terkendali)


-- >
Bahasa alami
Natural language
(Free language atau kosakata bebas)

PENGINDEKSAN KONSEP (Assigned indexing atau concept indexing)
Pengindeks mempelajari isi dokumen untuk mengidentifikasi ide-ide atau KONSEP-KONSEP penting yang dibahas dalam dokumen. Kemudian ia menggunakan bahasa indeks (seperti bagan klasifikasi atau daftar tajuk subyek) untuk menetapkan notasi atau tajuk subyek yang dapat mewakili konsep-konsep tsb. (to assign = menunjuk, menetapkan, menentukan)

Dalam assigned indexing atau concept indexing pengindeks tidak sekedar mengambil kata-kata yang ditemukannya dalam dokumen, tetapi harus mengenali konsep-konsep yang berada di belakang kata-kata tsb. Dengan demikian pemakai atau penelusur sistem temu balik informasi dapat menemukan kembali (retrieve) semua dokumen tentang konsep tertentu, meskipun istilah yang ia gunakan untuk konsep tsb. berbeda dari istilah yang digunakan penyusun dokumen atau istilah yang digunakan dalam sistem temu kembali tsb. untuk konsep tsb.

Ciri-ciri:
· Menggunakan bahasa indeks atau kosa kata terkendali (controlled vocabulary)
· Gangguan atau noise akibat adanya sinonim dan homonim teratasi
· Hubungan antar konsep terlihat lewat acuan ? lihat juga? atau ?see also?, atau karena subyek yang berhubungan ditempatkan berdekatan dalam urutan sistematis
· Penelusuran dapat diperluas/dipersempit
· Tidak dapat dikerjakan secara mekanis (oleh komputer))
· Memerlukan kemampuan intelektual

PENGINDEKSAN KATA (Derived indexing)
Pengindeks mengambil kata/istilah sebagaimana adanya dari judul dokumen, abstrak dokumen atau teks seluruh dokumen. (to derive = mengambil atau memperoleh dari). Juga disebut term indexing.

Ciri-ciri:
· Menggunakan bahasa dokumen, jadi bahasa alami atau kosa kata tak terkendali
· Ada gangguan atau noise akibat sinonim dan homonim
· Mudah dikerjakan, tidak memerlukan kemampuan intelektual
· Dapat dikerjakan secara mekanis oleh komputer
PENGINDEKSAN PRALARAS (Pre-coordinate indexing)
Penggabungan konsep-konsep untuk menyatakan suatu subyek majemuk dilakukan pada tahap pengindeksan (tahap input).


PENGINDEKSAN PASCALARAS (Post-coordinate indexing)
Penggabungan konsep-konsep subyek majemuk dilakukan pada tahap penelusuran (output).


BAHASA INDEKS (Indexing language (Controlled vocabulary atau kosakata terkendali)
Daftar istilah atau notasi yang dapat digunakan sebagai titik temu (access points) dalam suatu indeks, dan sarana-sarana yang dapat menunjukkan hubungan antar istilah.
Untuk penjelasan dan contoh-contoh: lihat bahan kuliah tentang topik Pengindeksan & Bahasa Indeks dari Mk Dasar-Dasar Organisasi Informasi.


BAHASA ALAMI ((Natural language, free language, uncontrolled vocabulary)
Kata-kata atau istilah-istilah yang terdapat dalam judul, abstrak atau teks dokumen.

= = = = = = = = = = = == = = = = = = = = = = = = = = = = = = = = = = = = = =

PENGINDEKSAN KATA
Pengindeksan yang menggunakan bahasa alami.
Dapat didasarkan pada:

1. Judul dokumen (permuted title indexing) Hasil:
a) Indeks kata kunci (Catchword title index)
b) Indeks KWIC (Keyword in context)
c) Indeks KWOC (Keyword out of context)

2. Penggabungan bibliografi (bibliographic coupling) Hasil:
a) Indeks sitiran (citation index)

3. Abstrak
4. Seluruh teks dokumen


JUDUL DOKUMEN
Keuntungan:
· Tidak memerlukan pemikiran pada tahap input
· Bisa dikerjakan komputer
· Proses pengindeksan cepat dan murah
· Mencerminkan terminologi mutakhir

Kerugian:
· Tidak semua judul menunjukkan subyek dokumen
· Cakupan dokumen sering lebih khusus daripada yang dinyatakan dalam judul
· Judul hanya menunjukkan tema utama dokumen
· Perolehan rendah, meskipun ketepatan tinggi
· Tidak memandu penelusur ke istilah-istilah yang sama artinya (sinonim) atau berkaitan

Indeks kata kunci (Catchword title index)
Manipulasi kata-kata dalam judul sehingga semua konsep secara bergilir menjadi titik temu (access point).
Kata(-kata) yang menjadi kata kunci ditempatkan di sebelah kiri (awal baris), diikuti oleh sisa judul.
Harus dikerjakan menurut peraturan tertentu, dan masih memerlukan pemikiran.
Lihat contoh: Foskett. The Subject Approach to Information, 4th ed. p.39.

Indeks KWIC
Tiap kata yang signifikan menjadi titik temu seperti pada indeks kata kunci, tetapi kata kunci ditempatkan di tengah baris, dengan sisa judul sebelah kanan dan kirinya.
Diperkenalkan oleh H.P. Luhn dari IBM.
Masalah: bagaimana memilih kata yang signifikan?
Harus ada stoplist berisi kata-kata yang tidak berguna sebagai titik temu, misalnya kata sandang (a, the) dan kata-kata lain seperti and, very, also, he, she, where, dsb.
Lihat contoh: Foskett. The Subject Approach to Information. 4th ed. p.40.

Indeks KWOC
Tiap kata yang signifikan menjadi titik temu dan ditempatkan di sebelah kiri (awal baris), diikuti oleh judul lengkap.
Lihat contoh: Foskett. The Subject Approach to Information. 4th ed. p.41-44.


Sistem-sistem pengindeksan ini menghasilkan sejumlah besar entri untuk tiap dokumen. Jumlahnya tergantung dari banyaknya kata yang dinilai signifikan dalam judul. Oleh sebab itu sistem-sistem ini biasanya dipakai untuk membuat indeks yang mengacu ke entri dengan data bibliografi, bukan sebagai tajuk untuk entri lengkap.

PENGGABUNGAN BIBLIOGRAFI
Didasarkan atas asumsi bahwa ada hubungan antara suatu dokumen dan sumber-sumber yang dikutip (di-sitir atau cited) dalam dokumen tsb. Jika dua dokumen mengutip sumber yang sama, maka tidak saja terdapat hubungan antara kedua dokumen ini dengan sumber asli, tetapi juga ada hubungan (link ) antara kedua dokumen tsb. Teknik ini disebut bibliographic coupling karena memanfaatkan bibliografi atau daftar pustaka dalam dokumen. Hasilnya adalah indeks sitasi atau citation index, misalnya: Science Citation Index, Social Sciences Citation Indes, Arts and Humanitiies Citation Index, dan indeks berbentuk pangkalan data seperti SCISEARCH, SOCIAL SCISEARCH dan ARTS and HUMANITIES SEARCH.

Keuntungan:

· Tidak perlu menetapkan tajuk subyek atau kata kunci, jadi tidak perlu pemikiran. Dikerjakan oleh komputer yang dengan bantuan paket perangkat lunak yang tepat mengolah sitasi (bibliografi) dari dokumen yang diindeks. Luaran (output) berupa indeks-indeks (tercetak atau dalam bentuk terbacakan mesin).
· Dengan menggunakan sejumlah dokumen sumber terbatas, sebagian besar literatur bidang bersangkutan dapat terjangkau. Misalnya dengan mengidentifikasi jurnal utama atau terpenting (key journals) bidang tertentu, lewat bibliografi yang melengkapi artikel-artikel jurnal tsb. dapat terjaring sejumlah besar artikel lain yang berhubungan.
· Tidak ada masalah dengan peristilahan atau terminologi. Pengindeksan tipe ini tidak terganggu oleh masalah yang mempersulit pengindeksan subyek seperti munculnya istilah-istilah baru, istilah teknis vs istilah umum, dan variasi lain dalam terminologi.
· Bahasa dokumen tidak menjadi masalah: bahasa dokumen sumber dan dokumen yang disitir tidak perlu sama.
· Memungkinkan penelusuran yang tepat dan langsung.
· Hasil bisa dibuat lebih komprehensif dengan penelusuran siklis. Penelusuran siklis dapat menujukkan perspektif historis perkembangan bidang subyek dan dokumen-dokumen penting yang merekam tonggak-tonggak perkembangan tsb.
· Dapat menunjukkan perkembangan yang bersifat lintas disiplin (cross-disciplinary). Indeks-indeks tradisional biasanya terbatas pada satu disiplin ilmu saja.
· Cakupan tidak terbatas pada tahun tertentu. Dokumen yang terdaftar dalam indeks biasa dalam terbitan bulan/nomor tertentu lazimnya hanya mencakup terbitan mutakhir atau sampai setahun sebelumnya. Indeks sitasi dapat mencakup dokumen periode lebih lama (beberapa tahun).

Kekurangan:
· Sitasi yang tidak standar, lengkap atau taat azas mempersulit penyusunan indeks sitasi. Dapat menimbulkan keraguan apakah sitasi yang tampaknya sama memang mengacu ke dokumen yang sama, atau menyebabkan kesulitan dalam mengidentifikasi dokumen yang dikutip.
· Indeks sitasi didasarkan pada asumsi bahwa ada hubungan antara dokumen-dokumen. Namun alasan mengapa pengarang mensitir dokumen lain tidak selalu alasan serius atau ilmiah. Tidak selalu berarti pengarang benar-benar menggunakan gagasan atau temuan dari artikel yang disitir.
· Tidak semua tipe dokumen bermanfaat sebagai sumber untuk bibliographic coupling.
· Biasanya literatur sumber untuk indeks sitasi adalah sekelompok jurnal. Akibatnya literartur dalam bentuk monograf kurang terwakili.


PENGINDEKSAN BERDASARKAN ABSTRAK
Menghasilkan indeks dengan ketelitian atau precision yang cukup tinggi.

PENGINDEKSAN BERDASARKAN SELURUH TEKS DOKUMEN
Pengindeksan otomatis (automatic indexing) hanya dapat dilakukan apabila sistem tsb telah computerized, dan teks dokumen berformat machine-readable text (teks yang terbacakan mesin).
Harus ada stoplist untuk mencegah pengindeksan berdasarkan kata yang tidak signifikan seperti kata sandang, kata depan, kata sambung, dsb. Komputer kemudian menyusun semacam daftar peringkat kata berdasarkan frekuensi pemunculan kata. Yang berada di atas sekali menjadi kata indeks atau index terms. Batas antara kata yang dipilih dan tidak dipilih a.l. dapat tergantung dari jumlah absolut, jumlah relatif (tergantung panjang teks). Ada pula sistem yang diprogram untuk memilih kombinasi kata atau frase, memilih akar kata, memberi bobot (weighting) pada akar, kata, frase. Selain kriteria frekuensi ada pula cara lain yang dapat digunakan untuk meningkatkan relevansi, yaitu dengan mengindeks kalimat pertama dan terakhir dari tiap paragraf saja, berdasarkan asumsi bahwa kalimat pertama biasanya merupakan kalimat topic (topic sentence), atau kalimat yang mengandung inti seluruh paragraf, dan bila tidak demikian, maka dalam banyak kasus kalimat terakhir yang merupakan kalimat topik.


PENGINDEKSAN PRALARAS (PRE-COORDINATE INDEXING)

Disebut pre-coordinate sebab koordinasi atau penggabungan istilah indeks untuk deskripsi indeks dilakukan pada tahap masukan atau input, jadi sebelum (= pra- ) penelusuran dilakukan. Terutama digunakan untuk indeks tercetak seperti dalam majalah indeks dan abstrak, bibliografi nasional, indeks majalah, dan juga katalog subyek di perpustakaan.

Ciri:
1. Subyek majemuk diperlakukan sebagai satu kesatuan
2. Pembentukan subyek majemuk dikerjakan pada tahap pengindeksan (input)
3. Perlu urutan sitiran (citation order) agar pengindeksan taat azas

Masalah:
1. Urutan sitiran tidak dapat memuaskan semua pemakai
2. Dokumen berisi informasi yang multi-dimensional bila disajikan secara linear hanya dapat didekati dari salah satu unsurnya

Masalah ini timbul karena sistem pralaras adalah ?sistem satu tempat? atau one-place system. Konsep primer atau faset yang disebut atau di-cite pertama menjadi titik temu, konsep lain tersembunyi. Meskipun demikian sistem seperti ini tetap diperlukan, juga dalam abad komputer, sebab:

1. Pertimbangan ekonomis: sangat berguna apabila dalam indeks, bibliografi atau katalog untuk pendekatan subyek tiap dokumen akan diwakili oleh satu entri subyek saja.
2. Pertimbangan praktis: dokumen hanya bisa ditempatkan di satu tempat, meskipun isinya multi-dimensional


Pendekatan berabjad (Alphabetical subject appraoah)

Baca: Rowley. Organising Knowledge: An Introduction to Information Retrieval. Chapter 7.
Foskett. The Subject Approach to Information. 4th ed. Chapter 7 (p.95 - 102)

Salah satu masalah penting dalam pengindeksan pralaras adalah urutan sitasi. Perlunya prinsip-prinsip untuk menentukan urutan sitasi, khususnya untuk tajuk subyek, telah disadari sejak daftar-daftar tajuk subyek mulai digunakan untuk organisasi informasi.

1. Charles Ammi Cutter dan Cutter?s Rules for a Dictionary Catalogue (1876)
Pencetus berbagai prinsip dan kebijakan yang hingga kini masih penting karena menjadi landasan bagi Library of Congress Subject Headings dan Sears? List of Subject Headings.
Cutter belum berhasil memberi pemecahan yang memuaskan, tetapi mengidentifikasi berbagai masalah lewat contoh-contoh dalam Rules for a Dictionary Catalogue. Cutter merekomendasikan penggunaan urutan kata bahasa alami, dan ini mengakibatkan bahwa kadang-kadang kata pertama dari tajuk adalah kata yang kurang signifikan. Untuk mencegah ini Cutter mengizinkan inversi atau pembalikan kata, apabila kata kedua dianggap lebih penting. Masalahnya ialah siapa yang menentukan lebih penting tidaknya kata kedua?
Untuk beberapa kasus Cutter memberikan petunjuk untuk urutan sitasi. Misalnya untuk subyek dan tempat, Cutter berpendapat bahwa subyek harus mendahului tempat jika topiknya bidang sains, tetapi untuk sejarah, ilmu pemerintahan dan perdagangan, sebaliknya.

2. Kaiser dan Systematic Indexing (1911)
Kaiser adalah orang pertama yang mempunyai pendekatan yang konsisten terhadap masalah urutan sitasi. Titik tolak Kaiser ialah bahwa banyak subyek komposit apabila dianalisis dapat dijadikan kombinasi dari suatu benda konkrit dan suatu proses. Urutan sitasi yang dianjurkan: Concrete - Process. Misalnya dokumen ?Servicing of ships? diindeks sebagai: Ships; Servicing. Jika konsep tempat ditemukan dalam dokumen maka Kaiser membuat entri ganda, sekali pada Concrete dan sekali lagi pada Tempat. Misalnya dokumen ?Shipbuilding in Japan? akan diindeks : Shipbuilding - Japan, dan Japan - Shipbuilding.
3. Coates dan Subject Catalogues.
Sumbangan pemikiran Coates sangat besar artinya bagi perkembangan prinsip-prinsip perumusan tajuk subyek. Ia selama bertahun-tahun (1963 -1976) editor British Technology Index, yang sekarang menjadi Current Technology Index, dan ide-idenya diterapkan dalam indeks ini. Ia mempelajari teori Kaiser dan menyetujui urutan sitasi Concrete - Process, tetapi menyebutnya Thing - Action. Prinsip ini dikembangkannya lebih lanjut menjadi: Thing - Part - Material - Action.

Masalah-masalah sistem pralaras
Kelemahan sistem pralaras sebagai sistem satu tempat dapat diatasi dengan cara:
A. Entri tunggal ditambah acuan-acuan
B. Entri berganda

A. Entri tunggal dengan acuan silang

Contoh:
Subyek dokumen: Heat treatment of aluminium
Entri indeks: Aluminium : heat treatment (Concrete : Process)
Acuan: Heat treatment see also Aluminium : Heat treatment
atau: Heat treatment : Aluminium see also Aluminium : Heat treatment

Masalah: bagaimana dengan subyek dokumen yang terdiri atas banyak konsep?
Contoh: ?The manufacture of multiwall kraft paper sacks for the packaging of cement?
Entri indeks: CEMENT, packaging, sacks, paper, kraft, multiwall, manufacture

Permutasi istilah-istilah dalam tajuk ini supaya tiap istilah mendapat giliran sebagai istilah pertama, kedua, ketiga, dsb. (agar semua variasi dalam mengkombinasikan istilah tercakup) akan menghasilkan acuan-acuan silang yang luar biasa banyaknya. Untuk tajuk yang terdiri atas 6 konsep diperlukan 720 acuan. Maka perlu dicarikan metode ekonomis untuk memilih acuan mana yang perlu dibuat.

Chain procedure (prosedur berangkai)
Metode dari Ranganathan untuk membuat acuan berjumlah kecil tetapi yang membuat tiap istilah menjadi istilah pertama atau titik temu.

Tajuk A : B : C : D
Acuan: (1) D : C : B : A lihat A : B : C : D
(2) C : B : A lihat A : B : C
(3) B : A lihat A : B

Metode ini sangat ekonomis sebab jika kemudian ada dokumen dengan tajuk A : B : C : E, maka acuan yang perlu dibuat hanya:

E : C : B : A lihat A : B : C : E

Acuan lain (2) dan (3) sudah ada dan tidak perlu diulang lagi.


Cycling (Pemutaran):
Tiap istilah secara bergilir menjadi istilah pertama.

Tajuk: A : B : C : D
Acuan: (1) B : C : D : A lihat A : B : C : D
(2) C : D : A : B lihat A : B : C : D
(3) D : A : B : C lihat A : B : C : D


Rotation (Rotasi):
Tiap istilah secara bergilir menjadi titik temu tetapi tidak berpindah tempat. Pada metode lain urutan istilah berubah.

Tajuk: A : B : C : D
Acuan: (1) A : B : C : D lihat A : B : C : D
(2) A : B : C : D lihat A : B : C : D
(3) A : B : C : D lihat A : B : C : D


PRECIS (PREserved Context Indexing System)
Digunakan dalam indeks tercetak yang diproduksikan dengan bantuan komputer. Konsep-konsep dalam suatu subyek dinyatakan dengan menggunakan istilah-istilah yang diambil dari daftar kosa kata terkendali. Tiap istilah menjadi titik temu secara bergilir, dan rangkaian istilah diperagakan sedemikian rupa sehingga konteks istilah terlihat dengan jelas. Tiap entri terdiri atas suatu ?lead term? dan istilah-istilah yang menunjukkan konteks (Qualifier), sedangkan istilah-istilah yang lebih khusus ditempatkan pada baris kedua (Display). Istilah-istilah berpindah tempat berdasarkan teknik ?shunting?.

LEAD Qualifier
Display


A
B ¾ C ¾ D

B ¾ A
C ¾ D

C ¾ B ¾ A
D

D ¾ C ¾ B ¾ A

Contoh:

Canada
Paper industries. Personnel

Paper industries. Canada
Personnel

Personnel. Paper industries. Canada

PRECIS memakai ?role operators? yang menunjukkan peran suatu istilah dalam konteks subyek ybs. Pengindeks menentukan ?role operator? untuk tiap istilah. Dengan demikian komputer mengetahui bagaimana istilah-istilah harus dimanipulasikan agar urutan istilah sesuai dengan prinsip-prinsip PRECIS. Hingga Januari 1991 PRECIS digunakan untuk membuat entri-entri indeks British National Bibliography, dan kemudian diganti dengan COMPASS (Computer Aided Subject System).

Bagan Klasifikasi

Komponen bagan klasifikasi:
1. Bagan: daftar subyek-subyek yang disusun secara sistematis sehingga hubungan antar subyek tampak;
2. Notasi: kode, yang menunjukkan tempat subyek dalam urutan sistematis, dan yang mewakili subyek dalam indeks, katalog, atau sarana bibliografi lain;
3. Indeks: sarana yang menunjukkan tempat subyek dalam urutan sistematis (dalam bagan).

Sebagai unsur penunjang yang sangat ikut menentukan terpakai tidaknya suatu bagan klasifikasi, perlu ada badan atau organisasi yang menerbitkan, mempromosikan, dan merevisi bagan.

Bagan

Bagan, atau daftar subyek sistematis adalah inti atau jantung bagan klasifikasi. Bagan menentukan subyek-subyek dan hubungan-hubungan antar subyek yang dapat diperagakan.

Ciri-ciri bagan yang efektif:

Untuk kelas-kelas utama:
1. Semua disiplin ilmu utama harus terwakili dalam bagan klasifikasi umum, agar semua subyek dapat diklasifikasi dengan bagan tsb.
2. Tempat yang diberikan dalam bagan pada suatu disiplin ilmu harus proporsional. Artinya: sebanding dengan volume literatur disiplin ilmu tsb. Kesalahan dalam penjatahan tempat akan mengakibatkan subyek dengan literatur terbatas terbagi atas terlampau banyak kelas/subdivisi, sehingga ada banyak subdivisi yang tidak atau jarang dipakai. Sebaliknya, subyek dengan banyak literatur yang mendapat jatah yang sama atau tidak sebanding akan terbagi atas kelas/subdivisi yang harus menampung subyek dengan cakupan yang terlampau luas.
3. Kelas-kelas yang berhubungan harus berdekatan dalam bagan, sebab salah satu tujuan klasifikasi ialah mengelompokkan subyek-subyek yang berkaitan. Misalnya: Bahasa ¾ Sastra, Kedokteran ¾ Fisiologi, Botani ¾ Pertanian.
4. Kemampuan menampung perubahan dalam kelas utama untuk mencerminkan:
a) perluasan disiplin ilmu yang sedang berkembang, diukur dari semakin besarnya volume literatur (misalnya ilmu komputer dan cabang ilmu-ilmu sosial tertentu)
b) berkurangnya volume literatur disiplin ilmu yang stabil atau kurang berkembang, seperti misalnya agama dan filsafat
c) perubahan hubungan antar disiplin, dan berkembangnya bidang-bidang interdisipliner seperti energi, keselamatan industri/lingkungan kerja.

Syarat-syarat untuk pembagian subyek di dalam masing-masing kelas:
1. Harus ada tempat yang jelas untuk setiap subyek sederhana. Misalnya: puisi di dalam disiplin ilmu sastra, laser di kelas fisika.
2. Harus ada tempat yang jelas untuk setiap subyek majemuk yang mungkin muncul dalam literatur. Misalnya: puisi Jerman abad ke-19 ; penggunaan serat optik untuk televisi.
3. Urutan subyek harus sistematis dan dapat diterima oleh mayoritas pemakai indeks dan koleksi, dan memudahkan browsing karena dokumen yang saling berkaitan tersusun berdekatan di rak buku.
4. Harus ada mekanisme yang memungkinkan perubahan agar cakupan subyek dapat dimodifikasi untuk dapat menampung literatur baru.
a) Harus ada tempat untuk subyek sederhana dan majemuk baru.
b) Topik yang tidak lagi menjadi pokok bahasan literatur baru pada saat yang sesuai harus dapat dikeluarkan (dihapus) dari bagan.
c) Harus dapat menampung perubahan dalam hubungan antar subyek.
5. Bagan harus dipublikasikan (diterbitkan), sehingga bagan dapat digunakan oleh mereka yang memerlukannya


Untuk memenuhi kriteria di atas penyusun bagan klasifikasi dapat menempuh dua jalur, yaitu dengan menyusun:

1. Bagan klasifikasi enumeratif
2. Bagan klasifikasi berfaset

Bagan klasifikasi enumeratif:
Bagan klasifikasi enumeratif berupaya mendaftarkan semua subyek, yang sederhana maupun yang majemuk, yang ada dalam literatur yang akan diklasifikasi.

Cara penyusunan bagan enumeratif:
1. Identifikasi disiplin ilmu yang termasuk cakupan bagan. Tiap disiplin ilmu menjadi kelas utama.
2. Tiap kelas utama dibagi lebih lanjut hingga menghasilkan kelas-kelas yang cukup khusus (spesifik) dan tiap subyek mendapat tempat. Satu subyek harus mendapat satu tempat.

Kelemahan:
1. Bagan enumeratif tidak memungkinkan penggabungan subyek/konsep. Subyek kompleks/majemuk yang tidak terdaftar (tidak ada tempatnya sendiri), tidak dapat dinyatakan. Pengindeks terpaksa menempatkan dokumen dengan subyek majemuk tsb. dalam kelas yang paling mendekati (mewakili salah satu subyek atau konsep).
2. Sering terjadi kesalahan dalam pembagian kelas, sebab penyusun tidak konsisten dalam menerapkan ciri pembagian.
3. Daftar akan menjadi sangat panjang apabila semua subyek didaftar. Harus ada seleksi. Dokumen dengan subyek kompleks/majemuk yang tidak terdaftar terpaksa ditempatkan dalam kelas yang lebih umum, dan tidak dapat dibedakan dari dokumen yang memang membahas subyek yang lebih umum tsb. Seleksi yang perlu dilakukan tidak mungkin akan cocok untuk semua perpustakaan, maka sulit menyusun bagan enumeratif bisa yang sesuai untuk berbagai jenis perpustakaan.
4. Klasifikasi silang cenderung terjadi karena berorientasi pada disiplin ilmu. Satu subyek terdapat pada beberapa tempat.
5. Sulit direvisi. Subyek baru harus ditampung, tetapi untuk memberikannya tempat yang tepat, urutan subyek yang telah ada harus diubah, sehingga seluruh kelas harus direvisi.

Bagan klasifikasi enumeratif memang banyak masalahnya, namun tetap cukup efektif untuk organisasi informasi. Kebanyakan bagan klasifikasi umum yang hingga kini dipakai secara luas adalah bagan emumeratif. Contoh: LC, DDC.

Bagan klasifikasi berfaset
Bagan berfaset mendaftarkan faset-faset atau konsep-konsep tunggal yang dapat dikenali dalam bidang-bidang subyek bagan, dan menyediakan mekanisme atau sarana yang memungkinkan penggabungan dua atau lebih faset.

Bagan berfaset didasarkan atas analisis faset. Konsep-konsep tunggal (isolat) yang menjadi subyek dokumen diidentifkasi, kemudian dengan menggunakan berbagai ciri pembagian akan diperoleh beberapa kelompok isolat. Kelompok isolat yang diperoleh lewat pembagian dengan satu ciri pembagian adalah satu faset. Isolat yang sudah menjadi anggota suatu faset, sekarang disebut fokus (tunggal) - foci (jamak).

Untuk menyatakan subyek kompleks/majemuk faset-faset yang terdaftar dapat dikombinasikan sesuai dengan peraturan yang berlaku untuk bagan tsb. Karena mencakup kegiatan analisis (pada tahap penyusunan bagan) dan penggabungan (pada tahap penerapan), maka bagan tipe ini juga disebut bagan analitiko-sintetik.

Proses konstruksi bagan berfaset:
1. Identifikasi isolat dan pengelompokan isolat menjadi faset.
2. Menentukan urutan foci dalam satu faset.Diawali dengan mengidentifikasi subfaset dari satu faset (jika ada).Susunan yang lazim digunakan: sederhana ® kompleks spatial (berdasarkan tempat) atau geografis kronologis, historis, atau berdasarkan evolusi kanonik (berdasarkan urutan yang sudah umum digunakan untuk bidang ilmu tsb.) abjad
3. Tentukan urutan kombinasi faset.Bagan mendaftar subyek sederhana atau konsep tunggal, yang nanti harus dikombinasikan untuk menyatakan subyek majemuk / kompleks yang ada dalam dokumen. Untuk ini harus ditentukan urutan kombinasi atau urutan sitasi. Dalam bagan mungkin diberikan urutan sitasi untuk bidang subyek tertentu, mungkin urutan sitasi diserahkan sepenuhnya pada pemakai bagan.
4. Tentukan urutan faset dalam bagan.
5. Berikan notasi.
6. Buatkan indeks.

Notasi

Notasi berfungsi menunjukkan urutan yang telah ditetapkan untuk subyek-subyek suatu bagan. Meskipun notasi baru ditambahkan setelah subyek-subyek dan urutannya ditentukan, notasi sangat berpengaruh atas efektivitas bagan klasifikasi. Notasi yang kurang baik dapat mengurangi kemampuan bagan untuk menampung subyek baru dan menghambat temu balik informasi yang efektif.
Untuk tiap subyek harus ada notasi yang unik. Notasi yang digunakan harus sudah dikenal secara universal. Sebab itu komponen notasi terbatas pada huruf Latin dan angka Arab. Lambang-lambang lain dapat juga ditambahkan bilamana perlu, tetapi nilai urutan lambang ini harus ditetapkan karena tidak otomatis diketahui orang.

Ada 2 tipe notasi:
1. Notasi murni, yaitu notasi yang hanya menggunakan satu set lambang (karakter), misalnya DDC, yang menggunakan angka (kecuali di beberapa tempat terbatas).
2. Notasi campuran, yaitu notasi yang menggunakan campuran huruf dan angka, misalnya LC.

Kriteria untuk menilai notasi:

1. Mudah digunakan. Notasi harus mudah diingat, ditulis, diketik dan dicocokkan. Faktor-faktor yang mempengaruhi kemudahan menggunakan notasi:
a) Mudah diingat. Lebih mudah untuk misalnya mengingat 681.945.6 daripada 6819456, dan lebih mudah lagi untuk mengingat notasi campuran seperti 532CRM721.
b) Singkat. Makin singkat makin mudah diingat. Panjang notasi dipengaruhi oleh beberapa faktor, a.l.:
i) Basis notasi, atau jumlah karakakter dalam set yang dipilih. Jika misalnya basisnya A - Z, maka 26 subyek dapat diwakili oleh notasi yang terdiri dari satu karakter. Dengan basis 1 - 9 untuk 26 subyek, maka sebagian besar subyek akan mendapat notasi yang terdiri dari lebih dari satu karakter.
ii) Alokasi notasi. Alokasi atau penjatahan mempengaruhi panjang notasi. Ketidakseimbangan dalam menetapkan notasi untuk subyek-subyek dengan volume literatur dan jumlah subdivisi yang kira-kira sama akan membuat notasi subyek tertentu panjang sekali. Misalnya: Sastra Perancis = 56 sedangkan Sastra Bulgaria = 768. Dengan sendirinya semua subdivisi sastra Bulgaria akan mempunyai notasi yang lebih panjang. Ketidakseimbangan notasi sering juga timbul akibat perkembangan subyek-subyek tertentu. Jatah yang tadinya sama menjadi semakin kurang seimbang dengan munculnya banyak subdivisi untuk subyek-subyek tertentu.
iii) Sintesis atau kombinasi dua atau lebih fokus dari bagan berfaset, disertai penggunaan indikator faset.
iv) Notasi yang ekspresif, yang dapat memperlihatkan hubungan subyek dengan subyek lain dalam bagan juga memperpanjang notasi, sebab tiap langkah pembagian ditandai dengan tambahan karakter.
c) Unsur mnemonik, yaitu sarana yang membantu pemakai lebih mudah mengingat notasi.
2. Hospitality.Notasi harus hospitable, yaitu mampu menampung subyek baru tanpa mengakibatkan kekacauan dalam urutan subyek yang telah ada. Ada dua cara untuk membuat notasi mampu menampung subyek baru, yaitu:
a) menyediakan notasi yang ?kosong? ¾ notasi yang tidak dialokasikan pada subyek ¾ dalam urutan notasi
b) menggunakan notasi desimal
3. Notasi harus ekspresif.Notasi ekspresif memperlihatkan hubungan antar subyek, dan ini membantu pemakai melihat struktur bagan dan mengidentifikasi subyek umum dan subdivisnya. Mempertahankan sifat ekspresif ini sulit jika muncul subyek-subyek baru. Notasi desimal paling mampu menunjukkan struktur hubungan, namun sistematika notasi ini pun akan terganggu jika subyek-subyek baru ditambahkan.
4. SintesisNotasi harus dapat menampung hasil sintesis, yaitu kombinasi fokus / faset yang mewakili subyek majemuk / kompleks.
5. FleksibilitasNotasi harus fleksibel agar dapat menampung beberapa urutan sitasi untuk satu subyek, apabila ini sesuai dengan isi dokumen dan diperlukan untuk memuaskan kebutuhan pemakai yang beraneka ragam. Misalnya: UDC memungkinkan pembalikan urutan notasi untuk memberikan pendekatan ganda. 766 untuk seni grafis komersial dan 659.3 untuk komunikasi masa dapat digabung menjadi 766:659.3 atau 659.3:766.
6. Notasi untuk penempatan di rak (Shelf notation)Notasi yang harus ditulis pada label yang akan ditempel di punggung buku jika perlu harus lebih singkat daripada notasi di katalog, indeks atau bibliografi. Bagi pengatalog sangat membantu apabila notasi lengkap dapat ?dipangkas? menjadi notasi ringkas yang menunjukkan kelas besar atau lebih umum dari dokumen. Notasi yang ekspresif lebih mudah diringkas, yaitu dengan menghilangkan satu atau lebih karakter paling akhir.


Indeks

Indeks yang menjadi bagian dari bagan klasifikasi mempunyai dua fungsi:
1. Menunjukkan lokasi topik dalam klasifikasi yang disusun secara sistematis.
2. Menunjukkan aspek-aspek satu subyek yang berhubungan yang dalam urutan sistematis terpencar

Ada dua jenis indeks:
1. Indeks relatif, seperti yang diusulkan oleh Melvil Dewey, yang mempunyai sekurang-kurangnya satu entri untuk tiap subyek yang terdaftar dalam bagan, dan yang mengumpulkan di satu tempat semua aspek suatu subyek konkret yang tersebar dalam bagan klasifikasi (karena urutan subyek dalam bagan mengikuti pendekatan berdasarkan disiplin ilmu).
2. Indeks spesifik, yaitu indeks yang dapat dibuat apabila dalam bagan klasifikasi ybs. tiap subyek hanya mempunyai satu tempat.


PENGINDEKSAN PASCA-LARAS

Disebut post-coordinate atau pasca-laras sebab koordinasi atau penggabungan istilah indeks dilakukan pada tahap penelusuran, jadi sesudah (post) tahap masukan. Agar dapat efektif dan efisien, untuk sistem pasca-laras diperlukan komputer.



Pada tahap masukan dokumen diindeks dengan menggunakan konsep-konsep tunggal.

Pada tahap luaran atau penelusuran harus ada mekanisme atau sarana yang memungkinkan penelusur mendapatkan (retrieve) dokumen berdasarkan satu konsep saja (satu istilah indeks), atau berdasarkan kombinasi konsep (beberapa istilah indeks).


Perkembangan sistem pasca-laras:
1. Uniterm cards (Mortimer Taube)
2. Peek-a-boo (H.W. Batten)
3. Edge notched cards
4. Computer input-output



Masalah:
False drop (= terjaringnya dokumen yang tidak relevan pada saat penelusuran)

Cara mengatasi:
1. Istilah majemuk dipralaraskan
2. Links
3. Roles
4. Weighting
5. Tesaurus sebagai sarana pengawasan kosa kata

Contoh:
Dokumen A:

?Manufacture of multiwall kraft paper sacks for the packaging of cement.?

Untuk dokumen ini pada sistem pralaras akan dibuatkan satu tajuk yang mencakup semua konsep ini, diurut menurut urutan sitasi tertentu.

Misalnya:
CEMENT: packaging : sacks : paper : kraft : multiwall : manufacture


Pada sistem pasca-laras tiap konsep penting dari suatu dokumen dijadikan istilah indeks (indexing term) yang menjadi titik temu (access point)


Istilah yang digunakan untuk mengindeks dokumen ini:

MANUFACTURE
MULTIWALL
KRAFT
PAPER
SACKS
PACKAGING
CEMENT

Dokumen ini dapat diakses lewat 7 istilah indeks
Õ SATU ISTILAH = SATU TITIK TEMU


Kelemahan:

· Entri-entri tidak bersifat spesifik. Akan ada banyak dokumen yang dapat diakses lewat istilah tertentu, sedangkan isi dokumen sesungguhnya lebih khusus daripada makna atau cakupan istilah indeks.Contoh: dokumen A akan di-retrieve apabila penelusur mencari pada istilah CEMENT.Isi dokumen jauh lebih khusus. Membahas pembuatan kantong untuk kemasan semen, bukan semen.

· Jumlah entri besar sekali.


Keuntungan:
· Tidak perlu memikirkan urutan sitasi.

· Jumlah tajuk lebih sedikit karena hanya menggunakan istilah-istilah indeks yang menyatakan konsep-konsep tunggal (foci).


Bandingkan:

Satu bidang subyek dengan 7 faset dengan masing-masing + 45 foci:

ÞDalam sistem pasca-laras maksimal hanya akan ada 45 istilah indeks.
ÞDalam sistem pralaras bisa muncul ratusan tajuk, sebab untuk tiap kombinasi foci dari berbagai faset tsb. harus ada tajuk majemuk.

Jadi dalam sistem pasca-laras:
Relatif sedikit tajuk (istilah indeks), tetapi di bawah satu istilah mungkin diindeks sejumlah besar dokumen.

Di bawah istilah indeks TIDAK akan ditemukan entri, tetapi ditemukan nomor identifikasi dokumen tsb.

Untuk mendapatkan wakil dokumen berisi data bibliografi lengkap, penelusur harus mencari dalam jajaran lain, yaitu jajaran entri yang disusun menurut nomor identifikasi atau nomor induk dokumen.


Untuk mendapatkan dokumen bersubyek majemuk penelusur menggabungan konsep tunggal (= foci yang relevan) pada saat penelusuran.



Contoh:

Deskriptor atau istilah indeks: Nomor induk:

MICROWAVES 28 79 88 133
172 211 243

POWER 12 69 172 192
196 200

COOKING 79 74 172 198 221 255

WAVEGUIDES 157 172 232

TRANSMISSION 11 44 87 150 168
172 200

TRANSPORT 11 40 93 124 172
210 229 266

ELECTRICAL ENGINEERING 50 159 172 200
247

HEATING 40 80 79 172
188 248 300


Penelusuran 1:
Yang diinginkan dokumen tentang microwaves.
Langkah-langkah penelusuran:
Penelusur mencari pada istilah indeks MICROWAVES. Ditemukan 7 nomor dokumen.
Data bibliografi lengkap harus dicari di jajaran kartu yang disusun menurut nomor dokumen.


Penelusuran 2:
Yang diinginkan dokumen tentang penggunaan microwave untuk memasak.
Harus dicari dokumen yang mencakup baik MICROWAVES maupun COOKING.
Penelusur harus mencari nomor dokumen yang diberi istilah indeks MICROWAVES dan COOKING.
Yang memenuhi kriteria penelusuran (search criteria) ini = 79 dan 172


Penelusuran 3:
Yang diinginkan dokumen yang membahas microwaves, waveguides, transmission, dan heating.
Penelusur harus memeriksa nomor dokumen yang diberi istilah indeks microwaves dan waveguides dan transmission dan heating.
Yang memenuhi kriteria penelusuran ini = 172

Untuk sistem pasca-laras harus ada sarana yang memungkinkan penelusur mendapatkan kombinasi konsep apapun dengan cepat.

Perkembangan sarana:

* UNITERM
Indeks pascalaras yang diperkenalkan oleh Mortimer Taube (1953).
UNIT + TERM ® UNITERM (satu istilah)


Menggunakan kartu-kartu indeks. Di bagian atas kartu dicatat istilah indeks, dan sisa kartu dibagi menjadi 10 kolom untuk diisi dengan nomor urut dokumen.

Langkah-langkah pengindeksan:
(dengan kartu uniterm)

1. Beri nomor urut pada dokumen yang masuk.
2. Buat deskripsi bibliografi dokumen.
3. Buat analisis subyek.
4. Tentukan istilah-istilah indeks.
5. Selesaikan cantuman bibliografi (pada kartu cantuman bibliografi).
6. Catat nomor urut pada kartu indeks yang sesuai.Nomor urut dicatat dalam kolom yang sama dengan angka (digit) terakhir dari nomor urut.
7. Untuk istilah baru, buatkan kartu indeks, dan catat nomor urut.
8. Susun kartu indeks menurut abjad.
9. Susun kartu cantuman bibliografi menurut nomor urut.Susun dokumen menurut nomor urut.

Langkah-langkah temu kembali:

1. Tentukan istilah indeks yang sesuai untuk topik yang dicari.
2. Keluarkan kartu indeks dengan istilah indeks yang sesuai. Cocokkan nomor urut yang sama pada kartu-kartu.
3. Keluarkan kartu cantuman bibliografi dengan nomor urut yang ditemukan pada langkah 2.
4. Carilah dokumen dengan nomor urut tsb.

* KARTU PEEK-A-BOO
Juga disebut Batten cards, optical coincidence cards, feature cards.
Bagian atas kartu digunakan untuk mencatat istilah indeks. Sisa kartu dibagi menjadi segi empat yang diberi nomor. Kartu kecil dapat berisi 500 s/d 1000 segi empat atau posisi. Kartu besar bisa sampai 10.000. Nomor urut dokumen ditandai dengan membuat lubang di segi empat yang menduduki urutan tsb. pada kartu. Untuk mendapatkan nomor dokumen dengan istilah indeks yang dicari, kartu-kartu dengan istilah-istilah tsb. dikeluarkan dan disusun. Nomor dokumen yang diindeks dengan istilah indeks yang sama ditemukan dengan bantuan sinar/cahaya yang menembus lubang dengan posisi yang sama.

* Edge notched cards
Menggunakan kartu dengan lubang-lubang di tepinya. Tiap lubang mewakili kode tertentu.

* Komputer
Sistem pengindeksan pasca-laras baru berkembang dengan baik dengan adanya komputer.
Komputer dengan cepat dapat membandingkan sejumlah besar istilah indeks dan nomor dokumen untuk memilih yang memenuhi kriteria penelusuran.

Sistem berbantuan komputer yang baik harus memungkinkan pengembangan strategi penelusuran dengan Boolean operators: (1) AND, (2) OR, (3) NOT


George Boole --- > ahli matematika Inggris abad ke-19
Boolean algebra, Boolean logic, Boolean operators

Mulai digunakan dalam penelusuran bibliografi (bibliographic searching) tahun 1950-an oleh a.l. C. Dake Gull, Calvin Mooers, Ralph Shaw, Mortimer Taube.


Tidak mutlak memerlukan komputer, tetapi teknik penelusuran ini baru bisa dimanfaatkan secara optimal setelah ada komputer. Sekarang penelusuran dengan boolean operators dianggap identik dengan penelusuran dengan komputer.


Masalah pengindeksan pasca-laras:

False drops = terjaringnya dokumen yang tidak relevan

Dapat disebabkan oleh:
Kosa kata tak terawasi, sehingga ada sinonim, homonim, masalah sintaksis.

Tidak ada komentar: