Monday, March 21, 2016

KAEDAH ALGORITMA PEMBELAJARAN DIPANTAU DALAM MENGESAN MANIPULASI PASARAN SAHAM – SIRI PENGENALAN



Walaupun terdapat maklumbalas dan tindakan yang pantas oleh pihak berkuasa serta terdapatnya pindaan dalam undang-undang, 
manipulasi pasaran adalah antara kebimbangan utama pelabur pasaran sekuriti/saham.

Kaedah mengenalpasti unsur penipuan dalam pasaran saham yang ada pada masakini adalah bergantung kepada undang-undang, peraturan dan kepakaran. Ianya berdasarkan pendekatan “atas ke bawah” yang menggunakan set corak yang dikenali dan ambang (threshold) yang telah ditakrif terlebih dahulu.

Data pasaran seperti harga dan volume saham (jumlah saham/kontrak yang didagangkan) dipantau menggunakan peraturan yang berkaitan dan notifikasi red-flag. Kemudian sebarang transaksi dalam tempoh pengesanan akan disiasat secara lanjut bagi mengenalpasti sebarang aktiviti penipuan.

Cara ini mempunyai dua kelemahan :

i) Mengesan tempoh yang luarbiasa yang tidak berkaitan dengan simtom (contohnya skim manipulatif yang tidak dikenali)

ii) Kesesuaiannya dengan keadaan/suasana pasaran yang berubah dengan pantas, transaksi data yang tinggi kerana kenaikan jumlah pelabur serta syarikat/saham yang disenaraikan). Ini menuntut pindaan terhadap undang-undang untuk memantau data yang begitu luas dan amat mencabar sekali.
  
Pasaran sekuriti sedang berubah dengan drastik. Suasana ini berpotensi mendedahkan loopholes  yang akan digunakan oleh pedagang untuk meraih keuntungan.

Pihak berkuasa mungkin memerlukan sejenis modul dan algorithma bagi menyokong pengenalpastian aktiviti manipulasi pasaran.

Secara amnya, penipuan saham adalah merujuk kepada kaitan antara tawaran dan jualan saham contohnya :


a) Pelaburan Hasil yang Tinggi (High-Yield) – merujuk kepada pulangan yang dijamin berdasarkan “risiko rendah” atau “tiada risiko langsung” dalam pelaburan instrumen sekuriti.

Penipuan ini bermula dengan “broker” mengambil peluang ke atas kepercayaan pelabur dan mendakwa pulangan yang tinggi di atas modal mereka. Pelaburan Hasil yang Tinggi dapat dikesan menerusi Skim Piramid, Skim Ponzi, Skim Perbankan, Skim Wang Pendahuluan, Komoditi (Forex dan Logam Berharga) dan Nota Promisori.

b) Penyelewengan Broker – Skim ini melibatkan broker bertindak melanggar undang-undang bagi mendapatkan keuntungan daripada pelaburan klien. Biasanya ini melibatkan perdagangan yang tidak sah dan penipuan dokumen.

c) Manipulasi Pasaran – Skim ini melibatkan individu atau sekumpulan manusia yang mengganggu-gugat pasaran yang teratur dan adil bagi mendapat keuntungan. Cara yang dilakukan biasanya melibatkan percubaan mengawal harga pasaran. Faktor inilah yang paling ditakuti pelabur.

Menggunakan pendekatan pelombongan data (data-mining), sekurang-kurangnya 5 kaedah dapat dilakukan.

a) Mengenali Corak (Pattern Recognition) – penggunaan kaedah ini adalah sama dengan melihat pada tren (trend) yang menimbulkan syak bahawa aktiviti penipuan sedang berlaku iaitu :

i) mengesan pedagang yang tatalakunya (behaviour) menampakkan aktiviti penipuan,
ii) mengesan saham yang berkaitan dengan aktiviti penipuan berkenaan,

Sebagai contoh, aktiviti berikut mungkin menampakkan unsur penipuan :

a)    Kecairan, pulangan dan volatiliti adalah lebih tinggi untuk saham yang dimanipulasikan berbanding dengan sampel yang dikawal.
b)   Keuntungan juga dapat dicapai dengan manipulasi harga saham bagi deflate harga (jualan jangka pendek – short-selling) tetapi kebanyakan pakar manipulasi akan cuba untuk menaikkan harga saham,
c)    Waktu Tutup (Closing Hours), Suku Berakhir, dan Tahun Berakhir adalah “ruang bagi manipulasi berlaku”
d)   Kenaikan drastik dalam volume dagangan dan volatiliti pulangan selalunya akan diikuti oleh manipulasi harga (dalam banyak kes)

Apapun, kaedah mengenalpasti corak adalah antara cara terbaik di mana pihak berkuasa dapat membekukan dagangan saham berkenaan.

Namun, proses pelombongan data secara talian dan real-time diperlukan dalam kes ini. Set datanya dalam konteks ini melibatkan secara data dagangan untuk setiap akaun pedagang atau setiap saham dan set corak/tren yang dikenalpasti sebagai penipuan (dilabelkan)

b) Pengesanan Outlier  - mengesan pemerhatian yang tidak konsisten dengan baki data. Ini akan membantu dalam mengenalpasti corak penipuan yang tidak dikenali. Pengesanan yang efektif dapat dilakukan dengan melihat Pancang (spike) berdasarkan keadaan pasaran dan bukannya menggunakan Ambang (threshold) untuk menapis Pancang.

Seperti grup pertama, kaedah ini dapat dilakukan ke atas pedagang dan saham yang didagangkan. Set Data yang diperlukan ialah maklumat mengenai sejarah perdagangan oleh pedagang atau saham yang berkaitan.

Pengesanan anomali akan dapat dicapai menggunakan kaedah pengelompokan (clustering) dan tidak memerlukan data yang dilabel.

Contoh senario : Data diwakili oleh variable statistik (min dan varian) untuk pembelian dan jualan pada tempoh yang tetap (fixed).  Satu parameter akan ditetapkan yang menerangkan jumlah objek dalam peer group dan kawalan ke atas sensitiviti model. Satu objek sasaran akan menentukan ahli dari peer group samada ahli-ahli peer group adalah objek yang paling mirip kepada objek sasaran.

Pada setiap tetingkap masa (contohnya setiap 5 minggu) peer group ini akan diringkaskan bagi mengenalpasti sentroid peer group. Kemudiannya, jarak ahli peer group dengan sentroid peer group akan dikira menggunakan statistik t dan objek yang “lari” daripada peer akan dikutip sebagai outlier.

Akaun dagangan akan dikaitkan dengan objek yang yang dianggap sebagai pedagang yang dicurigai di mana tatalakunya berbeza dengan peer yang lain.

c) Induksi Peraturan (Rules Induction) – mengestrak peraturan yang dapat diperiksa dan digunakan oleh auditor dan pihak berkuasa pasaran saham. Set data yang diperlukan ialah maklumat sejarah dagangan untuk setiap akaun pedagang yang dilabelkan sebagai “disyaki aktiviti penipuan”. Juga ekstrakkan peraturan yang mengenalpasti corak dan ketidakaturan (irregularity) yang tidak dikenali menggunakan data yang tidak dilabelkan (kaedah pembelajaran yang tidak dipantau)

Contoh senario : induksi peraturan menggunakan pelombongan data secara temporal.

Pertama, data siri masa dibersihkan (pra-pemprosesan) menerusi dua langkah :

i)       Penentuan Tempoh Seterusnya (subsequent) dan
ii)     Ektrak corak temporal menggunakan algoritma pengelompokan (min EM dan K)

Juga atrribut data yang relevan dipilih secara manual atau menggunakan pemilihan atribut algoritma.

Kedua, algoritma induksi peraturan (contohnya AQ15) untuk menentukan “if-then”. Satu suasana akan dibentuk bagi menggunakan kaedah yang dicadangkan dan diuji menggunakan set data yang mempunyai data harga temporal (harga, volume, tinggi, rendah, secara keseluruhan 13 indeks trend) untuk 9 saham dari negara X selama 6 bulan.

Keputusan menjual atau membeli setiap saham ditentukan menerusi kaedah pengelompokan dan digunakan untuk menguji ke atas saham yang berbeza. Hasil kajian menunjukkan kaedah Ekstrak Corak adalah yang terbaik di mana ianya melangkaui prestasi garisan asas (baseline)

d) Analisa Jaringan Sosial (Social Network Analysis) – mengesan akaun pedagang yang dikaitkan dengan manipulasi pasaran. Set data yang diperlukan juga maklumat sejarah dagangan untuk setiap akaun pedagang. Di sini, sumber data tambahan seperti sejarah pekerjaan pedagang dan perhubungannya diperlukan untuk disatukan dalam dataset ini. (contohnya – mendapatkan akses kepada mana-mana depositori pendaftaran pusat yang mempunyai maklumat mengenai broker yang berdaftar)

Cara pelombongan data secara tradisi menggunakan klasifikasi, pengelompokan dan peraturan perkaitan selalunya mempertimbangkan sampel poin data yang berasingan (independent). Cara ini tidak dapat leverage kaitan antara sampel set data yang distrukturkan secara komprehensif dan heterogen

Analisa Jaringan Sosial dapat mewakili penstrukturan data seumpama ini di mana nodnya adalah berkaitan dengan sampel data samada objek atau individu, dan sudut yang mewakili perhubungan dan pergantungan sesama objek. Pemetaan, kefahaman, analisa dan mengukur interaksi di jaringan dipanggil Analisa Jaringan Sosial.

Ianya berkesan untuk mencari korelasi yang menandakan berlakunya penipuan dalam pasaran saham bermula dengan perubahan peristiwa (event) dalam pasaran ke bentuk graf (pra-pemprosesan)

Selain itu, analisa ini juga dapat mengesan broker yang bersubahat dalam :

a)    Inflate/Deflate harga saham dengan meletakkan pesanan yang telah diaturkan terlebih dahulu dengan broker-broker lain diikuti dengan aktiviti manipulasi volume,

b)   Memindahkan saham antara akaun bagi mengelak cukai,

c) Mendapat kredibiliti dalam pasaran dengan transaksi jumlah yang tinggi.

Ada yang menggabungkan analisa jaringan sosial dengan kaedah visualisasi interaktif bagi mengenalpasti akaun yang dicurigai.

Antara aktiviti berbentuk penipuan ialah :

a) Perdagangan Kitaran (Circular) – konsisten dalam pembelian dan penjualan volume saham dalam jumlah yang sama samada belian/jualan tinggi atau rendah,

 b) Indikator Primer/Sekunder – menanda akaun yang rendah beliannya dan tinggi jualannya. Jaringan sentraliti akan membantu mencari akaun primer (utama), fungsi ‘f’ akan dikira untuk setiap vertex yang mewakili saiz akaun dan membandingkan harga transaksi dengan harga purata transaksi terdahulu,

  c) Sudut Indikator Utama : Memindahkan stok dari satu akaun ke satuakaun yang lain yang berlaku bila sudut (transaksi) muncul beberapa kali pada 2 vertices.

Analisa Jaringan Sosial terbukti berkesan dalam mencari aktiviti subahat dalam memanipulasikan pasaran dan kaedah bagi memantau interaksi pedagang di dalam pasaran.

e) Visualisasi – ini bukan terhad kepada carta semata-mata di mana auditor perlu berinteraksi dengan data pasaran dan mencari corak yang menampakkan penipuan.

Visualisasi terhadap data pasaran adalah sama pentingnya dengan pemantauan secara real-time dan penyiasatan ‘luar-talian’ (offline)

Kaedah visualisasi akan membantu auditor untuk mengenalpasti aktiviti yang disyaki penipuan dalam transaksi pedagang dan saham yang didagangkan.

Ini dilakukan dengan melihat pada corak di dalam data atau maklumat yang belum disedia untuk dibezakan (discernable). Apa yang diperlukan ialah sejenis kerangka analitikal visual yang menggabungkan treemap 3 Dimensi untuk pemantauan pasaran dan visualisasi berasaskan Tatalaku menggunakan Analisa Jaringan Sosial bagi memantau aktiviti broker.

Dalam Visualisasi 3 Dimensi, setiap sel mewakili satu saham dan saiz sel adalah proportional kepada pemodalan pasalan dan kod warna sel menunjukkan perubahan harga (warna “hijau” untuk “harga naik” dan “merah” untuk “harga turun”)

Ini akan melahirkan satu peralatan yang memantau secara real time dengan tangguhan 15 minit untuk aliran perdagangan asas (harga dan volume)

Keterangan dagangan akan dibandingkan dengan satu set parameter dan pengawasan akan dilakukan ke atas sebarang keluarbiasaan. Analisa jaringan dagangan bertujuan untuk mendedahkan struktur sosial sesama pedagang dan mengenalpasti corak dagangan yang luarbiasa. Nod-nod pula mewakili pedagang, kawasan sekitar setiap node mewakili nilai dagangan dan sudut berarah (directional edges) menandakan aliran dan keseimbangan dagangan.

Satu pangkalan data yang merekodkan setiap corak yang berpotensi ada elemen penipuan akan digunakan sebagai rujukan dan membandingkan peristiwa dalam jaringan dagangan serta mengenalpasti aktiviti yang boleh menimbulkan syak.


Kecairan, pulangan dan volatiliti adalah lebih tinggi untuk saham yang telah dimanipulasi. Oleh itu, mencartakan parameter secara parallel dengan alignment masa yang sama akan membantu penguatkuasaan bagi mengenalpasti corak dan tren yang boleh disyaki.