Thinkstock/scyther5
Jakarta, CB
--
Bocoran data investasi firma hukum asal Panama,
Mossack Fonseca tengah jadi sorotan global. Pasalnya, Mossack Fonseca
diduga membantu aksi pencucian uang, menggelapkan pajak dan menghindari
sanksi.
Dokumen yang diberi label "Panama Papers" itu bocor ke
media Jerman, Suddeutsche Zeitung sejak tahun lalu. Bocoran data
tersebut kemudian dibagikan kepada The International Consortium of
Investigative Journalists (ICIJ) untuk kemudian diselidiki oleh lebih
dari 100 grup media dan 400 jurnalis di dunia.
Lantas bagaimana data tersebut bisa bocor dan terbaca oleh media Suddeutsche Zeitung?
Mengutip situs
Wired,
diperlukan serangkaian proses bagi tim jurnalis untuk bisa mengolah dan
mengakses data mentah yang diterima Suddeutsche Zeitung dari seseorang
yang tidak dikenal alias anonim.
Serangkaian proses tersebut secara garis besar melingkupi konversi data
menjadi format digital menggunakan komputer berteknologi tinggi, serta
penggunaan algoritma untuk menemukan nama-nama yang terdaftar di dalam
"Panama Papers".
"Data yang beraneka ragam sangat sulit untuk
dicerna dan mampu memberi petunjuk ke kata lain," ucap salah satu
profesor ilmu komputer di University College London. "File format tabel,
angka, dan PDF nyaris mustahil ditembus."
Kemudian Süddeutsche
Zeitung dan ICIJ bekerjasama dengan perusahaan peranti lunak Nuix asal
Australia untuk menyisir dan mengatur data yang bocor tersebut.
Menurut
pernyataan konsultan senior Nuix, Carl Barron, menangani data yang
berada di dokumen "Panama Papers" tersebut semuanya disimpan di dalam
server pribadi yang tidak terhubung dengan dunia luar. Sekali terpisah,
maka data itu bisa diindeks, katanya.
Barron pun menyatakan,
pihaknya akan mengeluarkan teks informasi dan metadata informasi ini,
serta mulai menggunakan Nuix untuk menyelidikinya dari big data dan
perspektif analisis.
Tantangan terbesar dari proses mentelaah
data tersebut adalah jumlah teks yang awalnya tidak bisa dikenali oleh
mesin. Perangkat optical character recognition (OCR) digunakan untuk
mengubah data menjadi teks agar bisa dipahami dan dicari oleh komputer.
Saat teks bisa keluar, maka ia bisa dimasukan ke indeks dan database.
Ukuran database akhir diperkirakan Barron, mencapai 30 persen dari
ukuran data aslinya.
"Kami membiarkan ICIJ dan Süddeutsche
Zeitung menjalankan pencarian kata kunci sendiri, kami juga bisa
mengeluarkan entitas seperti nama depan, nama akhir dan angka," jelas
Barron.
Ia melanjutkan, "kami juga bisa menggunakan analitik
sendiri untuk menemukan bagaimana nama-nama ini mengacu pada dokumen.
Jika Anda menemukan satu nama di email, maka Anda kemungkinan ingin
mencari kira-kira di mana lagi nama itu disebut di data yang lain."
Kemudian,
jika informasi telah dimasukan ke indeks, algoritma pun digunakan untuk
melacak tautan secara spesifik di database. Akhirnya, informasi
tersebut digabungkan dengan data yang dibikin secara manual.
"Tim
jurnalis menghimpun daftar politikus penting, pelaku kriminal
internasional, atlet profesional kondang, dan lainnya," begitu
penjelasan Süddeutsche Zeitung di dalam editorial.
Diketahui
dokumen "Panama Papers" mengarah kepada 214 ribu entitas perusahaan di
banyak negara. Mossack Fonseca sendiri memiliki cabang di lebih dari 35
negara. Dokumen itu menyebutkan nama 140 tokoh politik, termasuk 12
pemimpin atau bekas pemimpin negara.
Berapa banyak data yang bocor?Dokumen
asli yang bocor belum dipublikasikan, ICIJ mengatakan daftar seluruh
perusahaan yang terlibat di dalam "Panama Papers" akan diungkap pada
Mei.
Namun besarnya data yang bocor sudah diketahui. Bocoran data tersebut mencapai 11,5 juta dokumen dari Mossack Fonseca.
Mengutip
Wired,
data tersebut melingkupi 4,8 juta email, 3 juta catatan database, 2
juta data berformat PDF, 1 juta gambar, dan 320 ribu dokumen teks.
Dataset tersebut disebut-sebut lebih besar dari kasus Wikileaks atau Edward Snowden.
Secara keseluruhan, dokumen "Panama Papers" mencapai kapasitas 2,6 TB.
Selain tokoh dunia, ada pula 2.960 nama warga negara Indonesia yang tercatat sebagai klien dari 43 perusahaan
offshore yang terafiliasi dengan Mossack Fonseca.
Credit
CNN Indonesia