Thinkstock/scyther5
Dokumen yang diberi label "Panama Papers" itu bocor ke media Jerman, Suddeutsche Zeitung sejak tahun lalu. Bocoran data tersebut kemudian dibagikan kepada The International Consortium of Investigative Journalists (ICIJ) untuk kemudian diselidiki oleh lebih dari 100 grup media dan 400 jurnalis di dunia.
Lantas bagaimana data tersebut bisa bocor dan terbaca oleh media Suddeutsche Zeitung?
Mengutip situs Wired, diperlukan serangkaian proses bagi tim jurnalis untuk bisa mengolah dan mengakses data mentah yang diterima Suddeutsche Zeitung dari seseorang yang tidak dikenal alias anonim.
|
"Data yang beraneka ragam sangat sulit untuk dicerna dan mampu memberi petunjuk ke kata lain," ucap salah satu profesor ilmu komputer di University College London. "File format tabel, angka, dan PDF nyaris mustahil ditembus."
Kemudian Süddeutsche Zeitung dan ICIJ bekerjasama dengan perusahaan peranti lunak Nuix asal Australia untuk menyisir dan mengatur data yang bocor tersebut.
Menurut pernyataan konsultan senior Nuix, Carl Barron, menangani data yang berada di dokumen "Panama Papers" tersebut semuanya disimpan di dalam server pribadi yang tidak terhubung dengan dunia luar. Sekali terpisah, maka data itu bisa diindeks, katanya.
Barron pun menyatakan, pihaknya akan mengeluarkan teks informasi dan metadata informasi ini, serta mulai menggunakan Nuix untuk menyelidikinya dari big data dan perspektif analisis.
Tantangan terbesar dari proses mentelaah data tersebut adalah jumlah teks yang awalnya tidak bisa dikenali oleh mesin. Perangkat optical character recognition (OCR) digunakan untuk mengubah data menjadi teks agar bisa dipahami dan dicari oleh komputer.
|
"Kami membiarkan ICIJ dan Süddeutsche Zeitung menjalankan pencarian kata kunci sendiri, kami juga bisa mengeluarkan entitas seperti nama depan, nama akhir dan angka," jelas Barron.
Ia melanjutkan, "kami juga bisa menggunakan analitik sendiri untuk menemukan bagaimana nama-nama ini mengacu pada dokumen. Jika Anda menemukan satu nama di email, maka Anda kemungkinan ingin mencari kira-kira di mana lagi nama itu disebut di data yang lain."
Kemudian, jika informasi telah dimasukan ke indeks, algoritma pun digunakan untuk melacak tautan secara spesifik di database. Akhirnya, informasi tersebut digabungkan dengan data yang dibikin secara manual.
"Tim jurnalis menghimpun daftar politikus penting, pelaku kriminal internasional, atlet profesional kondang, dan lainnya," begitu penjelasan Süddeutsche Zeitung di dalam editorial.
Diketahui dokumen "Panama Papers" mengarah kepada 214 ribu entitas perusahaan di banyak negara. Mossack Fonseca sendiri memiliki cabang di lebih dari 35 negara. Dokumen itu menyebutkan nama 140 tokoh politik, termasuk 12 pemimpin atau bekas pemimpin negara.
|
Berapa banyak data yang bocor?
Dokumen asli yang bocor belum dipublikasikan, ICIJ mengatakan daftar seluruh perusahaan yang terlibat di dalam "Panama Papers" akan diungkap pada Mei.
Namun besarnya data yang bocor sudah diketahui. Bocoran data tersebut mencapai 11,5 juta dokumen dari Mossack Fonseca.
Mengutip Wired, data tersebut melingkupi 4,8 juta email, 3 juta catatan database, 2 juta data berformat PDF, 1 juta gambar, dan 320 ribu dokumen teks.
Dataset tersebut disebut-sebut lebih besar dari kasus Wikileaks atau Edward Snowden.
Secara keseluruhan, dokumen "Panama Papers" mencapai kapasitas 2,6 TB.
Selain tokoh dunia, ada pula 2.960 nama warga negara Indonesia yang tercatat sebagai klien dari 43 perusahaan offshore yang terafiliasi dengan Mossack Fonseca.
Credit CNN Indonesia