Bagaimana Cara Mendapat Privasi Differensial Melindungi Data Anda? Marco Verch / Flickr, CC BY 

Perusahaan teknologi dapat menggunakan privasi diferensial untuk mengumpulkan dan berbagi data agregat tentang kebiasaan pengguna, sambil mempertahankan privasi individu.

Bukan rahasia bahwa perusahaan-perusahaan teknologi besar seperti Facebook, Google, Apple dan Amazon semakin menyusupi interaksi pribadi dan sosial kita untuk mengumpulkan sejumlah besar data pada kita setiap hari. Pada saat yang sama, pelanggaran privasi di dunia maya secara teratur membuat berita halaman depan.

Jadi bagaimana privasi harus dilindungi di dunia di mana data dikumpulkan dan dibagikan dengan peningkatan kecepatan dan kecerdikan?

Privasi diferensial adalah model baru dari keamanan cyber yang mendukung klaim dapat melindungi data pribadi jauh lebih baik daripada metode tradisional.

Matematika didasarkan pada dikembangkan 10 tahun yang lalu, dan metode ini telah diadopsi oleh Apple dan Google dalam beberapa tahun terakhir.


grafis berlangganan batin


Apa itu privasi diferensial?

Privasi diferensial memungkinkan perusahaan-perusahaan teknologi untuk mengumpulkan dan membagikan informasi agregat tentang kebiasaan pengguna, sambil mempertahankan privasi setiap pengguna.

Sebagai contoh, katakanlah Anda ingin menunjukkan rute yang paling populer orang berjalan melalui taman. Anda melacak rute orang 100 yang secara teratur berjalan melewati taman, dan apakah mereka berjalan di jalan atau melewati rerumputan.

Namun alih-alih membagikan orang-orang tertentu yang mengambil setiap rute, Anda membagikan data agregat yang dikumpulkan dari waktu ke waktu. Orang yang melihat hasil Anda mungkin tahu bahwa 60 dari 100 orang lebih suka mengambil jalan pintas melalui rumput, tetapi bukan orang 60 yang mana.

Mengapa kita membutuhkannya?

Banyak pemerintah dunia memiliki kebijakan ketat tentang bagaimana perusahaan teknologi mengumpulkan dan membagi data pengguna. Perusahaan yang tidak mengikuti aturan dapat menghadapi denda besar. SEBUAH Pengadilan Belgia baru-baru ini memesan Facebook berhenti mengumpulkan data tentang kebiasaan menjelajah pengguna di situs web eksternal, atau menghadapi denda € 250,000 sehari.

Bagi banyak perusahaan, terutama perusahaan multinasional yang beroperasi di yurisdiksi yang berbeda, hal ini membuat mereka dalam posisi yang sulit ketika menyangkut pengumpulan dan penggunaan data pelanggan.

Di satu sisi, perusahaan-perusahaan ini membutuhkan data pengguna sehingga mereka dapat memberikan layanan berkualitas tinggi yang menguntungkan pengguna, seperti rekomendasi yang dipersonalisasi. Di sisi lain, mereka mungkin menghadapi tuntutan jika mereka mengumpulkan terlalu banyak data pengguna, atau jika mereka mencoba memindahkan data dari satu wilayah ke wilayah lain.

Alat pelestarian privasi tradisional seperti kriptografi tidak dapat menyelesaikan dilema ini karena mencegah perusahaan teknologi mengakses data sama sekali. Dan anonimitas mengurangi nilai data - algoritme tidak dapat melayani saran hasil personalisasi jika tidak tahu apa kebiasaan Anda.

Bagaimana cara kerjanya?

Mari kita lanjutkan contoh rute berjalan melalui taman. Jika Anda mengetahui identitas mereka yang termasuk dalam penelitian, tetapi Anda tidak tahu siapa yang mengambil rute mana maka Anda mungkin menganggap bahwa privasi dilindungi. Tapi itu mungkin bukan masalahnya.

Katakanlah seseorang yang melihat data Anda ingin memastikan apakah Bob lebih suka berjalan di rumput atau di jalan. Mereka telah memperoleh informasi latar belakang tentang orang 99 lainnya dalam penelitian ini, yang memberitahu mereka bahwa orang 40 lebih suka berjalan di jalan dan 59 lebih suka berjalan melalui rumput. Oleh karena itu, mereka dapat menyimpulkan bahwa Bob, yang merupakan orang 100th dalam database, adalah orang 60th yang lebih suka berjalan melalui rumput.

Jenis serangan ini disebut serangan terdiferensiasi, dan cukup sulit untuk dipertahankan karena Anda tidak dapat mengendalikan seberapa banyak pengetahuan latar belakang yang dapat diperoleh seseorang. Privasi diferensial bertujuan untuk mempertahankan diri dari serangan jenis ini.

Seseorang yang menyimpulkan rute berjalan Anda mungkin tidak terdengar terlalu serius, tetapi jika Anda mengganti rute berjalan dengan hasil tes HIV, maka Anda dapat melihat ada potensi untuk pelanggaran privasi yang serius.

Model privasi diferensial menjamin bahwa bahkan jika seseorang memiliki informasi lengkap tentang 99 orang 100 dalam kumpulan data, mereka masih tidak dapat menyimpulkan informasi tentang orang terakhir.

Mekanisme utama untuk mencapai itu adalah dengan menambahkan noise acak ke data agregat. Dalam contoh jalur, Anda dapat mengatakan jumlah orang yang lebih suka menyeberangi rumput adalah 59 atau 61, bukan jumlah persis 60. Nomor yang tidak akurat dapat menjaga privasi Bob, tetapi itu akan berdampak sangat kecil pada pola: sekitar 60% orang lebih suka mengambil jalan pintas.

Kebisingan dirancang dengan hati-hati. Ketika Apple menggunakan privasi diferensial di iOS 10, Apple menambahkan suara ke input pengguna individu. Itu berarti dapat melacak, misalnya, emoji yang paling sering digunakan, tetapi penggunaan emoji dari setiap pengguna individual adalah tertutup.

Cynthia Dwork, the penemu privasi diferensial, telah mengusulkan bukti matematis yang luar biasa tentang seberapa banyak kebisingan yang cukup untuk mencapai persyaratan privasi diferensial.

Apa aplikasi praktisnya?

Privasi diferensial dapat diterapkan untuk segala sesuatu mulai dari sistem rekomendasi hingga layanan berbasis lokasi dan jejaring sosial. apel menggunakan privasi diferensial untuk mengumpulkan wawasan penggunaan anonim dari perangkat seperti iPhone, iPad, dan Mac. Metode ini mudah digunakan, dan secara hukum di tempat yang jelas.

Privasi diferensial juga akan memungkinkan perusahaan seperti Amazon mengakses preferensi belanja pribadi Anda sambil menyembunyikan informasi sensitif tentang daftar pembelian historis Anda. Facebook dapat menggunakannya untuk mengumpulkan data perilaku untuk iklan bertarget, tanpa melanggar kebijakan privasi suatu negara.

Bagaimana ini bisa digunakan di masa depan?

Negara yang berbeda memiliki kebijakan privasi yang berbeda-beda, dan dokumen sensitif saat ini harus diperiksa secara manual sebelum berpindah dari satu negara ke negara lain. Ini memakan waktu dan mahal.

Baru-baru ini, tim dari Universitas Deakin mengembangkan teknologi privasi diferensial untuk mengotomatisasi proses privasi dalam komunitas berbagi-cloud di seluruh negara.

PercakapanMereka mengusulkan menggunakan rumus matematika untuk memodelkan undang-undang privasi masing-masing negara yang dapat diterjemahkan menjadi "middleware" (perangkat lunak) untuk memastikan data sesuai. Mempekerjakan privasi diferensial dengan cara ini dapat melindungi privasi pengguna dan menyelesaikan sakit kepala berbagi data bagi perusahaan teknologi.

Tentang Penulis

Tianqing Zhu, Dosen Keamanan Siber, Fakultas Sains, Teknik & Lingkungan Buatan, Universitas Deakin

Artikel ini awalnya diterbitkan pada Percakapan. Membaca Artikel asli.

Buku terkait

at Pasar InnerSelf dan Amazon