Siapa yang mengumpulkan data besar dan mengapa?

Pada musim gugur 2019, sebuah skandal meletus dengan layanan Kartu Apple: saat mendaftar, batas kredit yang berbeda untuk pria dan wanita dikeluarkan. Bahkan Steve Wozniak kurang beruntung:

Setahun sebelumnya, terungkap bahwa platform Netflix menampilkan poster dan teaser yang berbeda kepada pengguna, tergantung pada jenis kelamin, usia, dan kebangsaan mereka. Untuk ini, layanan tersebut dituduh melakukan rasisme.

Terakhir, Mark Zuckerberg secara teratur ditegur karena diduga mengumpulkan, menjual, dan memanipulasi data penggunanya oleh Facebook. Selama bertahun-tahun, dia dituduh dan bahkan diadili atas manipulasi selama pemilu Amerika, membantu dinas khusus Rusia, menghasut kebencian dan pandangan radikal, iklan yang tidak pantas, membocorkan data pengguna, menghalangi penyelidikan terhadap pedofil.

Posting Facebook oleh zuck

Pada saat yang sama, layanan online Pornhub setiap tahun menerbitkan laporan tentang jenis porno apa yang dicari oleh orang-orang dari berbagai negara, jenis kelamin, dan usia. Dan untuk beberapa alasan ini tidak mengganggu siapa pun. Meskipun semua cerita ini serupa: di masing-masing cerita kita berurusan dengan data besar, yang pada abad ke-XNUMX disebut "minyak baru".

Apa itu data besar

Big data – mereka juga big data (eng. Big Data) atau metadata – adalah kumpulan data yang datang secara teratur dan dalam volume besar. Mereka dikumpulkan, diproses dan dianalisis, menghasilkan model dan pola yang jelas.

Contoh yang mencolok adalah data dari Large Hadron Collider, yang datang terus menerus dan dalam jumlah banyak. Dengan bantuan mereka, para ilmuwan memecahkan banyak masalah.

Tapi data besar di web bukan hanya statistik untuk penelitian ilmiah. Mereka dapat digunakan untuk melacak bagaimana perilaku pengguna dari berbagai kelompok dan kebangsaan, apa yang mereka perhatikan, dan bagaimana mereka berinteraksi dengan konten. Terkadang, untuk ini, data dikumpulkan bukan dari satu sumber, tetapi dari beberapa sumber, membandingkan dan mengidentifikasi pola tertentu.

Tentang betapa pentingnya data besar di jaringan, mereka mulai berbicara ketika jumlahnya sangat banyak. Pada awal tahun 2020, terdapat 4,5 miliar pengguna internet di dunia, dimana 3,8 miliar di antaranya terdaftar di jejaring sosial.

Siapa yang memiliki akses ke Big Data

Menurut survei, lebih dari separuh negara kita percaya bahwa data mereka di jaringan digunakan oleh pihak ketiga. Pada saat yang sama, banyak yang memposting informasi pribadi, foto, dan bahkan nomor telepon di jejaring sosial dan aplikasi.

Siapa yang mengumpulkan data besar dan mengapa?
Siapa yang mengumpulkan data besar dan mengapa?
Siapa yang mengumpulkan data besar dan mengapa?
Siapa yang mengumpulkan data besar dan mengapa?

Perlu dijelaskan di sini: orang pertama adalah pengguna itu sendiri, yang menempatkan datanya pada sumber daya atau aplikasi apa pun. Pada saat yang sama, dia setuju (memberi tanda centang pada perjanjian) untuk pemrosesan data ini pihak kedua – yaitu, pemilik sumber daya. Pihak ketiga adalah pihak yang kepadanya pemilik sumber daya dapat mentransfer atau menjual data pengguna. Seringkali ini ditulis dalam perjanjian pengguna, tetapi tidak selalu.

Pihak ketiga adalah lembaga pemerintah, peretas, atau perusahaan yang membeli data untuk tujuan komersial. Yang pertama dapat memperoleh data melalui keputusan pengadilan atau otoritas yang lebih tinggi. Peretas, tentu saja, tidak menggunakan izin apa pun – mereka hanya meretas basis data yang disimpan di server. Perusahaan (berdasarkan undang-undang) hanya dapat mengakses data jika Anda sendiri yang mengizinkannya – dengan mencentang kotak di bawah perjanjian. Kalau tidak, itu ilegal.

Mengapa perusahaan menggunakan Big Data?

Data besar di bidang komersial telah digunakan selama beberapa dekade, hanya saja tidak sekuat sekarang. Ini adalah, misalnya, rekaman dari kamera pengintai, data dari navigator GPS, atau pembayaran online. Kini, dengan berkembangnya jejaring sosial, layanan online, dan aplikasi, semua ini dapat dihubungkan dan mendapatkan gambaran terlengkap: di mana calon pelanggan tinggal, apa yang suka mereka tonton, ke mana mereka pergi berlibur dan merek mobil apa yang mereka miliki.

Dari contoh di atas, terlihat jelas bahwa dengan bantuan big data, perusahaan pertama-tama ingin menargetkan iklan. Artinya, untuk menawarkan produk, layanan, atau opsi individu hanya kepada audiens yang tepat dan bahkan menyesuaikan produk untuk pengguna tertentu. Selain itu, beriklan di Facebook dan platform besar lainnya menjadi semakin mahal, dan menunjukkannya kepada semua orang secara berurutan sama sekali tidak menguntungkan.

Informasi tentang pelanggan potensial dari sumber terbuka secara aktif digunakan oleh perusahaan asuransi, klinik swasta, dan pemberi kerja. Yang pertama, misalnya, dapat mengubah ketentuan asuransi jika melihat Anda sering mencari informasi tentang penyakit atau obat tertentu, dan pemberi kerja dapat menilai apakah Anda rentan terhadap konflik dan perilaku antisosial.

Tetapi ada tugas penting lain yang telah diperjuangkan dalam beberapa tahun terakhir: mendekati audiens yang paling mampu. Ini tidak mudah dilakukan, meskipun tugasnya sangat difasilitasi oleh layanan pembayaran dan cek elektronik melalui satu OFD (operator data fiskal). Untuk bisa sedekat mungkin, perusahaan bahkan berusaha melacak dan “memelihara” pelanggan potensial sejak kecil.: melalui game online, mainan interaktif dan layanan pendidikan.

Bagaimana cara kerjanya?

Peluang terbesar untuk pengumpulan data adalah dari perusahaan global yang memiliki beberapa layanan sekaligus. Facebook kini memiliki lebih dari 2,5 miliar pengguna aktif. Pada saat yang sama, perusahaan juga memiliki layanan lain: Instagram – lebih dari 1 miliar, WhatsApp – lebih dari 2 miliar, dan lainnya.

Tetapi Google memiliki pengaruh yang lebih besar: Gmail digunakan oleh 1,5 miliar orang di dunia, 2,5 miliar lainnya oleh OS seluler Android, lebih dari 2 miliar oleh YouTube. Dan itu belum termasuk pencarian Google dan aplikasi Google Maps, Google Play store, dan browser Chrome. Tetap kencangkan bank online Anda – dan Google akan dapat mengetahui segalanya tentang Anda secara harfiah. Omong-omong, Yandex sudah selangkah lebih maju dalam hal ini, tetapi hanya mencakup audiens berbahasa Rusia.



👍 Pertama-tama, perusahaan tertarik dengan apa yang kami posting dan sukai di jejaring sosial. Misalnya, jika bank melihat Anda sudah menikah dan secara aktif menyukai gadis di Instagram atau Tinder, kemungkinan besar Anda akan menyetujui pinjaman konsumen. Dan hipotek keluarga hilang.

Penting juga iklan apa yang Anda klik, seberapa sering dan dengan hasil apa.

(Yaitu Langkah selanjutnya adalah pesan pribadi: berisi lebih banyak informasi. Pesan bocor di VKontakte, Facebook, WhatsApp, dan pesan instan lainnya. Menurut mereka, ngomong-ngomong, mudah untuk melacak geolokasi pada saat mengirim pesan. Tentunya Anda pernah memperhatikan: saat Anda berdiskusi tentang membeli sesuatu atau sekedar memesan pizza dengan seseorang, iklan yang relevan langsung muncul di feed.

🚕 Data besar digunakan secara aktif dan “dibocorkan” oleh layanan pengiriman dan taksi. Mereka tahu di mana Anda tinggal dan bekerja, apa yang Anda sukai, berapa perkiraan penghasilan Anda. Uber, misalnya, menunjukkan harga yang lebih tinggi jika Anda pulang dari bar dan jelas berlebihan. Dan ketika Anda memiliki banyak agregator lain di ponsel Anda, sebaliknya, mereka akan menawarkan yang lebih murah.

(Yaitu Ada layanan yang menggunakan foto dan video untuk mengumpulkan informasi sebanyak mungkin. Misalnya, pustaka visi komputer – Google memilikinya. Mereka memindai Anda dan lingkungan Anda untuk melihat ukuran atau tinggi badan Anda, merek apa yang Anda kenakan, mobil apa yang Anda kendarai, apakah Anda memiliki anak atau hewan peliharaan.

(Yaitu Mereka yang menyediakan gateway SMS ke bank untuk pengiriman surat mereka dapat melacak pembelian Anda di kartu – mengetahui 4 digit terakhir dan nomor telepon – lalu menjual data ini ke orang lain. Karenanya semua spam ini dengan diskon dan pizza sebagai hadiah.

🤷️️ Akhirnya, kami sendiri membocorkan data kami ke layanan dan aplikasi kiri. Ingat hype di sekitar Getcontact, ketika semua orang dengan senang hati mengisi nomor telepon mereka untuk mengetahui bagaimana itu ditulis oleh orang lain. Dan sekarang temukan persetujuan mereka dan baca apa yang dikatakan tentang transfer data Anda (spoiler: pemilik dapat mentransfernya ke pihak ketiga atas kebijaksanaan mereka):

Siapa yang mengumpulkan data besar dan mengapa?

Korporasi dapat berhasil mengumpulkan dan bahkan menjual data pengguna selama bertahun-tahun, hingga terjadi gugatan – seperti yang terjadi dengan Facebook yang sama. Dan kemudian peran yang menentukan dimainkan oleh pelanggaran perusahaan terhadap GDPR – undang-undang di UE yang membatasi penggunaan data jauh lebih ketat daripada di Amerika. Contoh terbaru lainnya adalah skandal antivirus Avast: salah satu layanan anak perusahaan mengumpulkan dan menjual data dari 100 hingga 400 juta pengguna.

Tetapi apakah semua ini memiliki keuntungan bagi kita?

Seberapa besar data membantu kita semua?

Ya, ada sisi baiknya juga.

Data besar membantu menangkap penjahat dan mencegah serangan teroris, menemukan anak hilang, dan melindungi mereka dari bahaya.

Dengan bantuan mereka, kami kami menerima penawaran keren dari bank dan diskon pribadi. Berkat mereka kami kami tidak membayar untuk banyak layanan dan jejaring sosial yang hanya menghasilkan dari iklan. Kalau tidak, Instagram saja akan menelan biaya beberapa ribu dolar sebulan.

Facebook sendiri memiliki 2,4 miliar pengguna aktif. Pada saat yang sama, keuntungan mereka untuk tahun 2019 mencapai $18,5 miliar. Ternyata perusahaan menghasilkan hingga $7,7 setahun dari setiap pengguna melalui iklan.

Terakhir, terkadang nyaman: ketika layanan sudah mengetahui di mana Anda berada dan apa yang Anda inginkan, dan Anda tidak perlu mencari sendiri informasi yang Anda butuhkan.

Bidang lain yang menjanjikan untuk penerapan Big Data adalah bidang pendidikan.

Di salah satu universitas Amerika di Virginia, sebuah penelitian dilakukan untuk mengumpulkan data siswa dari apa yang disebut kelompok risiko. Ini adalah mereka yang belajar dengan buruk, ketinggalan kelas dan akan putus sekolah. Faktanya adalah bahwa di negara bagian setiap tahun sekitar 400 orang dikurangkan. Ini buruk baik untuk universitas, yang peringkatnya diturunkan dan dananya dipotong, dan untuk siswa itu sendiri: banyak yang mengambil pinjaman untuk pendidikan, yang, setelah dikurangi, masih harus dilunasi. Belum lagi kehilangan waktu dan prospek karir. Dengan bantuan data besar, dimungkinkan untuk mengidentifikasi waktu yang tertinggal dan menawarkan tutor, kelas tambahan, dan bantuan terarah lainnya kepada mereka.

Omong-omong, ini juga cocok untuk sekolah: kemudian sistem akan memberi tahu guru dan orang tua – kata mereka, anak bermasalah, mari bantu dia bersama. Big Data juga akan membantu Anda memahami buku teks mana yang berfungsi lebih baik dan guru mana yang menjelaskan materi dengan lebih mudah.

Contoh positif lainnya adalah pembuatan profil karier.: ini adalah saat remaja dibantu untuk memutuskan profesi masa depan mereka. Di sini, data besar memungkinkan Anda mengumpulkan informasi yang tidak dapat diperoleh dengan menggunakan tes tradisional: bagaimana perilaku pengguna, apa yang dia perhatikan, bagaimana dia berinteraksi dengan konten.

Di AS yang sama, ada program bimbingan karir – SC ACCELERATE. Itu, antara lain, menggunakan teknologi GPS CareerChoice: mereka menganalisis data tentang sifat siswa, kecenderungan mereka terhadap mata pelajaran, kekuatan dan kelemahan. Data tersebut kemudian digunakan untuk membantu para remaja memilih perguruan tinggi yang tepat bagi mereka.


Berlangganan dan ikuti kami di Yandex.Zen — teknologi, inovasi, ekonomi, pendidikan, dan berbagi dalam satu saluran.

Tinggalkan Balasan