Dati ir sensitīvs temats, un jūs, kā datu zinātnieks, protams, būsiet to tuvumā. Šeit ir daži noteikumi, kas jums vienmēr jāievēro.

Dati ir ārkārtīgi vērtīgi, un to izmantošana mūsdienās ir viena no labākajām praksēm lielākajai daļai organizāciju. Taču ir jāzina nozares standarti attiecībā uz to, lai datu zinātnieki nekļūdītos ar datiem, jo ​​cilvēki uzzina vairāk par to vērtību.

Tādējādi datu zinātniekiem ir jāizmanto droša un ētiska prakse un jāpieņem standartizēta prakse. Tā vietā, lai apsvērtu, cik vērtīgi ir tikai dati, ir prātīgi apšaubīt datu iegūšanas un apstrādes metodes jebkuram mērķim. Tādējādi šeit ir deviņi rīcības kodeksi, kas jāievēro katram datu zinātniekam.

1. Ievērojiet noteikumus

Datu zinātniekiem ir jāzina datu aizsardzības noteikumi, kas attiecas uz noteiktiem darbiem. Pretējā gadījumā jūs varat neapzināti pārkāpt likumu un apdraudēt sevi un citus. Tāpēc šīs zināšanas ir ļoti svarīgas, lai nodrošinātu ētisku darbu un novērstu neparedzētu kaitējumu.

Tāpēc pirms jebkādu darbību veikšanas pārbaudiet attiecīgos tiesību aktus. Turklāt ne tikai ievērojiet noteikumus, lai ievērotu noteikumus; meklēt arī dziļāku izpratni par tiem. Lai pareizi ievērotu noteikumus, jums jāzina, kāpēc tie tika novietoti un pret ko tie aizsargā.

instagram viewer

Daži ievērības cienīgi privātuma likumi ir ES Vispārīgā datu aizsardzības regula (GDPR) un Kalifornijas Patērētāju privātuma likumu (CCPA). Citi ietver HIIPA, DPA, PIPEDA, LGPD un daudzus nozarei specifiskus noteikumus.

2. Cieniet Privātumu

Adreses, e-pasta adreses un ID ir identifikatori, kas nedrīkst būt publiski, jo tie rada reālus riskus cilvēkiem. Tāpēc nodrošiniet, lai šī informācija būtu pēc iespējas privātāka.

Ja upuri tiek atklāti, tie var ciest no identitātes zādzības vai krāpšanas. Viņus var šantažēt arī cilvēki, kas draud izpaust viņu konfidenciālo informāciju. Turklāt profesionāļiem var tikt nodarīts kaitējums reputācijai un uzmākšanās tiešsaistē, tiklīdz tiek publiskotas viņu personīgās izvēles. Tie var ietekmēt viņu attiecības, karjeras iespējas un sociālo stāvokli.

Tāpēc, paturot to prātā, izpētiet un izvēlieties efektīvus veidus, kā uzlabot drošas tiešsaistes identitātes un deidentificēt datus. Piemēram, varat aizstāt rakstzīmes, noņemt tiešos identifikatorus vai vispārināt. To darot, tiek aizsargāti sensitīvi dati no kibernoziedzniekiem, vienlaikus palīdzot organizācijām ar jūsu atklājumiem.

3. Novērst neobjektivitāti

Datu zinātnieki paļaujas uz statistiku, lai tā būtu pēc iespējas objektīvāka. Tomēr, neskatoties uz šiem centieniem, neobjektivitāte saglabājas, jo uzskats, ka lielāki dati ir precīzāki, ir viens no visvairāk izplatīti datu zinātnes mīti.

Daļa patiesības tajā slēpjas, taču diemžēl lielos datos dažkārt ir ietverti nevajadzīgi vai viltus elementi un statistika. Tāpēc tā vietā, lai koncentrētos tikai uz skaitļiem, pārliecinieties, ka jūsu dati ir tīri un reprezentatīvi.

Datu tīrīšana vai filtrēšana pirms lietošanas ir lieliska metode neobjektivitātes apkarošanai. Piemēram, varat pārbaudīt, vai nav kļūdu, vai izmantot stratificētu izlasi, lai nodrošinātu reprezentatīvus datus.

4. Neizdomājiet un neizgudrojiet rezultātus

Izgatavošana ir datu nepareizas darbības un izpētes krāpšanas veids, kas ietver konstatējumu sagatavošanu un paziņošanu par tiem kā patiesiem.

Piemēram, datu zinātnieks var ziņot, ka lielākajai daļai noteiktas vecuma grupas locekļu narkotikai nav blakusparādību. Šie atklājumi tiktu izgatavoti, ja nebūtu sākotnējo medicīnisko eksperimentu un vāktu datus, lai tos atbalstītu.

Izgatavošanai ir nopietnas un negatīvas sekas datu zinātniekiem un tiem, kas paļaujas uz viņu darbu. Tas var sagraut jūsu uzticamību, sabojāt jūsu organizācijas reputāciju, kaitēt sabiedrībai vai pakļaut jūs juridiskiem riskiem.

5. Neviltojiet un nemanipulējiet pierādījumus

Falsifikācija ir manipulācija ar realitāti, savāktajiem datiem, lai tie atbilstu darba kārtībai. Kamēr ražotāji ģenerē rezultātus no neesošiem datiem, lai pamatotu savus apgalvojumus, viltotāji strādā, lai personisku iemeslu dēļ atspēkotu reālus un esošos datus. Lai to panāktu, viņi var manipulēt ar pētniecības aprīkojumu, mainīt vai pilnībā izlaist datus.

Viltošana var kaitēt sabiedrībai, sniedzot nepatiesu informāciju, kas ietekmē lēmumu pieņemšanu dažādās nozarēs. Piemēram, viltotu zāļu pētījums var pakļaut cilvēkus nevajadzīgiem riskiem, neefektīvai ārstēšanai vai kaitīgām blakusparādībām. Tas var izraisīt arī naudas, laika vai materiālu zudumu, ko varēja izmantot citiem mērķiem.

Viltošana un viltošana ir negodīga prakse ar negatīvām sekām un daudzām sankcijām. Tie var ietvert naudas sodus, akreditācijas datu atsaukšanu, pētniecības finansējuma zaudēšanu vai ieslodzījumu.

6. Rādīt caurspīdīgumu

Pārredzamība datu zinātniekiem nozīmē godīgumu attiecībā uz metodēm, kas tiek izmantotas datu vākšanai, analīzei un iesniegšanai. Datu zinātniekiem jābūt atvērtiem un gataviem dalīties savā praksē ar citiem datu zinātniekiem un pētījuma dalībniekiem.

Turklāt jums ir jāsaņem pētījuma dalībnieku piekrišana, jo rezultātu publicēšana bez informētas piekrišanas var dažādos veidos necieņu vai kaitēt dalībniekiem. Viņi var pārkāpt viņu cieņu, privātumu un autonomiju vai pakļaut viņus kaitīgiem, nevajadzīgiem riskiem, kas izriet no pētījuma.

Pārredzamība vairo uzticību tiem, kuri paļaujas uz jūsu datiem, lai gūtu ieskatu. Tas arī nodrošina datu kvalitāti, ļaujot citiem pārskatīt jūsu rezultātus.

Turklāt datu zinātnieku atvērtība veicina sadarbību un mācīšanos. Jūs varat palīdzēt veicināt inovāciju, daloties savā procesā un sazinoties ar labākās datu vizualizācijas metodes un datu zinātnes metodes vienaudžiem, mācoties no tiem.

7. Droši vāciet datus

Datu zinātniekiem ir jāapstiprina datu vākšanai, analīzei un uzglabāšanai izmantoto metožu drošība. Šādi tiek novērsti iespējamie datu pārkāpumi, kas var ietekmēt datu zinātniekus un pētījuma dalībniekus.

Datu pārkāpumi apdraud personas drošību, grauj sabiedrības uzticību un atklāj organizatorisku nekompetenci, kā rezultātā uzņēmumam tiek radīti satriecoši finansiāli zaudējumi. Šie zaudējumi varētu būt datu pārkāpuma upuru tiesas prāvas, mazāk klientu un citi.

Ņemot to vērā, jums ir jāveic izpēte, lai atrastu efektīvākie datu drošības risinājumi un piemēro tos. Piemēram, varat nodrošināt savienojumus ar TLS/SSL šifrēšanu vai izmantot rotējošus starpniekserverus. Varat arī ieviest piekļuves kontroles pasākumus un izveidot dublējumus uzbrukuma gadījumā. Kad atrodat risinājumus, neaizmirstiet dalīties tajos ar citiem, lai nodrošinātu maksimālu drošību.

8. Atbildīgi izmantojiet algoritmus

Algoritmi nav tikai rīki datu analīzei. Tie spēcīgi ietekmē cilvēku dzīvi, uzvedību un iespējas. Tomēr, lai gan tie palīdz risināt problēmas un veikt novatoriskas prognozes, tie ir arī nepilnīgi.

Ja algoritmi nav rūpīgi izstrādāti, pārbaudīti vai izvietoti, tiem ir sociāla un ētiska ietekme, kas var kaitēt noteiktām cilvēku grupām. Tie arī ievieš neobjektivitāti, ja tiek apmācīti dati, kas atspoguļo esošos aizspriedumus un var būt neparedzami. Tādējādi datu zinātniekiem tie ir jāizstrādā un jāizmanto atbildīgi.

Vienmēr izvēlieties piemērotus algoritmus, pārbaudiet to veiktspēju un paskaidrojiet, kā tie darbojas. Pārliecinieties arī, ka identificējat iespējamos novirzes avotus un ieviesiet mehānismus, kas vajadzības gadījumā tiek atjaunināti vai laboti.

9. Apsveriet sava darba ilgtermiņa sekas

Jūsu kā datu zinātnieka darbs būtiski ietekmēs daudzus sabiedrības aspektus. Tāpēc vienmēr apsveriet, kā jūsu modeļi ietekmē cilvēkus.

Piemēram, mēģiniet apšaubīt, vai jūsu darbs var iemūžināt aizspriedumus un nevienlīdzību vai apdraudēt privātumu nākotnē. Pēc tam adekvāti pievērsieties šīm bažām.

Ņemiet vērā, ka uz nākotni vērsts skatījums ir svarīgāks par jebkuru koriģējošu metodi, un domāšana par nākamajām dienām ir viens no efektīvākajiem veidiem, kā pieņemt ētiski pamatotus lēmumus.

Jums kā datu zinātniekam jābūt ētiskam

Kā datu zinātnieks jūs saņemat spēku, kas saistīts ar proporcionālu atbildību. Jūsu prasmes ir reti sastopamas, tāpēc jūs esat organizatorisku lēmumu pieņemšanas priekšgalā.

Jūsu lēmumi ietekmē visu, sākot no uzņēmuma biznesa plāniem līdz krimināltiesību sistēmām. Tātad, jums nevajadzētu tos padarīt viegli. Vienmēr esiet godīgs, ētisks un rūpīgs savā darbā, lai aizsargātu cilvēkus no esošajām ētiskām dilemmām jūsu nozarē un citās tehnoloģiju jomās.