66 proc. przedsiębiorstw zmierza do zwiększenia udziału sztucznej inteligencji w swoich procesach decyzyjnych – głosi opublikowany przez firmę Progress raport Data Bias: The Hidden Risk of AI. Jednak zmianę tę powinno się wprowadzać z dużą ostrożnością. Skuteczność algorytmów sztucznej inteligencji odzwierciedla jakość zasobów, za pomocą których była szkolona. Jeżeli nie zadbano o ich odpowiednie przygotowanie, dostarczane przez AI wyniki mogą być niepełne, niepoprawne, a nawet dyskryminujące wobec mniejszości. Zjawisko to nazywa się tendencyjnością danych (ang. data bias).
Tendencyjne dane to zbiory informacji zawierające systematyczne błędy czy też faworyzujące określoną grupę kosztem innej. Jednym z powodów powstawania tego typu nieprawidłowości jest brak różnorodności wśród członków zespołów pracujących nad modelami AI. Według badania Harvard Business Review personel ten w znacznej mierze składa się z jednorodnych kulturowo mężczyzn posiadających naukowy stopień doktora. Pomimo wysokich kwalifikacji, pracownicy ci często nie są w stanie rozszerzyć swojej perspektywy na społeczności, których nie reprezentują. Efektem takiej sytuacji jest powstawanie algorytmów, które nie mogą asystować firmom w podejmowaniu sprawiedliwych, inkluzywnych decyzji, ponieważ dysponują informacjami reprezentującymi jedynie wąską część populacji.
– Tendencyjność danych może przejawiać się w różnych obszarach funkcjonowania przedsiębiorstwa. Nierzadko bywa widoczna np. w dziale kadr i płac. Stosunkowo niedawno jeden ze znanych sprzedawców detalicznych odkrył wadę w swoim zautomatyzowanym systemie rekrutacji. Okazało się, że algorytm docelowo obsadzał wolne stanowiska technologiczne mężczyznami, ignorując równie dobrze wykfalifikowane kandydatki – wyjaśnia Jakub Andrzejewski, Business Development Manager na Polskę.
Świadomość firm rośnie – czy jest wystarczająca?
78 proc. przedsiębiorstw, które wzięły udział w badaniu Progress, sądzi, że tendencyjność danych będzie stawać się coraz istotniejszym problemem. Uważają, że będzie to jeden z bezpośrednich skutków zwiększającej się zależności firm i instytucji od sztucznej inteligencji. Równocześnie jednak tylko w 13 proc. ankietowanych przedsiębiorstw udało się opracować stały proces oceny skali występowania tego zjawiska. 45 proc. respondentów rozpoczęło pracę nad wdrażaniem polityki, która pozwoli im na zmniejszenie ryzyka tendencyjności danych, a 36 proc. firm dopiero zaczęło zgłębiać istotę problemu. Pozostałe 6 proc. respondentów nie wykonało żadnych kroków w kierunku zmniejszenia ryzyka występowania stronniczości informacji.
Według wyników badania Progress, świadomość firm dotycząca zjawiska data bias wzrasta. Wiedza ta nie zawsze pociąga jednak za sobą zdecydowane działania. Fakt ten jest spowodowany barierami, na jakie trafiają przedsiębiorstwa podczas próby podjęcia walki ze stronniczością występującą w ich systemach. Wśród największych przeszkód respondenci wymienili brak powszechnej świadomości na temat problemu; niewystarczające zrozumienie procesu identyfikacji uprzedzeń oraz niewystarczający dostęp do zasobów eksperckich, takich jak konsultacje z naukowcami zajmującymi się danymi.
Jak przeciwdziałać stronniczości?
Wyeliminowanie tendencyjności danych wymaga wdrożenia zmian w więcej niż jednym aspekcie funkcjonowania firm oraz projektowania modeli sztucznej inteligencji. Konieczne jest podjęcie różnorodnych działań:
- Zadbanie o zróżnicowanie personelu pracującego nad algorytmami AI – Zespoły te powinny składać się z osób reprezentujących odmienne perspektywy i kręgi kulturowe. Ponadto, należy wziąć pod uwagę pracowników posiadających mniej zaawansowane stopnie naukowe, wywodzących się z szerszego przekroju zawodów i środowisk.
- Przeprowadzanie szkoleń – Problem tendencyjności stwarza potrzebę organizacji treningów w zakresie zarządzania zbiorami danych. Dzięki temu możliwe stanie się opracowywanie protokołów wykrywania i naprawiania stronniczych algorytmów oraz przeciwdziałania powstawaniu ich.
- Regularne sprawdzanie danych – Należy aktywnie monitorować dane pod katem stronniczości na każdym etapie ich wykorzystania – od gromadzenia po końcową analizę.
Całkowite wyeliminowanie problemu tendencyjności danych będzie wymagało czasu i inwestycji ze strony firm. Równocześnie brak reakcji stawia przed nimi ryzyko strat wizerunkowych oraz – tym samym – finansowych. Uniemożliwia także pełne wykorzystanie potencjału sztucznej inteligencji w obrębie przedsiębiorstwa. W związku z tym aktywna walka z tendencyjnością danych to nie tylko decyzja wskazana pod kątem etycznym, ale również biznesowym.