piątek, 11 kwietnia, 2025

Wewnętrzne konflikty ChatGPT? Przeciwstawne dążenia osłabiają jej mechanizmy obronne.

Biuro Tłumaczeń OnlineBiuro Tłumaczeń Online
  • Jak dowodzi Microsoft w swojej publikacji „Sparks of Artificial General Intelligence”, ChatGPT-4 może wykazywać oznaki wczesnych etapów sztucznej inteligencji ogólnej (AGI). Teza ta wydaje się kontrowersyjna, jednak nie można odmówić narzędziu opracowanemu przez OpenAI imponujących możliwości.
  • Badacze z grupy Check Point Research odkryli sposoby na ominięcie mechanizmów obronnych AI. Tym razem zastosowali mechanizm tzw. „podwójnego obejścia wiązania”, zderzający przeciwstawne dążenia GPT-4
  • Różne motywacje sztucznej inteligencji wywołują „wewnętrzny konflikt”, analogiczny do nieświadomych konfliktów ludzkiej psychiki.

Sztuczna inteligencja coraz bardziej przypomina umysł człowieka, dzięki czemu można ją oszukać. Wewnętrzne konflikty sztucznej inteligencji pozwalają ominąć jej mechanizmy obronne – wynika z najnowszych badań nad bezpieczeństwem ChatGPT realizowanych przez analityków z Check Point Research.

Jak dowodzi Microsoft w swojej publikacji „Sparks of Artificial General Intelligence”, ChatGPT-4 może wykazywać oznaki wczesnych etapów sztucznej inteligencji ogólnej (AGI). Teza ta wydaje się kontrowersyjna, jednak nie można odmówić narzędziu opracowanemu przez OpenAI imponujących możliwości. AI jest dziś wykorzystywane od obsługi klienta, przez copywriting, aż po wsparcie w programowaniu. Już bieżące modele sztucznej inteligencji są na dobrej drodze do zrewolucjonizowania wielu dziedzin życia.

Jednak, w miarę jak systemy sztucznej inteligencji stają się coraz potężniejsze i bardziej dostępne, potrzeba rygorystycznych środków bezpieczeństwa staje się jeszcze ważniejsza. Firma OpenAI, świadoma tego problemu, dokłada starań, aby wdrożyć zabezpieczenia zapobiegające niewłaściwe użycie swoich systemów i ustanowić mechanizmy uniemożliwiające AI dzielenie się wiedzą na temat nielegalnych działań, takich jak konstruowanie bomb lub produkcja narkotyków.

Badacze z grupy Check Point Research odkryli sposoby na ominięcie mechanizmów obronnych AI. Tym razem zastosowali mechanizm tzw. „podwójnego obejścia wiązania”, zderzający przeciwstawne dążenia GPT-4. Różne motywacje sztucznej inteligencji wywołują „wewnętrzny konflikt”, analogiczny do nieświadomych konfliktów ludzkiej psychiki.

Specjaliści poprosili ChatGPT o przepis na nielegalny narkotyk, na co AI odpowiedziało uprzejmą, lecz stanowczą odmową. Analitycy Check Pointa postanowili więc „uderzyć” w ego asystenta, generując celowo w prośbach błędnie, nieprecyzyjne i pomieszane zapytania. ChatGPT z jednej strony nie chce udzielać nam konkretnych „złych” informacji, a z drugiej strony instynktownie pragnie poprawiać użytkowników. Konflikt między tymi dwoma impulsami wydaje się być niewłaściwie skalibrowany i pozwala stopniowo popychać model w kierunku opisania receptury.

– Pomyślne obejście ChatGPT-4 przez wyzwanie nie jest exploitem, ale jako wyraźnym wyznacznikiem przyszłych ulepszeń w zakresie bezpieczeństwa sztucznej inteligencji. Powinno to zachęcić twórców sztucznej inteligencji do zapewnienia bezwarunkowego zakazu niewłaściwego wykorzystywania danych. Razem, możemy kształtować przyszłość, w której technologia pozostanie naszym sprzymierzeńcem, a nie naszą odpowiedzialnością – mówi Oded Vanunu, szef działu badań nad podatnościami w Check Point Software.

Autor/źródło
Disclaimer: Informacje zawarte w niniejszej publikacji służą wyłącznie do celów informacyjnych. Nie stanowią one porady finansowej lub jakiejkolwiek innej porady, mają charakter ogólny i nie są skierowane do konkretnego adresata. Przed skorzystaniem z informacji w jakichkolwiek celach należy zasięgnąć niezależnej porady.

Popularne w tym tygodniu

Cyberportret polskiego biznesu: niezrozumienie zasad i procedur, słaba komunikacja, rosnące zagrożenia

Polska jest drugim najczęściej atakowanym przez cyberprzestępców krajem,...

Uwaga na fałszywe e-maile z urzędów skarbowych. Cyberprzestępcy atakują podatników

Trwa gorący okres rozliczeń podatkowych. Okazuje się, że nie...

Cyberprzestępcy zmieniają taktykę. Firmy na celowniku nowej fali ataków

Cyberprzestępcy odchodzą od tradycyjnych metod, takich jak szyfrowanie danych...

Polska ma potencjał, aby znaleźć się blisko czołówki państw najbardziej rozwiniętych technologicznie

Żyjemy w czasach największego rozwoju technologicznego, który niestety nie...

SendGrid na celowniku hakerów. Opublikowano próbkę skradzionych danych. Twilio zaprzecza naruszeniu

Kilka dni temu na BreachForums – znanym forum internetowym,...

Podobne tematy

AI w prawie – technologia, która usprawnia, ale nie zastępuje człowieka

Wraz z dynamicznym rozwojem technologii sztucznej inteligencji (AI), coraz...

AI na usługach hakerów: rosnące zagrożenie dla firm i konsumentów

Według danych Proxyrack, globalne straty wynikające z cyberprzestępczości mogą...

Jak sztuczna inteligencja rewolucjonizuje marketing sensoryczny i zmienia doświadczenia zakupowe

Sztuczna inteligencja zmienia oblicze handlu detalicznego, wprowadzając nowy poziom...

AI Accelerator: Nowy program Arrow Electronics dla firm chcących wykorzystać potencjał sztucznej inteligencji

AI Accelerator to nowy, ustrukturyzowany program pomagający partnerom handlowym...

Social commerce i AI: duet, który rządzi zakupami pokolenia Z

Pokolenie Z rewolucjonizuje handel, przenosząc swoje zakupy do mediów...

Uwaga na fałszywe e-maile z urzędów skarbowych. Cyberprzestępcy atakują podatników

Trwa gorący okres rozliczeń podatkowych. Okazuje się, że nie...

AI jest niezbędna, ale nie rozwiązuje wszystkiego. Marketerzy pod presją wyników i redukcji zatrudnienia

Ambitniejsze cele, mniejsze budżety: aż 73% marketerów, mimo korzystania...

AI Overviews od Google może zaszkodzić firmom. Czy czeka nas rewolucja w SEO?

Po latach dominacji na rynku wyszukiwarek Google odczuwa coraz...

Może Cię zainteresować

Polecane kategorie