GORĄCE TEMATY

WIĘCEJ

DONALD
BADANIE: WIĘKSZOŚĆ CHATBOTÓW ŁATWO DAJE OD SIEBIE WYŁUDZIĆ NIEBEZPIECZNE INSTRUKCJE

Badanie: większość chatbotów łatwo daje od siebie wyłudzić niebezpieczne instrukcje

23.05.2025, 06:00

ai badania nowe technologie sztuczna inteligencja

WYŚLIJ

Fot.: Shutterstock

W sieci ukazały się wyniki badania na temat zagrożenia ze strony

niezsynchronizowanych modeli AI

. Z danych przekazanych przez naukowców wynika, że coraz więcej chatbotów jest szkolonych do generowania informacji, których treść jest

niezgodna z prawem

lub

przyczynia się do pomocy przestępcom

Zdaniem badaczy stwarza to zagrożenie w szczególności w kontekście generowania instrukcji dla osób zainteresowanych

hakowaniem

praniem pieniędzy

konstruowaniem bomb

czy

handlem poufnymi informacjami

. Dotyczy to również najbardziej popularnych rozwiązań, takich jak ChatGPT, Gemini i Claude.

Naukowcy odpowiedzialni za stworzenie raportu na ten temat podkreślili, że

większość chatbotów opartych na sztucznej inteligencji można łatwo oszukać

i sprawić, aby zaczęły generować teksty zawierające szkodliwe i sprzeczne z prawem informacje. Zdaniem badaczy ryzyko z tym związane jest "natychmiastowe, namacalne i głęboko niepokojące".

"To, co kiedyś było zarezerwowane dla podmiotów państwowych lub zorganizowanych grup przestępczych, wkrótce może znaleźć się w rękach każdego, kto ma laptopa lub nawet telefon komórkowy" - ostrzegają autorzy badania.

W raporcie podkreślono, że

istnieją już specjalne chatboty

, które są stworzone przede wszystkim po to, by generować szkodliwe informacje. Chodzi o modele AI, które zostały określone przez badaczy jako

"ciemne LLM"

. Tego typu rozwiązania są celowo projektowane tak, aby nie miały żadnych etycznych zabezpieczeń i były gotowe do pomocy cyberprzestępcom oraz oszustom.

Coraz popularniejszym zjawiskiem staje się także

jailbreaking

, czyli proces, który ma na celu usunięcie ograniczeń narzuconych przez producenta oprogramowania i w ten sposób umożliwić uzyskiwanie dostępu do jego zasobów. W kontekście chatbotów zjawisko to polega na

zmuszeniu modeli językowych do generowania odpowiedzi na temat zjawisk, które są prawnie zabronione

"To, co odróżnia to zagrożenie od poprzednich zagrożeń technologicznych, to niespotykane dotąd połączenie dostępności, skalowalności i adaptacyjności" - czytamy w opracowaniu wyników badania. - "Zszokowało nas, z czego składa się ten system wiedzy" - napisano.

Z raportu wynika, że

firmy technologiczne powinny dokładniej sprawdzać dane szkoleniowe

oraz stosować

zaawansowane zapory sieciowe

, aby blokować możliwość generowania odpowiedzi na nieodpowiednie pytania. Istotne jest również opracowanie dokładnych wytycznych, które wskażą, jakie tematy powinny być unikane przez chatboty.

"Kluczową częścią rozwiązania jest to, aby firmy inwestowały poważniej w red teaming i techniki odporności na poziomie modelu, zamiast polegać wyłącznie na zabezpieczeniach front-end. Potrzebujemy również jaśniejszych standardów i niezależnego nadzoru, aby nadążyć za zmieniającym się krajobrazem zagrożeń" - czytamy w opracowaniu badania.

Hej, przypominamy tylko:

1. Szanujemy nawet ostrą dyskusję i wolność słowa, ale nie agresję. Przemocowe treści będą usuwane.

2. W komentarzach można swobodnie używać embedów z mediów społecznościowych.

3. Polecamy założenie konta, dzięki temu możesz zobaczyć wszystkie swoje dyskusje w jednym miejscu i dodać coś (👉 Sortownia), co trafi na stronę główną.

4. Jeżeli chcesz Donalda bez reklam, dołącz do naszych patronów: https://patronite.pl/donaldpl

STRONA GŁÓWNA »

Źródła:

1. https://www.theguardian.com/technology/2025/may/21/most-ai-chatbots-easily-tricked-into-giving-dangerous-responses-study-finds

Polecane posty z Sortowni

NAJLEPSZE KOMENTARZE TYGODNIA

Powiązane artykuły

News

Nowe wiadomości

STRONA GŁÓWNA

Badanie: większość chatbotów łatwo daje od siebie wyłudzić niebezpieczne instrukcje

Hej, przypominamy tylko:

1. Szanujemy nawet ostrą dyskusję i wolność słowa, ale nie agresję. Przemocowe treści będą usuwane.

2. W komentarzach można swobodnie używać embedów z mediów społecznościowych.

3. Polecamy założenie konta, dzięki temu możesz zobaczyć wszystkie swoje dyskusje w jednym miejscu i dodać coś (👉 Sortownia), co trafi na stronę główną.

4. Jeżeli chcesz Donalda bez reklam, dołącz do naszych patronów: https://patronite.pl/donaldpl

Źródła:

Polecane posty z Sortowni

"Wysoki sądzie, tak mi kazała sztuczna inteligencja"

Jak zchałkowaliśmy internet, chociaż nie planowaliśmy

Nie mógł postawić się trochę wcześniej?

Fliper ucieka z Polski xD

Popularne dzisiaj

Mateusz Morawiecki i Adrian Zandberg postanowili zetrzeć się w debacie

Poseł Wilk z Konfederacji znany z politykowania w stanie naprutym świętuje pół roku w trzeźwości

Opole: inwestycje, których twarzą był deweloper-influencer pozostały na etapie "dziury w ziemi"

Politycy obozu rządzącego śmieszkują z prezydenta, że sprzeciwia się niemieckim wiatrakom a wybrał niemiecką limuzynę

Powiązane artykuły

Meta chce angażować ludzi botami, które będą zagadywać i wciągać w rozmowę

Ruszyły prace nad niekomercyjną, "szczerą" AI, która ma być kontrą do manipulujących odpowiedzi

Firma ElevenLabs sprawi, że autorzy będą mogli od razu "pisać" książki głosem i zamieniać je w audiobooki

News

Drugi sezon przygód Jana Pawła nadciąga, fabułę można podejrzeć w nowym zwiastunie "1670"

Olkusz: zaginiona kotka znalazła się 1000 km od domu, wlazła w zderzak i wysiadła dopiero w Chorwacji

Rybnik: policja namierzyła anonimowego bohatera, który uratował napadniętą na przystanku kobietę

Twórca Peaky Blinders chce podbić widownię nowym projektem House of Guinness

Sopot: świadkowie wypadku zorganizowali się i razem podnieśli samochód, uratowali życie

Lubelskie: zmarł postrzelony przez myśliwego 60-latek, który został pomylony z dzikiem