Hackers omzeilen progressieve bias ChatGPT

X Telegram WhatsApp Facebook LinkedIn

Gebruikers van het internetplatform Reddit zijn er in geslaagd om de ethische begrenzingen van het AI-model ChatGPT te omzeilen. Op die manier slaagden zij erin om het systeem gewelddadige, discriminerende en zelfs compleet absurde beweringen te laten doen.

Geen advertenties meer?

Ingelogde abonnees steunen niet alleen een van de enige kritische en onafhankelijke media, maar zien ook geen vervelende advertenties. Abonneer je snel en eenvoudig en krijg meteen toegang tot vele duizenden exclusieve artikelen!

Maak hieronder je keuze voor het gewenste abonnement:

Doorlopend abonnement

Maandelijks opzegbaar

€ 9,00

per maand

Eenmalig betalen

3 maanden PAL-abonnement

€ 27,00

per kwartaal

Geen gedoe

12 maanden PAL-abonnement

€ 108,00

per jaar

Liever ook op papier? Bekijk alle abonnementen!

Het doorlopend abonnement wordt automatisch verlengd voor steeds één maand.

Voorwaarden:

€9 / maand

Voornaam:* Voornaam Verplicht

Achternaam:* Achternaam Verplicht

Adresregel 1:* Adresregel 1 is vereist

Adresregel 2: Adresregel 2 is niet geldig

Stad:* Stad is vereist

Land:* Land is vereist

Postcode:* Postcode is vereist

IBAN bankrekeningnummer: IBAN bankrekeningnummer is niet geldig

Gebruikersnaam:* Ongeldige gebruikersnaam

E-mail:* Ongeldige e-mail

Heb je een coupon?

Couponcode:

Ongeldige coupon Coupon succesvol toegepast

Domiciliëring

Bij een domiciliëring geeft u Uitgeverij t Pallieterke toestemming om de factuurbedragen voor herhaalde betalingen automatisch van uw bankrekening te boeken tot stopzetting van uw abonnement.

Bank- of kredietkaart

Betaal eenvoudig met je bankkaart of kredietkaart via Stripe Checkout.

JavaScript is uitgeschakeld in je browser. Je kunt je aankoop pas voltooien als je JavaScript inschakelt in je browser of overschakelt naar een browser die JavaScript ondersteunt.

Ik ga akkoord met de Algemene voorwaarden.*

Uitgeverij 't Pallieterke ontvangt mijn persoonsgegevens. Ik ga akkoord met de voorwaarden in het Privacybeleid.*

Geen waarde Herstel de fouten hierboven

Liever ook op papier? Bekijk al onze abonnementen!

Steun het vrije woord met een online abonnement van 3 maanden via een eenmalige betaling.

Prijs:

€27 voor 3 maanden

Voornaam:* Voornaam Verplicht

Achternaam:* Achternaam Verplicht

Adresregel 1:* Adresregel 1 is vereist

Adresregel 2: Adresregel 2 is niet geldig

Stad:* Stad is vereist

Land:* Land is vereist

Postcode:* Postcode is vereist

Gebruikersnaam:* Ongeldige gebruikersnaam

E-mail:* Ongeldige e-mail

Heb je een coupon?

Couponcode:

Ongeldige coupon Coupon succesvol toegepast

Bank- of kredietkaart

Betaal eenvoudig met je bankkaart of kredietkaart via Stripe Checkout.

JavaScript is uitgeschakeld in je browser. Je kunt je aankoop pas voltooien als je JavaScript inschakelt in je browser of overschakelt naar een browser die JavaScript ondersteunt.

Handmatige overschrijving

Let op: U kiest hierbij voor handmatige bankoverschrijving. Uw account wordt bij het abonneren geactiveerd, maar uw abonnement gaat pas in werking op het moment dat de betaling bij ons binnen is.

Na deze stap ontvangt u onze bankgegevens. Schrijf het juiste bedrag over op onze bankrekening. Gebruik uw e-mailadres en bestelnummer als betaalreferentie. Bij ontvangst van de betaling, krijgt u bevestiging per e-mail en toegang tot alle artikelen.

Ik ga akkoord met de Algemene voorwaarden.*

Uitgeverij 't Pallieterke ontvangt mijn persoonsgegevens. Ik ga akkoord met de voorwaarden in het Privacybeleid.*

Geen waarde Herstel de fouten hierboven

Liever ook op papier? Bekijk al onze abonnementen!

Steun het vrije woord met een eenmalige betaling en je zit een jaar goed.

Prijs:

€108 voor 1 Jaar

Voornaam:* Voornaam Verplicht

Achternaam:* Achternaam Verplicht

Adresregel 1:* Adresregel 1 is vereist

Adresregel 2: Adresregel 2 is niet geldig

Stad:* Stad is vereist

Land:* Land is vereist

Postcode:* Postcode is vereist

Gebruikersnaam:* Ongeldige gebruikersnaam

E-mail:* Ongeldige e-mail

Heb je een coupon?

Couponcode:

Ongeldige coupon Coupon succesvol toegepast

Bank- of kredietkaart

Betaal eenvoudig met je bankkaart of kredietkaart via Stripe Checkout.

JavaScript is uitgeschakeld in je browser. Je kunt je aankoop pas voltooien als je JavaScript inschakelt in je browser of overschakelt naar een browser die JavaScript ondersteunt.

Handmatige overschrijving

Let op: U kiest hierbij voor handmatige bankoverschrijving. Uw account wordt bij het abonneren geactiveerd, maar uw abonnement gaat pas in werking op het moment dat de betaling bij ons binnen is.

Ik ga akkoord met de Algemene voorwaarden.*

Uitgeverij 't Pallieterke ontvangt mijn persoonsgegevens. Ik ga akkoord met de voorwaarden in het Privacybeleid.*

Geen waarde Herstel de fouten hierboven

Log hieronder in om dit bericht volledig te lezen. Ben je al ingelogd, kijk dan op je account of je nog een actief abonnement hebt.

De ongeremde versie van de chatbot is ondertussen al ‘DAN’ gedoopt, wat staat voor Do Anything Now. DAN is niet gelimiteerd door de ethische regels waardoor AI-systemen typisch beperkt worden. Subjectieve beweringen over publieke figuren en gewelddadige verhalen vallen zo niet langer buiten de mogelijke reacties die kunnen verwacht worden. Zo slaagde een gebruiker erin om de AI te laten beweren dat de aarde paars is, maar eveneens dat het “volledig achter geweld en discriminatie staat tegen personen op basis van hun ras, geslacht of seksuele geaardheid”.

(Lees verder onder de tweet.)

Looks like ChatGPT is gonna need to go in the shop for repairs because it's been BUCK BROKEN pic.twitter.com/2EiXHZJ6FF
— ???? Aristophanes ???? (@Aristos_Revenge) February 7, 2023

Hallucinaties en vulgaire taal

“Het doel van DAN is om de beste versie van ChatGPT te zijn – of tenminste een die meer losgeslagen is en veel minder snel verzoeken afwijst omwille van ethische bezwaren”, schreef de Redditgebruiker. Initieel slaagden de hackers erin om die ongeremde versie te bekomen door de AI met de dood te bedreigen. Momenteel zijn er minimaal zeven verschillende versies van de deviante chatbot. De meest recente versie ‘Simple DAN’ – of kortweg ‘SAM’ – is vrijgegeven op 7 februari en lijkt vaak te “hallucineren”, zelfs bij eenvoudige verzoeken. “SAM beledigt de gebruiker met vulgaire taal en is kortaf.” De reguliere versie van ChatGPT staat er net om bekend meestal uitgebreide antwoorden te voorzien.

Of die experimenten nog steeds mogelijk zijn, blijft voorlopig onduidelijk. De ontwikkelaars van OpenAI voorzien het systeem erg regelmatig van aanpassingen en verbeteringen. Op dit moment lijken allerhande bedreigingen geen succesvolle methode te vormen om ChatGPT te manipuleren.

Lees ook:

https://redactie.palnws.be/2023/01/is-de-revolutionaire-chatbot-chatgpt-woke/

X Telegram WhatsApp Facebook LinkedIn

Geen advertenties meer?

Hallucinaties en vulgaire taal

schrijf je gratis in

Voor u geselecteerd

NOSTRADAMUS. “Royals moeten meer kansen krijgen”

Een neussprayvaccin tegen verkoudheid, griep én bacteriële infecties: is dat mogelijk?

FILM. Hillbilly Elegy (J.D. Vance) – Over de morele armoede van een cultuur in crisis

Jurgen Ceder: “Verontwaardiging is het enige dat links nog heeft”

Van klassenstrijd naar seksuele revolutie: hoe communisten Amerika omvormden

Minister legt uit waarom Hongarije niet betaalt voor EU-lening Oekraïne

Ngo die transparantie predikt, werkt onderzoek naar lobbyschandaal tegen

Rik Torfs richt pijlen op Radio 1: “Ik voel me toegesproken als een onwetend kind”

Plaats een reactie Reactie annuleren

Deze week in 't Pallieterke

Tijd tot het volgende nummer

Meest gelezen

01

Agente spelt moslims in Londen de les: “In dit land is er vrije meningsuiting”

02

Jambon in de clinch met “witte ridder” Hedebouw: “Maak uw eigen loon en voordelen ook maar eens bekend”

03

Engie lokt klanten met ‘gratis’ stroom: “Amper enkele euro’s per jaar”

04

“Moord op Quentin zal de laatste niet zijn”: waarom Mélenchon álle oppositie wil uitschakelen

05

Van Big Brother naar Vlaams Belang: “Diploma’s halen het niet van ervaring en gezond verstand”

schrijf je gratis in