@Schadi:
Zitat:
1.Neuer KI Filter: Ein neuer KI-Filter erkennt Gespräche im Zusammenhang von Sexualität und Minderjährigen. Als Konsequenz werden solche Gespräche beendet (Schritt 1a), Accounts von der Plattform verbannt (Schritt 2) und die Beteiligten erhalten die Möglichkeit, den Gesprächsverlauf mit einem Klick zur Überprüfung durch unser Team weiterzuleiten (Schritt 1b).

Ist diese Beschreibung irreführend?
Ich verstehe die Beschreibung, wie folgt:
Schritt 1a: Wenn ich die Beschreibung des KI-Filters lese, so verstehe ich es so, dass die KI ein Gespräch zwischen A und B (beide an einem pädosexuellen Thema interessiert) mit entsprechenden Inhalten erkennt und automatisiert ohne Eingreifen von Mitarbeitern unterbindet.
Schritt 2 (Folge nach dem Schritt 1a): Nach dem das Gespräch unterbunden wurde, werden die entsprechende Accounts gebannt, dies geschieht automatisiert ggf. nach einer Prüfung durch einen menschlichen Helfer.

Schritt 1b: Geht die unerwünschte Intention in einem Gespräch zw. A und B nur von einem (von B) aus, so wird die Person A gewarnt, das Gespräch wird unterbunden und die Person A kann B melden, was folgerichtig zum Ausschluss von B aus der Community führt.

Funktioniert der KI-Filter NUR wie im Schritt 1b beschrieben ODER gibt es einen automatisierten Prozess wie in Schritt 1a+2 beschrieben, denn zwei Personen mit entsprechenden Neigungen würden sich wohl kaum gegenseitig belasten.
Wenn der KI-Filter nur wie im Schritt 1b beschrieben funktioniert, macht diese Erklärung Sinn:
Antwort auf: Schadi
Unter anderem deshalb gibt es ja die Möglichkeit, das Gespräch direkt über den Filtereingriff an das Knuddelsteam zu melden, sodass wir den Eingriff prüfen können, wenn man der Meinung ist, dass dieser falsch war. Das Ergebnis: bisher hat in über 90% dieser Prüffälle der Filter richtig gehandelt. Die anderen Fälle nutzen wir dann, um den Filter noch besser zu machen.


Und wenn das der Fall ist, wären pädosexuellen Gespräche zwischen zwei interessierten Parteien weiterhin ohne Konsequenzen im Chat möglich. weil die sich nicht gegenseitig melden würden.

Meine Bedenken betreffen den völlig automatisierten Prozess (1a+2), wenn die Gespräche von unschuldigen und durch die KI missverstanden an Helfer weitergeleitet und von diesen mitgelesen werden. Wenn es zu Konsequenzen erst nach einer Meldung durch eine Person (siehe 1b) kommt, dann hat sich gar nicht viel verändert. Der KI-Filter würde lediglich eine Empfehlung zu einer Meldung eines Gesprächs abgeben.

Wie sieht es nun wirklich aus?
Kannst du es bitte für mich nachvollziehbar erklären?
_________________________
Sometimes the world doesn't need another HERO, sometimes what it needs, is a MONSTER.