Groucho schrieb:Oder anders gesagt: Ein Gradmesser dafür, wie dringend notwendig pc noch immer ist.
Absolut.
Ich habe mich jetzt etwas eingelesen in das Thema und eines vorweg: der Google Translator stand schon mehrfach in der Kritik, sexistische Vorurteile zu verbreiten.
Crowdsourcing und damit eventuell einhergehende Verzerrungen sind nicht das Problem, dafür ist der Anteil an den Datensätzen viel zu gering.
Google trainiert seine KI aktuell mit einem Datensatz von 750GB - das ist nur Text.
Diese Texte werden aus dem Internet gezogen, reddit, Wikipedia, Webseiten, Bedienungsanleitungen etc.
Das große Problem an KI, es lernt nur das was da ist, ein treffender und bezüglich des topics wichtigster Einwand:
„Viele denken, man muss nur die richtigen Trainingsdaten wählen, um Vorurteile aus dem maschinellen Lernen zu bekommen.“ Aber es sei keine Frage, die sich allein technisch lösen lasse, auch nicht mit kleineren Modellen und kuratierten Datensätzen: „Diese Vorurteile liegen in unserer Kultur, das sind wir.“
Quelle:
https://www.ipg-journal.de/regionen/global/artikel/zementierte-vorurteile-4984/Die KI repliziert also Stereotype die in der Gesellschaft vorkommen, in dem einen Land so ausgeprägt, in einem anderen anders.
Google hat mehrfach darauf reagiert, unter anderem mit Anpassungen des Algorithmus sowie einer künstlichen Aufarbeitung des Übersetzungsergebnisses indem man manuell beide gender ausgibt, paber schlussendlich ist es eine KI die aus Datensätzen lernt die aus der realen Welt kommen.
Aus meiner Sicht eine sehr große Herausforderung, wird doch diese ganze Simultanübersetzung zum Beispiel immer wichtiger - sie gilt als Barrierebrecher zwischen den verschiedenen Sprachen.
Wer sich für das Problem interessiert - Suchnegriffe wären sexism Google translator AI