Dirk Sliwka: „KI ist manchmal besser darin, unser Leistung einzuschätzen“

Artikel anhören
Artikel zusammenfassen
Teilen auf LinkedIn
Teilen per Mail
URL kopieren
Drucken

Personalwirtschaft: Wie kam es zu der Ausgangsfrage dieser Studie?
Prof. Dr. Dirk Sliwka: Mein Co-Autor Rainer Rilke beobachtete, dass ChatGPT, wenn es beispielsweise Bewerbungen einschätzen soll, erstaunlich oft sehr positiv bewertet und wenig differenziert. Da ich selbst zu subjektiven Leistungsbeurteilungen forsche, kam die Idee auf, das gemeinsam tiefer zu untersuchen.

Wie sind Sie konkret vorgegangen?
Wir haben dem Large Language Model beispielsweise die Vorstandsvorsitzenden der 500 führenden börsennotierten Unternehmen in den USA, die S&P 500, vorgelegt, um ihre Leistung auf einer standardisierten Skala von eins bis fünf zu bewerten. Dieselbe Skala verwenden auch Unternehmen häufig für Leistungsbeurteilungen. Dabei vergab es fast nie die untersten zwei Werte. Es zeigt also ein typisches Muster, das wir auch bei menschlichen Beurteilern oft beobachten – es gibt eine „Abneigung“, schlechte Bewertungen zu vergeben. Ich dachte, das bekommt das LLM besser hin.

Personalwirtschaft+Zugang wählen und weiterlesen:

Jahreszugang
Personalwirtschaft Digital

1 Monat gratis

  • Alle Plus-Artikel nutzen
  • Das Magazin als E-Paper lesen & Zugriff auf das E-Paper-Archiv
  • Im Gratismonat jederzeit kündbar, danach 175 € /Jahr
Gratismonat starten

Monatszugang
Personalwirtschaft Digital

25 € / Monat
im Monatsabo

  • Alle Plus-Artikel nutzen
  • Das Magazin als E-Paper lesen & Zugriff auf das E-Paper-Archiv
  • Jederzeit monatlich kündbar
Jetzt bestellen