Personalwirtschaft: Wie kam es zu der Ausgangsfrage dieser Studie?
Prof. Dr. Dirk Sliwka: Mein Co-Autor Rainer Rilke beobachtete, dass ChatGPT, wenn es beispielsweise Bewerbungen einschätzen soll, erstaunlich oft sehr positiv bewertet und wenig differenziert. Da ich selbst zu subjektiven Leistungsbeurteilungen forsche, kam die Idee auf, das gemeinsam tiefer zu untersuchen.
Wie sind Sie konkret vorgegangen?
Wir haben dem Large Language Model beispielsweise die Vorstandsvorsitzenden der 500 führenden börsennotierten Unternehmen in den USA, die S&P 500, vorgelegt, um ihre Leistung auf einer standardisierten Skala von eins bis fünf zu bewerten. Dieselbe Skala verwenden auch Unternehmen häufig für Leistungsbeurteilungen. Dabei vergab es fast nie die untersten zwei Werte. Es zeigt also ein typisches Muster, das wir auch bei menschlichen Beurteilern oft beobachten – es gibt eine „Abneigung“, schlechte Bewertungen zu vergeben. Ich dachte, das bekommt das LLM besser hin.
Zugang wählen und weiterlesen:
- Alle Plus-Artikel nutzen
- Das Magazin als E-Paper lesen & Zugriff auf das E-Paper-Archiv
- Im Gratismonat jederzeit kündbar, danach 175 € /Jahr
- Alle Plus-Artikel nutzen
- Das Magazin als E-Paper lesen & Zugriff auf das E-Paper-Archiv
- Jederzeit monatlich kündbar
