Dirk Sliwka: „KI ist manchmal besser darin, unsere Leistung einzuschätzen“

Kann ChatGPT menschliche Leistung bewerten? Dirk Sliwka von der Universität zu Köln ist dieser Frage nachgegangen. Das Ergebnis: Je subjektiver die Leistung, desto schwerer tut sich ein LLM.

vonAngela Heider-Willms

30. April 2026, 08:42 Uhr

Lesezeit: 4 Min.

Personalwirtschaft: Wie kam es zu der Ausgangsfrage dieser Studie?
Prof. Dr. Dirk Sliwka: Mein Co-Autor Rainer Rilke beobachtete, dass ChatGPT, wenn es beispielsweise Bewerbungen einschätzen soll, erstaunlich oft sehr positiv bewertet und wenig differenziert. Da ich selbst zu subjektiven Leistungsbeurteilungen forsche, kam die Idee auf, das gemeinsam tiefer zu untersuchen.

Wie sind Sie konkret vorgegangen?
Wir haben dem Large Language Model beispielsweise die Vorstandsvorsitzenden der 500 führenden börsennotierten Unternehmen in den USA, die S&P 500, vorgelegt, um ihre Leistung auf einer standardisierten Skala von eins bis fünf zu bewerten. Dieselbe Skala verwenden auch Unternehmen häufig für Leistungsbeurteilungen. Dabei vergab es fast nie die untersten zwei Werte. Es zeigt also ein typisches Muster, das wir auch bei menschlichen Beurteilern oft beobachten – es gibt eine „Abneigung“, schlechte Bewertungen zu vergeben. Ich dachte, das bekommt das LLM besser hin.

Jahreszugang
Personalwirtschaft Digital

1 Monat gratis

Alle Plus-Artikel nutzen
Das Magazin als E-Paper lesen & Zugriff auf das E-Paper-Archiv
Im Gratismonat jederzeit kündbar, danach 175 € /Jahr

Gratismonat starten

Monatszugang
Personalwirtschaft Digital

25 € / Monat
im Monatsabo

Alle Plus-Artikel nutzen
Das Magazin als E-Paper lesen & Zugriff auf das E-Paper-Archiv
Jederzeit monatlich kündbar

Jetzt bestellen

Themen

Künstliche Intelligenz Performance Management

Weitere Inhalte zum Thema

Aktuelle Ausgabe
Magazin

Juli / August 2026

Personalarbeit nach der Restrukturierung

Weitere Themen

Wie die BA die HR-Funktion neu aufstellt
Was professionelles Offboarding bringt
Arbeitsunfähigkeit: Wie hoch ist die Dunkelziffer?
Einsatz von Detekteien: Was ist zulässig?

Jetzt gratis lesen

Blick ins E-Paper

„Für das gleiche Geld mehr arbeiten“: Aumovio stimmt Mercedes-Benz zu – und...

VW-Krise: Gewinn bricht um ein Drittel ein – Tochter Porsche legt hingegen ...

Zeitarbeit im Strukturwandel: 5 Strategien für die Zukunft

Digitaler Stress: 5 HR-Maßnahmen gegen Dauererreichbarkeit

Dirk Sliwka: „KI ist manchmal besser darin, unsere Leistung einzuschätzen“

Weitere Inhalte zum Thema

Performance Management: Das zeigen die Daten wirklich

Uber, Talanx, DKB: Reicht harte Arbeit für eine High Performance aus?

Aktuelle Artikel

„Für das gleiche Geld mehr arbeiten“: Aumovio stimmt Mercedes-Benz zu – und hat es selbst schon gemacht

VW-Krise: Gewinn bricht um ein Drittel ein – Tochter Porsche legt hingegen zu

Aktuelle Ausgabe

Personalarbeit nach der Restrukturierung

News

Themen

Newsletter

Abonnements

Events

Publikationen

Dienstleister

Stellenmarkt

Über uns

Unser Team

Kontakt

Personalwirtschaft Mediadaten

Comp&Ben Mediadaten