I. Einleitung
Künstliche Intelligenz (KI) hält Einzug auch in die Justiz. Dabei ist ein breites Spektrum an Anwendungen denkbar - von der intelligenten Dokumentenaufbereitung über automatisierte Plausibilitäts- und Vollständigkeitsprüfungen bis hin zu Systemen, die Entscheidungsoptionen vorschlagen oder Risiken prognostizieren.[1] Für die Schweiz stellt sich vor diesem Hintergrund nicht nur die Frage, ob bereits heute KI in der Justiz eingesetzt wird, sondern vor allem, in welchen Erscheinungsformen solche Systeme künftig sinnvollerweise denkbar sind, welche Funktionen sie in justiziellen Abläufen übernehmen könnten und welche Herausforderungen damit typischerweise verbunden wären. Eine begrifflich und systematisch belastbare Typologisierung ist für die Beurteilung dieser Fragen ein zentraler Zwischenschritt: Erst wenn hinreichend klar ist, welche Arten von KI-Systemen im Justizkontext überhaupt gemeint sind, lassen sich die damit verbundenen Chancen und Herausforderungen und insbesondere die rechtliche Erfassung präzise diskutieren.
Ziel dieses Aufsatzes ist es entsprechend, eine auf den schweizerischen Kontext zugeschnittene, für verschiedene Rechtsgebiete und weitere Disziplinen anschlussfähige Typologisierung von KI-Systemen in der Justiz zu entwickeln. Die Typologisierung soll Forschung und Praxis als deskriptive, strukturierende Kartierung dienen: Sie ordnet mögliche Einsatzfelder, ohne damit bereits normative Aussagen über Zulässigkeit oder konkrete Rechtsfolgen zu verbinden. Im Zentrum steht damit die Herausbildung eines gemeinsamen Verständnisses von KI-Systemen in der Justiz. Die Entwicklung einer gemeinsamen Sprache soll den interdisziplinären Diskurs zwischen Rechtswissenschaft, Informatik, Verwaltungswissenschaft, Justizpraxis und Anbietenden erleichtern.
Ausgehend von europäischen Regulierungsansätzen, einschlägigen wissenschaftlichen Publikationen sowie Veröffentlichungen privater Akteure wird zunächst ermittelt, wie KI-Systeme, insbesondere solche im Bereich der Justiz, kategorisiert werden (Rz. 7 ff.). Der Blick auf diese Ansätze dient als Referenzrahmen: Er zeigt, welche Funktionstypen, Risikozuschreibungen und Systemverständnisse gegenwärtig prägend sind. Daran anschliessend wird eine eigenständige Typologisierung vorgeschlagen, die an institutionelle, verfahrensrechtliche und organisatorische Besonderheiten der Schweiz anschliesst (Rz. 45 ff.).
Der Bundesrat hat am 12. Februar 2025[2] den Grundsatzentscheid gefällt, wonach KI zum Schutz der Grundrechte reguliert werden muss.[3] Entsprechend hat er die KI-Konvention des Europarats[4] unterzeichnet[5] und bereitet bis Ende 2026 die für die Ratifizierung der Konvention notwendigen Gesetzesvorschläge vor.[6] Vor diesem Hintergrund bietet sich die Bezugnahme auf die Definition der KI-Konvention im vorliegenden Kontext an.
Begrifflich wird im Folgenden für «KI-System» auf die Definition des Europarats in Art. 2 der KI-Konvention abgestellt. Demnach handelt es sich um «ein maschinengestütztes System, das aufgrund expliziter oder impliziter Zielvorgaben ableitet, wie es Ergebnisse wie Vorhersagen, Inhalte, Empfehlungen und Entscheidungen erzeugen kann, die sich auf die physische und virtuelle Umgebung auswirken können».[7]
Inhaltlich wird der Typologisierung ein weiter Justizbegriff zugrunde gelegt, der Zivil-, Straf- und Verwaltungsgerichte umfasst. Um ein möglichst vollständiges Bild potenzieller Einsatzorte zu gewinnen, werden zudem Verfahrensstadien einbezogen, die einem Gerichtsverfahren vorgelagert sind, namentlich das Strafbefehlsverfahren sowie verwaltungsinterne Verfahren.
II. Referenzrahmen für die Typologisierung
Künstliche Intelligenz wird in Rechtsetzung, Rechtsanwendung und Wissenschaft nicht nur als technische Innovation, sondern als eigenständiger Regulierungsgegenstand betrachtet.[8] Entsprechend finden sich in europäischen Regulierungsansätzen - namentlich der KI-Verordnung[9] -, in wissenschaftlichen und amtlichen Publikationen sowie in Beiträgen privater Akteure verschiedene Ansätze, um KI-Systeme zu ordnen. Diese Kategorisierungen dienen insbesondere als Anknüpfungspunkte dafür, rechtliche Anforderungen an Entwicklung und Einsatz von KI-Systemen zu formulieren.
Für den vorliegenden Zusammenhang sind insbesondere drei wiederkehrende Typologisierungen, deren «Bausteine» in erweiterter, reduzierter oder kombinierter Form auftreten, von Interesse: Erstens die in der KI-VO angelegte, risikobasierte Kategorisierung (Rz. 9 ff.); zweitens Einteilungen nach Einsatzgebieten bzw. Tätigkeiten (Rz. 24 ff.); und drittens Systematisierungen nach den jeweiligen Rollen von Akteuren im Verfahren (Rz. 36 ff.). Im Folgenden werden die verschiedenen Ordnungsansätze skizziert und deren Aussagekraft für den Justizkontext geprüft.
1. Risikobasierte Kategorisierung der KI-VO
Der Anwendungsbereich der KI-VO erfasst u.a. KI-Systeme, die in der Justiz eingesetzt werden. Dies ergibt sich insbesondere daraus, dass der Einsatz von KI im Bereich der Rechtspflege zweifelsfrei mit einem grundrechtlichen Risikopotenzial einhergeht und die KI-Verordnung auch auf die Justiz anwendbar ist (mangels ausdrücklicher Ausnahme vom Anwendungsbereich der KI-VO fehlt [siehe Art. 2 Abs. 2-12 KI-VO]).
Die KI-VO unterscheidet zwischen Praktiken mit inakzeptablem Risiko, sog. «verbotene Praktiken» (Rz. 11 f.), zulässigen KI-Systemen mit hohem Risiko (Rz. 13 ff.), die in sich weiter differenziert werden und sog. «bestimmte KI-Systeme mit Transparenzpflichten» (Rz. 19 f.).
a) Verbotene Praktiken
Art. 5 Abs. 1 lit. a-h KI-VO zählt die sog. «verbotenen Praktiken» auf. Dazu gehören Manipulation und Täuschung (lit. a), das Ausnutzen von Vulnerabilität oder Schutzbedürftigkeit (lit. b), Schlechterstellung oder Benachteiligung durch Bewertung oder Einstufung, die im Ergebnis ungerechtfertigt, unverhältnismässig oder durch zweckfremde Nutzung von Daten erfolgt (lit. c), automatische Bewertung der Kriminalität (nicht aber Unterstützung der durch Menschen durchgeführten Bewertung) (lit. d), Gesichtserkennung und -abgleich mit dem Internet (lit. e), Emotionserkennung am Arbeitsplatz oder in Bildungseinrichtungen (lit. f), biometrische Kategorisierung ausserhalb der Strafverfolgung (lit. g) und schliesslich die biometrische Echtzeit-Fernidentifizierung (lit. h). Es handelt sich dabei um Praktiken, welche unter Umständen nicht zu rechtfertigende Eingriffe in die Menschenwürde darstellen.[10]
E contrario sind alle anderen Praktiken, sofern sie nicht gegen andere Rechtsvorschriften der Union verstossen, grundsätzlich als zulässig zu erachten.[11]
b) Hochrisiko-KI-Systeme
Mit besonderen Auflagen zulässig sind gem. Art. 8 Abs. 1 KI-VO sog. «Hochrisiko-KI-Systeme».[12] Die Einstufung als Hochrisiko-KI-System erfolgt anhand der Voraussetzungen in Art. 6 Abs. 1 KI-VO und der Liste in Anhang I der KI-VO.
aa) Hochriskante KI-Systeme
Ebenso unter «Einstufung von KI-Systemen als Hochrisiko-KI-Systeme» werden gem. Art. 6 Abs. 2 KI-VO die in Anhang III der KI-VO genannten Systeme geregelt. Dem Wortlaut der KI-VO folgend sind dies sog. «hochriskante Systeme». Zu den sog. «hochriskanten Systemen» werden gemäss Erwgr. 61 Systeme aufgrund ihrer potenziellen Auswirkungen «auf die Demokratie, die Rechtsstaatlichkeit, die individuellen Freiheiten sowie das Recht auf einen wirksamen Rechtsbehelf und ein unparteiisches Gericht» gezählt. Mit Blick auf den Justizsektor sind darunter die folgenden Bereiche von Relevanz: Biometrie (Ziff. 1), kritische Infrastrukturen (Ziff. 2), Personalmanagement (Ziff. 4), Zugänglichkeit und Inanspruchnahme öffentlicher Dienste und Leistungen (Ziff. 5), Strafverfolgung (Ziff. 6), Migration, Asyl und Grenzkontrolle (Ziff. 7), Rechtspflege und demokratische Prozesse (Ziff. 8).
Anhang III Ziff. 8 lit. a KI-VO folgend sind das insbesondere KI-Systeme, welche Justizbehörden bei der Ermittlung und Auslegung von Sachverhalten und Rechtsvorschriften sowie bei der Anwendung des Rechts auf konkrete Sachverhalte unterstützen. Die endgültige Entscheidfindung muss dabei eine von Menschen gesteuerte Tätigkeit bleiben.[13]
Immer als hochriskant gilt ein in Anhang III aufgeführtes KI-System dann, wenn es ein Profiling natürlicher Personen vornimmt (vgl. Art. 6 Abs. 3 letzter Satz KI-VO).
bb) Nicht hochriskante KI-Systeme
In Art. 6 Abs. 3 KI-VO werden Voraussetzungen aufgezählt, unter welchen ein KI-System trotz Listung in Anhang III der KI-VO als nicht hochriskant gilt. Es ist dies unter anderem dann, wenn es «das Ergebnis der Entscheidungsfindung nicht wesentlich beeinflusst».[14] Dies wird bejaht, wenn eine der nachfolgenden Bedingungen erfüllt ist: Die Verfahrensaufgabe ist eng gefasst (lit. a), das KI-System verbessert das Ergebnis einer zuvor abgeschlossenen menschlichen Tätigkeit (lit. b), es erkennt Entscheidungsmuster oder Abweichungen von früheren Entscheidungsmustern (lit. c), oder es ist dazu bestimmt, eine vorbereitende Aufgabe für eine Bewertung durchzuführen (lit. d).[15] Infolgedessen gelten rein begleitende Verwaltungstätigkeiten im Bereich der Justiz, die «die tatsächliche Rechtspflege in Einzelfällen nicht beeinträchtigen, wie etwa die Anonymisierung oder Pseudonymisierung gerichtlicher Urteile, Dokumente oder Daten, die Kommunikation zwischen dem Personal oder Verwaltungsaufgaben» als nicht hochriskant.[16]
In der Folge gelangen die in Kapitel 3 Abschnitt 2 KI-VO festgelegten Anforderungen für Hochrisiko-KI-Systeme nicht zur Anwendung.[17]
c) Bestimmte KI-Systeme (mit Transparenzpflichten)
Im 4. Kapitel der KI-VO werden Transparenzpflichten für Anbietende und Betreibende bestimmter KI-Systeme reguliert. Als sog. «bestimmte KI-Systeme» gelten gemäss Art. 50 KI-VO etwa solche, die für die Interaktion mit natürlichen Personen, zur Emotionserkennung oder für biometrische Kategorisierungen bestimmt sind und solche zur künstlichen Erzeugung oder Manipulation von Bild-, Ton- oder Videoinhalten, sog. «Deepfakes».[18] Vorbehalten bleiben punktuelle Ausnahmen, namentlich um den besonderen Erfordernissen der Strafverfolgung Rechnung zu tragen.[19]
Es handelt sich mithin um KI-Systeme, welche auch in der Justiz zum Einsatz gelangen können. In all diesen Fällen ist nach Art. 50 Abs. 5 KI-VO sicherzustellen, dass betroffene Personen in klarer und für sie verständliche Weise über den Einsatz der KI-Systeme und die damit generierten Inhalte informiert werden.[20]
d) Beurteilung
Die risikobasierte Kategorisierung der KI-VO liefert für den Justizkontext einen prüfenswerten Referenzrahmen. Allerdings trifft die KI-VO eine bewusste normative Entscheidung: KI darf Justizbehörden zwar bei der Ermittlung und Auslegung von Sachverhalten und Rechtsvorschriften sowie bei der Rechtsanwendung unterstützen, die endgültige Entscheidfindung soll jedoch eine von Menschen gesteuerte Tätigkeit bleiben.[21] Damit wird der entscheidungsersetzende KI-Einsatz als im Justizverfahren normativ unerwünscht markiert.[22] Insofern bildet diese Kategorisierung nicht alle Einsatzmöglichkeiten von KI-Systemen in der Justiz ab.
Die Kategorien der KI-VO sind sodann vor allem ein Instrument zur Schematisierung grundrechtlicher Sensitivität.[23] «Verbotene Praktiken» i.S.v. Art. 5 KI-VO erfassen nicht einfach «sehr riskante» Systeme, sondern solche, die aus Sicht des Unionsgesetzgebers typischerweise kategorisch mit Menschenwürde bzw. Kerngehalten grundrechtlicher Gewährleistungen kollidieren.[24]
Unschärfen können bei der Subsumtion konkreter Justizanwendungen entstehen: Ein und dasselbe System kann je nach Verfahrensphase und Einbindung eine andere grundrechtliche Qualität annehmen. Gerade Konstellationen, die nicht von Art. 5 KI-VO erfasst sind, können im Justizkontext dennoch verfassungs- und verfahrensrechtlich hochsensibel sein, etwa wenn ein System faktisch die Entscheidung vorprägt oder Verantwortung verschiebt. Das zeigt sich exemplarisch am hypothetischen Beispiel einer Richterperson, die selbst ein Vorhersagetool entwickelt oder ein solches Tool ausserhalb formaler Beschaffungs- und Kontrollprozesse einsetzt: Auch ohne Marktbereitstellung kann ein solcher Einsatz funktional die gleiche Wirkung entfalten wie ein externes Produkt und damit je nach Ausgestaltung entweder als Hochrisiko-Anwendung zu qualifizieren sein oder - jedenfalls - eigenständige Anforderungen aus Verfahrensgrundrechten, Unabhängigkeit und Begründungspflichten auslösen.
2. Kategorisierung nach Einsatzgebieten bzw. Tätigkeiten
a) Unterscheidung nach Art der Aufgabe
Ein Grundlagenpapier zum Einsatz von KI-Systemen in der Justiz ordnet die in Deutschland laufenden und geplanten Projekte sogenannten Clustern zu, die eine Kategorisierung der Einsatzgebiete ermöglichen (inkl. Mehrfachnennungen).[25] Es sind dies: Metadatenverarbeitung, automatische Verschlagwortung und Indexierung, Suchmaschinen/Recherche, (Früh-)Erkennung von Straftaten, Textvergleichung/-aufbereitung/Relation, Mustererkennung/Zuordnung von Textbausteinen, Dialogsysteme, Textgenerierung/Unterstützung der Entscheidfindung, Anonymisierung und schliesslich Spracherkennung.[26]
Reuss et al. bezeichnen die Tätigkeiten in den genannten Clustern als entscheidungs unterstützende (administrative) Tätigkeiten und grenzen diese ab von den entscheidungs ersetzenden (inhaltlich-normativen) Tätigkeiten, wobei die technische Machbarkeit von entscheidungsersetzenden Systemen bislang noch nicht vollständig analysiert worden sei.[27]
b) Unterscheidung nach Automationsgrad und Art des Automatisierungsprozesses
Bei der Untersuchung des Automationsgrades kann, vom Ergebnis ausgehend, grob unterschieden werden zwischen KI-Systemen, welche eine Entscheidgrundlage für eine natürliche Person liefern (Teilautomation) und jenen, die ohne jegliches menschliche Zutun einen endgültigen Entscheid liefern (Vollautomation).[28]
Eine viergliedrige Unterscheidung findet sich in der Praxis bspw. bei Microsoft, wo die graduelle Einbindung von KI-Systemen wie folgt beschrieben wird: Level 1 «Human-first», Level 2 «Human with agents», Level 3 «Agents with humans» und schliesslich Level 4 «Agent-first with human oversight».[29]
Eine fünfgliedrige Unterscheidung wird im Bereich des Verwaltungsverfahrens beschrieben: Von manuell, assistiert, teilautomatisiert, hochautomatisiert bis vollautomatisiert.[30]
Eine Unterscheidung kann ferner aber auch nach dem jeweiligen Einsatzziel vorgenommen werden: Der Einsatz von KI-Systemen kann einerseits auf die automatische Generierung von Entscheidungen (ex ante) gerichtet sein. Andererseits kann er der maschinellen Überprüfung bereits getroffener menschlicher Entscheidungen (ex post) dienen.[31]
c) Unterscheidung nach Komplexität
In Bezug auf die Komplexität fallen folgende Unterscheidungen in Betracht.
aa) Komplexität des KI-Systems
Eine erste Unterscheidung bezieht sich auf die Komplexität des KI-Systems als Instrument.[32] Sind die Tätigkeiten standardisierbar, sodass das KI-System im Sinne eines «Werkzeugs mit vordefinierten Regeln» auf eine Vielzahl von Ausführungen angewendet werden kann? Oder sind die Tätigkeiten heterogen, sodass ein interpretatives KI-System, welches auch neue Muster erkennen und interpretieren kann, erforderlich ist? Damit verwandt sind auch Typologisierungen, welche die Fähigkeiten bzw. die technische Autonomie des KI-Systems in den Vordergrund rücken.[33] KI zeichnet sich schon per Definition durch eine gewisse «Intelligenz» aus. Allerdings können die konkreten technischen Kapazitäten doch deutlich variieren. Unterschiede ergeben sich u.a. hinsichtlich der Frage, wie kontrolliert und damit auch transparent der Selbstlernprozess des Systems ist, wie offen das System neue Datenquellen erschliessen kann und ob es z.B. mit anderen Systemen interagieren kann (sog. Multi-Agenten-Systeme).[34] Anders als bei der Automation geht es hierbei also nicht um die Aufgabenteilung zwischen Mensch und Maschine, sondern darum, über welche Fähigkeiten und Freiheiten das System verfügt, um den «technischen Teil» der Kollaboration auszuführen.
bb) Komplexität der Tätigkeiten
Ferner kann unterschieden werden zwischen rein strukturierenden Tätigkeiten und solchen, bei denen das KI-System vorselektionierend oder priorisierend und damit inhaltlich normativ tätig wird.[35] Diese Unterscheidung bezieht sich auf die Komplexität der Tätigkeiten, die von KI-Systemen ausgeführt werden können. Es handelt sich weniger um eine Grenze, sondern vielmehr um eine Skala, welche bspw. der Untersuchung von Risiken zugrunde gelegt werden kann.
Bei Microsoft[36] wird in diesem Zusammenhang auch von «Spectrum of Agents» gesprochen, mit drei wesentlichen Stufen: Wird ein gezieltes Abrufen von Informationen («Retrieval»), ein Ausführen von repetitiven Aufgaben («Task») oder ein selbstständiges Arbeiten («Autonomous») angestrebt? Zwischen der Komplexität eines KI-Systems und den funktionalen Anforderungen der zu bewältigenden Aufgaben besteht ein Zusammenhang: Einfache, strukturierte Tätigkeiten lassen sich durch regelbasierte KI-Systeme mit minimalem Aufwand abbilden, während komplexere Prozesse adaptive Systeme erfordern, die strengeren rechtlichen Anforderungen unterliegen sollten. Hochkomplexe, autonome Entscheidungsprozesse hingegen würden selbstlernende Systeme verlangen, die aufgrund ihrer Dynamik und (der mutmasslich damit einhergehenden) Intransparenz maximale rechtliche, technische und ethische Herausforderungen aufwerfen. Diese Abstufung zeigt exemplarisch, dass die Komplexität der Tätigkeit nicht nur die Architektur des KI-Systems, sondern auch den rechtlichen Regulierungsbedarf bestimmt.
d) Beurteilung
Die dargestellten Kategorisierungen sind grundsätzlich sinnvoll, weil sie unterschiedliche, rechtlich relevante Dimensionen des KI-Einsatzes in der Justiz sichtbar machen. Besonders überzeugend ist die Trennung von funktionalem Einsatzfeld (z.B. Recherche, Anonymisierung) und Eingriffsintensität in die Entscheidung (Priorisierung/Selektion bis hin zur Vollautomation). Zugleich zeigen die Kategorisierungen, dass Automation ein graduelles Phänomen ist; das passt zu prozessualen Leitbildern wie richterlicher Unabhängigkeit, rechtlichem Gehör und Begründungspflichten, die je nach Systemrolle unterschiedlich berührt sind.
Gleichwohl besteht die Gefahr von Überschneidungen und begrifflicher Unschärfe: Cluster (z.B. Textgenerierung) etwa lassen die inhaltliche und zeitliche Nähe zum Entscheid unberücksichtigt. Dabei kann diese durchaus relevant sein: Die maschinelle Übersetzung als Entscheidgrundlage (bspw. Übersetzung fremdsprachiger Literatur) birgt andere Risiken als die maschinelle Übersetzung eines Entscheids für die Publikation. Ferner kann «entscheidungsunterstützend» faktisch «entscheidungslenkend» wirken (Stichwort: Automation Bias), ohne formal «entscheidungsersetzend» zu sein. Auch die Komplexitätsachsen (System, Tätigkeit) sind als trennscharfe Anknüpfungspunkte eher ungeeignet, da sie in der Praxis schwer messbar sind.
3. Kategorisierung nach den Rollen von Akteuren im Verfahren
In der Literatur sodann weit verbreitet ist die Zuschreibung von Rollen: Von «Robo-Judge»[37] und «Roboter-Richter»[38], «AI Judge»[39], «KI-Richterin»[40] und «KI-Richter»[41] bis hin zum «gläsernen Richter»[42] und dem «Subsumtionsautomat 2.0»[43].
Die Darstellung von KI-Systemen anhand natürlicher Personen bzw. deren Rollen im Bereich der Justiz ist naheliegend und per se nicht zu beanstanden. Zu vermeiden ist allerdings der Eindruck, dass damit primär die «Ersetzung des Menschen» bzw. die «Abschaffung einer menschlichen Rechtsprechung» bezweckt werden soll.[44]
a) Unterscheidung nach den Parteirollen
Eine grobe Unterscheidung kann anhand der Parteirollen vorgenommen werden: Wer setzt das KI-System ein und in wessen Interesse? In Betracht fallen die Parteien und ihre Rechtsvertretung auf der einen Seite und das Gericht auf der anderen Seite.[45] Unter Umständen setzt das Gericht ein KI-System auch im Interesse der Parteien ein, bspw. intelligente Dialogsysteme wie Chatbots als Informationsquelle und Anlaufstelle für jene, die nicht anwaltlich vertreten sind.[46] Gleichzeitig kann die Parteivertretung ein KI-System auch im Interesse der Gerichte einsetzen; zu denken ist bspw. an Schnittstellen für die rechtssichere Einreichung von Akten oder an strukturierte Eingaben.[47]
b) Unterscheidung nach den Nutzenden
Ausgehend von der Prämisse, dass der Einsatz von KI-Systemen die Mitarbeitenden entlasten soll,[48] kann unterschieden werden, welchen Personen der Einsatz von KI-Systemen zugutekommt. Werden primär Personen aus der Gerichtsverwaltung («Kanzlei») entlastet oder wird das KI-System vom eigentlichen Gericht («Spruchkörper») verwendet, d.h. von Richterinnen und Richtern, von Gerichtsschreibern und Gerichtsschreiberinnen oder von gerichtsnahen Personen wie Sachverständigen?[49]
c) Unterscheidung nach der Delegierbarkeit
Für eine weitere Unterscheidung nach (Justiz-)Geschäfts- und Entscheidprozess kann auf die Delegierbarkeit der Aufgabe abgestellt werden. Handelt es sich um eine Aufgabe, welche nach dem anwendbaren Verfahrensrecht und Gerichtsorganisationsgesetz ausschliesslich den Richterinnen und Richtern vorbehalten ist oder können diese die konkrete Aufgabe auch delegieren?[50] Liegt ein gesetzlicher Vorbehalt vor, bleibt kein Raum für den Einsatz von KI-Systemen, die ohne jegliches menschliche Zutun einen endgültigen Entscheid liefern (Vollautomation).[51] Ist eine Delegation hingegen zulässig, kann der Beizug eines KI-Systems, welches Entscheidgrundlagen liefert (Teilautomation), geprüft werden.[52]
d) Beurteilung
Die dargestellten «Rollenlabels» sind als erste Orientierungsraster nachvollziehbar, ihre analytische Tragfähigkeit ist jedoch begrenzt. Rollenmetaphern («KI-Richter») sind kommunikativ wirksam, suggerieren aber schnell einen Ersatz richterlicher Tätigkeit und verdecken, dass KI-Systeme bis anhin typischerweise als Unterstützung eingesetzt werden. Die Kategorisierung nach Parteirollen bzw. Nutzenden bildet zwar praxisrelevante Interessenkonstellationen ab, kann allerdings auch Missverständnisse begünstigen: Rollen können sich überschneiden und die verwendeten Begriffe sind weder gesetzlich standardisiert noch schweizweit vereinheitlicht. Am ehesten anschlussfähig ist die Unterscheidung nach Delegierbarkeit, weil sie an das Verfahrensrecht und den Richtervorbehalt anknüpft und damit unmittelbar Grenzen zwischen Voll- und Teilautomation markieren kann. Allerdings reduziert auch dieses Raster die Bewertung auf Zuständigkeitsfragen und erfasst materielle Risiken nur mittelbar.
4. Zwischenfazit
Die in der KI-VO, in der Literatur und bei Privaten anzutreffenden Kategorisierungsvorschläge bilden Ansatzpunkt für Regulierung bzw. kontextspezifische Anknüpfungspunkte mit unterschiedlichem Erkenntnisinteresse: Die KI-VO ordnet nach grundrechtlicher Risikosensibilität und normativen Leitplanken, während tätigkeits-, funktions- oder rollenbezogene Einteilungen andere Aspekte (Ablauf, Verantwortlichkeiten, Interaktion im Verfahren) sichtbar machen.
Unter den Kategorisierungen finden sich zwar auch solche, die spezifisch den KI-Einsatz im Kontext der Justiz in den Blick nehmen. Dennoch erweisen sie sich dafür, insbesondere in der Schweiz, als nur begrenzt tragfähig. Zum einen ermöglichen sie teilweise keine trennscharfe Abgrenzung der in gerichtlichen Verfahren relevanten KI-Anwendungen, weil ein und dasselbe System je nach Verfahrensphase, Zweck oder Einbindung unterschiedliche Funktionen übernehmen kann. Zum anderen beruhen die vorhandenen Einteilungen nicht auf einheitlich definierten Kriterien, was Vergleichbarkeit und dogmatische Anschlussfähigkeit erschwert. Die Folge ist eine begriffliche und konzeptionelle Unschärfe, die sich unmittelbar auf die rechtliche Bewertung auswirken kann - etwa bei der Frage, welche Schutzgüter im Vordergrund stehen oder welche verfahrensrechtlichen Garantien berührt werden.
Die nachfolgend entwickelte Typologisierung will deshalb eine insbesondere für den schweizerischen Justizkontext anschlussfähige, strukturierende Kategorisierung bereitstellen, die interdisziplinäre Verständigung erleichtert und als Grundlage für eine konsistente rechtliche Diskussion unterschiedlicher Einsatzformen dienen kann.
III. Vorschlag einer eigenständigen Typologisierung
Für eine im helvetischen Kontext rechtswissenschaftlich belastbare Einordnung ist eine Typologisierung wichtig, die die Eigenlogik gerichtlicher Verfahren und die schweizerischen Rahmenbedingungen abbildet.
Die föderale Struktur der Schweiz hat dazu geführt, dass die Zuständigkeiten im Bereich der Justiz zwischen Bund und Kantonen aufgeteilt sind. Die Gesetzgebung im Zivil- und Zivilprozessrecht ist gemäss Art. 122 Abs. 1 BV[53] Sache des Bundes. Dasselbe gilt nach Art. 123 Abs. 1 BV für das Straf- und Strafprozessrecht. Für die Organisation der Gerichte und die Rechtsprechung sind demgegenüber nach Art. 122 Abs. 2 BV und Art. 123 Abs. 2 BV die Kantone zuständig. Hinzu tritt, dass den Gerichten als Ausfluss der Unabhängigkeit und Unparteilichkeit i.S.v. Art. 30 Abs. 1 BV und Art. 191c BV die Kompetenz zur Selbstverwaltung zukommt.
Darüber hinaus ist der Instanzenzug der Justiz in der Schweiz dreistufig ausgestaltet. Abgesehen von wenigen Ausnahmen werden Streitigkeiten im Zivil- und Strafrecht i.d.R. zunächst von zwei kantonalen Instanzen und anschliessend vom Bundesgericht beurteilt. Wird eine Menschenrechtsverletzung geltend gemacht, kann schliesslich noch Klage beim Europäischen Gerichtshof für Menschenrechte erhoben werden. Im Bereich der Verwaltungsrechtspflege sind Verfügungen kantonaler Behörden zunächst bei verwaltungsinternen Instanzen und erst anschliessend beim kantonalen Verwaltungsgericht anzufechten. In Ausnahmefällen ist jedoch eine direkte Anfechtung beim Bundesverwaltungsgericht vorgesehen, während dies bei Verfügungen von Bundesbehörden die Regel darstellt. Gegen Entscheide kantonaler Verwaltungsgerichte sowie Entscheide des Bundesverwaltungsgerichts steht schliesslich die Beschwerdemöglichkeit an das Bundesgericht offen.[54]
Aufgrund des Dargelegten wird im Folgenden eine für unterschiedliche Rechtsgebiete anschlussfähige Typologisierung vorgeschlagen. Ausgangspunkt bildet die Erkenntnis, dass Risiken und rechtliche Anforderungen je nachdem, in welchem Verfahrensschritt das KI-System eingesetzt wird, erheblich variieren. Die Orientierung am zeitlichen Ablauf bildet daher den Ausgangspunkt der folgenden Überlegungen. Sie orientiert sich im Wesentlichen am Verfahrensrecht, das grob in eine (Rz. 52 ff.) vorprozessuale, (Rz. 56 ff.) prozessuale und eine (Rz. 62 ff.) nachprozessuale Phase unterteilt werden kann.[55] Diese Unterteilung ermöglicht eine detailliertere Untersuchung anhand von Indikatoren wie bspw. gerichtliches Ermessen, rechtliches Gehör und Beeinflussbarkeit, die je nach Verfahrensschritt unterschiedlich ausgestaltet sind, und schafft damit eine sachbezogene Dimension.
Die Orientierung am zeitlichen Ablauf bleibt dabei nicht das einzige Kriterium. Vielmehr tritt eine personenbezogene Dimension hinzu, indem die im jeweiligen Verfahrensschritt beteiligten Akteure und deren Wechselwirkungen miteinbezogen werden. Dadurch gewinnen zusätzliche, phasenspezifische Aspekte an Bedeutung, deren Auswirkungen sich jeweils einzelfallabhängig entfalten. Prüft ein Gericht bspw. eine Änderung seiner Rechtsprechung, so findet dies im jeweiligen Fall in der prozessualen Phase statt. Die vollzogene Rechtsprechungsänderung entfaltet aber auch Wirkung auf alle späteren Fälle. Auf diese wirkt sich die Änderung der Rechtsprechung folglich bereits auf die vorprozessuale Phase aus.
Eine technologiebezogene Dimension würde schliesslich eine Unterscheidung zwischen regel- und datenbasierten KI-Systemen erlauben. Regelbasierte Systeme operieren auf der Grundlage einer Reihe vom Menschen vordefinierten Regeln.[56] Die Systementscheidung erfolgt dabei deterministisch auf «Wenn-Dann-Verknüpfungen».[57]
Demgegenüber beruhen datenbasierte Systeme auf statistischen Modellen sowie auf Verfahren des maschinellen Lernens, insbesondere auf künstlichen neuronalen Netzen.[58] Deren Funktionsweise ist nicht durch explizit vorab definierte Regeln festgelegt.[59] Vielmehr können diese Systeme auf Basis umfangreicher Trainingsdaten zur eigenständigen Bearbeitung nachgelagerter Aufgaben eingesetzt werden.[60] Dies erfolgt, indem sie Muster, Strukturen und Zusammenhänge in Datenbeständen erkennen, bestimmte Informationen extrahieren und darauf aufbauend Klassifikationen, Prognosen und Entscheidungen ableiten.[61]
1. Vorprozessuale Phase
Der Eintritt der vorprozessualen Phase kann variieren. Diese endet jedenfalls mit dem Beginn der prozessualen Phase durch Anwendbarkeit des jeweiligen Verfahrensrechts und den diesbezüglich einschlägigen Bestimmungen. Im Zivilrecht ist für das Ende der vorprozessualen Phase auf die Rechtshängigkeit nach Art. 62 ff. ZPO[62] abzustellen. Im Strafrecht wird die vorprozessuale Phase durch das Vorverfahren abgelöst, das - gestützt auf einen Anfangsverdacht - mit der Ermittlungstätigkeit der Polizei oder der Eröffnung der Untersuchung durch die Staatsanwaltschaft eingeleitet wird (Art. 299 ff. StPO[63]). Die vorprozessuale Phase umfasst jedenfalls sämtliche Handlungen von potenziellen Prozessparteien im Hinblick auf einen späteren, aber noch nicht realisierten (Gerichts-)Prozess.
Im Verwaltungsverfahren wird hingegen zwischen dem verwaltungsinternen Verfahren und dem strittigen Verwaltungsverfahren unterschieden, wobei das Verwaltungsprozessrecht auf Verfahren in Verwaltungssachen, die durch Verfügung zu erledigen sind, Anwendung findet. Die Verfügung kann je nach Sachgebiet in einem verwaltungsinternen Beschwerdeverfahren angefochten werden oder es folgt mit der Anfechtung direkt das verwaltungsgerichtliche Verfahren. Unabhängig davon, ob es sich um ein internes oder strittiges Verfahren handelt, beginnt im Bereich des Verwaltungsverfahrens folglich mit der Anfechtung die prozessuale Phase im hier verstandenen Sinne. Infolgedessen ist Sämtliches vor Anfechtung dem Bereich der vorprozessualen Phase zuzuordnen.
Eine differenziertere Einteilung der vorprozessualen Phase würde zwischen dem Einsatz von KI-Systemen zur Informationsvermittlung (einschliesslich Registerabfragen über intelligente Dialogsysteme)[64], zur Anspruchsprüfung (Ermittlung der Zuständigkeit, der Prozessaussichten und -kosten)[65] und zur Verbesserung des Justizzugangs (Unterstützung bei der Formulierung der Begehren und der allfällig erforderlichen Beweismittel)[66] unterscheiden.[67]
In einer mehrdimensionalen Auseinandersetzung könnte bspw. untersucht werden, ob die gerichtliche Unabhängigkeit (sachliche Dimension) gewahrt ist, wenn ein Chatbot (technologiebezogene Dimension) den Rechtssuchenden eine prozessrelevante Einschätzung der später zuständigen Instanz, welche gleichzeitig den Chatbot zur Verfügung stellt (personenbezogene Dimension), vermittelt.
2. Prozessuale Phase
Die prozessuale Phase beginnt im Zivilrecht mit der Rechtshängigkeit bzw. Anhängigkeit bei Gericht und im Strafrecht mit dem Einleiten des Vorverfahrens und dauert mindestens an, bis ein Entscheid vorliegt. Für die vorliegende Betrachtung kann vorerst offenbleiben, ob für das Ende der prozessualen Phase auf den Eintritt der Rechtskraft abgestellt wird und die prozessuale Phase mehrere Instanzen umfasst.
Für den Einsatz von KI-Systemen in der prozessualen Phase könnten die folgenden Verfahrensschritte unterschieden werden, wobei die Eigenheiten der jeweiligen Verfahrensgesetze zu berücksichtigen sind.
Auf Seiten der Parteien fällt der Beizug von KI-Systemen insbesondere bei der Geltendmachung (Formulierung[68] und Übermittlung der Rechtsbegehren) und bei der Darlegung (Behauptung und Bestreitung des Sachverhalts sowie der Rechtsgrundlagen) in Betracht. Die vorangehende Recherche fällt je nach Verfahren und Parteirolle in die vorprozessuale (klagende oder gesuchstellende Partei) oder in die prozessuale Phase (beklagte, beschuldigte oder gesuchsbelastete Partei).
Auf Seiten der Gerichte[69] fällt der Beizug von KI-Systemen bei der Fallanalyse (Prüfung der formellen Eintretensvoraussetzungen, Zuordnung[70] in Fallgruppen bei Massenverfahren, Zusammenstellung des Spruchkörpers, Ansetzung von Verhandlungsterminen und Fristen, Übersetzung[71] aus Fremdsprachen, Transkription[72] von Partei- und Zeugenaussagen, Aktenstudium und Aktendurchdringung[73] sowie weitere Sachverhaltsermittlungen[74]), bei der Recherche (Abklärungen insb. des anwendbaren Rechts, Rechtsabklärung[75], Literaturaufbereitung), bei der Würdigung (Aufbereitung[76] der Parteieingaben und Würdigung des rechtlich relevanten Sachverhalts[77], Ermittlung und Bezeichnung der relevanten Beweismittel) und bei der Subsumtion (inkl. Berechnungen[78] von Schadenspositionen und zahlenmässigen Ansprüchen, Strafzumessung[79], sowie Entscheidfällung[80] und deren Überprüfung[81] und schliesslich Eröffnung und Begründung[82]) in Betracht.
Diese Verfahrensschritte wiederholen sich bei jeder Instanz, wobei im Rechtsmittelverfahren die allfällig eingeschränkte Kognition der Rechtsmittelinstanz zu berücksichtigen ist. Dort rechtfertigt sich möglicherweise eine (zusätzliche) Unterscheidung nach den prozessrechtlichen Rügegründen (unrichtige oder unvollständige Sachverhaltsfeststellung, unrichtige Rechtsanwendung einschliesslich Ermessensfehler und Unangemessenheit), welche sich ebenfalls aus dem Prozessrecht ergeben.[83]
In einer mehrdimensionalen Auseinandersetzung könnte bspw. untersucht werden, ob das rechtliche Gehör (sachliche Dimension) verletzt wird, indem das Beweisthema durch Mustererkennung (technologiebezogene Dimension) fixiert und dadurch ein ausschlaggebender Beweisantrag einer nicht anwaltlich vertretenen Partei (personenbezogene Dimension) übersehen wird, nur weil dieser nicht ausdrücklich als «Beweisantrag» deklariert wurde.
3. Nachprozessuale Phase
Die nachprozessuale Phase beginnt spätestens mit der Rechtskraft des Entscheids und umfasst sämtliche Handlungen von beteiligten Akteuren, aber auch Dritten, im Zusammenhang mit dem abgeschlossenen Verfahren.
In die nachprozessuale Phase fällt der Einsatz von KI-Systemen zur Publikationsvorbereitung (Anonymisierung[84], Zusammenfassung und sprachliche Vereinfachung, Übersetzung in Fremdsprachen, Anreicherung mit Metadaten), zur Publikation des Entscheids durch das Gericht sowie zur Bereitstellung der Daten an Dritte (bspw. über eine API - auch für das Training von KI-Systemen).
In einer mehrdimensionalen Auseinandersetzung könnte bspw. untersucht werden, wie es sich in Bezug auf den Persönlichkeitsschutz i.S.v. Art. 13 BV (sachliche Dimension) der Verfahrensparteien verhält (personenbezogene Dimension), wenn automatisierte Anonymisierungen von Urteilen fehlerbehaftet publiziert werden (technologiebezogene Dimension).
IV. Fazit
Eine Typologisierung entlang der zeitlichen Dimension hat verschiedene Vorteile. Zunächst erlaubt sie die systematische Untersuchung der Vereinbarkeit des Einsatzes von KI-Systemen in der Justiz mit den verfassungsrechtlichen Grundrechts- und Verfahrensgarantien, die in der vorprozessualen, prozessualen und nachprozessualen Phase je unterschiedliche Ausprägungen annehmen können.
Sodann bildet sie eine übersichtliche Grundlage im Hinblick auf die Untersuchung der Beeinflussung von Entscheidprozessen, indem sowohl sämtliche Tätigkeiten vor Gericht (und damit aller am Entscheid Beteiligten) als auch diejenigen in vorangehenden (Verwaltungs- oder Strafbefehls-)Verfahren berücksichtigt werden. Zudem kann damit sowohl die zeitliche als auch die inhaltliche Nähe des Einsatzes eines KI-Systems zum Entscheid berücksichtigt werden.
Diese auf die Verfahrensschritte ausgerichtete Typologisierung erlaubt auch die Untersuchung von näher zu spezifizierenden Indikatoren für die sachbezogene und ferner für eine technologiebezogene Dimension.[85] Durch den Einsatz beobachtbarer Indikatoren gewinnt die Typologisierung an Vergleichbarkeit (über Gerichtsbarkeiten hinweg, ggf. auch international) und letztlich an wissenschaftlicher Belastbarkeit. Die sachbezogene Dimension kann bspw. auf folgende Indikatoren, die je nach Verfahrensschritt variieren, zurückgreifen: Den Anteil strukturierter Inputs (Anteil Formularfelder vs. Fliesstext), den Grad der Standardisierung (Varianz der Textbausteine, Komplexität der Prozesspfade), den Grad der Reversibilität von Entscheidungen (Vorhandensein vs. Fehlen von Korrigierbarkeit im selben Prozessstadium) und die Existenz formaler Verfahrensoutputs (z.B. Protokolle vs. handschriftliche Notizen von Gerichtspersonen). Diese sachbezogenen Indikatoren stehen in direktem Zusammenhang mit der technologiebezogenen Dimension. Auch für Letztere lassen sich Indikatoren formulieren, die ebenfalls in Abhängigkeit der Verfahrensabschnitte variieren. Dazu gehören bspw. der Autonomiegrad des anzuwendenden KI-Systems (statisches vs. selbstlernendes System),[86] den Umfang der Daten- und Wissensbasis (selektive Aktenbasis vs. grosse Rechtskorpora), Validierbarkeit (z.B. durch Vorhandensein messbarer Qualitätsmetriken)[87] und technische, evidenzbasierte Evaluierbarkeit der Prozesse (z.B. durch Logging von Ereignissen)[88].
Die Anwendung einer zusätzlichen, personenbezogenen Dimension eignet sich schliesslich für die Untersuchung der gerichtlichen Unabhängigkeit: Welche Wechselwirkungen bestehen zwischen den involvierten Akteuren im Hinblick auf die interne/externe Unabhängigkeit sowie die personelle/institutionelle Unabhängigkeit in den jeweiligen Verfahrensschritten?
Eine auf diese Typologisierung gestützte, mehrdimensionale Forschung kann aufgrund ihres Detaillierungsgrades auch für den grenzüberschreitenden Vergleich geeignet und international anschlussfähig sein. Dank der Anknüpfung an das Verfahrensrecht werden die gewonnenen Erkenntnisse ohne Transformation auch für die Rechtsanwendungspraxis zugänglich. Sie kann schliesslich als Grundlage für vertiefende Forschung, bspw. anhand veränderter Indikatoren, herangezogen werden.
Die vorgeschlagene Typologisierung ist freilich nicht frei von Schwachstellen: Als deskriptive Kartierung bleibt sie notwendig abstrakt und kann Grenzfälle - etwa hybride Systeme mit mehreren Funktionen entlang verschiedener Verfahrensstadien - nur begrenzt trennscharf erfassen. Zudem droht sie angesichts der hohen Entwicklungsdynamik im KI-Bereich rasch zu veralten. Gleichwohl bietet die Typologisierung einen praktikablen Ausgangspunkt für die weitere Auseinandersetzung mit KI in der Justiz, weil sie mögliche Einsatzfelder systematisch ordnet, ohne vorschnell normative Schlussfolgerungen zu ziehen.
Idealerweise bildet sie den Ausgangspunkt für eine iterative Weiterentwicklung im Dialog zwischen Rechtswissenschaft, Informatik und Justizpraxis. Gerade als gemeinsame Sprache stärkt sie die interdisziplinäre Verständigung und erleichtert es, Chancen, Risiken und rechtliche Anforderungen an den Einsatz von KI-Systemen im schweizerischen Justizkontext präziser zu identifizieren und zu diskutieren.
