Alle Hochschulen in Nordrhein-Westfalen stehen vor der Herausforderung, große Sprachmodelle datenschutzsicher und unabhängig in Forschung, Lehre, Studium und Verwaltung zu betreiben. Das Projekt Open Source-KI.nrw möchte an der Ruhr-Universität Bochum erstmals den Zugang zu einem Sprachmodell mit Datenhoheit im Land NRW ermöglichen. Gefördert wird das Projekt vom NRW-Ministerium für Kultur und Wissenschaft.
OSKI.nrw setzt auf das europäische Sprachmodell Mistral Small 3.2 Instruct
Das in Europa entwickelte Sprachmodell Mistral Small 3.2 Instruct läuft im Hochleistungsrechenzentrum Ramses der Universität zu Köln. Mistral ist ein sogenanntes Open-Weight-Modell: Es bildet einen Mittelweg zwischen geschlossenen, kommerziellen und vollständig offenen Open-Source-Modellen.
Zwar seien Quellcode und Trainingsdaten nicht einsehbar, doch die Gewichtungen und Parameter – das gelernte „Wissen“ – sollen öffentlich zugänglich sein. Dadurch könnten solche Modelle lokal genutzt und weiterentwickelt werden. So werde die Ruhr-Universität Bochum als Pilothochschule unabhängiger von kommerziellen Anbietern.
Pilotprojekt soll Perspektive für alle Hochschulen in NRW geben
„Das sind gute Nachrichten für Datenschutz und digitale Souveränität an der RUB und perspektivisch für alle Hochschulen in NRW“, sagt Martin Bovermann, der das Projekt OSKI.nrw leitet. „Nutzende können sicher sein, dass ihre Anfragen nicht von externen Unternehmen weiterverwendet werden. Die Daten bleiben in NRW – das ist essenziell für die Arbeit mit sensiblen Forschungsdaten.“
Das neue Sprachmodell läuft an der Ruhr-Universität Bochum über den Dienst GPT@RUB. Darüber hinaus können seit dem Wintersemester 2024/25 alle RUB-Hochschulangehörigen kostenlos auf ChatGPT von OpenAI und weitere Open-Source-Modelle zugreifen. »red«
Über Open Source-KI.nrw
Open Source-KI.nrw (OSKI.nrw) ist ein gemeinsames Projekt der Ruhr-Universität Bochum und der Universität zu Köln. In der Pilotphase werden Leistungsdaten erhoben, um den Rechenbedarf für einen landesweiten Zugang besser einschätzen zu können. Ziel ist der Aufbau eines landeseigenen, datensouveränen Sprachmodells für NRW-Hochschulen als sichere Alternative zu kommerziellen KI-Angeboten.

