HIDA Lecture: Exploring the World of LLMs
Referent: Jan Ebert, Software Engineer and Researcher Large-Scale HPC Machine and Deep Learning am Forschungszentrum Jülich
Datum: 20.03.2024, 11:00 Uhr
Titel: ChatGPT's Backgrounds: Exploring the World of Large Language Models
Inhalt
Der Vortrag gibt zunächst eine kurze historische Einführung in die Themen Deep Learning und Large Language Models (LLMs). Darauf aufbauend werden im Anschluss verschiedene Aspekte des Trainings dieser Modelle beleuchtet und exemplarische Formen der Arbeit mit LLMs vorgestellt. Einen Überblick über den aktuellen Stand und ein Ausblick in die Zukunft runden den Vortrag ab.
Jan Ebert
Jan Ebert hat Kognitive Informatik und Intelligente Systeme an der Universität Bielefeld studiert. Er arbeitet am Jülich Supercomputing Centre als Helmholtz AI Consultant zu arbeiten. Er unterstützt Forscher in verschiedenen Bereichen bei der Anwendung von Techniken der Künstlichen Intelligenz (KI) für ihre Forschung und war Mitbegründer von LAION, einer offenen Community für offene KI-Projekte.
Weitere Arbeitsschwerpunkte liegen auf Transformers und Large Language Models. Jan Ebert hat an Projekten wie OpenGPT-X und TrustLLM mitgearbeitet, um intelligente und stichhaltige Sprachmodelle für europäische Sprachen zu erstellen.