‪Simon Lermen‬ - ‪Google Scholar‬

Mijn eigen profiel maken

Geciteerd door

	Alles	Sinds 2019
Citaties	24	24
h-index	2	2
i10-index	1	1

0

20

10

202320243 20

Medeauteurs

Charlie Rogers-SmithGeverifieerd e-mailadres voor rogerssmith.co.uk
Teun Van Der WeijMSc Artificial Intelligence student, Utrecht UniversityGeverifieerd e-mailadres voor students.uu.nl

Simon Lermen

Simon Lermen

Technical University of Berlin

Geverifieerd e-mailadres voor alumni.tu-berlin.de - Homepage


Titel Sorteren op citaties Sorteren op jaar Sorteren op titel	Geciteerd door Geciteerd door	Jaar
Lora fine-tuning efficiently undoes safety training in llama 2-chat 70b S Lermen, C Rogers-Smith, J Ladish arXiv preprint arXiv:2310.20624, 2023	18	2023
BadLlama: cheaply removing safety fine-tuning from Llama 2-Chat 13B P Gade, S Lermen, C Rogers-Smith, J Ladish arXiv preprint arXiv:2311.00117, 2023	5	2023
Evaluating Shutdown Avoidance of Language Models in Textual Scenarios T van der Weij, S Lermen arXiv preprint arXiv:2307.00787, 2023	1	2023
Exploring the Robustness of Model-Graded Evaluations and Automated Interpretability S Lermen, O Kvapil arXiv preprint arXiv:2312.03721, 2023		2023

Het systeem kan de bewerking nu niet uitvoeren. Probeer het later opnieuw.

Artikelen 1–4