Ruiqi Zhang

Geciteerd door

	Alles	Sinds 2019
Citaties	94	94
h-index	3	3
i10-index	2	2

2022202320248 52 34

Openbare toegang

Alles bekijken

2 artikelen

0 artikelen

beschikbaar

niet beschikbaar

Op basis van financieringsmachtigingen

Medeauteurs

Peter BartlettProfessor, EECS and Statistics, UC BerkeleyGeverifieerd e-mailadres voor cs.berkeley.edu
Spencer FreiUC DavisGeverifieerd e-mailadres voor ucdavis.edu
Mengdi WangCenter for Statistics & Machine Learning, ECE, Princeton UniversityGeverifieerd e-mailadres voor princeton.edu
Chengzhuo NiPrinceton UniversityGeverifieerd e-mailadres voor princeton.edu
Xuezhou ZhangBoston UniversityGeverifieerd e-mailadres voor bu.edu
Xiang JiPrinceton UniversityGeverifieerd e-mailadres voor princeton.edu
Andrea ZanetteAssistant Professor, Carnegie Mellon UniversityGeverifieerd e-mailadres voor andrew.cmu.edu
Zhaorun ChenPh.D. Student, UChicago CSGeverifieerd e-mailadres voor uchicago.edu
Zhuokai ZhaoPhD Candidate, University of ChicagoGeverifieerd e-mailadres voor uchicago.edu
Huaxiu YaoAssistant Professor of Computer Science and Data Science, UNC Chapel HillGeverifieerd e-mailadres voor cs.unc.edu
Bhiksha RajCarnegie Mellon UniversityGeverifieerd e-mailadres voor cs.cmu.edu
Jingfeng WuUniversity of California, BerkeleyGeverifieerd e-mailadres voor berkeley.edu
Yuexiang ZhaiUC BerkeleyGeverifieerd e-mailadres voor berkeley.edu
Licong LinPhD student at UC BerkeleyGeverifieerd e-mailadres voor berkeley.edu
Song MeiAssistant Professor at UC BerkeleyGeverifieerd e-mailadres voor berkeley.edu
Yu BaiResearch Scientist, Salesforce ResearchGeverifieerd e-mailadres voor salesforce.com

Volgen

Ruiqi Zhang

Ph.D. Student, Statistics Department at University of California, Berkeley

Geverifieerd e-mailadres voor berkeley.edu - Homepage

Statistical Machine Learning Deep Learning Theory LLM Alignment Sequential Decision Making


Titel Sorteren op citaties Sorteren op jaar Sorteren op titel	Geciteerd door Geciteerd door	Jaar
Trained Transformers Learn Linear Models In-Context R Zhang, S Frei, PL Bartlett Journal of Machine Learning Research 25 (49), 1-55, 2024	68	2024
Off-policy fitted q-evaluation with differentiable function approximators: Z-estimation and inference theory R Zhang, X Zhang, C Ni, M Wang International Conference on Machine Learning, 26713-26749, 2022	18	2022
Optimal estimation of policy gradient via double fitted iteration C Ni, R Zhang, X Ji, X Zhang, M Wang International Conference on Machine Learning, 16724-16783, 2022	4*	2022
AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via Controllable Question Decomposition Z Chen, Z Zhao, Z Zhu, R Zhang, X Li, B Raj, H Yao NAACL 2024, 2024	2	2024
Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data R Zhang, A Zanette Advances in Neural Information Processing Systems, 2024, 2023	2	2023
Negative Preference Optimization: From Catastrophic Collapse to Effective Unlearning R Zhang, L Lin, Y Bai, S Mei arXiv preprint arXiv:2404.05868, 2024		2024
Is Offline Decision Making Possible with Only Few Samples? Reliable Decisions in Data-Starved Bandits via Trust Region Enhancement R Zhang, Y Zhai, A Zanette arXiv preprint arXiv:2402.15703, 2024		2024
In-Context Learning of a Linear Transformer Block: Benefits of the MLP Component and One-Step GD Initialization R Zhang, J Wu, PL Bartlett arXiv preprint arXiv:2402.14951, 2024		2024

Het systeem kan de bewerking nu niet uitvoeren. Probeer het later opnieuw.

Artikelen 1–8

Citaties per jaar

Dubbele citaties

Samengevoegde citaties

Medeauteurs toevoegenMedeauteurs

Volgen

Geciteerd door

Medeauteurs