吴翼
前OpenAI研究员,清华大学交叉信息院助理教授
吴翼,清华大学交叉信息院助理教授,博士生导师,智能体强化学习框架AReaL负责人。2019于加州大学伯克利分校获得博士学位,曾任OpenAI全职研究员,研究领域为强化学习、推理模型、通用智能体等。代表作包括多智能体学习最高引算法 MAPPO/MADDPG,OpenAI多智能体捉迷藏项目等,还曾获得顶级会议NIPS2016 best paper award和ICRA2024 best demo award finalist,WAIC2025云帆奖,MIT Techreview Asia-Pacific 35under35奖。