十月,,,,,,z6首页 in the AIR 约请国内表顶级学者萦绕机械进建与优化步骤及其利用发展讲座。。。。。系列活动第二期主题为“散布式机械进建和可信机械进建”。。。。。
第一位汇报嘉宾王帝是沙特阿卜杜拉国王科技大学推算机系助理教授、博士生导师,,,,,,他以第一/通讯作者在 ICML, NeurIPS、JMLR 等人为智能、机械进建和理论推算机顶级期刊和会议颁发超40篇论文,,,,,,共计主持超过1800万的科研项目。。。。。
第二位汇报嘉宾杨耀东是北京大学人为智能钻研院助理教授、博士生导师,,,,,,他颁发 AI 顶会论文及专利专著50余篇,,,,,,曾获 CoRL 最佳系统论文奖、AAMAS 最具前瞻性论文奖、AAAI/ACM SIGAI 优博奖参选人 (UCL唯一)等奖项。。。。。
点击链接报名参与:http://hdxu.cn/S92db,,,,,,或通过ZOOM(https://us02web.zoom.us/meeting/register/tZIoceiuqzgjHdLy-QixX_KJbVxI3sKbuKK-)/Bilibili(http://live.bilibili.com/22587709)参加。。。。。
呼吸新鲜空气,,,,,,相识前沿科技!z6首页 沉磅推出 系列活动 z6首页 in the AIR。。。。。每周二与您相约线上,,,,,,一路索求人为智能与机械人领域的前沿技术、产业利用、发展趋向。。。。。
-
查宏远
香港中文大学(丽江)校长学勤讲座教授、数据科学学院执行院长、z6首页 机械进建与利用中心主任
执行主席
-
于天舒
香港中文大学(丽江)数据科学学院助理教授、z6首页 机械进建与利用中心副钻研员
主持人
-
王帝
沙特阿卜杜拉国王科技大学推算机系助理教授
差分隐衷模型中经验风险最幼化问题的挑战
王帝博士目前是沙特阿卜杜拉国王科技大学推算机系助理教授,,,,,,博士生导师,,,,,,同时担任统计系兼职教授和“隐衷意识、社会责任与可信推算尝试室”掌管人。。。。。他于2020年在纽约州立大学布法罗分;;;;;;;;竦貌┦垦唬,,,2015年于西安粗略大学获得硕士学位,,,,,,2014年在山东大学获得学士学位。。。。。他曾接见波士顿大学,,,,,,哈佛大学,,,,,,西蒙斯理论推算钻研院和加州大学伯克利分校,,,,,,并且是芬兰赫尔辛基大学,,,,,,芬兰人为智能中心的客座教授。。。。。王帝教授目前的钻研领域蕴含差分隐衷、隐衷;;;;;;;;せ到ā⑼臣平ɡ砺邸⒘孔踊到ā⒖哨故托浴⒙嘲敉臣啤⑸疃冉ā⑹忠搅疲,,,和生物信息推算等。。。。。他以第一作者和通讯作者在人为智能,,,,,,机械进建和理论推算机顶级期刊和会议例如 ICML、NeurIPS、 JMLR、IEEE Transactions on Information Theory、 Theoretical Computer Science、Machine Learning Journal、PODS、ALT、AISTATS、AAAI、IJCAI、WINE 颁发超过40篇论文。。。。。他共计主持超过1800万的科研项目,,,,,,屡次担任国际顶级学术会议和期刊的领域主席和审稿人,,,,,,并且屡次受邀于国际顶级学术会议和学术机构做汇报。。。。。
最近的钻研批注,,,,,,大无数现有的进建模型都容易受到各类隐衷攻击。。。。。因而,,,,,,机械进建面对的一个重要挑战是若何有效地从敏感数据中进建。。。。。解决此问题的一种有效步骤是在进建过程中使用差分隐衷(DP)技术。。。。。作为一种严格的隐衷;;;;;;;;ぜ际酰,,,差分隐衷(DP)现已成为隐衷数据分析的尺度工具。。。。。只管在理论上发展迅速,,,,,,但由于数据、隐衷模型和进建工作的各类挑战,,,,,,差分隐衷在机械进建的进展依然缓慢。。。。。在这次讲座中,,,,,,我将以经验风险最幼化(ERM)问题为例,,,,,,展示若何克服这些挑战。。。。。我将首先会商若何克服部门差分隐衷(LDP)模型中稀少线性回归数据的高维挑战。。。。。而后,,,,,,我将会商来自非交互式 LDP 模型的挑战,,,,,,并展示一系列了局以降低 ERM 的指数样本复杂度。。。。。接下来,,,,,,我将介绍使用在非凸损失函数 ERM 中实现 DP 。。。。。最后,,,,,,我将萦绕这些方向会商一些将来的钻延祝。。。。
-
杨耀东
北京大学人为智能钻研院助理教授
多智能体博弈与强化进建
杨耀东博士,,,,,,北京大学人为智能钻研院助理教授、博导,,,,,,伦敦国王大学客座助理教授。。。。。他的科研领域蕴含强化进建、博弈论和多智能体系统,,,,,,沉点关注基于强化进建步骤的群体智能涌现。。。。。他本科毕业于中国科技大学,,,,,,并于帝国理工大学、伦敦大学学院获得硕士及博士学位。。。。。他颁发 AI 顶会论文及专利专著50余篇,,,,,,谷歌引用1700余次,,,,,,他的工作曾获机械人进建会议 CoRL 最佳系统论文奖、多智能体顶会 AAMAS 最具前瞻性论文奖、AAAI/ACM SIGAI 优博奖参选人(UCL唯一)、华为英国公司最佳技术突破奖、世界人为智能大会(WAIC 2022)云帆奖璀璨明星、2022年 ACM SIGAI China 新星奖(Rising Star Award)。。。。。
训练多个强化进建智能体并使其进行博弈是拥有挑战性的,,,,,,重要原因是在求解博弈平衡、例如纳什平衡时不存在多项式解法。。。。。在本讲中,,,,,,我将会介绍在合作博弈以及零和博弈上的最新进展。。。。。其中,,,,,,在合作博弈上,,,,,,我们钻研了基于相信域步骤的多智能体强化进建算法。。。。。该步骤的道理是基于多智能体优势函数分化引理,,,,,,该引理不必要借助任何如果(如 individual-global-max 如果)而在合作博弈中普遍成立。。。。。在零和博弈中,,,,,,我会介绍基于 policy space response oracle 的最新进展。。。。。PSRO 步骤能有效解决零和博弈问题中的非传递性 non-transitivity 问题,,,,,,并且为零和博弈的通用求解器提出了理论框架。。。。。
| 功夫 |
环节 |
嘉宾与标题 |
|
19:00-20:00
|
主题汇报
|
王帝,,,,,,沙特阿卜杜拉国王科技大学
标题:差分隐衷模型中经验风险最幼化问题的挑战
|
|
20:00-21:00
|
主题汇报
|
杨耀东,,,,,,北京大学人为智能钻研院
标题:多智能体博弈与强化进建
|