Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse

合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理

基本信息

  • 批准号:
    2312842
  • 项目类别:
    Standard Grant
  • 资助金额:
    40万
  • 负责人:
    Qing Qu
  • 依托单位:
    Regents of the University of Michigan - Ann Arbor
  • 结题年份:
    2026
  • 批准年份:
    2023
  • 项目状态:
    未结题
  • 起止时间:
    2023-07-01 至 2026-06-30

项目摘要

Deep learning has demonstrated unprecedented performance across various domains in engineering and science. However, the theoretical understanding of their success has remained elusive. Very recently, researchers discovered and characterized an elegant mathematical structure within the learned features and classifiers called Neural Collapse. This phenomenon persists across a variety of different network architectures, datasets, and data domains. This project will leverage the symmetry of Neural Collapse to develop a rigorous mathematical theory to explain when and why it happens and how it can be used to quantify generalization performance and provide guidelines to understand and improve transferability. By advancing the mathematical foundations of deep learning, this project is expected to influence not only the machine learning community, but also related areas such as optimization, signal and image processing, and natural language processing. The project also involves an integrated outreach and education plan, including promoting accessibility and awareness of computing and STEM concepts for K-12 students.This project will expand our understanding of the principles behind non-convex optimization of training deep learning models, and provide new mathematical insights on their generalization and transferability properties, leading to practical implications. In particular, the project is focused on the following three overarching research thrusts: (i) provide a unified framework to analyze convergence guarantees for training deep and overparametrized models through general loss functions to states of neural collapse, first for simplified cases and then for more general deep models that exhibit progressive neural collapse, with multi-labels and data imbalance; (ii) harness the structure of neural collapse to provide tighter generalization bounds for deep models, by characterizing the structure of the resulting classifiers and their mild dependence on the training data, as well as by making natural distributional assumptions; (iii) leverage the generalization of progressive neural collapse to new environments to understand transferability of deep models to new domains and tasks, and develop principled approaches for improving transferability and efficient fine-tuning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度学习表明,工程和科学领域的各个领域表现出了前所未有的表现。但是,对他们成功的理论理解仍然难以捉摸。最近,研究人员发现并描述了在称为神经崩溃的学识渊博的特征和分类器中的优雅数学结构。这种现象一直存在于各种不同的网络体系结构,数据集和数据域中。该项目将利用神经崩溃的对称性来开发一种严格的数学理论,以解释何时以及如何使用它来量化概括性能并提供指导方针,以理解和提高可传递性。通过推进深度学习的数学基础,该项目不仅会影响机器学习社区,还会影响相关领域,例如优化,信号和图像处理以及自然语言处理。该项目还涉及一项综合的外展和教育计划,包括促进K-12学生的计算和STEM概念的可访问性和意识。该项目将扩展我们对非convex优化培训深度学习模型背后的原理的理解,并提供有关其概括性和转移性属性的新数学洞察力,从而带来实际含义。特别是,该项目的重点是以下三个总体研究推力:(i)提供一个统一的框架来分析收敛保证,以通过对神经崩溃状态的一般损失功能进行培训,以训练深层和过度参数化的模型,首先是简化的病例,然后是更深层的深层模型,以表现出具有多型Labels和数据IMBAIL和数据Imbalance的渐进性神经崩溃; (ii)利用神经崩溃的结构,通过表征所得分类器的结构及其对训练数据的温和依赖,并通过做出自然的分布假设来为深层模型提供更严格的概括界限; (iii)利用进行性神经崩溃对新环境的概括,以了解深层模型向新领域和任务的转移性,并开发有原则性的方法来提高可转移性和有效的微调。这一奖项反映了NSF的法定任务,并通过评估该基金会的知识分子功能和广泛的影响来评估NSF的法定任务。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.titleTranslate }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAwards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

Ultrasmall Pd and PtPd nanoparticles for highly efficient catalysis directed by predesigned Morchella-inspired encapsulation
  • DOI:
    https://doi.org/10.1016/j.jcis.2020.11.097
  • 发表时间:
    2021
  • 期刊:
    Journal of Colloid and Interface Science
  • 影响因子:
    --
  • 作者:
    Shunling Li;Lei Li;Xinwei Wen;Xiaoqiang Yang;Xiaoling Shi;Qing Qu
  • 通讯作者:
    Qing Qu
Exact and Efficient Multi-Channel Sparse Blind Deconvolution — A Nonconvex Approach
精确高效的多通道稀疏盲反卷积——一种非凸方法
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    Asilomar Conference on Signals, Systems and Computers
  • 影响因子:
    --
  • 作者:
    Qing Qu;Xiao Li;Zhihui Zhu
  • 通讯作者:
    Zhihui Zhu
Corrosion Behavior of Titanium in Artificial Saliva by Lactic Acid
  • DOI:
    doi:10.3390/ma7085528
  • 发表时间:
    2014
  • 期刊:
    Materials
  • 影响因子:
    3.4
  • 作者:
    Qing Qu;Lei Wang;Yajun Chen;Lei Li;Yue He;Zhongtao Ding
  • 通讯作者:
    Zhongtao Ding
ThetypeIVsecretionsystema ¡ ectstheexpressionofOmp 25 / Omp 31 and theoutermembraneproperties ofBrucellamelitensis
IV型分泌系统a ¡
  • DOI:
    --
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    --
  • 作者:
    Yufei Wang;Zeliang Chen;Feng Qiao;Z. Zhong;Jie Xu;Zhoujia Wang;Xinying Du;Qing Qu;Jing Yuan;Leili Jia;Hongbin Song;Yansong Sun;Liuyu Huang
  • 通讯作者:
    Liuyu Huang
Synthesis and facile structure-adjusting of Pd–Pt nanocrystal electrocatalysts with improved activity for ethanol oxidation reaction
  • DOI:
    DOI: 10.1039/c9nj04094c
  • 发表时间:
    2019
  • 期刊:
    New Journal of Chemistry
  • 影响因子:
    --
  • 作者:
    Chang Liu;Xin Ran;Qing Qu;Tiantian Zhang;Guanben Du;Long Yang
  • 通讯作者:
    Long Yang

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

Qing Qu的其他基金

CAREER: From Shallow to Deep Representation Learning: Global Nonconvex Optimization Theories and Efficient Algorithms
  • 批准号:
    2143904
  • 批准年份:
    2022
  • 资助金额:
    63.33 万元
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Medium: Foundations of Robust Deep Learning via Data Geometry and Dyadic Structure
  • 批准号:
    2212326
  • 批准年份:
    2022
  • 资助金额:
    47.2 万元
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Medium: Taming Deep Unsupervised Representation Learning in Imaging: Theory and Algorithms
  • 批准号:
    2212066
  • 批准年份:
    2022
  • 资助金额:
    37.07 万元
  • 项目类别:
    Continuing Grant

相似国自然基金

虚拟现实中的人类路径整合研究
  • 批准号:
    31200758
  • 批准年份:
    2012
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
运用遗传基因组学方法对大麦麦芽品质相关性状的精细遗传分析
  • 批准号:
    30771333
  • 批准年份:
    2007
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
ITPR3诱导细胞外基质降解在雌激素治疗宫腔粘连中的作用及机制研究
  • 批准号:
    81701396
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
草鱼脂肪沉积相关限速酶乙酰辅酶A羧化酶分子与细胞因子调控
  • 批准号:
    31172419
  • 批准年份:
    2011
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目
基于数字图像检测的结构工程施工控制虚实结合技术研究
  • 批准号:
    51278137
  • 批准年份:
    2012
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
钛酸铋系铁电薄膜的光诱导电流产生机制研究
  • 批准号:
    50702036
  • 批准年份:
    2007
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目
耗散形式下后牛顿拉格朗日和哈密顿动力学性质与引力波形比较
  • 批准号:
    11903022
  • 批准年份:
    2019
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
分形的结构稳定性、临界集与自相似测度的特征刻划
  • 批准号:
    10301029
  • 批准年份:
    2003
  • 资助金额:
    10.0 万元
  • 项目类别:
    青年科学基金项目
粘性泥沙悬浮体类凝胶态网络微细结构研究
  • 批准号:
    50179016
  • 批准年份:
    2001
  • 资助金额:
    20.0 万元
  • 项目类别:
    面上项目
听觉距离定位因素及其在空间声重放中的应用
  • 批准号:
    11574090
  • 批准年份:
    2015
  • 资助金额:
    73.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: FET: Medium:Compact and Energy-Efficient Compute-in-Memory Accelerator for Deep Learning Leveraging Ferroelectric Vertical NAND Memory
合作研究:FET:中型:紧凑且节能的内存计算加速器,用于利用铁电垂直 NAND 内存进行深度学习
  • 批准号:
    2312886
  • 财政年份:
    2023
  • 资助金额:
    26.6
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312841
  • 财政年份:
    2023
  • 资助金额:
    40
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312872
  • 财政年份:
    2023
  • 资助金额:
    26.5
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312842
  • 财政年份:
    2023
  • 资助金额:
    40
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Designing AI Systems with Steerable Long-Term Dynamics
合作研究:III:中:设计具有可操纵长期动态的人工智能系统
  • 批准号:
    2312865
  • 财政年份:
    2023
  • 资助金额:
    98
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Medium:Compact and Energy-Efficient Compute-in-Memory Accelerator for Deep Learning Leveraging Ferroelectric Vertical NAND Memory
合作研究:FET:中型:紧凑且节能的内存计算加速器,用于利用铁电垂直 NAND 内存进行深度学习
  • 批准号:
    2312884
  • 财政年份:
    2023
  • 资助金额:
    26.8
  • 项目类别:
    Standard Grant
CSR: Small: CONCERT: Designing Scalable Communication Runtimes with On-the-fly Compression for HPC and AI Applications on Heterogeneous Architectures
CSR:小型:CONCERT:为异构架构上的 HPC 和 AI 应用程序设计具有动态压缩的可扩展通信运行时
  • 批准号:
    2312927
  • 财政年份:
    2023
  • 资助金额:
    60
  • 项目类别:
    Standard Grant
Bond Strengthening and Grain Size Refinement in Superhard Metal Borides
超硬金属硼化物中的键强化和晶粒尺寸细化
  • 批准号:
    2312942
  • 财政年份:
    2023
  • 资助金额:
    64
  • 项目类别:
    Continuing Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
  • 批准号:
    2312932
  • 财政年份:
    2023
  • 资助金额:
    40
  • 项目类别:
    Standard Grant
Collaborative Research: NeTS: Medium: EdgeRIC: Empowering Real-time Intelligent Control and Optimization for NextG Cellular Radio Access Networks
合作研究:NeTS:媒介:EdgeRIC:为下一代蜂窝无线接入网络提供实时智能控制和优化
  • 批准号:
    2312978
  • 财政年份:
    2023
  • 资助金额:
    70
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了