Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse

合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理

基本信息

  • 批准号:
    2312842
  • 项目类别:
    Standard Grant
  • 资助金额:
    40万
  • 负责人:
    Qing Qu
  • 依托单位:
    Regents of the University of Michigan - Ann Arbor
  • 结题年份:
    2026
  • 批准年份:
    2023
  • 项目状态:
    未结题
  • 起止时间:
    2023-07-01 至 2026-06-30

项目摘要

Deep learning has demonstrated unprecedented performance across various domains in engineering and science. However, the theoretical understanding of their success has remained elusive. Very recently, researchers discovered and characterized an elegant mathematical structure within the learned features and classifiers called Neural Collapse. This phenomenon persists across a variety of different network architectures, datasets, and data domains. This project will leverage the symmetry of Neural Collapse to develop a rigorous mathematical theory to explain when and why it happens and how it can be used to quantify generalization performance and provide guidelines to understand and improve transferability. By advancing the mathematical foundations of deep learning, this project is expected to influence not only the machine learning community, but also related areas such as optimization, signal and image processing, and natural language processing. The project also involves an integrated outreach and education plan, including promoting accessibility and awareness of computing and STEM concepts for K-12 students.This project will expand our understanding of the principles behind non-convex optimization of training deep learning models, and provide new mathematical insights on their generalization and transferability properties, leading to practical implications. In particular, the project is focused on the following three overarching research thrusts: (i) provide a unified framework to analyze convergence guarantees for training deep and overparametrized models through general loss functions to states of neural collapse, first for simplified cases and then for more general deep models that exhibit progressive neural collapse, with multi-labels and data imbalance; (ii) harness the structure of neural collapse to provide tighter generalization bounds for deep models, by characterizing the structure of the resulting classifiers and their mild dependence on the training data, as well as by making natural distributional assumptions; (iii) leverage the generalization of progressive neural collapse to new environments to understand transferability of deep models to new domains and tasks, and develop principled approaches for improving transferability and efficient fine-tuning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度学习表明,工程和科学领域的各个领域表现出了前所未有的表现。但是,对他们成功的理论理解仍然难以捉摸。最近,研究人员发现并描述了在称为神经崩溃的学识渊博的特征和分类器中的优雅数学结构。这种现象一直存在于各种不同的网络体系结构,数据集和数据域中。该项目将利用神经崩溃的对称性来开发一种严格的数学理论,以解释何时以及如何使用它来量化概括性能并提供指导方针,以理解和提高可传递性。通过推进深度学习的数学基础,该项目不仅会影响机器学习社区,还会影响相关领域,例如优化,信号和图像处理以及自然语言处理。该项目还涉及一项综合的外展和教育计划,包括促进K-12学生的计算和STEM概念的可访问性和意识。该项目将扩展我们对非convex优化培训深度学习模型背后的原理的理解,并提供有关其概括性和转移性属性的新数学洞察力,从而带来实际含义。特别是,该项目的重点是以下三个总体研究推力:(i)提供一个统一的框架来分析收敛保证,以通过对神经崩溃状态的一般损失功能进行培训,以训练深层和过度参数化的模型,首先是简化的病例,然后是更深层的深层模型,以表现出具有多型Labels和数据IMBAIL和数据Imbalance的渐进性神经崩溃; (ii)利用神经崩溃的结构,通过表征所得分类器的结构及其对训练数据的温和依赖,并通过做出自然的分布假设来为深层模型提供更严格的概括界限; (iii)利用进行性神经崩溃对新环境的概括,以了解深层模型向新领域和任务的转移性,并开发有原则性的方法来提高可转移性和有效的微调。这一奖项反映了NSF的法定任务,并通过评估该基金会的知识分子功能和广泛的影响来评估NSF的法定任务。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.titleTranslate }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAwards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

Exact and Efficient Multi-Channel Sparse Blind Deconvolution — A Nonconvex Approach
精确高效的多通道稀疏盲反卷积——一种非凸方法
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    Asilomar Conference on Signals, Systems and Computers
  • 影响因子:
    --
  • 作者:
    Qing Qu;Xiao Li;Zhihui Zhu
  • 通讯作者:
    Zhihui Zhu
Nitrogen dozen carbon quantum dots as one dual function sensing platform for electrochemical and fluorescent detecting ascorbic acid
氮打碳量子点作为电化学和荧光检测抗坏血酸的双功能传感平台
  • DOI:
    10.1007/s11051-019-4741-9
  • 发表时间:
    2020
  • 期刊:
    Journal of Nanoparticle Research
  • 影响因子:
    2.5
  • 作者:
    Xin Zhou;Qing Qu;Lin Wang;Lei Li;Shunling Li;Ke Xia
  • 通讯作者:
    Ke Xia
Responsible Leadership with Chinese Characteristics
中国特色的责任领导
  • DOI:
    10.1017/mor.2023.38
  • 发表时间:
    2024
  • 期刊:
    Management and Organization Review
  • 影响因子:
    2.9
  • 作者:
    Qing Qu;Pingping Fu;Yu Tu;Masoud Shadnam
  • 通讯作者:
    Masoud Shadnam
Compounds inhibitory nematophagous fungi produced by Bacillus sp. Strain H6 isolated from soil.
抑制芽孢杆菌产生的食线虫真菌的化合物。
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    European Journal of Plant Pathology
  • 影响因子:
    1.8
  • 作者:
    Qing Qu;Ke-Qin Zhang;Lei Li;Minghe Mo
  • 通讯作者:
    Minghe Mo
ThetypeIVsecretionsystema ¡ ectstheexpressionofOmp 25 / Omp 31 and theoutermembraneproperties ofBrucellamelitensis
IV型分泌系统a ¡
  • DOI:
    --
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    --
  • 作者:
    Yufei Wang;Zeliang Chen;Feng Qiao;Z. Zhong;Jie Xu;Zhoujia Wang;Xinying Du;Qing Qu;Jing Yuan;Leili Jia;Hongbin Song;Yansong Sun;Liuyu Huang
  • 通讯作者:
    Liuyu Huang

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

Qing Qu的其他基金

CAREER: From Shallow to Deep Representation Learning: Global Nonconvex Optimization Theories and Efficient Algorithms
  • 批准号:
    2143904
  • 批准年份:
    2022
  • 资助金额:
    63.33 万元
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Medium: Foundations of Robust Deep Learning via Data Geometry and Dyadic Structure
  • 批准号:
    2212326
  • 批准年份:
    2022
  • 资助金额:
    47.2 万元
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Medium: Taming Deep Unsupervised Representation Learning in Imaging: Theory and Algorithms
  • 批准号:
    2212066
  • 批准年份:
    2022
  • 资助金额:
    37.07 万元
  • 项目类别:
    Continuing Grant

相似国自然基金

单量子态氦原子的制备和精密测量
  • 批准号:
    11304303
  • 批准年份:
    2013
  • 资助金额:
    30.0 万元
  • 项目类别:
    青年科学基金项目
选择性干扰抑制性免疫球蛋白受体(KIRs)表达提高NK细胞杀伤功能的研究
  • 批准号:
    30672387
  • 批准年份:
    2006
  • 资助金额:
    26.0 万元
  • 项目类别:
    面上项目
梯度功能压电材料设计中的力学问题研究
  • 批准号:
    10072041
  • 批准年份:
    2000
  • 资助金额:
    20.0 万元
  • 项目类别:
    面上项目
高效嗜冷产甲烷功能菌群分析及应用
  • 批准号:
    51108378
  • 批准年份:
    2011
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
能动磨盘加工大口径离轴非球面反射镜的关键技术
  • 批准号:
    61178043
  • 批准年份:
    2011
  • 资助金额:
    33.0 万元
  • 项目类别:
    面上项目
金黄虎头蜂蜂毒抑制类风湿性关节炎炎症和血管生成的作用机制及物质基础研究
  • 批准号:
    81360679
  • 批准年份:
    2013
  • 资助金额:
    50.0 万元
  • 项目类别:
    地区科学基金项目
高电流密度及高发光效率的双极有机发光场效应晶体管的研究
  • 批准号:
    61177017
  • 批准年份:
    2011
  • 资助金额:
    68.0 万元
  • 项目类别:
    面上项目
常压氧化酸浸-湍流电积回收湿法炼锌净化铜渣中金属铜的基础研究
  • 批准号:
    51764035
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
高强度聚焦超声断层布阵式扫描治疗肝肿瘤的实验研究
  • 批准号:
    39770841
  • 批准年份:
    1997
  • 资助金额:
    13.0 万元
  • 项目类别:
    面上项目
多模态影像结合术后大病理及分子分型引导早期乳腺癌保乳术后瘤床靶区个体化确定研究
  • 批准号:
    81703038
  • 批准年份:
    2017
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Raising diagnostic accuracy and therapeutic perspectives in interstitial lung diseases
提高间质性肺疾病的诊断准确性和治疗前景
  • 批准号:
    441274680
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Dual-responsive organo-sulfur network cathodes for stable high capacity polymer batteries
用于稳定高容量聚合物电池的双响应有机硫网络阴极
  • 批准号:
    441323218
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
Formats and Practices of Media Studies in the Age of Digital and Social Networks: An Ethnographic and Netnographic Study
数字和社交网络时代媒体研究的格式和实践:民族志和网络志研究
  • 批准号:
    441413969
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Design of collaborative and context aware mobile applications considering normative requirements from legal science and computer science (NORA)
考虑法律科学和计算机科学 (NORA) 的规范要求,设计协作和上下文感知的移动应用程序
  • 批准号:
    441416429
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Research Grants
FAIRVASC - building registry interoperability to inform clinical care
FAIRVASC - 建立注册表互操作性以告知临床护理
  • 批准号:
    441416480
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Multi-criteria Multi-constraint Path Query Processing on Graph Databases
图数据库的多准则多约束路径查询处理
  • 批准号:
    441421444
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
At Infinity of Symmetric Spaces
在无限对称空间
  • 批准号:
    441425994
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
Non-judicial rights review. The Promise and Limits of Rights Review by Non-Judicial Public Institutions inGermany, the EU and the UN
非司法权利审查。
  • 批准号:
    441470804
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Automated Modular Synthesis for Reliable Cyber Physical System Design
用于可靠网络物理系统设计的自动模块化综合
  • 批准号:
    441512781
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Independent Junior Research Groups
Pinning and Relaxation of Dislocations in Continuum and Atomistic Models
连续体和原子模型中位错的钉扎和弛豫
  • 批准号:
    441523275
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了