删失数据超高维共线性模型的变量选择

基本信息

  • 批准号:
    11726615
  • 项目类别:
    数学天元基金项目
  • 资助金额:
    -- 万
  • 负责人:
    唐年胜
  • 依托单位:
    云南大学
  • 学科分类:
    A0403.贝叶斯统计与统计应用
  • 结题年份:
    2018
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2018-12-31

项目摘要

Dimensionality reduction of high-dimensional data is a frontier topic nowadays. This project aims to solve the variable selection in ultra-high dimensional models with censored data, especially for the collinearity models. Although there was much literature about censored data, there was no systematic theoretical investigation of simultaneous variable selection and coefficients estimation in the continuous generalized linear model with current status data. The existence of high correlation among variables in high-dimensional data can cause a serious problem of collinearity, therefore the main focus of this study is to resolve this issue. We propose a new combined-penalization which mixed by a nonconcave penalized function and the ridge. Inspired by Sure Independence Screening(SIS) method, we explore the appropriate algorithm and explain the corresponding data in the reality. This research can enrich the variable selection method system of penalization, as well as provide theoretical basis for the application in the area of survival analysis.
超高维数据的降维是当今统计学研究的前沿课题。本项目拟研究带有删失数据的超高维统计模型的变量选择问题,尤其是超高维协变量之间具有高度相关关系(即共线性关系)的变量选择问题。尽管对删失数据的变量选择已有一些研究成果,但对于区间删失数据模型的变量选择的研究尚少,因此,为了避免超高维数据带来的共线性问题的困扰,本项目拟对带区间删失数据的广义线性模型提出推广的组合惩罚,构造新的惩罚似然函数,发展新的变量筛选方法。在超高维框架下发展新的变量筛选方法以实现充分降维,探索合适的算法,将理论成果应用于实际数据分析。其研究可以丰富惩罚类变量选择的方法体系,也为生存数据分析领域的应用提供理论基础。

结项摘要

超高维数据的降维是当今统计学研究的前沿课题。本项目研究了带有删失数据的超高维统计模型的变量选择问题,尤其是超高维协变量之间具有高度相关关系(即共线性关系)的变量选择问题。由于在超高维的数据下,共线性问题更为普遍,对于相关度较高的一组协变量,变量选择的结果很可能只选择出一个变量。所以,超高维变量之间具有高度相关关系(即共线性关系)的变量选择问题是我们亟待解决的问题。本年度的研究内容可分为以下三部分:一、我们给出了超高维情况下广义线性模型的变量选择,应用SCAD-Ridge组合的惩罚,在一定的假设条件下,证明了该模型的估计所具有的理论性质,当调整参数满足适当的条件时,该方法能够一致地选出真实模型,模拟结果也表明了这一方法的结果具有优良的统计性质。二、以连续广义线性模型为主要研究对象,构造带有删失数据的惩罚似然目标函数,该部分模型已经构建,为得到适合删失数据下共线性问题的更有效的估计方法,接下来还需进一步证明估计的渐近性质以及研究其模拟结果,以确定提出方法的可行性。三、基于研究者的兴趣提出了一个新的混合模型,该模型欲解决金融、保险精算、生物医学等领域常遇到的混合总体的估计问题,探讨了该类混合总体的广义线性模型的M—估计。在合适的假设条件下,证明了提出模型的估计具有一致性和渐近正态性。同时,为了估计这个模型的有限样本性质,我们给出了该模型的数值模拟,这些模拟的结果说明了我们所提出的模型的合理性。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
SCAD-Ridge penalized likelihood estimators for ultra-high dimensional models
超高维模型的 SCAD-Ridge 惩罚似然估计器
  • DOI:
    10.15672/hjms.201612518375
  • 发表时间:
    2016-05
  • 期刊:
    Hacettepe Journal of Mathematics and Statistics
  • 影响因子:
    0.8
  • 作者:
    Ying Dong;Lixin Song;Muhammad Amin
  • 通讯作者:
    Muhammad Amin
M-estimation of mixed-type generalized linear model
混合型广义线性模型的M估计
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    Probability and Mathematical Statistics
  • 影响因子:
    --
  • 作者:
    Ying Dong;Lixin Song;Mingqiu Wang;Muhammad Amin
  • 通讯作者:
    Muhammad Amin

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.titleTranslate }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAwards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

非线性再生散度随机效应模型的渐近性质
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    数学物理学报A辑
  • 影响因子:
    --
  • 作者:
    唐年胜;夏天;王学仁;张文专
  • 通讯作者:
    张文专
变窗宽局部线性回归中的M-估计
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    云南大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    蒋学军;唐年胜;夏天
  • 通讯作者:
    夏天
Bayesian Analysis for Mixture of Latent Variable Hidden Markov Models with Multivariate Longitudinal data
潜变量隐马尔可夫模型与多元纵向数据混合的贝叶斯分析
  • DOI:
    10.1016/j.csda.2018.08.004
  • 发表时间:
    --
  • 期刊:
    Computational Statistics and Data Analysis
  • 影响因子:
    1.8
  • 作者:
    夏业茂;唐年胜
  • 通讯作者:
    唐年胜
Estimation and variable selection in generalized partially nonlinear models with nonignorable missing responses
具有不可忽略的缺失响应的广义部分非线性模型中的估计和变量选择
  • DOI:
    10.4310/sii.2018.v11.n1.a1
  • 发表时间:
    2018
  • 期刊:
    Statistics and Its Interface
  • 影响因子:
    0.8
  • 作者:
    唐年胜;唐琳
  • 通讯作者:
    唐琳
Regression analysis of interval-censored failure time data with time-dependent covariates
具有时间依赖性协变量的区间删失故障时间数据的回归分析
  • DOI:
    10.1016/j.csda.2019.106848
  • 发表时间:
    2020
  • 期刊:
    Computational Statistics and Data Analysis
  • 影响因子:
    1.8
  • 作者:
    易凤婷;唐年胜;孙建国
  • 通讯作者:
    孙建国

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

唐年胜的其他基金

分布式张量回归的变分推断
  • 批准号:
    12271472
  • 批准年份:
    2022
  • 资助金额:
    46 万元
  • 项目类别:
    面上项目
高维缺失数据半监督支持向量机研究
  • 批准号:
    12126362
  • 批准年份:
    2021
  • 资助金额:
    20.0 万元
  • 项目类别:
    数学天元基金项目
数学学科2021-2035年中长期发展规划及“十四五”发展规划战略研究
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    10 万元
  • 项目类别:
    专项基金项目
国际贝叶斯分析学会2020年世界大会
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    20 万元
  • 项目类别:
2018年统计学研究生暑期学校
  • 批准号:
    11826027
  • 批准年份:
    2018
  • 资助金额:
    60.0 万元
  • 项目类别:
    数学天元基金项目
2017年全国统计学研究生暑期学校
  • 批准号:
    11726024
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    数学天元基金项目
超高维数据统计推断
  • 批准号:
    11731011
  • 批准年份:
    2017
  • 资助金额:
    250.0 万元
  • 项目类别:
    重点项目
2016年统计学研究生暑期学校
  • 批准号:
    11626020
  • 批准年份:
    2016
  • 资助金额:
    68.0 万元
  • 项目类别:
    数学天元基金项目
不可忽略缺失数据模型的统计推断方法研究
  • 批准号:
    11671349
  • 批准年份:
    2016
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目
2015年西部地区统计学青年教师暑期培训
  • 批准号:
    11526027
  • 批准年份:
    2015
  • 资助金额:
    75.0 万元
  • 项目类别:
    数学天元基金项目

相似国自然基金

基于新型可视薄膜传感器芯片的食品过敏原高通量检测方法研究
  • 批准号:
    31071552
  • 批准年份:
    2010
  • 资助金额:
    26.0 万元
  • 项目类别:
    面上项目
服务型领导对企业和员工结果的跨层影响机制研究
  • 批准号:
    71672190
  • 批准年份:
    2016
  • 资助金额:
    48.0 万元
  • 项目类别:
    面上项目
考虑信息缺陷和人为因素的结构可靠性设计理论
  • 批准号:
    10772070
  • 批准年份:
    2007
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
与HBV感染有关的肝癌D4S2964位点抑癌基因的鉴定
  • 批准号:
    30772491
  • 批准年份:
    2007
  • 资助金额:
    29.0 万元
  • 项目类别:
    面上项目
复杂基质样品的稳健分析方法研究
  • 批准号:
    20835002
  • 批准年份:
    2008
  • 资助金额:
    200.0 万元
  • 项目类别:
    重点项目
自由活塞式内燃机电耦合系统燃烧循环波动性的基础研究
  • 批准号:
    51376116
  • 批准年份:
    2013
  • 资助金额:
    75.0 万元
  • 项目类别:
    面上项目
IL-25/IL-33/TSLP应答轴在调节Th2型免疫应答和哮喘发生与转归过程中的作用研究
  • 批准号:
    81471594
  • 批准年份:
    2014
  • 资助金额:
    71.0 万元
  • 项目类别:
    面上项目
ERK诱导的Mig-6磷酸化调控EGFR介导的乳腺癌增殖的作用机制研究
  • 批准号:
    81302311
  • 批准年份:
    2013
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
受体介导的金纳米复合物靶向阻断及光热杀灭猪伪狂犬病病毒研究
  • 批准号:
    31902304
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
亚磺酰胺的反应性及环状亚磺酰胺手性配体的研究
  • 批准号:
    21372034
  • 批准年份:
    2013
  • 资助金额:
    40.0 万元
  • 项目类别:
    面上项目

相似海外基金

Raising diagnostic accuracy and therapeutic perspectives in interstitial lung diseases
提高间质性肺疾病的诊断准确性和治疗前景
  • 批准号:
    441274680
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Dual-responsive organo-sulfur network cathodes for stable high capacity polymer batteries
用于稳定高容量聚合物电池的双响应有机硫网络阴极
  • 批准号:
    441323218
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
Formats and Practices of Media Studies in the Age of Digital and Social Networks: An Ethnographic and Netnographic Study
数字和社交网络时代媒体研究的格式和实践:民族志和网络志研究
  • 批准号:
    441413969
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Design of collaborative and context aware mobile applications considering normative requirements from legal science and computer science (NORA)
考虑法律科学和计算机科学 (NORA) 的规范要求,设计协作和上下文感知的移动应用程序
  • 批准号:
    441416429
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Research Grants
FAIRVASC - building registry interoperability to inform clinical care
FAIRVASC - 建立注册表互操作性以告知临床护理
  • 批准号:
    441416480
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Multi-criteria Multi-constraint Path Query Processing on Graph Databases
图数据库的多准则多约束路径查询处理
  • 批准号:
    441421444
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
At Infinity of Symmetric Spaces
在无限对称空间
  • 批准号:
    441425994
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
Non-judicial rights review. The Promise and Limits of Rights Review by Non-Judicial Public Institutions inGermany, the EU and the UN
非司法权利审查。
  • 批准号:
    441470804
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Automated Modular Synthesis for Reliable Cyber Physical System Design
用于可靠网络物理系统设计的自动模块化综合
  • 批准号:
    441512781
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Independent Junior Research Groups
Pinning and Relaxation of Dislocations in Continuum and Atomistic Models
连续体和原子模型中位错的钉扎和弛豫
  • 批准号:
    441523275
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了