项目摘要
Dimensionality reduction of high-dimensional data is a frontier topic nowadays. This project aims to solve the variable selection in ultra-high dimensional models with censored data, especially for the collinearity models. Although there was much literature about censored data, there was no systematic theoretical investigation of simultaneous variable selection and coefficients estimation in the continuous generalized linear model with current status data. The existence of high correlation among variables in high-dimensional data can cause a serious problem of collinearity, therefore the main focus of this study is to resolve this issue. We propose a new combined-penalization which mixed by a nonconcave penalized function and the ridge. Inspired by Sure Independence Screening(SIS) method, we explore the appropriate algorithm and explain the corresponding data in the reality. This research can enrich the variable selection method system of penalization, as well as provide theoretical basis for the application in the area of survival analysis.
超高维数据的降维是当今统计学研究的前沿课题。本项目拟研究带有删失数据的超高维统计模型的变量选择问题,尤其是超高维协变量之间具有高度相关关系(即共线性关系)的变量选择问题。尽管对删失数据的变量选择已有一些研究成果,但对于区间删失数据模型的变量选择的研究尚少,因此,为了避免超高维数据带来的共线性问题的困扰,本项目拟对带区间删失数据的广义线性模型提出推广的组合惩罚,构造新的惩罚似然函数,发展新的变量筛选方法。在超高维框架下发展新的变量筛选方法以实现充分降维,探索合适的算法,将理论成果应用于实际数据分析。其研究可以丰富惩罚类变量选择的方法体系,也为生存数据分析领域的应用提供理论基础。
结项摘要
超高维数据的降维是当今统计学研究的前沿课题。本项目研究了带有删失数据的超高维统计模型的变量选择问题,尤其是超高维协变量之间具有高度相关关系(即共线性关系)的变量选择问题。由于在超高维的数据下,共线性问题更为普遍,对于相关度较高的一组协变量,变量选择的结果很可能只选择出一个变量。所以,超高维变量之间具有高度相关关系(即共线性关系)的变量选择问题是我们亟待解决的问题。本年度的研究内容可分为以下三部分:一、我们给出了超高维情况下广义线性模型的变量选择,应用SCAD-Ridge组合的惩罚,在一定的假设条件下,证明了该模型的估计所具有的理论性质,当调整参数满足适当的条件时,该方法能够一致地选出真实模型,模拟结果也表明了这一方法的结果具有优良的统计性质。二、以连续广义线性模型为主要研究对象,构造带有删失数据的惩罚似然目标函数,该部分模型已经构建,为得到适合删失数据下共线性问题的更有效的估计方法,接下来还需进一步证明估计的渐近性质以及研究其模拟结果,以确定提出方法的可行性。三、基于研究者的兴趣提出了一个新的混合模型,该模型欲解决金融、保险精算、生物医学等领域常遇到的混合总体的估计问题,探讨了该类混合总体的广义线性模型的M—估计。在合适的假设条件下,证明了提出模型的估计具有一致性和渐近正态性。同时,为了估计这个模型的有限样本性质,我们给出了该模型的数值模拟,这些模拟的结果说明了我们所提出的模型的合理性。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
数据更新时间:{{ journalArticles.updateTime }}
数据更新时间:{{ monograph.updateTime }}
数据更新时间:{{ sciAwards.updateTime }}
数据更新时间:{{ conferencePapers.updateTime }}
数据更新时间:{{ patent.updateTime }}