项目摘要
With the development of computer and network information technology, high-dimensional data are increasingly emerged in biomedical and medical health. Unlike the traditional data, high-dimensional data have the following new features: the diversity of the data, the sparsity of the useful information, the dependency of the data and missingness of the data, which shows that the traditional statistical analysis methods can not be used to deal with these challenges. Hence, it is a pressing need to develop novel statistical methods to make statistical inference on high-dimensional data. Although there are some effective methods to analyze high-dimensional data with some features, they are far from meeting the increasing requirement. This project aims to develop some novel approaches to make statistical inference on high-dimensional data with some new features such as dependence, missing and unknown distributions, and establish their theories; and propose some novel approaches to model-free variable screen, new clinical design study, hypothesis test, subgroup analysis and interval censored data analysis.
随着计算机和网络信息技术的发展,在生物医学和医疗健康等领域涌现出大量的高维数据。与传统数据不同,高维数据具有类型多样、有用信息稀疏、数据相依以及缺失等新特征,致使经典的统计推断方法在分析这些数据时遇到了瓶颈。因此,针对高维数据的这些新特征发展新的统计推断方法是统计学目前迫切需要解决的关键问题。尽管针对高维数据的某些特征已发展了一些有效方法,但现有的统计推断方法远远不能满足现实发展需要。鉴于此,本项目拟针对高维数据的一些新特征如:相依、缺失、分布未知等,发展一些新的统计推断方法并建立其理论,进而研究它们在不依赖于模型假设的变量筛选、新型临床试验设计方法研究、假设检验、亚组分析、区间删失数据分析等中的应用。
结项摘要
对医疗健康大数据的有效收集和挖掘,可为患者提供精准的个体化诊断和治疗方案。与传统数据不同,医疗健康大数据具有维数高、数据量大但信息稀疏、类型多样且结构复杂、数据相依以及缺失等新特征。尽管针对此类数据的某些特征已发展了一些有效的统计推断方法,但现有的统计推断方法远远不能满足现实发展需要。因此,本项目针对生物医学、遗传学、临床试验以及医疗健康等领域出现的大数据发展新的统计推断方法具有十分重要的理论和现实意义。.本项目的主要研究内容包括:在高维数据框架下提出了广义的多组平衡重要协变量的自适应随机化临床试验设计新方案以及筛选生物标记物的新方法,在超高维数据框架下发展了协变量选择自适应设计方案及其渐近马氏链的理论,在自适应设计下建立了检验有关处理效应假设的理论框架以及基于海量流数据的聚类自适应Network数据A/B检验过程,在超高维缺失数据情况下提出了可适用于两个试验组的连续型协变量自适应临床设计方案,针对超高维复杂相依数据发展了一系列亚组分析新方法并建立了其理论和算法,针对超高维数据提出了一系列不假设数据模型的特征筛选方法以及拟合优度检验方法,针对超高维协变量的区间删失数据模型基于广义估计方程发展了有效的统计推断理论等。在国内外重要学术刊物,如:《JASA》、《AoS》、《JRSSB》、《JoE》、《JBES》、《JMLR》等上发表学术论文91篇;在科学出版社出版专著2部,在国际出版社Intechopen主编出版学术论文集3部;获计算机软件著作权3项。获云南省自然科学二等奖1项。.项目执行期间,组织或承办国内国际学术会议9次;项目组成员中,1人当选IMS Fellow,1人获“国家杰出青年科学基金”,1人晋升副教授,1人获“云南省最美科技工作者”称号,1人获ICSA 杰出服务奖,1人获“云南省中青年学术和技术带头人”称号。培养出站博士后8人,毕业博士研究生18人、硕士研究生39人, 其中1名博士生的博士学位论文获云南省优秀博士学位论文。
项目成果
期刊论文数量(81)
专著数量(5)
科研奖励数量(1)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
数据更新时间:{{ journalArticles.updateTime }}
数据更新时间:{{ monograph.updateTime }}
数据更新时间:{{ sciAwards.updateTime }}
数据更新时间:{{ conferencePapers.updateTime }}
数据更新时间:{{ patent.updateTime }}